把人的眼睛变大,把嘴合上,转动眼珠:
质量如此逼真,一点糊图的痕迹都没出现 。
如果我不说,你知道这其实是对抗生成网络自己 P 的吗。
除了人脸,汽车啊鸟啊猫啊也都可以,比如改改车轮大小,换个车轴样式:
把小鸟的喙部变长,头抬高,胸脯变壮:
用动图展示就更炫酷了:
大点大点,圆点圆点,头发再多一点。
怎么样,这 GAN 的效果是不是也不输 PS。
一个高质量 P 图 GAN
研究出自英伟达,多伦多大学以及 MIT,相关论文已被 NeurIPS 2021 接收。
EditGAN 作为一种全新方法,只需少量语义标记就能训练。
它会把原图像分割成高度精细的语义块,有多精细呢。
就比如下面这张人脸图,被足足按 30 种语义进行了分割:
而在一个交互工具中,只需操作这些语义块就可以对相应部分进行修改。
EditGAN 的关键思想在于利用图像和语义分割的联合分布 p 。
然后进行共享潜码的优化,以保持新分割图与真实图像的 RGB 外观一致,如图所示:
相应的梯度则通过共享生成器反向传播而成。
还可以泛化到绘画作品上
真实质量如何。
研究人员在在四个不同类别的图像上对 EditGAN 进行评估:汽车,鸟类,猫和人脸。
定性实验结果
在下面这种高清的图像上效果就更好了:
此外,EditGAN 也有很强的泛化能力,比如在下面这种绘画等风格的人像上,做点小表情毫无违和感。
定量实验结果
一作凌欢,多伦多大学博士生,同时在该校人工智能研究院和英伟达做研究。
共同一作 Karsten Kreis,英伟达高级研究科学家,2018 年以博士学位毕业德国马普高分子所。
。郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。