您的位置:首页 > 财经

用“对抗生成网络”也可以P图,效果不输Photoshop

发布时间:2021年11月13日 13:04 来源:IT之家 编辑:竹隐  阅读量:6899  
导读:把人的眼睛变大,把嘴合上,转动眼珠: 质量如此逼真,一点糊图的痕迹都没出现。 如果我不说,你知道这其实是对抗生成网络自己P的吗。 除了人脸,汽车啊鸟啊猫啊也都可以,比如改改车轮大小,换个车轴样式: 把小鸟的喙部变长,头抬高,胸脯...

把人的眼睛变大,把嘴合上,转动眼珠:

用“对抗生成网络”也可以P图,效果不输Photoshop

质量如此逼真,一点糊图的痕迹都没出现 。

如果我不说,你知道这其实是对抗生成网络自己 P 的吗。

除了人脸,汽车啊鸟啊猫啊也都可以,比如改改车轮大小,换个车轴样式:

把小鸟的喙部变长,头抬高,胸脯变壮:

用动图展示就更炫酷了:

大点大点,圆点圆点,头发再多一点。

怎么样,这 GAN 的效果是不是也不输 PS。

一个高质量 P 图 GAN

研究出自英伟达,多伦多大学以及 MIT,相关论文已被 NeurIPS 2021 接收。

EditGAN 作为一种全新方法,只需少量语义标记就能训练。

它会把原图像分割成高度精细的语义块,有多精细呢。

就比如下面这张人脸图,被足足按 30 种语义进行了分割:

而在一个交互工具中,只需操作这些语义块就可以对相应部分进行修改。

EditGAN 的关键思想在于利用图像和语义分割的联合分布 p 。

然后进行共享潜码的优化,以保持新分割图与真实图像的 RGB 外观一致,如图所示:

相应的梯度则通过共享生成器反向传播而成。

还可以泛化到绘画作品上

真实质量如何。

研究人员在在四个不同类别的图像上对 EditGAN 进行评估:汽车,鸟类,猫和人脸。

  • 定性实验结果

在下面这种高清的图像上效果就更好了:

此外,EditGAN 也有很强的泛化能力,比如在下面这种绘画等风格的人像上,做点小表情毫无违和感。

  • 定量实验结果

一作凌欢,多伦多大学博士生,同时在该校人工智能研究院和英伟达做研究。

共同一作 Karsten Kreis,英伟达高级研究科学家,2018 年以博士学位毕业德国马普高分子所。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。