字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少

2021/9/19 15:53:33 来源:IT之家 作者:信鸽 责编:信鸽

IT之家 9 月 19 日消息 今日字节跳动技术团队在其官方公众号发表文章,介绍了字节跳动的一项深度学习新技术。深度学习模型中的生成式对抗网络(GAN),可以用于图片风格迁移、图像编辑、图片生成等场景,为画面以及视频改变风格。

举例来看,该技术可以将一匹棕色的马变成斑马,或者将莫奈的风景画变成真实的照片。依据一个 鞋子的轮廓,可以自动生成真实的鞋子图形。

图片

图片

2020 年,麻省理工学院、Adobe 和上海交通大学技术人员提出一种 GAN 压缩算法,将算力消耗成功减少到 1/21。

最近,字节跳动技术团队推出了一项自研 GAN 压缩算法,名为“在线多粒度蒸馏技术”,简称 OMGD。这项算法能够极大降低 CycleGAN 和 Pix2Pix 模型的算力消耗,分别降至原来的 1/40 和 1/46。不仅参数和计算量更少,图像生成效果也更好

上图的结果显示,OMGD 消耗的计算量仅为 1.219G,相比于原始状态的 56.8G,计算量大幅减少,生成效果也更优。

IT之家了解到,目前 OMGD 技术已经应用在多款抖音智能特效中。比如“三屏人生”,可以将过去、现在、未来的自己实时展现在屏幕上。

使用动态照片功能,可以让静态画面动起来,表情丰富逼真。

相关文章

软媒旗下网站: IT之家 辣品 - 超值导购,优惠券 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 魔方 旗鱼浏览器(极速内核) 云日历 酷点桌面 Win7优化大师 Win10优化大师 软媒手机APP应用