首页> 热点 >

DeepFake换头术升级：浙大新模型，GAN出一头秀发

2022-04-24 12:10:48 来源：商业新知网

磐创AI分享

转自 |新智元

编辑 | 袁榭、拉燕

【导读】虽然DeepFake能令人置信地换脸，但没法同样换好头发。现在浙大与瑞典研究者都扩宽思路，用GAN或CNN来另外生成逼真的虚拟发丝。

DeepFake技术面世的2010年间末叶，正好赶上了川普时代。

无数搓手打算用DeepFake来好好恶搞大总统一下的玩梗人，在实操中遇到了一个不大不小的障碍：

各家DeepFake类软件，可以给图像换上金毛闯王的橙脸，但那头不羁的金发实在让AI都生成不出令人置信的替代品。

看，是不是那头毛就让DeepFake产品露馅了。

DeepFake搞得定换脸，也搞不定换头发

其实这是老问题遇到了新挑战。如何栩栩如生地复现人像模特的头发，这是一个自希腊-罗马时代的雕像师开始就很觉棘手的难题。

人脑袋平均有大概100000根头发丝，并且因为颜色和折射率的不同，在超过一定的长度后，即使在计算机时代也只能用复杂物理模型进行模拟，来进行图像移动和重组。

目前，只有自20世纪末以来的传统CGI技术可以做到这一点。

2017年的CGI头发模型处理结果

当下的DeepFake技术还是不太能解决这个问题。数年来，DeepFaceLab也只发布一个仅仅能捕捉短发的「头部全体毛发」模型，发部还是僵硬的。这还是一款在业内领先的软件包。

最近，DFL的合作伙伴FaceSwap做出了BiseNet语义分割模型，能使用户在deepfake输出图像中包括到耳部和头发的图形细节呈现。

这两套软件包都来自2017年Deepfakes的源代码，在当时颇受争议。

就算现在DeepFake模型要呈现的头发图像非常短，输出结果的质量往往也很差，头像好像是叠加上去的一样，不像是浑然一体的图像一部分。

用GAN来生成毛发

目前，业界用来模拟人像使用最多的两种办法，一个是神经辐射场技术（Neural Radiance Fields）。NeRF可以从多个视角捕捉画面，之后可以将这些视角的3D成像封装在可探索的神经网络AI里。

另一种办法则是生成对抗网络（GAN），GAN在人类图像合成方面比NeRF更加先进，即使是NeRF在2020年才出现。

NeRF对3D几何图形的推测性理解，将使其能够以较高的保真度和一致性，对图案场景进行复制。哪怕当前没有施加物理模型的空间、或者准确来说和摄像头视角无关的变化，所收集的数据导致的变形都是一样的。

不过就目前来看，NeRF模拟人类发丝运动模拟的能力并不出色。

与NeRF不同，GAN天然就有个几乎致命的劣势。GAN的潜在空间并不会自然包含对3D信息的理解。

因此，3D可感知的GAN所生成的人脸合成图像，在近几年成了图像生成研究的热点问题。而2019年的InterFaceGAN是最主要的突破之一。

然而，即使是在InterFaceGAN展示上的精心挑选的图像结果，也都表明：在时间的一致性的表现上，神经网络AI生成发丝图像达到令人满意的一致性依然是一项艰巨的挑战，应用在VFX图像工作流程中仍然性能不可靠。

用InterFaceGAN换脸后，头像上的发丝出现蒸腾效果

越来越明显的是，通过操控神经网络AI潜在空间进行的连贯视图生成，可能是一种类似炼金术的技术。

越来越多的论文中不得不另辟蹊径，将基于CGI的3D信息作为稳定的和规范化的约束，纳入GAN的工作流程。

CGI元素可以由3D形式的中间图形元表示，比方说「蒙皮多人线性模型」（SMPL，Skinned Multi-Person Linear Model）。

又或是应用和NeRF模式相近的3D推断技术得出，在这种技术中，图像的几何元素是从源图像和源视频中评估出来的。

就在本周，悉尼科技大学的ReLER实验室、AAII研究所、阿里达摩院以及浙江大学的研究者合作发布了一项论文，描述了用于3D可感知图像合成的「多视角连贯性生成性对抗网络」（MVCGAN）。

MVCGAN生成的头像

MVCGAN包含了一个「生成辐射场网络」（GRAF）AI，它可以在GAN中提供几何限制。理论上来讲，这个组合可以说实现了任何基于GAN的方法的最逼真虚拟头发输出结果。

MVCGAN生成的带发丝头像与其他模型生成头像的对比

从上图可以看出，在极端发丝参数下，除MVCGAN外，其他模型的图像结果都产生不可置信的扭曲

不过，在CGI工作流程中，以时间为基础的虚拟发丝重建依然是一项挑战。

因此业界尚无理由相信，传统的、基于几何图形的办法，能够在可预见将来能把具有时间一致性的发丝图形合成带入AI的潜在空间中。

用CNN生成稳定的虚拟头发数据

不过，瑞典查尔默斯理工学院三位研究人员即将发表的论文，或许还可以为「用神经网络生成人发图像」的研究提供新进展。

这篇题为《用卷积神经网络实时进行毛发滤镜》的论文即将在2022年5月份的重要学术会议「交互式3D图形和游戏盛会」上发表。

该系统由一个基于自动编码器的神经网络AI作为基础，该神经网络AI能够实时评估生成的虚拟发丝图案分辨率，包括发丝在虚拟空间中自动产生的阴影和头发厚度呈现。此自动编码器的随机数种子来自于由OpenGL几何体生成的有限随机数样本。

由这种方法途径，就可以只渲染有限数量的、具有随机透明度的样本，然后训练U-net来重建原始图像。

该神经网络在PyTorch上进行训练，可以在6-12小时内完成训练达到收敛，具体市场取决于神经网络体量和输入特征值的数量。然后将训练的参数（权重）用于图像系统的实时实现。

训练数据集，则是通过以随机距离、姿势以及不同的照明条件，来渲染数百张直发和波浪发型的实际图片而生成的。

样本中的发丝半透明度数值，是从在超采样分辨率条件下、以随机透明度渲染的图像平均求得的。

原始的高分辨率数据，先被降采样，以适应网络和硬件限制；然后在典型的自动编码器工作流程中进行上采样，以提高清晰度。

利用从训练模型派生的算法的「实时」软件，作为此AI模型的实时推理应用程序，采用了NVIDIA CUDA、cuDNN和OpenGL的混合。

初始输入特征值被转储到OpenGL的多重采样颜色缓冲区中，其处理结果在CNN中继续处理前会分流到cuDNN张量，然后这些张量将会被复制回「实时」OpenGL纹理中，以施加到最终图像中。

这个AI的实时运行硬件是一张NVIDIA RTX 2080显卡，产生的图像分辨率是1024x1024像素。

由于头发颜色的数据值与神经网络AI处理的最终值是完全分离的，因此改变头发颜色是一项容易的任务，尽管虚拟发丝的渐变和条纹等效果仍然将在未来构成挑战。

结论

探索自动编码器或GAN的潜在空间，仍然更类似于靠直觉的驾帆船，而非精确驾驶。只有在最近的时段，业界才开始看到在NeRF、GAN和非deepfake（2017）自动编码器框架等方法中生成「更简单」的几何形状（如人脸）的可靠结果。

人类头发显著的结构复杂性，加上需要结合当前物理模型和图像合成方法无法提供的其他特征，表明头发合成不太可能仍然只是一般面部合成模型中的一个集成组件。此任务需要复杂的、专用的和独立的神经网络AI来完成，即使这些神经网络最终可能会被纳入更广泛、更复杂的面部合成框架中。

关键词：神经网络自动编码器

上一篇：
下一篇：

精彩阅读

DeepFake换头术升级：浙大新模型，GAN出一头秀发
热点
虽然DeepFake能令人置信地换脸，但没法同样换好头发。

数据中心碳中和之路，新华三如何全栈赋能？
热点
2022开年后，在科技圈中有一则重磅新闻发生：“东数西算”工程正式启动。

波场DAO新物种下场，USDD如何破局稳定币市场？
热点
对于大部分加密用户来说，不知道从什么时候开始，我们已经完全将TRC-20USDT当成了一种习惯。

小扎真扎心，Meta要开始收“元宇宙税”了
热点
Meta至高要抽取47 5%的佣金。

《2022年第一批山东省信创优秀解决方案》：超越科技、海尔、瀚高、华云、浪潮、麒麟、兆芯、中孚等19家公司，31个方案入围
热点
2022年4月22日，山东信创工委会发布2022年第一批山东省信息技术应用创新优秀解决方案。

K时评知乎理性乐观的依据是什么？
热点
值得期待的是，就在知乎上市首日，公司CEO周源在站内信中提到一个关键词，理性乐观。

豆瓣“渡劫”：小红书、知乎、虎扑……谁能赢下内容社区之战？
热点
豆瓣正在“渡劫”。

周公观娱 | 在元宇宙里，可以跟偶像谈恋爱吗？
热点
如果说近两年最热的关键词，除了“疫情”之外，无疑要以“元宇宙”为首。

AI律师，在线诈骗
热点
TechTalks创始人，软件工程师BenDickson近来遭遇了一场诈骗。

【永生】在元宇宙里复活？病魔夺走父亲5年，小哥独创挚爱「永生」版本
热点
5年前，癌症将父亲从他的身边夺走。出于对父亲的思念，外国小哥创建了一家VR公司，让逝去的亲人在元宇宙中实现永生。

财富

体验经济时代，长虹引领电视产业新发展
资讯
体验经济时代，潜在消费者对产品的体验程度，影响着产品的市场表现力。对于2022年的8K电视来说，体验经济模式带来的效应非常明显。体验改变

全球第一！宁德时代2021年净利润159.31亿元
资讯
4月21日晚间，宁德时代发布2021年财报，数据显示，2021年营业收入约1303 56亿元，同比增加159 06%;归属于上市公司股东的净利润约159 31亿元

13mini不受欢迎苹果将停产5.4英寸iPhone14mini
资讯
苹果要放弃mini系列是有原因的，因为用户都不是很买单。消费者数据研究机构CIRP的一份新报告展示了iPhone阵营各款手机的销售状况。iPhone

联想承诺2025年全线计算机产品100%含再生塑料
资讯
越来越多的科技公司开始参与环保事业，不仅推进清洁能源，也在加大对再生材料的支持，全球最大的PC厂商联想今天承诺到2025年，全线计算机产

为环保不再标配充电器，苹果被巴西法院罚款
资讯
从iPhone 12系列开始，苹果为环保不再标配充电器，这一举措导致苹果被罚款。4月22日消息，据当地媒体Tecmundo报道，巴西戈亚尼亚市一家法

东微半导体2021年净利润1.47亿元，同比增430.66%
资讯
东微半导体昨日发布2021年年度报告。报告期内，公司实现营业收入7 82亿元，较去年同期相比增加153 28%;归属于上市公司股东的净利润约1 47亿

当下自动驾驶商业化落地过程中的五大难点
资讯
当聊到自动驾驶商业化落地的时候，我们通常可能会想到Robotaxi、物流、矿山、港口码头、固定路线区域接驳、无人环卫、自主泊车等等。每一个

石头科技披露2021年年报及2022年一季报净利润14.02亿元
资讯
4月21日晚间，石头科技披露了2021年年报及2022年一季报。年报显示，2021年石头科技实现营业收入约58 37亿元，同比增长28 84%;归属于上市公

致欧科技更新招股书，财务资料过期被交易所中止申报
资讯
随着移动互联网技术的发展，电商已成为人们购物的重要方式之一。作为世界工厂的中国，凭借着在供应链方面的优势，在亚马逊、ManoMano、Cdis

微信也有热搜榜了！内测“搜索发现”功能，可删除搜索词
资讯
现在各大新闻平台都有热搜榜，让用户一眼就能看到当前最火的内容。而一直标榜小而美的微信，似乎也要上线类似功能了。近日，有网友发现微信

MORE+ 资讯

体验经济时代，长虹引领电视产业新发展

网红书店VS场景阅读，谁是全民阅读更优解？

辛巴被曝卖假货，而我在直播间卖水果，日销3000斤

自助餐：倒闭2万家，可我还在数钱

十年投入700亿，雷军要造五菱宏光还是兰博基尼？

名创优品的潮玩店，为何潮不起来？

被“副业焦虑”支配的年轻人

谁在抄底猪肉股？

张庭是如何忽悠二胎宝妈，建立300亿传销帝国的？

疫情反复两年多，你会如何回答这四个问题？

MORE+ 热点

DeepFake换头术升级：浙大新模型，GAN出一头秀发

数据中心碳中和之路，新华三如何全栈赋能？

2022开年后，在科技圈中有一则重磅新闻发生：“东数西算”工程正式启动。

波场DAO新物种下场，USDD如何破局稳定币市场？

对于大部分加密用户来说，不知道从什么时候开始，我们已经完全将TRC-20USDT当成了一种习惯。

小扎真扎心，Meta要开始收“元宇宙税”了

Meta至高要抽取47 5%的佣金。

《2022年第一批山东省信创优秀解决方案》：超越科技、海尔、瀚高、华云、浪潮、麒麟、兆芯、中孚等19家公司，31个方案入围

2022年4月22日，山东信创工委会发布2022年第一批山东省信息技术应用创新优秀解决方案。

K时评知乎理性乐观的依据是什么？

值得期待的是，就在知乎上市首日，公司CEO周源在站内信中提到一个关键词，理性乐观。

MORE+ 焦点

锐龙55600G评测：台积电7nm工艺，6核心12线程

自从AMD推出Zen3架构的锐龙5000系列处理器后，在市面上大杀四方，不论是单核性能、多核性能还是游戏性能都远胜于Intel10代和11代酷睿，甚至

欧菲光：公司8P镜头项目已研发成功，目前处于试产阶段

曾经为苹果提供镜头模组的欧菲光今日在互动平台表示，公司团队历经多年技术攻坚，突破高端镜头技术壁垒，一亿像素7P光学镜头已量产，长焦镜

支付宝：处置69375个违规账号和参与“跑分”的账号

4月19日下午，支付宝安全中心官方发布了关于持续打击电信网络诈骗、租售账号等违规行为的公告。为保障用户账户安全，营造清澈、安全的

华润啤酒频现“超标排放”环保问题遭罚款

4月18日，北京商报记者在聊城市生态环境局注意到，华润雪花啤酒(聊城)有限公司(以下简称雪花聊城公司)因涉嫌超标排污被聊城市生态环境局罚

Eurocom推出15.6英寸笔记本电脑工作站

Eurocom 正推出 15 6 英寸的 Raptor X15 Mobile Supercomputer，该工作站采用 LGA1700 插槽的英特尔第 12 代桌面处理器。通过最

帅丰电器发布2021年年报，净利润同比增长26.95%

4月13日，帅丰电器(605336)发布2021年度报告，报告期内公司实现营业收入977,641,254 43元，同比增长36 93%;归属于上市公司股东的净利润246,

MORE+ 智能

苹果发布的iPhoneSE3销量低于公司预期

苹果35W充电头曝光，或并非iPhone14系列天花板

耶路撒冷希伯来大学和巴伊兰大学就量子技术进行研究合作

小菲电子推出双USB-C快充充电器

前华为产品经理，搭上“米链”快车，素士科技冲刺电动牙刷第一股

统信桌面操作系统V20专业版正式发布新增一系列全新特性

铠侠宣布为第二代PCIe5.0SSD提供样品

一半盖泡面，一半挂闲鱼！电子纸平板或成最具潜力电子纸终端

年内五连涨！2022款欧拉好猫全系车型价格调整

Q-CTRL：量子计算算法成功率提高1000倍以上

精彩推送

DeepFake换头术升级：浙大新模型，GAN出一头秀发

数据中心碳中和之路，新华三如何全栈赋能？

波场DAO新物种下场，USDD如何破局稳定币市场？

小扎真扎心，Meta要开始收“元宇宙税”了

《2022年第一批山东省信创优秀解决方案》：超越科技、海尔、瀚高、华云、浪潮、麒麟、兆芯、中孚等19家公司，31个方案入围

周公观娱 | 在元宇宙里，可以跟偶像谈恋爱吗？

豆瓣“渡劫”：小红书、知乎、虎扑……谁能赢下内容社区之战？

K时评知乎理性乐观的依据是什么？

超越数字化，塑造未来的七大战略要务！

AI律师，在线诈骗

【永生】在元宇宙里复活？病魔夺走父亲5年，小哥独创挚爱「永生」版本

体验经济时代，长虹引领电视产业新发展

百度虚拟数字人凭借综合实力夺冠，两年内有望实现“数字人自由”

历史沿革：NFTs在以太坊上的发展之路

为什么 AI 驱动的分析对于数据驱动的决策至关重要

视频号必须赚钱

全球第一！宁德时代2021年净利润159.31亿元

辛巴被曝卖假货，而我在直播间卖水果，日销3000斤

锐龙55600G评测：台积电7nm工艺，6核心12线程

“内鬼”获取公民个人信息搞电诈

联通李氏三兄妹，都是牛人！

1.55亿TB出货量打破2019年纪录，磁带存储再创新高

办公自由后，我逃离了大城市

有人翻小红书种草，有人却翻到了最新AI技术趋势

360业绩公告公布完成5.47亿元城市安全订单

十年投入700亿，雷军要造五菱宏光还是兰博基尼？

元宇宙房地产：又一个疯狂的加密市场吗？

完美日记失重，逸仙电商危矣

看齐QQ！微信iOS内测版推出重磅升级：朋友圈也可以直接转发

利拉德做鞋垫生意，第一年就要卖100万美元货

中央5部联合：实施智慧广电乡村工程，使用低频5G网络覆盖

日本教授发明咸味放大筷子，少盐食物也能有滋味了！此前还搞出舔屏尝味电视

网红书店VS场景阅读，谁是全民阅读更优解？

谁在抄底猪肉股？

13mini不受欢迎苹果将停产5.4英寸iPhone14mini

5G实时云渲染+“云选车”，新兴技术推动疫情之下的行业变轨

顶天立地，扎稳根基，AI落地助力讯飞逆势高速增长

从激进、落幕再到追逐：美俄中的载人登月战争

张庭是如何忽悠二胎宝妈，建立300亿传销帝国的？

国内首家元宇宙门户正式上线，芝麻财经专注数字藏品第三方服务

名创优品的潮玩店，为何潮不起来？

全民阅读时代，书店不靠卖书挣钱了

自助餐：倒闭2万家，可我还在数钱

被“副业焦虑”支配的年轻人

【机器视觉】从传感器到算法原理，机器人视觉避障原来是这样的

疫情反复两年多，你会如何回答这四个问题？

阿里云 VMware 服务正式上市

测试版微信可以定向清理缓存，小容量手机有救了？

趣头条确认将调整业务，停止自媒体平台

联想承诺2025年全线计算机产品100%含再生塑料

为环保不再标配充电器，苹果被巴西法院罚款

东微半导体2021年净利润1.47亿元，同比增430.66%

互联网凉了？

宇宙人(1015期）俄“萨尔马特”洲际导弹试射；中国航天日海报发布；传阿里达摩院裁员30% ；

一座2500人的意大利小城正在实验“比特币挖矿”

科大讯飞 2021 年营收 183 亿元，同比增长 40.6%

“东数西算”如何解决能耗难题？新华三早已深度布局

机器学习三个时代的计算趋势

中国联通：2022年第一季度净利润46.34亿元

新中产钱包缩水，谁来圆蕉下的lulu梦？

微信朋友圈10周年，App膨胀了10年，512GB存储都不够用了！

融资丨「数派跨境」完成近千万元天使轮融资，领星集团独家投资

融资丨「寓科未来」完成D+轮融资，清华x-lab创业DNA基金、启恒产业投资基金加持

英国石油巨头与澳大利亚电动汽车充电桩签订多年期合同

融资丨「小森日禾」完成数百万元天使轮融资，睿鼎资本独家投资

与「看不见的手」掷骰子的人

为企业出海“搭桥”，汇量科技靠什么出圈？

用友商旅云：重构商旅服务，助力企业数智化创新

无代码AI营销平台Mutiny完成5000万美元融资，老虎全球基金、Insight Partners领投

第一波“刘畊宏女孩”已经受伤了

60岁华裔数学家将在美接受审判，被指控7项重罪，可能面临最高20年监禁

超算云如何登上“东数西算”的快车

中国移动：一季度净利256亿元同比增长6.5%

安吉星手机应用APP迎来10.0重磅升级

阻止“TA们”监听你，AI能做到吗？

Omdia观察：沃达丰推出基于区块链的平台来推动物联网经济

丰田再次宣布停产，5月全球销量将为75万辆

安华金和&OceanBase打造数据库安全联合解决方案

对于现阶段GameFi发展而言，兼容EVM重要吗？

Oracle数据库机：让数据价值回归用户“第一性原理”

5G分流比，这里率先突破40%！

上海联通等一等，兄弟公司爱心物资运来啦！克服物流受阻困难！

创维将推出超短焦VR一体机、AR眼镜Viture开启众筹、HTC推特流出新产品......

美国窃密全球的主战装备被我国曝光！国产化和自主可控是应对王道

联通被判侵权！排超联赛IPTV侵权“第一案”！

多家平台宣布，将上线显示用户IP属地功能

当下自动驾驶商业化落地过程中的五大难点

请别神化「私域」：六大陷阱，招招毙命

获国家级认可，畅捷通入选2021年“中小企业数字化转型典型案例”！

为了保护隐私？谷歌安卓商店颁布新规定：通话录音软件全凉了

知乎回应裁员40人：视频业务上没有裁员计划

“携号转网”两年多，你后悔了吗？

收购拍乐云，布局音视频，钉钉上演迷踪拳还是组合拳？

Meta VR游戏展再临，多人VR游戏春天要来了？

合其家物物地图走进社区，林昕杨提出的“两圈融合”首站落地福州

百度再战社交，语音比元宇宙有机会？

石头科技披露2021年年报及2022年一季报净利润14.02亿元

三家运营商一季度业务喜提“开门红”

融资丨「华翊量子」完成过亿元天使轮融资，高榕资本领投

又闯红线？中国联通某分公司因违法行为被警告

DeepFake换头术升级：浙大新模型，GAN出一头秀发

磐创AI分享

【导读】 虽然DeepFake能令人置信地换脸，但没法同样换好头发。现在浙大与瑞典研究者都扩宽思路，用GAN或CNN来另外生成逼真的虚拟发丝。

【导读】虽然DeepFake能令人置信地换脸，但没法同样换好头发。现在浙大与瑞典研究者都扩宽思路，用GAN或CNN来另外生成逼真的虚拟发丝。