2022-07-26 17:01:25 来源:新智元
千年一瞬,他们眨眼的瞬间,仿佛历史重演。前不久,外国博主Panagiotis Constantinou用AI修复了秦代兵马俑。
更令人惊艳的是,他还让古人做出了细微的动态表情。
快看,兵马俑在向你眨眼、微笑。
去过兵马俑后,大家都会对这些泥塑真人古迹的感到震撼。再看用AI复原后的兵马俑,竟变成了有血有肉的大叔。
每个兵马俑的表情都是千奇百态,几千年过去了,我们很难想象出他们当时的样子。
这位外国小哥让这些兵俑重新焕发了生机,穿越千年来和你对话。
此前,B站UP主大谷也对兵马俑进行了修复,让其嘴巴也动了起来。
其实,除了兵马俑,Panagiotis Constantinou还对埃及帝王敌后、古希腊哲学家、英国女王等做了一系列动态修复。
凭借这一系列修复,外国博主也爆火出圈,也引来许多人的关注。
修复技术
那么AI修复工作一般都是如何实现的呢?
大多都会用到这三个技术:第一个是负责做补帧的DAIN,第二个是做分辨率扩增的ESRGAN,第三个是上色的DeOldify。
DAIN:深度感知视频帧插值(DAIN)模型,通过探索深度信息来显式地检测遮挡。该项目开发了一个深度感知流动投影层,优选取样更近的物体,以合成中间流插补视频帧。
ESRGAN:ESRGAN改进自SRGAN ,主要用来做视频超分辨率。
与SRGAN的深层模型越来越难以训练相反,更深层次的 ESRGAN 模型通过简单的训练就能达到卓越的性能,核心点在于平衡视觉质量和峰值信噪比的网络插值策略。
DeOldify:DeOldify 使用了NoGAN 进行训练,NoGAN对于获得稳定和丰富多彩的图像是至关重要的。
NoGAN 训练结合了 GAN (美妙的着色)的好处,同时消除了副作用(如视频中的闪烁对象)。
不论是图像还是视频,AI能够将其修复得栩栩如生,最主要的是归功于它强大的学习能力。
这里我们再简单了解一下AI修复离不开的「灵魂GAN」。
还记得马和斑马相互转换的图像吗?这便是GAN的应用之一。
和其他经典的机器学习算法相比,GAN算法最大的创新点便是它结合了生成器(Generator)和判别器(Discriminator),以二者的相互对抗进而实现相互优化,最后达到一个「势均力敌」的状态。
以图像为例,判别器D经过反复训练,最后希望可以准确分辨出哪一个是真实的数据分布,哪一个是生成器的数据分布;同时,生成器G也不断地训练,最后希望能够以假乱真,让判别器判断不出到底哪个是真的图像,哪个是假的图像。
现在越来越多的技术像是AI修复、AI换脸等都离不开GAN网络,曾经困扰GAN的难题,比如难以收敛等也都渐渐得到了改善,而且基于GAN也衍生出了越来越多的更优秀的网络,比如CycleGAN、StackGAN等,愈加逼真、生动的图像逐一呈现在大众眼前。
现在大抵是「万物皆可AI」的时代了!
AI还会继续给我们带来何种视觉惊喜,我们拭目以待~~~
千年一瞬,他们眨眼的瞬间,仿佛历史重演。前不久,外国博主Panagiotis Constantinou用AI修复了秦代兵马俑。更令人惊艳的是,他还让古人做
对一些人来说,量子计算(Quantum computer)可能听上去像是科幻小说,是几十年后的情景。实际上,全球已经有不少人已经投入这项前沿计算的
意大利竞争与市场监管机构对智能手机供应商小米的当地部门处以320万欧元罚款,指控后者违反了电子设备维修保修规则。在一份声明中,意大利
苹果M系列自研处理器有多成功?数据说明一切。市调机构Strategy Analytics的最新研究显示,2021年的ARM架构笔记本处理器市场上,苹果凭借M1
Reddit 周四宣布,该公司将以未公开的架构,收购机器学习(ML)实验平台 Spell 。据悉,前 Facebook 工程师 Serkan Piantino 于 201
报道称苹果公司将会在今年晚些时候推出iPad10,采用公司的 A14 Bionic 芯片。除了芯片上的升级之外,iPad 10 在很多方面都会获得升级
苹果发布了 iOS 16、iPadOS 16 系统,并且已经发布了首个开发者预览版 Beta。此前 iOS 16 代码泄露,提及了息屏显示(Always On D
在 iOS iPadOS 16 中重塑的 Home 应用中,苹果似乎移除了将 iPad 作为 Home Hub 的支持。在 iOS 15 中,苹果允许用户将 Appl
海外创投丨「Oncoustics」获530万美元种子轮融资,专注于肝脏病治疗,Oncoustics计划利用种子轮融资加速肝脏评估和诊断产品的开发。
融资丨「菲力克斯」完成亿元A轮融资,专注于电子设备研发,菲力克斯成立于2012年,是一家集设计、生产、销售为一体的国家高新技术企业。
融资丨「丹擎医药」完成数千万元天使轮融资,幂方健康基金独家投资,丹擎医药是一家立足中国,面向全球的创新驱动型药物研发公司。
DALL·E是OpenAi去年推出的图像生成模型,它可以根据一句文本(caption)生成现实世界中不存在的图像。
商汤科技限售股解禁后的股价波动,再度引发了外界对AI赛道的质疑与担忧。
2022年6月24日,交易所CoinFLEX宣布暂停提款,随后平台TokenFLEX的价格暴跌。
目前,《PuzzlingPlaces》共16个游戏关卡,从大型场景到单体建筑都有所包含。
很多人并不理解什么是Web3 0。本文尝试以最简洁的语言来解释一下我对于这个问题的理解。