Deepfake平民化,10美元加一台笔记本,人人都能“换脸”阿汤哥

  这段著名的视频中比尔·哈德在不知不觉中变成汤姆·克鲁斯,而且还是阿汤哥年轻时的样子。

  这段著名的视频中比尔·哈德在不知不觉中变成汤姆·克鲁斯,而且还是阿汤哥年轻时的样子。

  本文来自于微信公众号硅谷洞察(ID:guigudiyixian),钛媒体经授权发布。

  如果说最近哪项技术在近段时间引发了美国全社会的反感,那毫无疑问是人脸识别技术。

  从去年开始,美国就已经开始有禁止人脸识别的动作了。去年 5 月,旧金山成为第一个禁止政府购买和使用人脸识别技术的城;而今年受弗洛伊德事件影响,6 月 10 日,美国科技巨头 IBM 宣布正式放弃人脸识别技术,紧接着第二天,亚马逊表示停止对警方提供面部识别技术。

  这背后除了种族歧视的问题以外,还存在另一个比较严重的隐患。那就是人们的面部数据可能被用于“深度伪造”(Deepfake)。

  曾经,Deepfake 还是有一定门槛的。虽然网上有开源的 Deepfake 的软件和工具,但是要么硬件要求过高,要么就是「Fake」的不够「Deep」。总之,想要制作出一个完美的 Deepfake 视频需要专业人士大费周章。

  但是,让人担忧的 Deepfake 如今已“平民化”。小探甚至发现了只需要 10 美元和一台最基础的笔记本就能进行 Deepfake 的开源工具包。只需要经过 24 小时,一张满脸横肉的面容就能变成大帅哥「汤姆·克鲁斯」。其造假程度说是「偷天换日」也不为过。

  想知道这背后的工作原理和操作方式吗?那就继续往下看吧~

  只需要 24 小时,我就能变阿汤哥

  某日,小探在B站上发现了一条名为「最高境界的换脸」的视频。

  视频中一群「科技宅」在自己的实验室中进行视频拍摄,并运用 AI 技术将他的脸换成著名演员汤姆·克鲁斯的脸

  换脸的过程总共需要五步「视频转图片」、「提取脸部」、「训练模型」、「人脸替换」、「合成视频」

  首先,他们会为自己拍摄一段源视频作为素材以供 AI 进行学习。注意,在拍摄的过程中你的面部表情需要尽可能的多,这样才能够更好和需要替换的对象进行融合。

  拍摄源视频时表情尽可能的丰富

  然后利用视频软件对脸部表情进行提取,这里用到的软件是 AE 视频剪辑。在视频中人进行运动的时候,对其脸部的轮廓和细节进行「抠图」,并生成一张张不同角度和表情的图片。

  读取动态面部数据

  在图片提取完成后,就可以开始进入「模型训练」部分了。

  视频中我们可以看到五个部分,其中最左边的是最真实的照片,最中间的是需要替换的目标人物的脸,最右边模糊的部分是最终替换的结果预览。

  而中间两条模糊的对比栏则是 AI 在进行学习时不断匹配最优角度的过程对比。

  导入人脸数据由 AI 进行训练

  在不停的学习过程中,AI 生成的图片会和实际拍摄的图片越来越接近,而最终学习的结果越真实则代表着最终的「换脸」真实度会越高。同时这也需要更久的时间。

  AI 生成的面部数据会逐渐接近真实的人脸

  而最终经过一天的不间断学习,他们成功的将自己的脸更换成了汤姆克鲁斯的脸。

  「汤姆·克鲁斯」来啦

  虽然在视频中我们可以看到,「汤姆·克鲁斯」的脸在某些时候会因为没有匹配好而产生扭曲,这也是因为 AI 只学习了一天的原因。但是在正常的视角下还是非常逼真的。

  虽然视频并没有写明这帮「科技宅」使用的是哪种 Deepfake 工具。但是小探在搜索过程中发现了一款名叫「DeepFaceLab」的开源工具,这是由一个名叫「ctrl shift face」的公司发布的开源 Deepfake 工具。

  Ctrl shift face 官网

  而那段著名的 Deepfake 视频就是采用「DeepFaceLab」制作的。这段著名的视频中比尔·哈德在不知不觉中变成汤姆·克鲁斯,而且还是阿汤哥年轻时的样子。

  你看得出来他们在一瞬间换脸了吗?

  目前这款工具包已经在 GitHub 上获得了五百多星,并且它支持最低 2G 显存的 64 位像素学习。也就是说,你并不需要太多的算力就能够在自己的电脑上进行 AI 人脸学习。

  DeepFaceLab 能在 2G 显存 64 位像素下进行 AI 换脸

  DeepFaceLab 唯一的安装要求就是对应版本的显卡驱动,甚至不需要 CUDA 和 CuDNN。并且该软件还有中文官网以及详细的中文安装说明和教程,同时还自带许多人脸图片数据。

  根据其教程显示,虽然没有可视化的操作界面,但是其操作流程还算简单易懂。完全没有代码基础的小白只要认真随着操作步骤操作就能很快速的上手。

  Ctrl shift face 官网提供了三档氪金服务

  并且只需要最高 10 美元/月,就能够使用畅享其所有的换脸数据库,这可真的算是良心价了。

  这里值得注意的是,虽然这款工具包对于算力的基本要求非常低,但前面我们也提到过,越高的显存和越长的 AI 学习时间才是高质量 Deepfake 视频的保障。所以,如果需要达到上面那种一瞬间换脸的程度,恐怕需要你电脑中昂贵的 GPU 长时间的运转才能做到。

  Deepfake 只是娱乐,千万不要触犯法律

  如今,Deepfake 的工具和开源包非常的多,许多极客和计算机爱好者都喜欢使用不同的软件和工具制作自己的 Deepfake 视频或音频。

  但是千万别忘了,Deepfake 这个专有名词天生就带有欺骗性质,如果滥用会对个人隐私、媒体公信力、司法裁决等多方面带来困扰。

  比如之前硅谷洞察报道过的,2018 年 4 月,美国前总统奥巴马说“特朗普是个彻头彻尾的笨蛋”的视频,在推特上获得超过 200 万次的播放,2019 年 5 月特朗普在推特上转发并嘲讽的美国众议长佩洛西说话结巴的视频引发大量关注,最终都被证明是由深度伪造技术生成的伪视频。

使用男演员图像伪造的奥巴马发表讲话视频,图片来自于网络

  使用男演员图像伪造的奥巴马发表讲话视频,图片来自于网络

  这些虚假信息除了将直接影响个人信誉外,甚至还可能引发“蝴蝶效应”导致整个社会秩序的紊乱。

  而 2018 年在国内出现的换脸 App「ZAO」,在经历上线三天的火爆后,立马被下架封杀。并且国内在去年年底相继发布《网络音视频信息服务管理规定》、《网络信息内容生态治理规定》等法规,明确不得利用深度学习、虚拟现实等新技术新应用从事法律、行政法规禁止的活动。

  曾红极一时的换脸 App ZAO,图片来源于网络

  除了这些衍生的社会影响外,Deepfake 也给人脸识别这项技术本身带来了一个无法逾越的挑战。

  2018 年,「Deepfake」这一概念的提出者 Sébastien Marcel 和 Pavel Korshunov 两位科学家就表示根据目前人脸识别技术的发展水平,在相同模型下,同等训练时长的人脸识别对 Deepfake 视频的识别错误率高达 95%。也就是说,当前已有的先进人脸识别模型和检测方法,在面对 Deepfake 时基本束手无措。

  两位科学家指出,换脸技术的不断发展的同时,Deepfake 的造假能力也在随之提升,两者会在很长的时间里「并驾齐驱」。

  也就是说,将人脸识别技术比喻为蜘蛛侠的话,那么 Deepfake 就是附在他身上的「毒液」。它会随着本体力量的增强而不断增强,若用于正道它会成为不小的助力;但如果心存邪念,它强大的力量可能连本体都会吞噬。

  所以在最后,小探想要提醒大家。Deepfake 对于人脸识别技术的发展是一种鞭策的力量,并且可以让一些「科技宅」很好的测试自己电脑 GPU 的算力,但是如果使用这项技术从事违法犯罪,那可就是本末倒置了。

  参考链接:

  https://www.patreon.com/ctrl_shift_face

  https://github.com/iperov/DeepFaceLab

  https://www.bilibili.com/video/BV16x411R73Q?from=search&seid=3033760871383602659

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注