只凭 DNA 就还原出罪犯的长相,还是 3D 版的?
没错,只需要一个 AI 模型,就能还原出这人的年龄、肤色、瞳色、甚至整个 3D 头像……
即使在此之前,没有任何人目击过这个嫌疑犯也没关系,用它合成的照片直接就能发布通缉令。
据提供这项技术的公司介绍,他们之前用这种手段合成过一张照片,最后捉到的嫌犯和照片中长得几乎一模一样。
听起来不仅高科技,甚至有点魔幻了。
消息一出,不少网友闻讯赶来围观,但他们很快发现了不对劲的地方。
从这家公司其他的 DNA 表型分析照片来看,嫌犯和照片长得比较像,更多情况下是一种“巧合”。
他们还扒出这家公司之前发布过的一张罪犯照片,两人除了性别以外,可以说是长得毫不相干……
那么这种技术,真的能用在罪犯通缉这么严肃的事情上吗?
一个备受争议的例子
事情还要追溯到 2019 年冬天的一个凌晨,加拿大埃德蒙顿警察局接到了一个报警电话。
一位 20 多岁的女性被强奸后丢在了路边,全身只有一件衬衫。
那天的气温接近零下 20 多度,她一度被冻得失去知觉,因此凌晨 5 点多醒来后才找到路人报了警。
由于嫌疑人带着面罩,又穿着厚厚的外套,受害人没有看清他的长相,只知道他说话带点口音、身高 1.63 米(5.3 英尺)左右。
案件的侦查也一直没有进展,就这样过去了 3 年。
就在上周二,事情迎来了新转机,加拿大警方找到一家专门从事 DNA 分析服务的公司,对该案犯人留下的 DNA 进行表型分析,得到了一张 3D 人像。
警方把它作为通缉令,发布在了其官网和推特等社交平台上,并声称这是“在所有调查途径都用尽后的最后手段”。
不过老实讲,从通缉令上可以看出的信息并不多,能确定的似乎只有他是一名年轻的黑人男性。
其他特征像嫌疑人的具体年龄、发型、是否有纹身、是否有疤痕都不得而知。
而且,让加拿大警方没想到的是,通缉令一经发布,就在网上引起了轩然大波。
许多隐私专家表示,警方这一举动是极其有害的,很有可能加剧种族偏见和侵犯 DNA 数据库隐私。
美国电子隐私信息中心的全球隐私顾问 Callie Schroeder 就转发了该推文,并对 3D 人像的实用性提出了质疑:
如果你看到这条消息,你会如何思考?难道怀疑看到的每个身高 1.63 米的黑人吗?
他还进一步解释:不了解 DNA 表型知识的人看到合成图像,很可能会相信嫌疑人长得和 3D 人像完全一样。
他们意识不到这只是一个近似值,年龄、体重、发型和脸型都可能相差很大,而且肤色、发色、眼睛颜色也可能有细微区别。
在 reddit 论坛上,热评前几也几乎都是质疑声。
我不明白这怎么可能有用。
当警察缺乏必要的证据时,这将被操纵用来专门针对某人,或者只是为了骚扰他们不喜欢的人,这个主意太可怕了。
有网友甚至还举了自己因为和通缉令上的头像长得相似,被误认为是嫌疑人的例子,力证这一行为的不靠谱:
最后,在巨大的舆论压力下,加拿大警方不得不删除了这一通缉令,并表示会继续寻找其他方法破案。
不过话说回来,用 DNA 还原 3D 人脸,真的没有前途吗?
DNA 还原 3D 人脸,什么原理?
给警方提供 DNA 还原 3D 人脸照片的这家公司名叫 Parabon NanoLabs。
公司成立于 2008 年,大约在 2015 年初推出了一个名叫 Snapshot DNA 的 DNA 表型分析工具,可以基于 DNA 推测一个人的肤色、发色和种族等信息。
这项工具一发布,就受到了警方的热烈欢迎,当年美国国防部还给 Snapshot DNA 专门提供了 200 万美元的研发资金。
2015 年 6 月,Snapshot DNA 成功协助美国警方侦破了一起长达三年的谋杀案,如今罪犯已经在监狱服刑。
同时一些专家也认为,Snapshot DNA 在一定程度上具有科学依据,包括人类的发色、瞳色、肤色以及身高都与基因有关。
BUT,这项技术发布以来一直在遭到质疑 ——
毕竟 DNA 既不能解释由于吸烟、饮酒、受伤(包括纹身)等引起的个人外貌变化,甚至连实际人脸大小都无法预测。
生物信息学 & Snapshot 部门技术主管、哈佛大学博士 Ellen Greytak 对此回应称,尽管这项技术没有将一个人的所有细节特征还原出来,但“提供了一种针对罪犯长相的描述”。
Ellen Greytak 进一步介绍称,Snapshot 是基于机器学习技术来根据 DNA 合成 3D 人像的,训练数据来自公开 DNA 数据集和对应的人脸长相。
但对于 Snapshot DNA 背后的详细算法原理,Parabon NanoLabs 拒绝公布。
当然,目前学术界已经有不少针对类似算法的研究。
此前发表在 PNAS(美国国家科学院院刊)上的一篇文章就试图通过 1061 个来自不同种族和年龄段的志愿者 DNA / 人像样本,训练出仅凭 DNA 还原肤色、身高、年龄等信息的 3D 模型。
虽然这个 AI 经过训练后,脸型和肤色看起来比较接近:
但从实际数据来看,DNA 对于年龄等数据的预测准确度还有待提升:
所以,这些公开的 DNA 数据是怎么来的?
主要来源于两个家谱分析网站 GEDmatch 和 FamilyTree DNA。
在这些免费公开的网站上,人们只需要上传自己的 DNA 信息,就能知道哪些名人 or 网友和自己有亲属关系。
甚至如果你上传照片和出生年月等信息,各种家谱网站还能帮你整理好一整个系的图谱,但这些信息如今却被用在训练 AI 合成模型上了。
如此来看,这项技术距离真正精确用上还有不少的路要走。
参考链接:
-
[1]https://www.pnas.org/doi/10.1073/pnas.1711125114
-
[2]https://www.edmontonpolice.ca/News/MediaReleases/DNAPhenotypeOct4
-
[3]https://www.edmontonpolice.ca/News/MediaReleases/StatementonDNAPhenotyping
-
[4]https://www.vice.com/en/article/pkgma8/police-are-using-dna-to-generate-3d-images-of-suspects-theyve-never-seen
本文来自微信公众号:量子位 (ID:QbitAI),作者:萧箫、羿阁