头像秒变像素风,宅男大叔自学AI打造大师级水准,火爆推特

  梅宁航发自凹非寺

  量子位报道公众号 QbitAI

  最近,一位日本宅男大叔佐藤做了一个 AI 生成肖像画的网站 AI Gahaku,10 天内用户访问量从 0 暴增到 100 万,引爆推特。

  简单易操作,上传一张人脸照片,就能生成一张大师级肖像画

  而比技术更神奇的是佐藤自己,因为他是自学 AI 做出来的,不得不佩服的宅男创造力。

  佐藤患有阿斯伯格症——也被俗称成“社交恐惧症”,名副其实的天才病,一般来说,此类患者会在某个领域具有特殊潜能,但不适应普通人的生活。

  当然,佐藤的技能点就点在了 AI 上。

  pix2pix,TensorFlow 内置的 cGAN 模型

  让大叔此次闻名的 AI 技术,就是是大名鼎鼎的 GAN 的变种。

  此次的人脸肖像画生成技术,就是大叔在 TensorFlow 内置的 cGAN (条件生成对抗网络)中的pix2pix模型上改造而来。

  不同于 GAN 的技术通用性,cGAN 更强调特定场景下的发挥,比如 AI Gahaku,就只能针对人脸,如果用户上传的是猫脸,则是无法生成结果的。

  GAN 的特点在于损失函数的自行计算和自动更新,这使得 GAN 本身具有和迁移学习结合的潜质,在近年来的发展路径上看,更多是把 GAN 当做手段,去实现迁移学习提出的目标,迁移学习为应用 GAN 提供具体指向。

  TensorFlow 的内置 pix2pix 的是基于 cGAN 的图像对图像翻译的模型,模型本身已经成熟,直接调用便可运用到对黑白图像着色、图像风格变化等场景的使用上来。

  具体到大叔的使用上,利用 pix2pix 模型,大叔其实是将模型限定在大师肖像画的生成上,这也体现了模型本身强大的扩展性。

  如何使用,都取决于你自身。

  在佐藤的另一款作品 PixelMe 中,同样使用 pix2pix 技术,但是生成的是 8bit 的像素风格头像,一个模型,多种用途。

  当然,实际效果因人而异,毕竟严格来说,大叔是在对既有模型进行二次开发,原有的算法和数据结构并未改变,因此性能和效果受到原有模型的限制。

  宅男的 AI 进阶之路

  大叔人生经历可以说复杂,从大学退学后,先后干过面包师,参加过护士学校培训课程,但觉得都都不太适合自己,直到他决定运用自己的才智,投身到 AI 的事业当中去。

  那说干就干,就从 TensorFlow 学起吧。

  借助 Google Colab 的算力资源,大叔从头按着 TensorFlow 教程学起,不过大叔也确实适合干 AI,而不是去蒸糕点。

  在学习过程中,佐藤找到了适合自己的方向,迁移学习和 GAN,可以较好的实现图像的再生成,使用不同的图像训练数据集,可以针对具体场景进行学习和生成。

  GAN 属于典型的非监督学习方法,核心原理是让两个神经网络进行“对抗”,通过不断优化参数来得到最优结果,自我博弈。

  这种技术主要用在计算机视觉领域,这也是佐藤选择 GAN 的主要原因。

  得益于 Google 的慷慨,大叔使用的网站服务器和算力资源都较为便宜,大约为一天 20 美刀,大叔表示,在可接受的能力范围之内,短期不会寻求商业化。

  AI for Everyone!

  在红了之后,大叔也没飘。

  他认为这是在做自己感兴趣的东西,而不是为了经济利益。

  出于对技术的热爱,佐藤开始了自己的 AI 之路,并在两年之后便能上线应用。

  这份为梦想而不懈努力的奋斗精神,才是真正值得我们学习的。

  毕竟,不是每个人有勇气去自学 AI。

  参考链接:

  1. https://cloud.google.com/blog/products/ai-machine-learning/using-google-cloud-platform-free-tier-to-scale-out-an-ai-service
  2. https://www.tensorflow.org/tutorials/generative/pix2pix
  3. https://ai-art.tokyo/en/#/https://pixel-me.tokyo/en/

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注