郭一璞 乾明 发自 凹非寺
量子位 报道 公众号 QbitAI
2020,AI 的研究会有哪些突破?
2020,AI 的应用又会有什么变化?
吴恩达 DeepLearning.ai 旗下的 THE BATCH 刊物,分享了包括 Yann LeCun、李开复、周志华、还有他们的老板吴恩达在内的 10 位 AI 大佬的新年寄语,以及对 AI 在 2020 年能有什么突破的“新年愿望”。
一起来看看吧~
吴恩达:保持学习和好奇心
在这份「新年寄语篇」的开头,吴恩达作为发起人开场,总体是一些关于学习新知识的碎碎念。
吴恩达说,他每年冬天的假期都会围绕一个新的主题进行学习。
比如 10 年前的那个冬天,他的学习主题是教育学,虽然当时他拖着十分沉重的书箱在机场赶路,但对教育学的研究的确为后来在线学习平台 Coursera 的成立起到了帮助。
而去年,当时他的宝贝女儿 Nova 还在母亲腹中,吴恩达就在冬天读了很多育儿书籍。
而这个冬天,吴恩达说他在研究续命——包括遗传学、还有夸克什么的在内的新兴科学,还实地探访去拜见了自己 101 岁的爷爷,爷爷用亲身经历告诉他:
长寿的秘方,就是保持好奇心。
照这个规律,吴恩达觉得自己的关注者里会有不少人能在 101 岁之后依然活蹦乱跳的。
最后,吴恩达祝大家过一个充满好奇心、学到新东西、有爱的 2020 年。
李开复:AI 将在更多行业落地
李开复的新年寄语主题,是AI 无处不在。他说:
人工智能已经从发现的时代到了落地的时代。在我们主要在中国的投资组合中,我们看到了在银行、金融、运输、物流、超市、饭店、仓库、工厂、学校和药物研发中使用人工智能和自动化技术的应用。
但是,从整体经济的角度来看,只有一小部分企业开始使用 AI,这表明还 AI 有巨大的增长空间。
我相信,在人类技术进步的历史上,AI 将与电力同等重要。在未来的一二十年中,人工智能将渗透到我们的生活和工作中,从而提供更高的效率和更智能的体验。现在正是企业、机构和政府充分拥抱 AI 并推动社会前进的时机。
我对 AI 在医疗和教育上的影响非常兴奋。这两个行业已经为 AI 的部署做好了准备。
我们投资了一家使用 AI 和大数据优化供应链的公司,从而缓解了超过 1.5 亿中国农村人口的药品短缺情况。我们也在投资用深度学习来生成化合物的药物研发公司,以将药物发现时间缩短三到四倍。
在教育方面,我们看到一些公司正在用 AI 改善学生的英语发音,帮助学生提升成绩,用个性化和游戏化的方式帮助学生学习数学。这将使教师从日常工作中解放出来,并使他们能够花时间为新兴一代的学生做更多鼓励性的工作。
我希望看到更多明智的企业家和公司在 2020 年及以后的几年中开始使用 AI 来帮助他们获得更大的好处。
LeCun:自监督学习带来 AI 革命
深度学习三巨头之一、图灵奖得主 Yann LeCun 的新年寄语主题,是Learning From Observation。
让人忍不住把它翻译成“格物致知”。
“格”的是开车这件小事。LeCun 提到,人类学开车只要几十个小时,但是模仿学习算法需要学几十万个小时,强化学习算法甚至需要学几百万个小时,这里面一定有什么问题。
人类可以高效学习,是因为我们人在脑海里建立了世界的模型。婴儿很难和世界互动,但是在刚出生的几个月里,他们通过观察吸收了大量关于这个世界的背景知识。显然,大脑的很大一部分被用在了理解世界的结构,并预测一些无法直接观察到的事物,比如未来才会出现的东西、或者被隐藏的事物。
因此,AI 的前进方向,就是自监督学习(self-supervised learning),它和监督学习类似,但是并不会训练系统去把数据分类,而是我们隐藏一些部分,让后让机器预测丢失的部分,比如把视频的一些帧抹掉,然后训练机器根据剩余的帧来填补被抹掉的部分。
最近,这种方法在 NLP 方面非常成功。诸如 BERT、RoBERTa、XLNet、XLM 之类的模型以自监督的方式进行训练来预测文本中缺少的单词,它们在所有主要的自然语言基准测试中都有记录。
希望在 2020 年,自监督学习能够用在视频和图像上。它会在视频这类高维连续数据上创造类似的革命吗?
其中一项严峻的挑战是应对不确定性。像 BERT 这样的模型无法判断句子中丢失的单词是“猫”还是“狗”,但是它们可以产生概率分布向量。对于图像或视频帧,我们没有一个好的概率分布模型。但是最近的研究非常接近,或许我们很快就会发现这样一个模型。
这样,我们就能用很少的视频训练样本,来实现非常好的性能预测、动作预测,而这在以前是不可能的。
当这个想法实现的时候,2020 年就会是 AI 领域非常激动人心的时刻。
周志华:方法创新,方针明确
南京大学周志华教授对 2020 年有三个希望:
- 希望能够出现深度神经网络以外的高级机器学习技术。神经网络已经被许多研究人员、工程师和从业人员研究并应用了很长时间,其他机器学习技术为创新提供了相对未开发的空间。
- 希望 AI 可以涉足更多领域,为人们的日常生活带来更多积极的变化。
- 希望研究人员、工程师和从业者们对于如何采取措施防止 AI 技术的错误开发和滥用进行更多的思考和讨论。
Anima Anandkumar:模拟的力量
Anima Anandkumar 是英伟达机器学习的总监,也是加州理工的计算机教授。
Anandkumar 教授提到,在仿真环境学习中训练算法会让网络更为强大,并且能模拟各种复杂的情况,在一些情况下可以解决研究人员数据不够的问题。
她所在的加州理工已经用物理模型来模拟真实数据,用深度学习进行地震预测的研究;英伟达也推出了仿真平台 Isaac。
她希望,2020 年 AI 科学家们能认识到在模拟环境中进行训练的价值,并在新的一年产生更为重大的 AI 进步。
Oren Etzioni:工具创造平等
Oren Etzioni 是艾伦人工智能研究所的首席执行官、华盛顿大学计算机教授、Madrona 资本合伙人。
他认为,AI 界花了很多时间讨论算法的公平和透明性,但在应用上,AI 还可以为社会提供更多帮助,比如为行动不便的人提供无障碍技术,解决教育、流浪者、人口贩卖的问题,AI 能对人们的生活质量产生巨大的积极影响,但现在 AI 界对此的研究和探讨只浮于表面。
因此,他希望 2020 年 AI 界能用切实的手段让这些处于不利地位的人受益,让世界更公平。
Chelsea Finn:泛化的机器人
Chelsea Finn 是斯坦福计算机科学与电气工程助理教授。
她认为,目前的许多 AI 技术都能在围棋等特定任务上取得非常好的成绩,但在泛化方面做得还不够,无法用一个机器人来完成多个任务。
比如,识别 ImageNet 上的图片需要一个模型,但如果机器人需要与环境交互,那为每个任务都创造一个 ImageNet 那么大的数据集是不切实际的。
因此,她也在进行更多赋予机器人泛化能力的研究。如果强化学习的临界质量发展和泛化有所突破,会是非常令人振奋的事情。如果能应对这些挑战,机器人会比现在的更加智能,而不仅仅是停留在实验室里。
David Patterson:快速训练与推理
David Patterso 是加州大学伯克利分校的计算机科学教授,RISC-V 国际开源实验室负责人,也是 ACM 和 IEEE 的 Fellow。
他说,过去一年,阿里巴巴、 Graphcore 和英特尔等公司都在研发专门的人工智能处理器,而这些芯片将慢慢进入研究实验室和数据中心。
他认为,投资数十亿美元打造新颖的人工智能硬件将在 2020 年初见成效。
并希望人工智能社区能接受其中最好的芯片,来推动这个领域朝着更好的模型和更有价值的应用方向发展。
Dawn Song:要对数据负责
Dawn Song 是安全领域的顶尖学者之一,1996 年本科毕业于清华大学,现在是加州大学伯克利分校(UC Berkeley)计算机科学和电子工程教授,也是 Oasis Labs 首席执行官和联合创始人。
她认为,人们对敏感数据的收集正在迅速增加,几乎涵盖了人们生活的方方面面。但用户几乎无法控制他们生成的数据如何被使用。与此同时,企业和研究人员在利用数据方面面临着诸多挑战。
在她看来,这种数据收集方式将个人和企业置于危险之中,她希望 2020 年应该是为负责任的数据经济打下基础的一年。
这需要创造新的技术、法规和商业模式。Dawn Song 认为,2020 年在在机器学习方面仍然存在更大的挑战,要打造可扩展的系统来为实际部署大型、异构数据集服务,联邦学习的进一步研究和部署对于某些用例也很重要等等。
Richard Socher:信息海洋已经沸腾
Richard Socher 博士毕业于斯坦福大学计算机系。2016 年,自己创办的公司被 Salesforce 收购后,加入 Salesforce,现在是 Salesforce 的首席科学家。
他认为,如何处理铺天盖地的事实、意见和观点仍然是一个挑战。
比如,在你没有读过一个冗长的文档之前,你很难知道你会在里面找到什么信息。而且,想要知道某个特定的陈述是否正确也非常困难。
在他看来,自动提取摘要可以解决这些问题,2020 年,这一技术将会迎来重大发展,改变我们消费信息的方式。
不仅能帮助人们应对不断涌现的新信息,而且还能让人们进一步拥抱人工智能的巨大潜力,创造一个更美好的世界。