人工智能技术从诞生伊始就被冠以悬在人类头上的达摩克利斯剑之名。
在游戏《赛博朋克 2077》(Cyberpunk 2077)中,超级科技企业荒坂集团制霸全球,掌控着大部分国家的政府及命脉,渗透在人们生活的每个角落。它如同坐落在夜之城的庞然巨兽,敲骨吸髓地汲取着整个星球的养分。
对此我们不禁感到担忧?作为举足轻重、甚至可能影响人类整体未来走向的 AI 技术,若掌控在寥寥几家科技巨头手中,能否避免潜在风险继续普惠大众、造福人类呢?
耐人寻味的是,当今人工智能的“领头羊”几乎都坐落在夜之城的原型 —— 美国加利福尼亚州。这些曾经野心勃勃并急速扩张的初创企业,现在已经成长为无可撼动的行业巨鳄。自 2020 年以来美国对互联网巨头的反垄断突然升级,去年 10 月 众议院反垄断小组委员会公布了一份长达 449 页的重磅报告 ——《数字市场的竞争调查》(Investigation of Competition in Digital Markets),认定这些当代科技“大亨”GAFA(Google, Amazon, Facebook, Apple)利用在业务中积累的巨量数据,滥用垄断权力为扩展相关领域获取巨大优势,造成不公平的恶性竞争。
怎样打击日渐严峻的 AI 技术垄断?如同强子对撞机对物理学的影响,美国政府委员会目前正在考虑一项创新举措,它将令人工智能领域产生革命性的转变。
由斯坦福大学教授李飞飞等顶尖专家组成、美国家人工智能研究资源工作组 (National AI Research Resource Task Force, 简称 NAIRR) 正在研究如何开发「国家研究云计算框架」(National Research Cloud,简称 NRC)。让学者们能够获得目前由少数科技巨头掌握的计算资源 —— 访问他们的云数据中心,和用于研究的公共数据集,为基础和非商业 AI 的发展注射入一针强心剂。
20 世纪 60 年代中期,美国政府在公共科学的投资接近 GDP 的 2%,回报同样惊人,今天美国任何一个科技巨头都是站在联邦研发投资 (research and development, R&D) 的肩膀上发展起来的。然而自冷战时期以来,美政府对基础科学研究的投资率大幅减少。中国发展研究基金会的文章指出,美国对研发投入的高峰期在 20 世纪 60 年代,接近联邦预算的 12%,该比例之后一路走低,目前只有 4% 左右。据报业辛迪加(Project Syndicate)数据,美国科研支出已经下降到 GDP 的 0.6%,世界排名第 12 位。而中国正在加倍加大对科学的投资,科研项目支出约占 GDP 的 1.3%,从经济规模的角度相对比,这一比例是美国的两倍。
国家研究云计算框架(NRC)的概念其实很简单,是由美国联邦政府提供 AI 研究所需数据和计算资源。随着工业界和学术界发展愈渐失衡,学者们想要获得这些资源越来越难。为他们拓宽访问渠道的最佳方式,是由政府部门为学者科学家们提供资金支持短期访问现有的云数据,同时构建长期公共云计算系统。
反对声
消息一出犹如平地惊雷,引发激烈争议,支持声和抵制声都纷涌而至。NRC 甚至诱发了科技巨擎怀疑论者和自由市场主义者的“应激”反应,质疑的“炮火”主要密集攻击两点:
-
科技巨擎怀疑论者担心这会增加大型科技公司“裹挟”的能力,借助 AI 技术损害弱势群体的权益,因此拒绝接受 NRC 的设想。
-
自由市场主义者则认为政府扮演的角色过于激进,“伸手”太长管的太宽。学术研究完全可依赖私营技术公司提供的商业云服务。
面对反对的呼声甚嚣尘上,斯坦福大学三位学者(Daniel E. Ho, Jennifer King 和 Russell C. Wald)公开发文驳斥:“你们错了。”
斯坦福大学“以人为本”人工智能研究所 (Stanford Institute for Human-Centered AI,简称 HAI) 在 2020 率先发起呼吁建立人工智能研究资源工作组(NAIRR)。过去的 10 个月里,这里汇集了全美最优秀的科学家深入研究如何架构 NAIRR,最终呈现了一份“重量级”白皮书《构建国家人工智能研究资源:国家研究云蓝图》(Building a National AI Research Resource: A Blueprint for the National Research Cloud.)
“我们的调查结果就是给反对者最有力的回应。”
“美国需要国家研究云”
“我们想对那些担心 AI 研究力会集中在大科技公司的人说: 目前已经是这种情况了。如果最终不能成功建立国家研究云,这只会进一步巩固私营企业在人工智能领域的主导地位。”
“最好的服务器都在工业界。”深度学习(Deep Learning)是人工智能中机器学习的重要分支,也是美国国家研究云的主要着力点。代码运行需要巨大的算力支撑,而算力是靠钱“烧”出来的。一个优秀算法模型的诞生,需要数十万、乃至数百万美金的投入。根据 OpenAI 的资料显示,过去 7 年里,人工智能头部公司的计算量飙升大约 30 万倍。高昂的成本让学术界难以应对,只有谷歌、亚马逊这种巨头才供得起数据中心每年数十亿美金的研发经费。
在经费和设备的双重差异下,计算机人才纷纷投奔大公司的怀抱。十年前,人工智能专业博士进入学术界和工业界的可能性是一样的。但现在,他们选择工业界的可能性更高,是学术界的两倍!这种失衡会有两个严重后果:
首先,私营部门的研究方向受制于科技公司的决策、监督和否决权,最终造成研究短视。像之前 Facebook 驳回了旗下产品 Instagram 对年轻女性有危害问题的内部讨论。第二,私营部门的科研工作因受利益挟制,只能指向宽泛不足的应用领域。
一切正如数据科学家杰夫・哈默巴赫尔 (Jeff Hammerbacher) 所说:“ That sucks!我们这代里最聪明的人都在思考如何让人点击广告!”哈默巴赫尔是扎克伯格在哈佛时的同学,Facebook 的数据团队正是由他一手创建的。
毋庸置疑,国家研究云是解决核心矛盾的最佳办法。因为它可以拓宽企业环境之外的 AI 访问资源。研发、评审 AI 科研人员可以借助国家研究云的力量“超越”狭隘的技术领域(包括自然科学、社会科学和人文科学)。在保证隐私前提下释放地球观测、劳动力市场和司法系统的数据 —— 当前只有少数人有权限访问 —— 这将引导人工智能解决更多样复杂且迫切的社会问题。
对于那些视政府部门如“仇敌”、私营部门如“亲朋”的异见者,三位学者表示:
仅依靠私营部门只会阻碍 AI 产业整体发展、造成减缓创新,最终损害的将是的民众利益。公共部门对促进基础研究和成本效益方面至关重要。以卫星图像为例,2008 年前,美国地质调查局 (U.S. Geological Service) 对每张卫星图像收取约 600 美元的费用,随着后来数据开放免费提供图像,这大大推动了计算机视觉在研究全球变暖、栖息地改变、贫困和城市扩张方面的应用,每年产生 30 – 40 亿美元的效益。
文中指出,在计算领域,联邦政府对建立运尖端计算设施经验丰富值得信任,从橡树岭国家实验室的 Summit 系统(2018-2020 年世界上最强大的超级计算机),再到美国国家科学基金会 (National Science Foundation) 投资高性能计算网络,与私营部门合作,在应对 COVID-19 等重大事件中发挥了强大的作用。依赖商业云服务的成本是构建自己系统的 3 到 8 倍。国家公共云不可能一蹴而就,但它带来的回馈,会让前期的努力和投入都变值得。
美国迫切需要建立一支能够在紧要关头随时投入使用、监控和监管 AI 系统的公共部门“战队”—— 实现这一目标的最好方式就是国家研究云。早先遗留的 IT 系统持续困扰着美国当局,政府问责局 (Accountability Office) 曾指出的,截止 2016 年,美国防部仍在使用 8 英寸软盘来协调足以毁灭世界的核力量”。
“NAIRR 是联邦政府“洗牌”AI 领域的机会,不该沦为技术怀疑论者和唯市场论者之间的儿戏,零和博弈没有赢家,都是输家!”
实际上技术垄断之下,这些科技“寡头”也不会是永远的胜利者。
垄断无益
今年 7 月美国反垄断执法机构首次对移动应用商店提起诉讼,指控谷歌利用 Google Play 商店向销售应用的开发商收取过高佣金,故意屏蔽安卓系统上其他竞争对手的应用商店。令人诧异的是,世界上为数不多比谷歌规模还大的公司 —— 亚马逊竟也成了受害者。要知道在反垄断的诉讼案中,亚马逊可是被告席上的“常客”。
“国家研究云将受益每个人。”白皮书中的原文这样写到:“NRC 将提供优廉的高端计算资源、大规模政府数据集的安全云环境、和必备的专业知识,通过资源之间的密切合作受益学术界、政府和工业界。以扩大 AI 研究中关键资源的获取渠道,NRC 将提供支持基础科学人工智能研究、人工智能创新的大众化,以及继续提升美国在人工智能领域的领导地位。”
眼下,科技巨头对 AI 的掌控大有不可阻挡之势。HAI 认为,一个健康且来源广泛、包容度高的创新生态系统 —— 国家研究云计算框架是扭转局面的唯一钥匙。打破“卡脖子”的数据壁垒将对实现 AI 的产研平衡产生深远影响。
目前“国家研究云”仍在构想阶段,诸如“组织架构、实施主体、资金安排、合作机制、硬件布局、数据范畴、访问权限”等许多难点并未攻克,此外还需要强力的“数据标准化”等公共政策和持续的资源支撑,以及大量持续的资金投入。
《构建国家人工智能研究资源:国家研究云蓝图》(Building a National AI Research Resource: A Blueprint for the National Research Cloud.)的作者:
-
Daniel E. Ho, William Benjamin Scott 和 Luna M. Scott 法学教授,斯坦福大学以人为本的人工智能研究所(HAI)副所长。
-
Jennifer King,斯坦福大学以人为本的人工智能研究所(HAI)的隐私和数据政策研究员。
-
Russell C. Wald,斯坦福大学以人为本人工智能研究所(HAI)的政策主任。
-
Christopher Wan,斯坦福大学法学博士/MBA 预读生,是“建立国家人工智能研究资源”报告的合著者,为本文提供了研究和编辑协助。
斯坦福大学“以人为本”人工智能研究所 (Stanford Institute for Human-Centered AI,简称 HAI),由华裔斯坦福大学人工智能科学家李飞飞和哲学教授约翰・埃切曼迪联合担任院长,致力于推动人工智能跨领域合作,让科技以人为本,回归人性,加强对人工智能社会影响力的研究。
国家人工智能研究资源工作组 (NAIRR) :美国国家智库,由 12 名来自学术界、政界和产业界尖端专家组成,斯坦福大学李飞飞教授,谷歌云 Andrew Moore, 艾伦人工智能研究所 Oren Etzioni 等。旨在让 AI 科研人员旨科研人员获得更多政府数据、计算资源和其他工具。
链接:
-
https://thehill.com/opinion/technology/580594-do-we-really-want-facebook-and-amazon-to-rule-ai?rl=1
-
https://hai.stanford.edu/sites/default/files/2021-10/HAI_NRCR_2021_0.pdf
-
https://www.project-syndicate.org/commentary/biden-infrastructure-plan-increases-federal-science-funding-by-jonathan-gruber-and-simon-johnson-2021-04/chinese?barrier=accesspaylog
-
https://judiciary.house.gov/uploadedfiles/competition_in_digital_markets.pdf?utm_campaign=4493-519
-
https://www.cdrf.org.cn/fangjin/5545.htm
-
https://picture.iczhiku.com/weixin/message1595243731316.html