12 月 24 日消息,现在,人工智能已经以各种方式融入了我们的生活中。但随着被解决的问题逐渐增多,人工智能也开始逐步走进深水区,面临更加复杂的场景和需求。
那么,当前的人工智能算法到底走到了什么阶段?
今天技术的创新和创造越来越多的有点像工业化流水线,我们能够用更多系统把算法创造的各个环节整合打通,并且在这个过程中通过数据的输入,算力的支撑,持续地规模化地生产技术创新的结果。
站在 MEET 2022 智能未来大会的现场,商汤科技的联合创始人兼副总裁杨帆这样解释道:
技术创新在未来会走向一个更加通用、智能、低成本、高效的过程,技术创新本身的模式在持续演化和进步。
我们越来越需要通用基础设施,以此为将来更大、更广范围内的人工智能产业创新提供支撑和服务。
那么,人工智能产业的下一个阶段又是什么?
现阶段还面临着怎样的挑战和趋势?
AI 业界又该采取什么样的措施来响应这样的趋势?
……
为了完整展现杨帆关于上述问题的答案和思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。希望能够给你带来更多的启发与思考。
关于 MEET 智能未来大会:MEET 大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。MEET2022 采取线上参会形式,20 余家直播平台和渠道转播大会直播,200 万行业用户线上参会。除量子位微信、头条号、知乎、微博等全媒体矩阵外,新华社、凤凰科技、腾讯科技、澎湃新闻等数十家主流媒体纷纷报道大会及相关内容,线上曝光量累计超过 2000 万。
要点
-
人工智能产业时的最大价值不是去形成某一个闭环的产业、特定的消费行业、或者说某一个特定的生产型行业,而是说本身就是类似于催化剂一样的形式。
-
我们越来越需要通用基础设施,以此为将来更大、更广范围内的人工智能产业创新提供支撑和服务。
-
相比于之前算法比较依赖于科学家个人,在过去五年,在我们对人工智能产业的逐步熟悉的今天,人工智能是对于架构、算力、数据这些外化型要素强依赖的一种技术。由此会看到今天技术的创新和创造越来越多的有点像工业化流水线,我们能够用更多系统把算法创造的各个环节整合打通,并且在这个过程中通过数据的输入,算力的支撑,持续地规模化地生产技术创新的结果。
-
技术创新在未来会走向一个更加通用、智能、低成本、高效的过程,技术创新本身的模式在持续演化和进步
-
在人工智能时代系统第二重要,更重要的是算法本身。
-
把模型算法想象成乐高积木块,我们提供更多基础的积木块,支撑产业内的同仁一起用它打造更多更有价值的模型结果。
以下为商汤科技联合创始人兼副总裁杨帆演讲全文:
人工智能逐步走入深水区
感谢量子位的邀请,今天来跟大家聊一聊商汤最近在做的一些事情。
量子位今天的主题特别好,“因为看见所以相信”,而且我觉得这话反过来说也挺有道理,“因为相信所以看见”,都很有味道。
所以,今天在这里想跟大家分享一下,在商汤最近两年的人工智能产业发展过程中,我们都看见了什么,以及我们相信什么。
从 2015 年、2016 年以来,过去的六七年时间里,人工智能产业或者说技术对于各个行业赋能的落地,在中国取得了非常大的进展,而且这个进展可以说领先于全世界,这绝非幸之,背后的原因非常多。
其中最重要的一个就是,当我们去看人工智能的产业时,它最大的价值不是自己去形成某一个闭环的产业、某一个特定的消费行业、或者说某一个特定的生产型行业,而是说本身就是类似于催化剂一样的形式。
通过这种技术的创新能够给我们整个国家经济、各个产业提供一种效率的提升、新场景的挖掘和新的价值。
在 2017 年发的人工智能的白皮书中讲到:到 2030 年,中国人工智能核心产业规模将是一万亿,带动上下游相关产业规模十万亿,最有价值的是十倍的杠杆,这也是我们去看 AI 产业最大的价值。
最近一两年我跟很多朋友聊,大家也在问一个问题,就是人工智能似乎在逐步走入深水区,我们是不是即将面临越来越多更加复杂化的问题。
其实,虽然说今天 AI 已经能够为我们提供非常多的产品和服务,但在我们看来还有更多的细分场景的刚需大量存在,且在今天并不能被满足。
随便举几个例子,比如今天的高铁铁路的车辆设备的临检,需要在极短时间内对于车辆设备的各个环节进行快速的检查,看是否存在安全的隐患。
这样的需求目前就满足得不够好,因为它需要有大量的问题被定义,而且要在一个有限的成本下被解决。
还有最近做得比较多的城市智慧化管理,怎么样才能针对一个城市的多样化的管理需求提供这种综合性的能力?
比如,我们今天做一个城市管理,其需求可能是了解整个城市有没有自行车乱停乱放、井盖的丢失、灯箱的损坏、乃至于粪车的偷排,这些数量众多的细碎需求。
需求侧的两个最大挑战
所以,我们觉得今天工智能产业或者商业面临最大的挑战有两个:
第一个是幸福的烦恼,幸福在哪里?刚需大量存在,我们会面临大量碎片化场景和多样化场景。
第二个问题是与此同时,我们提供这样的技术创新的成本,包括边际成本非常高,这也造成了今天 AI 产业进一步发展面临的供需匹配失调的问题。
我们先讲第一个问题,场景碎片化。
一张简单照片,中间可以被人类所理解和感知的信息量非常大。
一个人每天平均接触六百个物品,每接触三个物品定义成动作的话,有三千多万种组合等待着我们定义。
我们再看真实世界,有句话叫“长尾是无处不在的”,各种行业,各种场景下对于技术需求是非常细分而多样的,这是未来五年十年会面临的关键产业性问题。
另一个问题,就是今天的技术创新的成本仍然非常高。
数据获取成本非常高,标注成本非常高,处理成本也非常高。
举个例子,有客户需求说:我这里有一条河,希望你们能帮我在有人有时候掉河里去的时候自动检测。
但面临的第一件事情就是正样本数据怎么收集,找一些人天天往河里跳吗?不现实。
同样,我们也要看到今天的技术进步对于海量数据的使用。人工智能在过去五年的发展中,单一模型的训练所需要的算力成本大了三十万倍,这就是非常大的资源性的成本。
所以我们在需求侧看到两个非常大的挑战,第一是场景多样化和碎片化,第二个就是今天去解决碎片化场景的成本太高。
技术供给侧和数据上的变化
再看技术供给侧的进步。
过去五年中人工智能的创新,最原始的创造周期在大大缩短。
和五年前比起来,当我们今天研发一个同等目的的模型时,所需要的不论是人数还是需要投入的时间都在大大缩短,伴随我们对于市场进一步渗透的提高,这个时间将变得更短。
在今天,我们仍然认为算力会成为人工智能产业向下发展的非常重要的基础性能力 —— 科研的演化方向是推动大模型的建设,而大模型首先需要更大的算力支撑。
今天海量的产业应用,对于算力提出了非常高的要求。
我们再来看看第三个要素:数据。数据是这个产业在未来五年会发生最大变化的地方。
当我们的应用场景深入到各个行业中间时,一方面,我们对于数据的隐私和安全越来越重视,行业内会有很多新的技术和方式被提出来,并应用到产业中。
另一方面,如果说未来人工智能注定是这样对于数据有大量消化和使用的产业的话,对于数据的权属的界定、数据的所有权、使用权、结果共享这些在我们今天都没有得到足够清晰定义的问题,就有赖于我们整个产业的同仁一起,在未来的时间中共同探索。
算法经历的三个阶段
刚才讲到的一些我们看到的产业发展的趋势中,有需求侧趋势,有供给侧趋势,这些趋势会为产业带来什么样的变化呢?
我个人观点是,会看到两个重要变化。
首先,我们越来越需要通用基础设施,以此为将来更广范围内的人工智能产业创新提供支撑和服务,产业链走到今天这种分化的状态也需要更细力度的分工。
另一方面,技术创新、产业创新、应用创新也越来越需要跨组织的联合与协作,这样的协作模式对于过去 20 年互联网高速发展,甚至更早的产业发展中的组织形态,协作模式都会提出前所未有的新的变化、挑战和机会。
我这里重点讲一下第一件事,也就是人工智能通用技术设施。
商汤一直是做算法的,在我们自己内部来看,做算法经历了三个时代:
第一个时代,在某种意义上像手工业,科学家其实是一种劳动力,就跟一千两年前木匠或者铁匠一样,算法非常依赖于这个科学家的聪明才智和他的能力。
这样情况下如果把它类比成工业化的话,某种意义上是作坊式的研发,其结果实际上不可知,而且依赖于科学家个人的水平。
第二个时代,在过去五年,随着我们对人工智能产业的逐步熟悉,人工智能开始成为对于架构、算力、数据这些外化型要素强依赖的一种技术。
今天技术的创新和创造越来越像工业化流水线,我们能够用更多系统把算法创造的各个环节整合打通,并且在这个过程中通过数据的输入,算力的支撑持续地,规模化地生产技术创新的结果。
下一个阶段是什么呢?在我们看来,就是有了流水线,进入工业革命,走到今天的工业 4.0。
这是什么概念?整个生产线流水线更加自动化、智能化。
换句话说,我们认为技术创新在未来会走向一个更加通用、智能、低成本、高效的方向,技术创新本身的模式在持续演化和进步,中间涉及到很多技术问题,整体上是这样的趋势。
如何响应这样的趋势
如何响应这样的趋势呢?
商汤给出的观点是,首先,我们就去用这种所谓的人工智能的通用基础设施 —— 我们自己的版本叫 SenseCore。
通过这些方案,把从底层基础设施到硬件、软件、上游应用,整个端到端系统化模式,或者说从人工智能的技术创新到应用创新的各个环节都进行更加标准化的定义,以及更加有机的组合。
其次,在这个过程中,对于整个平台的通用性、开放性,以及相互之间连接应该给出更好的标准和支撑,用它支撑我们在更加上层的百花齐放的应用和创新的开发。
当然,这种平台的组合也会进一步带来更低的成本和更高的效率。
而商汤正是在去年年初的时候推动了上海重要新基建的项目,构建了一个商汤内部最大的智算中心(AIDC)。
这一设施可达到 3740P FLOPS 的算力,预计明年初正式投入运营。
我们以 AIDC 作为基础底座,用它支撑未来低成本、高效率的更好的技术创新和创造。
这一设施有非常多优势,包括大规模弹性算力、更低的成本和更高效的使用,并且,当端到端进行整合的时候,也能带来更高的安全性和更低的网络时延,给上面的核心软件系统提供更好的支撑。
此外,商汤也有自研的人工智能的训练引擎,用以支撑工业化大规模超大模型生产。
同时,我们也关注如何才在整个 AI 的模型生产过程中,通过系统的方式把更多的数据,更大结构的网络整合起来,让算力资源得到更好的规模化应用。
其实,如果从一个系统来看,光有训练能力远远不够。因为训练出来的算法模型离真正来到应用侧,可以被高效部署还有很长距离。
而我们的平台兼容业内典型主流的各类开源平台,通过开放架构给用户提供更好的支撑,用大大小小的功能化组件提供服务支撑。
人工智能时代算法最重要
我个人认为,在人工智能时代系统第二重要,更重要的是算法本身。我们应该通过算法去实现上面提到的大量多样的碎片化的、细分的技术创造。
用什么方式去推动技术创造呢?
把模型算法想象成乐高积木块,我们提供更多基础的积木块,支撑产业内的同仁一起用它打造更多更有价值的模型结果。
那么,用了这样一整套平台体系的我们今天在做什么?
其实人工智能大装置一直在持续迭代和进步,商汤的几个主要业务方向上的大量应用和技术创新都来自于我们人工智能大装置的支撑。
下一步,我们希望对当前整个产业进行更大分化。我们相信,当深入到场景挖掘出更多用户的细分需求时,这种平台化、规模化且低成本、高效的工具体系,实际上会让整个产业技术创新走的更快。
举个例子,如果用这样的平台去跟某些做特定类型研究的科研机构、特定行业的科研技术平台、行业头部企业合作的话,就能够推动持续的发展和创新。
我们希望通过这样一整套的技术底座和平台体系,以及整个产业生态中的开放合作,持续地加速我们创新的过程,降低创新的成本,解决我在一开始讲到的人工智能产业的、我们看见的、也是我们相信的未来关键的挑战。
我今天的分享就到这里,谢谢。