“摩尔定律已经死了。”英伟达(NVIDIA)CEO黄仁勋在2019年末下了这样的定论。
摩尔定律是所有计算机人都耳熟能详的词。这个词指的是1965年英特尔联合创始人戈登·摩尔(Gordon Moore)提出的一个想法,即集成电路上可容纳的元器件的数量每隔18至24个月就会增加一倍,性能也将提升一倍。
半个世纪以来,这条定律都非常准确地预测了半导体行业的发展趋势,成为计算机处理器制造的准则,也成为推动科技行业发展的“自我实现”预言。
那么以游戏芯片起家的英伟达为何会得出这样的结论?这岂不是“打脸”?他们会如何应对“摩尔定律已经结束”的未来?
“英伟达很早就认识到这个世界在不断变化。”英伟达中国区高级市场总监刘念宁在接受创业采访时强调,“所以创新被看作是‘第一原则’,创新的核心则是创造出让客户满意且能提高行业标准的产品。”
从1999年在纳斯达克上市,发行市值不过2.3亿美元;到2020年最新市值高达1780多亿美元,英伟达对“创新”这一概念有着当之无愧的发言权。
从GPU到HPC再到“HPC+AI”
1993年,英伟达成立。创始人是从LSI Logic走出的黄仁勋及来自Sun Microsystem 的两位工程师 Chris Malachowsky 和Curtis Priem。黄仁勋看准了图形显示芯片赛道,并坚信终有一天PC会成为享受游戏和多媒体的消费级设备(在当时PC主要作为生产力设备而非消费级设备),这也是英伟达诞生的初衷。
尽管其RIVA处理器系列一经推出就成了行业“爆款”,彼时的英伟达还是一家“小公司”,直到1999年上市,发行市值也不过2.3亿美元左右。
1999年对于英伟达来说是具有里程碑意义的一年。同年,英伟达推出 GeForce 256——世界上第一款功能齐全,可从真正意义上替代 CPU 渲染的图形处理单元(GPU)就此诞生。GPU也就是Graphic Processing Unit(图形处理器),和CPU相比,更擅长进行大规模并行数据处理。
GPU诞生后,整个芯片世界也同时进入了一波新的飞腾时期。但是和英特尔、AMD不同的是,英伟达一心专注在GPU领域,将几乎全部的研发费用都投入在了GPU上,不断打磨技术,构建核心能力——它坚信,未来属于GPU。
虽然GPU是为了图像处理而生,但GPU不仅可以在图像处理领域大显身手,还可以被用在科学计算、密码破解、数值分析、海量数据处理(排序、Map-Reduce等)、金融分析等需要大规模并行计算的领域。因此,GPU也可以认为是一种较通用的芯片。
2007年,英伟达收入超过40亿美元,相比上市时成长了近5倍。
随着PC市场增长趋缓,显卡市场的增量红利消失,竞争对手对存量市场的争夺开始趋于白热化。2008年,AMD公司收购显卡二当家ATI公司,试图用CPU整合GPU,而Intel也开始倒向ATI,并在自己的芯片组中集成了3D图形加速器。CPU向GPU宣战。
此时,受到2008年金融危机影响的英伟达也出现了亏损。当英伟达发现传统业务注定只能在存量市场中博弈时,它毅然进行业务转型——创建出CUDA编程模型和Tesla GPU平台,将并行处理引入通用计算领域,一种全新的强大的高性能计算方式(HPC,High-performance Computing)由此诞生。
在此之前,HPC领域虽被行业看好,但并没有明显胜出的“赢家”。
在NVIDIA 推出CUDA之后,江湖格局已定:CUDA使用C语言扩展并行编程,通过共享存储器来通信,两个层次的并行方式都简化了编程,这使得本科生也能够使用CUDA来写大规模高性能计算程序;竞争对手AMD的brook++一下子就黯然失色。
此后,英伟达聚焦高端游戏市场,并同步发展GPU通用计算。智能手机出现后,笔记本电脑、平板等多元化应用分散了PC的需求,PC及PC独立显卡出货量均开始呈下滑趋势。但是英伟达此时已经成功地将战略中心转移至高端游戏卡市场,加快GPU架构的迭代速度,实现与PC市场成功解绑。
在HPC领域的深耕使得英伟达在下一波浪潮来临时做好了充足准备:2012年,深度学习之父Hinton采用GPU解决方案去参加了大规模视觉识别挑战赛(ILSVRC)而一举夺冠。
AI时代到来,人类社会进入到新纪元。
英伟达率先意识到,深度学习是一个潜在的大市场。在当时,其竞争对手几无察觉。深度学习大火后,英伟达为互联网大公司提供GPU用于深度学习训练,在这一领域基本上占据了绝对优势,并且为英伟达贡献了大量收入和近十倍的市值提升。
2015年,公司营业收入增长至50亿美元左右,总市值突破150亿美元,实现对AMD的反超。与此同时,用于运算的Tesla显卡也随着GPU架构的升级得到不断更新,为后期数据中心业务发力做出了充足的储备。
如今,英伟达已经在人工智能训练芯片市场确立了垄断性地位,市值达千亿美元。这既是时代的机遇,也是专注的结果。超级计算的适用范围正在迅速扩展,从最尖端的物理、医学研究,到当前最热门的人工智能和自动驾驶研发,时代再次证明了英伟达的眼光:以CPU为中心的单块式超级计算机时代即将结束。
新的时代已经到来。
“创新”第一原则:提高行业标准
看起来,英伟达是被AI的“馅饼”给砸中。实际上,机遇往往是为做好准备的人提供。
“英伟达的核心价值观第一条就是创新。”刘念宁告诉创业邦,“而创新的第一原则就是做出让客户满意、并且能够提高行业标准的产品。”
就像大家很容易遗忘在iPhone发布前,苹果已经在电脑上做了十几年操作系统一样,AI芯片公司们也在忘记英伟达是一家显卡供应商的同时,它还一直在不断打磨另一个杀器——CUDA。
其实,在CUDA推出后的一段时间内,英伟达的HPC业务收入相比其他业务还是小头,给英伟达带来的利润也不高,但是英伟达还是坚持为GPU计算开发了一代“热卡”Fermi,Fermi能进一步降低CUDA编程的难度。
在每年的NVIDIA GTC会议上,黄仁勋还会花大量的时间介绍GPU计算,出了什么新卡和新库,CUDA新版本有哪些特性,等等,让参会者时常忘记这是一家以显卡为主营业务的公司。
“正是因为基于这样的第一原则,我们才能在其他人都还没觉察到他需要什么的时候,就带给他新事物。”刘念宁说。
那么如何为消费者带来新的产品和新的体验?刘念宁告诉创业邦,英伟达把创新分成了四个方面:第一,梦想要大(dream big);第二,从小做起(start small);第三,敢于冒险(take risk);第四,快速学习(quick learning)。体现在从GPU到HPC的转型上,就是一方面把GPU通用化——让一块只能渲染图形的独立显卡,变成一个通用计算图形处理器(GPGPU);另一方面让英伟达现有与即将推出的所有GPU都必须支持CUDA程序。
“这就是为什么在游戏业务蓬勃发展的同时,英伟达能很早就开始颇具先见性地着手将 GPU 用于通用计算的问题;在AI时代到来之前,英伟达也很早就在使用深度学习教AI观察及识别图像和声音,了解它们的状态,并推断接下来会出现什么。” 刘念宁说。
例如,英伟达是少数建立了VR生态的公司之一,并通过HolodeckVR平台助力3D模型的协同开发。和PC游戏类似,性能对于VR设备至关重要。VR设备的高性能需求将使得英伟达产品进一步高端化。公司计划将 GeForce GTX 1060 或者更高端的GPU用于具备VR功能的台式机或者笔记本电脑。高性能硬件将大幅降低总体拥有成本,创造长期商业机会。
如今,不管是在自动驾驶,医疗健康,还是大数据领域等,都能看到英伟达进行创新的原则——围绕并行处理技术方面的基本优势,在不同的领域中找寻突破和延伸。
以自动驾驶为例。2019年12月,英伟达发布了最新的自动驾驶芯片Orin,该芯片由 170 亿个晶体管组成,由英伟达团队耗时四年打造。Orin SoC 集成了英伟达新一代 GPU 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,每秒可运行 200 万亿次计算,几乎是英伟达上一代 Xavier 芯片性能的7倍。
正如黄仁勋在苏州GTC China 大会上所表示的:“打造安全的自动驾驶汽车,也许是当今社会所面临的最大计算挑战。实现自动驾驶汽车所需的投入呈指数级增长,面对复杂的开发任务,则需要像Orin这样的可扩展、可编程、软件定义的 AI 平台。”
回顾英伟达发展历程,刘念宁认为,从 PC 图形芯片到游戏显卡,从GPU到HPC再一路到AI,英伟达能从一家传统的显卡供应商转变为人工智能服务器供应商,推动它不断前进的,正是“创新”。
一砖一瓦搭建生态
时间来到2020年,美国财经网站MarketWatch曾用“华尔街为之震惊”,来形容英伟达财报的强势表现——游戏板块保持强劲、云计算应用稳中有涨、无人驾驶、专业视觉化、OEM&IP前景可期。
未来,英伟达的野心在哪里?
刘念宁根据自己的市场观察,认为答案将落在“生态”上。
其实,自从推出CUDA以来,如何建立生态,吸引开发者使用CUDA就是英伟达一直在思考的事,随后,英伟达推出了一系列的措施来建立生态。
“当我们看到一个新兴市场的潜力时,会基于我们现有的技术优势,找到合适的细分角度再去切入。”刘念宁说,“这时候,需要开发者和初创企业为我们(英伟达)赋能,一个开放式的生态平台必不可缺。”
随着自然语言理解取得最新突破,AI可以学习人类知识的代码,计算机也可以进行自然对话、进行阅读和总结,并更自然地与人类协作。从运输到医疗保健,从金融服务到零售,各个行业都在竞相利用AI的自动化功能,这也意味着可应用的场景将更加垂直化和碎片化。
如何进入到这些新场景中?
英伟达一方面对数据库进行开源,如支持常见并行原语的CUDA,支持多GPU之间通信的NCCL,英伟达优化的nvcaffe等,这些库降低了各个领域使用英伟达GPU开发应用的难度。但另一方面,英伟达并没有贸然推出新品,而是通过优化软件性能的基础库给厂商赋能,通过这种“多交朋友”的方式,英伟达扩大了生态触角,又避免了自己去做的潜在失败可能。
例如,过去数十年来,汽车行业的研究和开发投入都集中在引擎设计和材料加工上。可现在,更多汽车生产商打算把资金投入到由软件定义的未来自动驾驶技术上。英伟达在此基础上和丰田进行了合作开发、训练和验证,并将架构扩展至新一代自动驾驶汽车的完整产品线上。
2016年,英伟达发起了名为“英伟达初创加速计划 NVIDIA Inception Program”的开放式创新计划,目前已经与5000多家各个垂直领域的AI初创公司合作。
作为一个免费会员制的创业孵化器,英伟达初创加速计划 NVIDIA Inception Program依托英伟达在业界领先的AI技术,以技术为驱动,为会员提供全方位的免费服务,支持使用深度学习,机器学习以及数据科学技术的初创公司。
其中,在刘念宁主导的中国市场中已有600多家合伙伙伴,分布在全国30多个城市以及30多个不同的行业。如果成为初创加速计划 Inception Program的成员,就可以较早应用NVIDIA 的技术并参与协助NVIDIA一些新产品线的研发,例如图森未来、速腾聚创等一批国内自动驾驶技术公司就是初创加速计划 Inception Program的成员。
“对于英伟达来说,通过初创加速计划,能够迅速了解世界上最领先的创业公司在做什么,并且在适当的时机还可以通过投资等手段把这些创业公司吸引到自己的生态中。” 刘念宁说。
以图森未来为例。这是国内最早研发可商用的L4级(SAE标准)自动驾驶卡车解决方案的公司之一,总部设在北京和美国圣迭戈。图森未来先通过初创加速计划 Inception Program获得了英伟达的注意,随后又在进行B轮融资时获得了英伟达GPU Venture Program的投资。
作为上市公司,往往面对“创新”时会优先考虑哪个项目更容易尽快实现收入和盈利,从而可以继续做大上市公司市值。
那么对于项目培养周期长、投资金额大、回报周期长的项目,就会被上市公司放在次重要位置,甚至被搁置、抛弃。可是很多伟大的技术突破性产品,需要公司用很长的时间投入巨资耐心培育,这就导致大公司陷入了“创新者的窘境”。
“英伟达突破‘大公司窘境’的方法是建设生态,我们为初创公司和开发者提供他们需要的产品和技术。”刘念宁说,“这样一来可以为初创公司赋能;二来可以加速英伟达的开发速度。”
以人为本,不断重塑自我
今年以来,突如而来的疫情席卷全球。在经济萧条的大环境下,该如何坚守初心,积极创新?黄仁勋不久前给所有员工写了一封公开信,信里体现了这家大公司“以人为本”的理念。
信里首先提及,英伟达不仅不会裁员,还会“争取给大家多发一些钱”。而公司在图形、科学、人工智能和机器人领域所做的工作对未来比以往任何时候都更加重要。“人们对机器人技术的兴趣正在高涨,从自动零售结账和仓库机器人到自动移动消毒机器人,把造成工人感到不安全的任务自动化。在医疗保健领域,诊断仪器和科学计算的需求量很大,因为医疗行业正在寻找遏制和减轻这种病毒影响的方法。”
除此之外,英伟达也在用自己的技术和专业技能加速疫苗的研发。“我们组建了一支由英伟达人工智能和高性能计算机专家组成的团队,加入了COVID-19高性能计算机联盟……大部分计算能力是NVIDIA GPU加速的。我们在充分利用这些系统方面拥有丰富的专业知识,协助加速疫苗的研发。”
信的最后,黄仁勋还为世界各地居家办公的员工打气:“我最喜欢的是,我们的一位员工在这一切之中生了一个漂亮的女婴。他正在享受育婴假福利。我提醒他我们都正在享受同样的居家福利。虽然没有忙着换尿布,但许多同仁正在重新温习几何和三角。说不定还有些人很乐意和这个新手父母交换位置呢!”
在这个特殊的时期,英伟达初创加速计划 NVIDIA Inception Program还依托公司的生态资源推出了一系列的活动支持会员公司:如通过英伟达深度学习学院NVIDIA DEEP LEARNING INSTITUTE(DLI)在线课程可以免费学习通用基础、数字内容、医疗、智能视频分析、IT等众多领域课程,并在学习完成后获得英伟达深度学习学院(DLI)的课程认证证书。
再比如,初创加速计划Inception Program的会员也可以享受GPU云资源优惠,这些云资源包括AWS、Microsoft Azure、滴滴云、阿里云等。
如果说,天下是否有免费的午餐?那么在摩尔时代,摩尔定律就是免费午餐;在AI时代,算力就是免费的午餐。英伟达知道自己的优势所在,英伟达还将把自己的优势在各行各业发挥出来。
27岁的英伟达意气风发,如同一台“学习机器”,不断重塑自我。