11月11日,英特尔正式发布其全新服务器GPU,即首款数据中心的独显产品,该服务器基于Xe LP微架构,专为高密度、低时延的安卓云游戏和流媒体服务而设计。同时,英特尔还宣布将于12月正式交付相应的软件堆栈oneAPI Gold工具。
英特尔此次同时推出了全新服务器GPU和oneAPI软件,意味着英特尔开始释放XPU的强大实力。
10年前,美国数据科学家舍恩伯格在《大数据时代》一书中对“大数据时代”作出系统阐释。
10年后,互联网、人工智能、云计算的发展正飞速推动全球数据量的增长。国际数据公司IDC统计显示,预计到2025年,全球数据量将比2016年的16.1 ZB(1 ZB=十万亿字节)增加10倍,达到163 ZB。
尽管越来越多的数据让现代人置身于信隐私泄露的恐慌之中,但不可否认的是,大数据正为硬件、软件乃至服务等市场带来前所未有的经济增长。
但在这之前需要解决一个关键问题,在单一芯片算力受限的情况下,如何更好地发挥海量数据的真正价值?
对于这一问题,英特尔早已给出了答案。2015年,英特尔就开始斥资167亿美元收购当时全球第二大FPGA厂商Altera,此后,又接连收购主攻深度学习方向的Nervana Systems、计算视觉公司Movidius、自动驾驶视觉处理公司Mobileye和云端AI推理芯片已经商用的Habana Labs。
英特尔成为业界唯一一家拥有全类别AI芯片的公司之后,紧接着吸纳业界顶尖的芯片人才,并于2018年架构日提出制程、封装、架构、存储、互联、安全、软件的六大技术战略。
这是英特尔首次、也是业界首次明确将单一架构之后的发展方向定义为XPU。
英特尔数据中心XPU产品和解决方案副总裁Jeff McVeigh表示:“XPU战略的提出,在于我们意识到需要不同类型的架构来服务于各种不同的工作负载,其中一些工作负载在本质上是标量的,另一些是向量、矩阵、空间等等。”
英特尔表示,这款GPU采用的是英特尔能效最高的图形架构,英特尔Xe LP微架构,拥有低功耗、独立片上系统(SoC)设计,并配备128比特管道和8GB专用板载低功耗DDR4显存。
另外,如果将英特尔服务器GPU同英特尔至强可扩展处理器组合,服务提供商可以在不改变服务器数量的情况下,单独扩展显卡容量,得以在每个系统上支持更多流和订阅用户,并且同时实现较低的总体拥有成本(TCO)。
通过在新华三3/4长、全高的x16 PCIe 3.0扩展卡内封装四个英特尔服务器GPU,即可在一个典型双卡系统中支持超过100个安卓云游戏并发用户。这一数量最高可扩展至160个并发用户,实际数量取决于具体的游戏和服务器配。
之所以说英特尔XPU战略进展迅速,是因为其从2019年底发布Xe架构到推出基于Xe架构的集成GPU和独立GPU产品,以及用于数据中心独显产品,间隔时间不到一年,就兑现了产品交付计划。
事实上,Xe架构作为一个基础GPU架构,属性灵活且扩展性强,能够衍生出多种针对不同领域和场景的GPU产品。
在英特尔2020年架构日上,英特尔官方首次详细介绍了可实现全扩展的Xe图形架构。按照不同的应用场景分,可将Xe架构分成四个系列:Xe LP、Xe HP、Xe HPC和Xe HPG。
Xe LP属于低功耗系列,是针对PC和移动计算平台的最高效架构,最高配置EU单元多达96组,并具有新架构设计,包括异步计算、视图实例化 (view instancing)、采样器反馈(sampler feedback)、带有AV1的更新版媒体引擎以及更新版显示引擎等。TigerLake SoC里集成的GPU、英特尔锐炬 Xe MAX 独立显卡和此次发布的面向数据中心的独显产品均采用这一架构。
Xe HP属于高性能系列,是业界首个多区块(multi-tiled)、高度可扩展的高性能架构,可提供数据中心级、机架级媒体性能,GPU可扩展性和AI优化。目前处于同客户共同测试的阶段,Xe HP产品将于明年推出。
Xe HPC属于高性能计算系列,可用于超级计算机。Xe HPG是一种为游戏优化的微架构,将具有加速的光线跟踪支持,Xe HPG产品预计将于2021年开始发货。
一般而言,基于底层硬件架构的不同,完成同一项开发往往需要开发者使用不同的代码重写一次,需要付出极大的人力成本和财力成本。如果将硬件层面XPU的实现比喻成一个语言互不相通的团队,那么要想更好地释放团体的真正实力,还需要一台能够降低队员们沟通成本,甚至能够实现“灵魂互通”的机器。
虽然从生物算法的角度,目前还没有办法实现意识和“灵魂”的交换和交流,计算机应用程序的跨平台优化也一直是业界难点,但对于XPU而言,英特尔已经开发出帮助XPU团队释放真正实力的工具,即英特尔软件级oneAPI工具包。
英特尔官方表示,如果用上了oneAPI工具包,开发者就能够访问英特尔XPU的通用、开放且基于行业标准高的编程模型,释放底层硬件性能的同时降低软件开发和维护成本。
同时,Jeff也告诉雷锋网:“oneAPI能够把人们熟悉的语言和库上的代码,比如所有目前已经在至强处理器上运行的代码,无缝地迁移到GPU和其他的架构上。所以它确实有很多好处,比如代码重用,能够利用现有的库等等。如果你已经熟悉了一些库,比如TBB和其他来自英特尔的库,我们把它们进行了扩展以支持多种架构。这样已经使用过这些库的开发者可以继续做开源,支持GPU和其他XPU架构。”
“oneAPI让你不必有两种不同的配置,两种不同的构建,但是能够在设计点之间为完全相同的服务提供一些灵活性。”英特尔数据平台事业部副总裁,视觉基础架构事业部和NPG战略总经理LynnComp补充道。
oneAPI是英特尔在SuperComputing2019大会上首次提出且为实现统一、简化的跨架构编程模型的一个愿景,即不受限于单一厂商专用的代码构建,且能实现源有代码的集成。借助oneAPI,开发者可以针对他们要解决的特定问题选择最佳的加速器架构,且无需为此一个架构和平台再重写软件。
英特尔初次提出这一愿景时,很多人认为其实现难度大,能够完成的可能性几乎为零。但今天英特尔却如期交付了oneAPI开发者工具包,足以证明其软件实力。
英特尔宣布,英特尔oneAPI工具包将于12月在本地和英特尔DevCould上免费提供,同时还将提供包括英特尔技术咨询工程师全球支持的商业版本。英特尔还会将英特尔Parallel Studio XE和英特尔System Studio工具套件迁移到oneAPI产品中。
近期,微软Azure和谷歌的TensorFlow已经宣布支持oneAPI,众多领先的研究机构、公司和大学也支持oneAPI。
从收购FPGA公司到吸纳图形处理器顶尖人才,从发展单一架构到定义XPU时代,从Xe架构提出到如期交付产品,近些年英特尔一直在释放大数据潜力的产业领域探索,如今成长为业界唯一一家能够提供XPU芯片的全能性公司,且能为其应将提供相适配的软件、应用程序和生态,英特尔在数据在数据中心拥有独一无二的实力。
未来的英特尔,又会在实现XPU的路上取得什么样的成绩呢?