XPU时代创新者英特尔

11月11日，英特尔正式发布其全新服务器GPU，即首款数据中心的独显产品，该服务器基于Xe LP微架构，专为高密度、低时延的安卓云游戏和流媒体服务而设计。同时，英特尔还宣布将于12月正式交付相应的软件堆栈oneAPI Gold工具。

英特尔此次同时推出了全新服务器GPU和oneAPI软件，意味着英特尔开始释放XPU的强大实力。

10年前，美国数据科学家舍恩伯格在《大数据时代》一书中对“大数据时代”作出系统阐释。

10年后，互联网、人工智能、云计算的发展正飞速推动全球数据量的增长。国际数据公司IDC统计显示，预计到2025年，全球数据量将比2016年的16.1 ZB（1 ZB=十万亿字节）增加10倍，达到163 ZB。

尽管越来越多的数据让现代人置身于信隐私泄露的恐慌之中，但不可否认的是，大数据正为硬件、软件乃至服务等市场带来前所未有的经济增长。

但在这之前需要解决一个关键问题，在单一芯片算力受限的情况下，如何更好地发挥海量数据的真正价值？

对于这一问题，英特尔早已给出了答案。2015年，英特尔就开始斥资167亿美元收购当时全球第二大FPGA厂商Altera，此后，又接连收购主攻深度学习方向的Nervana Systems、计算视觉公司Movidius、自动驾驶视觉处理公司Mobileye和云端AI推理芯片已经商用的Habana Labs。

英特尔成为业界唯一一家拥有全类别AI芯片的公司之后，紧接着吸纳业界顶尖的芯片人才，并于2018年架构日提出制程、封装、架构、存储、互联、安全、软件的六大技术战略。

这是英特尔首次、也是业界首次明确将单一架构之后的发展方向定义为XPU。

英特尔数据中心XPU产品和解决方案副总裁Jeff McVeigh表示：“XPU战略的提出，在于我们意识到需要不同类型的架构来服务于各种不同的工作负载，其中一些工作负载在本质上是标量的，另一些是向量、矩阵、空间等等。”

英特尔表示，这款GPU采用的是英特尔能效最高的图形架构，英特尔Xe LP微架构，拥有低功耗、独立片上系统（SoC）设计，并配备128比特管道和8GB专用板载低功耗DDR4显存。

另外，如果将英特尔服务器GPU同英特尔至强可扩展处理器组合，服务提供商可以在不改变服务器数量的情况下，单独扩展显卡容量，得以在每个系统上支持更多流和订阅用户，并且同时实现较低的总体拥有成本（TCO）。

通过在新华三3/4长、全高的x16 PCIe 3.0扩展卡内封装四个英特尔服务器GPU，即可在一个典型双卡系统中支持超过100个安卓云游戏并发用户。这一数量最高可扩展至160个并发用户，实际数量取决于具体的游戏和服务器配。

之所以说英特尔XPU战略进展迅速，是因为其从2019年底发布Xe架构到推出基于Xe架构的集成GPU和独立GPU产品，以及用于数据中心独显产品，间隔时间不到一年，就兑现了产品交付计划。

事实上，Xe架构作为一个基础GPU架构，属性灵活且扩展性强，能够衍生出多种针对不同领域和场景的GPU产品。

在英特尔2020年架构日上，英特尔官方首次详细介绍了可实现全扩展的Xe图形架构。按照不同的应用场景分，可将Xe架构分成四个系列：Xe LP、Xe HP、Xe HPC和Xe HPG。

Xe LP属于低功耗系列，是针对PC和移动计算平台的最高效架构，最高配置EU单元多达96组，并具有新架构设计，包括异步计算、视图实例化（view instancing）、采样器反馈（sampler feedback）、带有AV1的更新版媒体引擎以及更新版显示引擎等。TigerLake SoC里集成的GPU、英特尔锐炬 Xe MAX 独立显卡和此次发布的面向数据中心的独显产品均采用这一架构。

Xe HP属于高性能系列，是业界首个多区块（multi-tiled）、高度可扩展的高性能架构，可提供数据中心级、机架级媒体性能，GPU可扩展性和AI优化。目前处于同客户共同测试的阶段，Xe HP产品将于明年推出。

Xe HPC属于高性能计算系列，可用于超级计算机。Xe HPG是一种为游戏优化的微架构，将具有加速的光线跟踪支持，Xe HPG产品预计将于2021年开始发货。

一般而言，基于底层硬件架构的不同，完成同一项开发往往需要开发者使用不同的代码重写一次，需要付出极大的人力成本和财力成本。如果将硬件层面XPU的实现比喻成一个语言互不相通的团队，那么要想更好地释放团体的真正实力，还需要一台能够降低队员们沟通成本，甚至能够实现“灵魂互通”的机器。

虽然从生物算法的角度，目前还没有办法实现意识和“灵魂”的交换和交流，计算机应用程序的跨平台优化也一直是业界难点，但对于XPU而言，英特尔已经开发出帮助XPU团队释放真正实力的工具，即英特尔软件级oneAPI工具包。

英特尔官方表示，如果用上了oneAPI工具包，开发者就能够访问英特尔XPU的通用、开放且基于行业标准高的编程模型，释放底层硬件性能的同时降低软件开发和维护成本。

同时，Jeff也告诉雷锋网：“oneAPI能够把人们熟悉的语言和库上的代码，比如所有目前已经在至强处理器上运行的代码，无缝地迁移到GPU和其他的架构上。所以它确实有很多好处，比如代码重用，能够利用现有的库等等。如果你已经熟悉了一些库，比如TBB和其他来自英特尔的库，我们把它们进行了扩展以支持多种架构。这样已经使用过这些库的开发者可以继续做开源，支持GPU和其他XPU架构。”

“oneAPI让你不必有两种不同的配置，两种不同的构建，但是能够在设计点之间为完全相同的服务提供一些灵活性。”英特尔数据平台事业部副总裁，视觉基础架构事业部和NPG战略总经理LynnComp补充道。

oneAPI是英特尔在SuperComputing2019大会上首次提出且为实现统一、简化的跨架构编程模型的一个愿景，即不受限于单一厂商专用的代码构建，且能实现源有代码的集成。借助oneAPI，开发者可以针对他们要解决的特定问题选择最佳的加速器架构，且无需为此一个架构和平台再重写软件。

英特尔初次提出这一愿景时，很多人认为其实现难度大，能够完成的可能性几乎为零。但今天英特尔却如期交付了oneAPI开发者工具包，足以证明其软件实力。

英特尔宣布，英特尔oneAPI工具包将于12月在本地和英特尔DevCould上免费提供，同时还将提供包括英特尔技术咨询工程师全球支持的商业版本。英特尔还会将英特尔Parallel Studio XE和英特尔System Studio工具套件迁移到oneAPI产品中。

近期，微软Azure和谷歌的TensorFlow已经宣布支持oneAPI，众多领先的研究机构、公司和大学也支持oneAPI。

从收购FPGA公司到吸纳图形处理器顶尖人才，从发展单一架构到定义XPU时代，从Xe架构提出到如期交付产品，近些年英特尔一直在释放大数据潜力的产业领域探索，如今成长为业界唯一一家能够提供XPU芯片的全能性公司，且能为其应将提供相适配的软件、应用程序和生态，英特尔在数据在数据中心拥有独一无二的实力。

未来的英特尔，又会在实现XPU的路上取得什么样的成绩呢？

XPU时代创新者英特尔

Published by

风君子

发表回复取消回复

Published by

风君子

发表回复 取消回复

发表回复取消回复