英特尔公布 AI 战略路线图:今年推 Gaudi 3、明年推 Falcon Shores 等

3 月 14 日消息,英特尔近日发布公告,分享了关于 AI 战略和加速器的更多信息,在更多产品和软件中整合 AI 元素,更好服务企业和数据中心未来发展。

基于新闻稿内容,简要梳理内容如下:

加速 AI 布局

在人工智能方面,英特尔开发了一套完整的企业 AI 堆栈(Enterprise AI stack),使用 OpenVINO、Intel Developer Cloud oneAPI & Synapse 等开源标准,推进硬件、系统、应用的快速发展。

硬件分为三个分支:数据中心(可扩展系统、加速器、CPU)、网络(开放标准和可配置性、基础设施)以及 Client & Edge(AI PC、NPU、GPU、CPU)。

Gaudi 2 性价比更高

英特尔表示,在定价方面,Gaudi 2 采用的工艺与英伟达 A100 相同,都是台积电的 7nm 工艺,但关键区别在于,在 Stability Diffusion 和生成式 AI 负载方面,Gaudi 2 性能是 A100 的 3 倍,这意味着使用 Gaudi 2 可以比英伟达的 A100 节省更多成本。

在某些工作负载中,Gaudi 2 硬件的性能也优于最新的 H100 GPU,英特尔表示会继续扩大这些优势,将在未来继续保持领先地位。

Gaudi 3 计划 2024 年第 3 季度上市

在路线图方面,英特尔仍将 Gaudi 3 定位为 Gaudi 2 和 Falcon Shores 的后续产品。英特尔表示,Gaudi 3 加速器目前已进入验证实验室,将于 2024 年第 3 季度全面上市。

英特尔表示,在软件 / 应用方面为 Gaudi 3 构建了广泛的 OEM 生态系统和英特尔开发者云网络,在硬件方面,Gaudi 3 加速器将采用与 Gaudi 2 相同的高性能架构,不过计算能力是其 4 倍,网络带宽是其 2 倍,HBM 内存带宽是其 1.5 倍。

Falcon Shores 计划 2025 年上市

Falcon Shores 是首个专为人工智能工作负载设计的 GPU 架构。它将 Gaudi 人工智能 IP 和英特尔 GPU 技术的精华结合到一个融合产品中。Falcon Shores 的开发工作进展顺利,目标是在 2025 年推出。

3-5 行代码就能实现模型迁移

AI 开发人员的一个主要担忧是,迁移到新硬件会带来一些问题,例如修改代码以支持新的加速器。根据英特尔的说法,大多数开发人员都在堆栈的高层(Hugging Face、Mosiac ML、PyTorch 等)上工作,利用英特尔的软件解决方案,他们只需在 Python 脚本中添加几行代码,就能迁移现有模型或新模型。

英特尔的 “模型迁移” 只需 3-5 行代码即可将现有模型或新模型迁移到新硬件上。对于高级软件,英特尔提供从英伟达到整个 Gaudi 甚至下一代猎鹰海岸加速器阵容的迁移支持。

该公司还在努力增加底层模型,如 OpenAPI、Triton 和 TPC-C,以便从英伟达™(NVIDIA®)硬件迁移到 Falcon Shores GPU 时获得支持。

将推出中国提供版 Gaudi 硬件

英特尔表示在完全遵守美国当局的规定前提下,针对中国市场定制 Gaudi 硬件,以便可以出口到中国市场。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平