作者:包永刚
英特尔不久前公布的 2019 第四季度财报轻松超越了预期,服务器 CPU 和提供相关产品的数据中心集团(DCG)收入增长 19% 绝对是这份漂亮成绩单中不可忽略的亮点。不过,2020 年英特尔在这一利润丰厚的市场将面临同属 x86 阵营 AMD 以及 Arm 阵营的左右夹攻。
特别是,随着计算机国产替代“3-5-2”的推进,来自 Arm 服务器 CPU 阵营的华为将和英特尔迎来正面竞争。
HPC 市场,2020 年英特尔将被左右夹攻
高性能计算(HPC)市场利润丰厚且已经连续增长多年,目前至少有 x86、Arm、Power 三种 CPU 架构,超过 6 家可靠的供应商,英特尔的 x86 CPU 在很长一段时间占有这一市场超过九成的份额。然而,2020 年英特尔面临着来自两个阵营的挑战。
一个阵营是英特尔所处的 x86 领域。AMD Epyc 的势头将使英特尔面临自 Opteron(皓龙,AMD 2003 年推出的 64 位处理器)时代以来最激烈的竞争。几乎可以确定第,二代 Epyc CPU(又名“罗马”)将抢占英特尔在服务器领域(包括 HPC)的市场份额。
AMD 凭借令人印象深刻的性价比抢占英特尔在服务器 CPU 市场的份额,同时,Arm 阵营也在缓慢进入服务器 CPU 领域。
之所以说缓慢,是因为从技术角度看,与 x86 或任何其它通用处理器,Arm 指令集架构处理器没有任何特殊的优势。但 Arm 的优势在于,其 IP 可授权,这让该架构可以满足不同市场定制处理器的需求,这和全球软件生态系统捆绑在一起。
目前,富士通、Marvell、亚马逊、华为都已经推出了基于 Arm 指令集的高性能服务器 CPU。一直跟踪 HPC 中 Arm CPU 销售情况的 Hyperion Research 的数据显示,2019 年有 50,000 颗 Arm 芯片被用于 HPC, Hyperion 预计该数字到 2020 年将超过 233,000 颗,到 2024 年将超过 610,000 颗。
Hyperion Research 预计,在未来五年中,该领域 Arm 处理器收入的复合年增长率为 64.7%。
当然,即便 Arm 处理器维持较高的增长率,但 x86 处理器在未来 5 年甚至更长时间仍将主导 HPC CPU 市场。
补充一句,虽然 IBM Power 架构 CPU 也被用于 HPC,还有 OpenPower 计划,但游戏的唯一玩家仍然只有 IBM,所以在可以遇见的未来,Power 架构似乎只能扮演次要角色。
国产替代需求强劲,华为 Arm 处理器迎来机遇
从中兴事件到华为事件,无论是国家、政府还是个人都深刻地意识到掌握核心关键技术的重要性,由此,多个领域都在加速国产替代的速度。根据证券日报此前的一篇报道,中国可能在未来 3 年内逐步停用外国计算机设备和软件。
据称,上述政策被概括为“3-5-2”,即按照在 2020 年完成 30%、2021 年完成 50%、2022 年完成 20% 的速度来推进。按此进度,中国需要更换 2000 万件至 3000 万件外国设备。
IDC 预测,到 2023 年,全球计算产业投资空间 1.14 万亿美元。中国计算产业投资空间 1043 亿美元,接近全球的 10%,是全球计算产业发展的主要推动力和增长引擎。
另有研究机构的数据指出,中国计算终端设备市场规模接近 4000 亿元,其中,电脑市场规模约 2500 亿元,服务器市场规模约 1200 亿元。
但是,中国企业目前仅在整机制造等价值量最低的环节具有一定优势,在利润率最高、产值最大的核心芯片(CPU、GPU 等)和操作系统 OS、办公软件等市场依旧处于弱势地位。
仅就 CPU 而言,这一领域国内代表性的公司就是龙芯中科,其已经推出了桌面 CPU 和服务器 CPU。去年 12 月,龙芯中科发布的最新产品在工艺不变的条件下,通过微结构的设计优化,性能比上一代提升了一倍。
龙芯中科取得的成绩固然值得新闻,但要和业内最领先的产品相比,依旧难以竞争。
显然,自主可控的 HPC CPU 在国内有强劲的需求,机遇也由此产生。除了龙芯中科,华为在去年也发布了高性能服务器 CPU。
鲲鹏的三步走策略
2019 年 1 月 7 日,华为推出了当时业界最高性能的 Arm 指令集架构处理器鲲鹏 920 以及基于该处理器的 TaiShan 服务器。据悉,鲲鹏 920 由华为公司自主设计,采用最先进的 7nm 半导体制程工艺制造,通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高处理器性能。
具体性能表现上,鲲鹏 920 主频可达 2.6GHz,单芯片可支持 64 核,集成 8 通道 DDR4,内存带宽超出业界主流 46%。芯片集成 100G RoCE 以太网卡功能,大幅提高系统集成度。
同时,鲲鹏 920 支持 PCIe4.0 及 CCIX 接口,可提供 640Gbps 总带宽,单槽位接口速率为业界主流速率的两倍,有效提升存储及各类加速器的性能。
从 Benchmark 表现看,典型主频下,SPECint Benchmark 评分超过 930,超出业界标杆 25%。同时,能效比优于业界标杆 30%。性能更高、功耗更低、良好的兼容性也正是华为鲲鹏系列 Arm 处理器参与这一市场竞争的基础。
雷锋网了解到,华为围绕鲲鹏处理器打造了 “算、存、传、管、智”五个子系统的芯片族,历经十几年,目前投入了超过 2 万名工程师。华为的鲲鹏处理器还将秉承量产一代、研发一代、规划一代的演进节奏,壮大鲲鹏计算产业。
然而,芯片的竞争,特别是企业级芯片的成功,最终还是生态的竞争。这个生态包括硬件、软件、行业应用、产业政策、开发者体系以及标准体系。
根据《鲲鹏计算产业发展白皮书》,为了建立和壮大鲲鹏计算产品,华为在硬件领域会开放服务器主板和 PC 主板,也会优先支持有意愿有能力的厂家发展机遇鲲鹏处理器的主板的自由品牌整机。
值得注意的是,华为表示其开发 TaiShan 服务器的根本目的是立标杆,使能产业链。条件成熟时,华为可逐步停止 TaiShan 服务器销售业务,转为以主板和部件等方式全面支持和服务更多整机厂商共同发展。
软件方面,华为会针对鲲鹏计算产业,通过建立 openeuler.org 社区,开源 OS 源代码,并贡献经过调优的鲲鹏处理器驱动代码,开放编译器、JDK、软件库等基础工具等方式,统一代码来源,缩短厂家构建基于 openEuler 的发行版 OS 的开发周期。
鲲鹏计算产业的行业应用则会通过产业联盟、开源社区、OpenLab、行业标准组织一起完善产业链,实现打通行业全栈,帮助行业简单高效地迁移到鲲鹏计算平台,持续发展壮大。
另外,华为还计划通过鲲鹏生态创新中心、行业联盟、产业联盟等运作机制,协同产业界各方制定相应的发展策略,达成产业共识。
开源生态的建设会从与上下游厂家、开发者和用户共同打造 openEuler 开源社区,构建跨平台、统一和开源的操作系统;借助华为在社区的影响力,将最佳实践贡献到主流开源社区;与业界主流的 CI 提供商、开源基金会以及华为云合作,向主流开源社区贡献 CI 环境三个方面来构建。
开发者体系的建设方面,华为计划通过高校、科研院所、培训机构合作培养鲲鹏计算产业人才,通过职业认证体系打开开发者的职业上升通道。
标准体系方面,鲲鹏计算产业会通过硬件、固件、软件、测试的开放标准,顺应市场和客户的诉求。
总体而言,鲲鹏计算产业从关键行业试点到全行业、全场景产业链建设目标,计划分为三个阶段来实现:第一阶段试点,标杆行业典型场景;第二阶段推广,行业扩展,数字化业务创新;第三个阶段深化,全行业全场景。
能否撼动英特尔霸主地位?
计划是宏伟的,但现实往往是残酷的。对于企业级服务器 CPU 而言,替代的成本会远远高于带来的收益,因此想要进入这一市场门槛极高,难度也很大。
因此,即便市场上出现性能和功耗都更有优势的可替代产品,想要获得订单也非常困难。但华为似乎已经找到了一个好的切入点。
白皮书中有这么一句话,“在全球鲲鹏计算厂商的共同努力下,已经构筑了相对完整的基础软件生态,在政务等重点行业的生态也初步成型。业界主流的 Linux 操作系统、虚拟化软件、数据库、中间件等基础软件均全面支持鲲鹏处理器;在政府、金融、电信和互联网等行业的主要场景已经规模商用。”
而政务、电信、金融和互联网正是鲲鹏计算产业发展试点阶段的三大应用领域。
那么具体的进度如何?华为表示,从 2019 年 Q4 开始,逐步开放基于标准规范的服务器主板和 PC 主板,厂商基于主板开发自有品牌的整机产品,产品上市周期可大幅缩短。
另外,在 2020 年 Q1 完成重点行业标杆项目建设,可满足 20% 业务场景迁移至鲲鹏计算平台,形成重点行业重点业务的技术架构部署参考设计。
还有,英伟达在去年六月宣布 CUDA 支持 Arm 处理器,要知道,英伟达 HPC GPU 市场拥有绝对的领导力,CUDA 的支持为 Arm 进入超算市场解决了一个重要的挑战。
这意味着,随着鲲鹏计算平台从试点应用逐步扩展到全场景,英特尔和华为在服务器 CPU 市场即将迎来一战,至于在桌面级 CPU 市场双方是否也会成为竞争对手,这就需要看鲲鹏是否会推出桌面级 CPU 以及这一市场的竞争情况。
不过,正如 IDC 给出的观点一样,未来计算产业发展方向必然是多种计算架构共存,云服务的普及将会加速这一进程。
雷锋网认为,数字经济、物联网市场巨大的规模,足以给不同的厂商生存空间,竞争并不意味着非此即彼,更不意味着没有合作。况且,想要撼动英特尔在这一市场的地位,生态建设,可靠的合作伙伴、稳定可靠的供货都是一系列巨大挑战,绝非一朝一夕的事情。