一年一度云栖大会,又到了阿里在技术上“秀肌肉”的时刻。
自 2019 年发布首款 RISC-V 玄铁处理器,到去年发布 AI 芯片含光 800,再到今年发布的通用服务器芯片倚天 710,阿里旗下半导体公司平头哥在芯片上实现了“年更”。
在半导体领域被“卡脖子”的当下,阿里在芯片设计上的进展格外引发关注。
顶配?
对比之下,本次最新发布的倚天 710 芯片,是目前参数表现最为亮眼的一个:5nm 制程、单芯片容纳 600 亿晶体管、采用最新的 ARMv9 架构、DDR5 内存带宽、PCIe 5.0 接口,每一项都是 2020 年才启动的新技术,也是各自技术领域的“顶配”。跑出的 SPECint2017 440 分,也是同类芯片中的最高成绩。
在采用各项新技术的同时,倚天 710 的在面世前各个环节的进展也十分顺利。
阿里云智能总裁、达摩院院长张建锋在接受包括搜狐科技在内的媒体采访时表示,倚天芯片研发进展超过预期,在行业内普遍需要两次流片(像流水线一样通过一系列步骤制造芯片)的情况下,倚天 710 仅在 7 月进行一次流片,就已经基本符合需求。
出色的参数显然拔高了人们对于阿里这款芯片的期待。
从阿里公开披露的信息中,倚天 710“性能较业界标杆高 20%,能效比高 50%”的表述格外值得注意。
一位不愿具名的分析师对搜狐科技表示:“如果对标的是同为 5nm 的芯片,那么 20% 的性能提升是一个非常不错的成绩,但如果对标的是 7nm 芯片,则 20% 只能算是一个正常的提升。”
性能和能效比是衡量一款芯片好坏与否的重要参数。制程、架构、内核数对此都有影响。
张建锋坦承,由于是最新发布的产品,倚天 710 在表现优秀的同时,也必然存在技术红利。有业内人士也表示:“在这些最新的技术尚未成熟时提前布局,是阿里敢于承担风险的表现,且使用新技术也付出了更高的成本。”
不过,需要澄清的是,上述这些看似高超的技术大多是由外部授权提供。
如芯片架构可分为指令集架构和微架构等。通常厂商会对微架构进行调整,以适配产品,并侧面证明自己的研发实力,但此次倚天 710 并未对微架构进行技术改造,而是全盘采用了公版授权。相比之下,华为鲲鹏 920 芯片虽然早 2 年发布,基于的也是旧版的 ARMv8.2 架构,但却对微架构进行了自行设计。
在自研方面,阿里在对外宣传中着重强调了该芯片对云应用场景的适配。如解决云计算高并发条件下的带宽瓶颈。“倚天 710 针对片上互联进行了特殊优化设计,通过流控算法缓解了系统拥塞问题。”
考验
从实际投产商用的角度来看,倚天 710 也面临着诸多考验。
首先是芯片质量的稳定性。国际调研机构 Wit Display 首席分析师林芝称,由于是首次亮相,这款芯片的良率、稳定性以及可靠性都并没有获得市场的验证,在这个时间点来判断这款芯片的实际表现,为时尚早。
有业内人士也表示,目前的国产服务器芯片,大多表面数据好看,核多,内存通道多,但实际使用体验很差,在外设的兼容性等等方面的指标上和英特尔芯片还不在一个级别。
另外,由于采用了最先进的工艺,倚天 710 在生产制造上也面临难度。
“5nm 芯片在工艺上比较成熟的只有台积电、三星,目前主要生产消费级 5nm 芯片(如手机),能给到阿里服务器芯片的产能十分有限。”林芝表示。
除此之外,由于全部自用,这款芯片所能带来的利润难以量化,也更难证明它的商业价值。
相比之下,同样在大力发展云计算的华为,早在 2019 年就推出了基于 ARM 架构的 7nm 服务器芯片“鲲鹏 920”和服务器“泰山”。2020 年 6 月,泰山服务器先后中标三大运营商的服务器采购项目。
变局
倚天 710 芯片的发布,除了对阿里云业务自身产生影响外,还有可能因为规模效应,给服务器芯片市场带来变局。
有业内人士对搜狐科技评估表示,倚天 710 的研发成本在十几亿元左右,包括架构授权及几千万美元的流片费用,这相当于阿里云在今年上半年利润总额的 2-3 倍。
值得注意的是,经历了长达 12 年发展和投入,阿里云直到今年才开始正式盈利。
巨大的成本付出,对应的是潜在且更大的商业回报。关于这款芯片在未来所能带来的利润回报,张建锋并未给出明确答案。
不过,阿里云目前已经拥有超过 150 万台服务器,具备极强的规模效应,相比于外部采购,自研所能节省的成本相当可观。据了解,倚天 710 芯片将搭载在同期发布的磐久服务器上,并在今年开始部署。
林芝对搜狐科技表示,自研芯片不仅可以为阿里的云计算服务降低成本,从而提供更高的竞争力,甚至有可能会改变服务器芯片市场的竞争格局。
放眼整个整个服务器芯片市场上,X86 芯片占据主导地位,其中英特尔的芯片占据了 90% 以上的市场份额。
“英特尔的一款 10nm 制程的 X86 芯片,主频能达到 3.4GHz;AMD 7nm 制程的 X86 芯片,主频可以达到 3.5GHz”,林芝介绍道:“而阿里的这款芯片,尽管是 5nm 工艺,但由于采用了 ARM 架构,主频只有 3.2GHz。”
这主要是受架构的影响。相比于 X86 架构,采用 ARM 架构的芯片在性能上虽不占优势,但在功耗和价格上都更低,对于用电量和采购量都十分庞大的云计算公司来说,是个不错的选择。
同时,由于可以不完全依赖 X86 架构的服务器,也可以应对潜在的单一供应商风险。
2018 年,亚马逊开启了使用 ARM 架构自研服务器芯片的先河,并在接下来两年内发布两款命名为 Graviton 的服务器芯片。随后华为鲲鹏芯片、Ampere 的 Altra 芯片都采用了 ARM 架构。
随着多家云计算尝试 ARM 架构芯片自研业务,这个拥有 7000-8000 亿规模的市场或许也将迎来新的变化。
溯源
时间回到 2018 年 4 月,阿里巴巴全资收购当时大陆唯一一家自助嵌入式 CPU IP Core 公司中天微系统有限公司,开启了自研芯片之路。
在此之前,阿里巴巴已经先后投资了多家芯片公司,如寒武纪、Barefoot Networks、深鉴、耐能(Kneron)、翱捷科技(ASR)等等。马云也被媒体称为“要买下大半个芯片产业”。
马云表示:“阿里投入数十亿美金研发芯片并不是为了控制技术,而是想让每个年轻人,每家小公司都能以性价比更高的方式分享这项技术。”
关于自研芯片的目的,张建锋表示,主要是为了更适配云服务场景。“原来 CPU 并不完全为了云上负载来设计的,难以完全适配大规模、高并发的的云计算需求。”
不过,对于外界猜测的阿里是否打算涉及更为核心的芯片制造业务,张建锋表示否认。
“产业有分工,像我们服务器最大的提供商是浪潮,交换机最大提供商是锐捷,还有很多大大小小的厂商。他们不仅满足了我们自己的需求,也给产业带来更大的空间。”
目前,平头哥拥有处理器 IP、AI 芯片及通用芯片等产品家族,旗下玄铁系列处理器出货量已达 25 亿颗;两年前问世的阿里第一颗芯片含光 800 已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。截至目前,阿里云已经完成了从芯片、部件到整机的云基础设施闭环。