AMD 64核心神U实测:双路256框框将对手碾压成灰

  作者:上方文Q

  近日,AMD 正式发布了第二代 EPYC 霄龙骁龙处理器,为数据中心市场奉上一道大餐,规格参数遥遥领先,生态建设也是欣欣向荣。那么实际性能到底如何呢?

  AnandTech 有幸进行了一番实测,一起来瞻仰瞻仰。

  二代霄龙的规格无疑是相当炫目的,也没有任何敌手:7nm 全新工艺、Zen 2 全新架构、Chiplet 小芯片设计、最多 64 核心 128 线程、最大 256MB 三级缓存、首发支持 PCIe 4.0 并有 128 条通道、单路最大 4TB DDR4-3200 内存、18GT/s高速低延迟第二代 Infinity Fabric 互连总线、SME 安全内存加密、SEV 安全加密虚拟化……

  AnandTech 拿到的是旗舰型号霄龙 7742,64 核心 128 线程,基准频率 2.25GHz,最高加速 3.40GHz,三级缓存 256MB,热设计功耗 225W,价格为 6950 美元。

  Intel 方面目前最顶级的是至强铂金 8280/8280M,14nm 工艺,28 核心 56 线程,基准频率 2.7GHz,最高加速 4.0GHz,三级缓存 38.5MB,热设计功耗 205W,价格 10009/13012 美元。

  其实,Intel 也有 56 核心 112 线程的至强铂金 9282,但采用了 LGA 封装,整合在主板上,热设计功耗高达 400W,价格更是据说要五六万美元。

  就在二代霄龙发布前,Intel 刚刚宣布了 56 核心 118 线程的 LGA 独立封装新品,但尚未正式发布,具体规格也没有公布,而且即便如此核心数量上也仍处于劣势,价格怎么也得两三万美元。


二代霄龙双路产品线


二代霄龙 VS 二代可扩展至强


二代霄龙单路产品线

  实际测试中用了两颗霄龙 7742,组成双路共 128 核心 256 线程,搭配主板是一块参考设计板子,内存是美光的 DDR4-3200 512GB (32GB×16),硬盘启动盘是三星 MZ7LM240、数据盘是美光 9300 3.84TB,电源 1200W。

  同时还有初代霄龙旗舰 7601,32 核心 64 线程,最高频率 2.2-3.2GHz,三级缓存 64MB,热设计功耗 180W,也搭配 16 条 32GB 内存。

  Intel 方面参战一个是刚才说的至强铂金 8280,另一个是初代可扩展至强铂金 8176,也是 28 核心 56 线程,频率 2.1-3.8GHz,三级缓存 38.5MB,热设计功耗 165W,价格 8725 美元。

  有时候还会加入至强 E5-2699 v4,Broadwell 四代酷睿同架构,14nm 工艺,22 核心 44 线程,频率 2.2-3.6GHz,三级缓存 55MB,热设计功耗 145W,价格 4115 美元。

  由于服务器的测试项目都比较专业、复杂,我们这里不做过多展开,看看对比差异就好。

  另外,霄龙的内存延迟问题由于比较复杂,后续将单独展开介绍。

  SPEC CPU2006 单线程测试中,霄龙 7742、7601 单个核心可以分别最高加速到规定的 3.4GHz、3.2GHz,至强 8176 也能如约达到 3.8GHz,但无法获得至强 8280 的数据,如果能达到 4GHz 则性能可比至强 8176 高出大约3-5%。

  霄龙 7742 的单线程性能比前代霄龙 7601 几乎每个项目中都有明显提升,最多达到了 36%,平均也有 18%。如果排除一个不变、一个倒退1%,其他项目平均提升幅度达 22%。

  霄龙 7742 对比至强 8176 则是有高有低,最好的领先 28%,最差的落后 39%,平均落后7%,如果对比至强 8280 可能落后 10% 左右。

  另外要注意,GCC 编译器的版本非常重要,越新越好,GCC 8.3 相比于 GCC 7.4 霄龙 7742 的性能略有提升,456.hmmer 甚至翻了一番。

  SPEC CPU2006 多线程测试中,霄龙 7742 相比霄龙 7601 核心数翻番、频率更高,领先幅度最高达到了恐怖的 153%,平均也有 109%,翻了一番还多。

  霄龙 7742 对比至强 8176 更是碾压一般的存在,最多领先 188%,最少领先 36%,平均高达 121%!即便是对至强 8280 也能领先超过 110%。

  在部分测试中比如 libquantum,霄龙 7742 可以所有核心线程都跑到 3.2GHz,而在另一些测试比如 h264ref 则都是 2.5GHz。

  7-Zip 压缩测试中,霄龙 7742 领先霄龙 7601 78%,领先至强 8176 54%,解压测试中分别领先 1.27 倍、1. 51 倍

  Java Max-jOPS 测试中,霄龙 7742 领先霄龙 7601 60%,领先至强 8280 38-48%

  如果每个节点四个 Java 虚拟机,官方数据提供的霄龙 7742 性能可领先联想系统实测的至强 8280 73%。

  Java Critical-jOPS 测试中,大页(huge pages)的话霄龙 7742 领先至强 8176 33%,小页(small pages)则是可怕的2. 57 倍

  按照两家官方数据,如果为虚拟机配置更大内存,霄龙 7742 可领先66%

  NAMD 高性能计算测试,至强 8280 终于扳回一局,但即便是开启 AVX-512 指令集,也只能领先霄龙 7742 2%,否则的话霄龙 7742 就能领先43%,而对比霄龙 7601 则提升了 71%。

  虽然因为时间关系,本次测试并不全面深入,尤其是缺乏最高负载的测试,但是很明显可以看出二代霄龙的强大优势,相比对手性能超出 50-100%,而价格低了 40%,无论性能、性价比、能耗比都无情碾压。

  更何况,二代霄龙还有更新的工艺、更多的核心、更多的内存通道和容量、更多的 PCIe 通道和首发的 PCIe 4.0。

  这也难怪众多软硬件企业巨头都纷纷力捧 AMD,也难怪 AMD 提出了数据中心市场份额要达到两位数的目标(目前为 3.4%)。

  AnandTech 也是对二代霄龙赞不绝口,认为 AMD 达成了精彩绝伦(stellar)的成就,值得热烈鼓掌。

  AMD 后续还有 Zen 3、Zen 4 架构按期推进,Intel 则会在明年推出 10nm Ice Lake 新工艺新架构的新至强,号称 IPC 提升 18%,也支持八通道内存,核心数几乎肯定要多于 56 个,但不知道是否也会采用 chiplet 小芯片设计,频率和功耗又会如何。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注