去年11月份,AMD发布了,首次采用,和游戏向的RDNA架构截然不同。现在,第二代的MI200也首次浮出了水面。
MI100采用台积电7nm工艺制造,集成120个计算单元、7680个流处理器,并专门加入Matrix Core(矩阵核心)用于加速HPC、AI运算,还整合了4096-bit 32GB HBM2显存,支持PCIe 4.0 x16和八卡并行,整卡功耗300W。
,混合精度和FP16半精度的AI性能提升接近7倍。
根据最新消息,MI200将会采用下一代CNDA架构,并首次引入MCM多芯片封装,看这样子翻番到1.5万个流处理器问题不大。
本次曝光的MI200将用于HPE Cray EX超级计算机,执行加速计算,产品名被描述为“MCM Special FIO Accelerator”,其中FIO代表“Factory Installation Option”(厂商安装选项),此外还有OAM形态,代表开源加速卡。
不过,MI200的具体规格目前一无所知,除了猜测流处理器可能因为MCM封装而翻一番,还有望加入FullRate640ps指令集、支持全速率FP64浮点计算。
Trento并未出现在AMD霄龙演进路线图上,其实是即将发布的第三代“Milan”(米兰)的定制版,专为超算优化,可能会提前支持PCIe 5.0。