世界上首台基于 Arm 架构的超算,现如今终于退役了。
2018 年 5 月,这台拥有 10000 个核心的系统 Isambard 2 首次部署。
它使用了由 Cavium 开发、台积电制造的 64 位 Armv8 ThunderX2 处理器,外加几个 Nvidia P100 GPU。
Isambard 2 这一项目,是由来自布里斯托尔大学微电子小组负责人 Simon McIntosh-Smith 教授领导。他在社交媒体上,公布了这一消息。
而且,下一代 Isambard 3 超算,将使用 HPE 提供的基于 NVIDIA Grace ARM 的 CPU 上线接任。
据称,二代 Isambard 超算将于当地时间 9 月 30 日上午 9 点关闭,因此用户必须在截止日期之前,删除数据。
6 年使命已完成,超算光荣退役
Isambard 2 并不是第一台在 2024 年退役的超算。
橡树岭国家实验室的 Summit 超级计算机,也将于今年 11 月退役。这台超算同样在 2018 年建成,随之被功能更强大的 Frontier 超算所取代。
众所周知,超级计算机的购置成本,高达数百万美金,甚至操作成本也是非常高。
然而,随着技术的进步,一些科技大厂为了紧追前沿,就不得不淘汰较老的设备,即便是其运作依旧良好。
这是因为,最新的硅芯片能提供更优性能、效率,进而让研究人员更快取得突破。
因此,即便重新投入建设新超算,也是物有所值。
Isambard 3 下一代超算备齐
全新 Isambard 3 超算仍基于 Arm 架构搭建,但这一次,它将配备 34,272 核的 NVIDIA Grace CPU。
这一超算,首次亮相在 2023 年 5 月。
Isambard 3 被部署在英国布里斯托尔和巴斯科学园,预计其性能和能效将是 Isambard 2 的 6 倍。
它将成为欧洲最节能的系统之一,将为医疗和科学研究提供动力。
据报道,它能够达到 2.7 petaflops(FP64)峰值性能,功耗不到 270KW,跻身世界第三大最环保的非加速超级计算机之列。
同样,这一项目由布里斯托尔大学牵头(作为 GW4 Alliance 一部分),巴斯大学、卡迪夫大学和埃克塞特大学也参与其中。
对此,Arm 高级 VP 基础设施总经理 Mohamed Awad 表示,从气候变化到医学,超算已经让学术界和行业领袖能够应对世界一些极大的挑战。
推动生命科学、医学等领域的突破
Isambard 3 的打造,将帮助科学界在 AI、生命科学、医学、天体物理、生物技术方面取得突破。
它就可以训出结构异常复杂的模型,比如风力发电场、聚变反应堆,进而帮助研究人员揭示清洁和绿色能源新进展。
与此同时,Isambard 3 还将继续前一代模拟分子水平机制的工作,以便更好地了解帕金森氏症。而且,也是为了找到治疗骨质疏松症和新冠肺炎的新方法。
这些密集型应用,在 Grace CPU 加持下,将能发挥出最大的极致性能。
布里斯托尔大学高性能计算教授 Simon McIntosh-Smith 称:
Isambard 3 应用程序性能效率是其前身 6 倍,可与许多速度最快的 50 个 TOP500 系统相媲美,将为科学家们提供一个革命性的全新超级计算平台,以推进突破性研究。
不过目前,Isambard 3 超算没有进入 Top500 最强超级计算机排行榜,但在 24 年 6 月的 Green500 排行榜上获得了第二名,成为当今最高效超算。
此外,Isambard 3 超算将增加 5280 个处理器,使其性能提高 32 倍,并在可能在下一次运行中跻身 Top500 榜单的前 10 名。
世界 TOP 500 超算,Frontier 第一
每年,世界 TOP 500 超算榜单,都会公布今年超算的最新名单。
第 63 届 TOP500 排行榜显示,尽管 Frontier 不再是榜单中唯一以百亿亿次浮点运算计算的系统,但依旧夺得榜首。
而另外一个值得注意的点是,一个全新超算冲进了前 10 名。
Frontier 被部署在美国田纳西州橡树岭国家实验室,依旧是视觉上最强大系统,其 HPL 得分为 1.206 百亿亿次浮点运算 / 秒。
该系统总共有 8,699,904 个 CPU 和 GPU 核心,采用 HPE Cray EX 架构。而且,它采用了针对高性能计算(HPC)和 AI 优化的第三代 AMD EPYC CPU 和 AMD Instinct MI250X 加速器,并依靠 Cray 的 Slingshot 11 网络进行数据传输。
此外,这台机器的能效比达到了 52.93 十亿次浮点运算 / 瓦特,使 Frontier 在 GREEN500 排行榜上位列第 13 位。
与上一份榜单一样,位于美国伊利诺伊州阿贡国家实验室的 Aurora 系统在 TOP500 中排名第二。
尽管目前正在调试且尚未完全完成,Aurora 现在成为第二台正式突破百亿亿次级障碍的系统,HPL 得分为 1.012 百亿亿次浮点运算 / 秒。
这一结果,相比上一份榜单的 585.34 千万亿次浮点运算 / 秒有所提升。
此外,前十名榜单中,还有三台美国超算 —— Eagle、Summit、Eos NVIDIA DGX SuperPOD。
正如开篇所述,Summit 超算将于今年退役。
还有日本著名的超算富岳(Supercomputer Fugaku),从 2020 年 6 月-2021 年 11 月,一直占据榜首位置。
它部署在日本神户,HPL 得分为 442 千万亿次浮点运算 / 秒,它仍是美国以外排名最高的系统。
值得一提的是,唯一跻身前十名的新系统,来自瑞士国家超级计算中心(CSCS)的 Alps 计算机,位列第六。该系统的 HPL 得分为 270PFlop/S。
参考资料:
-
https://www.tomshardware.com/tech-industry/supercomputers/isambard-2-the-worlds-first-arm-based-supercomputer-retires-after-six-years-of-service-isambard-3-will-tap-nvidias-grace-cpu-superchips
-
https://www.top500.org/
本文来自微信公众号:微信公众号(ID:null),作者:桃子,原标题《全球首台 Arm 超算光荣退役!下一代已接任,配备 384 块英伟达 Grace CPU》