2021 Top 500上半年超算榜单新上榜系统分析

在刚刚结束的2021国际超算大会(ISC)上,Top500组织发布了最新一期的超算Top 500榜单。虽然位于Top10的超算由于只增加了一台排名第五位的Perlmutter而略显平淡,但新上榜的超算系统仍然有58个。按照以往的惯例,对这58套新上榜超算系统进行一番统计分析,有助于了解整个超算行业的最新发展状况。

从6月份新上榜超算系统所用CPU的厂家来看,AMD和Intel的x86 CPU仍然是最为主流的选择。相比于前几期Top500榜单上的新系统,在本期榜单的新系统里AMD开始取得对于Intel的领先。在AMD EPYC处理器持续的迭代之下,凭借CPU核数和IO资源上的领先优势,超算领域和数据中心领域一样,AMD相比Intel售卖出了更多的CPU。

2021年6月Top500新上榜系统CPU按厂家分类

进一步地按照CPU型号进行分类,可以看到在新上榜超算系统里,老一代的Intel Xeon E5和AMD EPYC Zen处理器(Naples)已经退出了超算系统的舞台,使用Intel Skylake处理器的新系统也比较少了。与之相对的,AMD EPYC Zen2处理器(Rome)和Intel Cascade Lake Xeon-SP处理器成为了新系统的主流选择。今年新发布的AMD EPYC Zen3处理器(Milan)和Intel Ice Lake Xeon-SP处理器随着发货量的增加,也开始进入到使用过程中。

2021年6月Top500新上榜系统CPU按型号分类

随着AMD EPYC处理器的大量使用,新上榜超算系统的CPU核数分布也发生了一定的变化。Intel最新的Ice Lake处理器每Socket的核数最多只有40个,而48%的新上榜系统每Socket的核数在48或64个,这就从另一个侧面表明新超算系统上更多地使用了AMD EPYC处理器。

2021年6月Top500新上榜系统CPU核数分布

在所用的AMD EPYC处理器里出现了EYPC 7V12型号,这是微软Azure云所使用的定制化Socket,具有48个核心,主频为2.45GHz。在本期榜单上,AWS和Azure都有超算系统上榜,这表明云厂商也在构建基于云的HPC基础架构。这些HPC系统在性能上虽然并不是最顶尖的,但对于中小型企业和科研所而言,能够在云上使用HPC系统,将会极大地提高其数据处理效率。

在58个新上榜超算系统中有22个使用了加速器模块,这些加速器模块无一例外地全部来自于NVIDIA,这也表明了NVIDIA在加速计算领域的统治地位。从所用的NVIDIA GPU型号来看,主要是上一代和当前顶级性能的V100 GPU和A100 GPU。A100 GPU在去年5月份正式发布,但新系统中所用数量已经远超V100 GPU,这说明NVIDIA新产品的普及速度还是很快的。

2021年6月Top500新上榜系统所用GPU种类

虽然NVIDIA GPU是业界目前唯一的加速模块选择,但由于美国的E级超算Frontier和EI Capitan将会使用AMD的Instinct GPU,另一台E级超算Aurora将会使用Intel Xe HPC GPU。当这些新一代的超算发布之后,NVIDIA GPU加速模块一统天下的局面将有望得到改变。

在2020年6月的Top500榜单上,有53%的新系统使用了以太网进行超算节点间的互连。但这一次,情况又发生了变化。使用Infiniband网络的超算系统达到39套,占新上榜系统的67%,而使用以太网的新系统只有19%的比例。虽然在每期Top500榜单上以太网和Infiniband网络会在新系统所用网络的一二名位置来回变动,但跟其它自定义的互连网络相比,Infiniband和以太网仍然是超算系统进行网络互连的唯二选择。

2021年6月Top500新上榜系统所用网络类型

细分一下可以看到,新上榜系统中的大部分都使用了200Gbps带宽的Infiniband HDR网络。在400Gbps网络还没完全普及之前,200Gbps带宽的网络将是性价比最高的选择。

2021年6月Top500新上榜系统网络带宽的类型

新上榜的这些超算系统主要来自于Lenovo、Atos和HPE这三家厂商。虽然Lenovo制造的大部分HPC系统都提供给了国内的客户,但Lenovo也在帮助国外的客户进行系统升级,Lenovo制造全球排名第15位的Super-MUC-NG超算进行升级后,有望进一步提升该超算系统在Top500榜单上的成绩。

2021年6月Top500新上榜系统按制造商的分类


总 结

在2021年6月Top500榜单前十名几乎没有发生变化的情况下,E级超算的激烈竞争正在悄然进行之中。除了最引人注目的Top10系统外,榜单上的其它超算系统也在跟随着CPU、GPU和网络产品的迭代升级而提升性能。Top500榜单虽然不能涵盖全球所有的高性能计算系统,但在其上发生的变化也反映了整体技术的进步趋势。

下一篇
« Prev Post
上一篇
Next Post »