2021年全球超级计算大会:中国团队采用同一测试基准

在2021年全球超级计算大会(SC21))上,来自中国的团队获得了享有盛誉的戈登·贝尔奖,相当于超级计算领域的诺贝尔奖。该团队的论文《Closing the QuantumSupremacyGap》:AchievingReal-TimeSimulationofaRandomCircuitUsingaNewSunwaySupercomputer”(Bridging the Quantum Hegemony Gap: Real-Time Simulation of Random Circuits with the New Sunway Supercomputer)描述了他们如何使用新的超级计算机来模拟随机量子电路。5nxednc

事实上,谷歌在 2019 年研发的 Sycamore 量子计算机自称是“量子霸权”,这在当时颇有争议,而这一次中国团队使用了相同的测试基准。谷歌声称,平面树量子计算机可以在200秒内完成的计算任务,像萨米特(Summit)这样的经典超级计算机需要1万年才能完成。这一说法当时被 IBM 驳斥,认为实际数字可能只有 2.5 天。结合中国团队算法研究的最新中国超级计算机,可在304秒内完成相同的计算任务。看起来量子计算机仍然比经典超级计算机略胜一筹,但差距无疑正在缩小。5nxednc

根据论文,基于神威的超级计算机具有 1.2ExaFLOPS 的单精度性能。虽然这并没有正式证实传闻中的中国百亿级性能(1.2ExaFLOPS 是单精度,而“百亿级”这个词需要双精度性能的 1ExaFLOPS),但新的超级计算机似乎确实是世界上最强大的超级计算机之一。虽然尚未命名,但可以肯定的是,该研究使用了 4190 万个神威 RISC 处理器内核进行计算。5nxednc

500强超级计算机发布

世界上第一个 Exascale 系统备受期待,但前 10 名在前 500 名 HPC 基准测试中几乎没有变化。中国尚未签约其基于神威的新超级计算系统,而将于 2021 年底推出的美国 1.5ExaFLOPS 系统 Frontier 似乎还没有准备好(图 1).5nxednc

在中国新超级计算机缺席、美国边疆缺席的情况下,前 500 强仍然是卫冕冠军富岳,这是自 2020 年 6 月以来一直保持的纪录。日本超级计算机的 HPL(High Performance Linpack)基准测试成绩为 442PFLOPS,是日本超级计算机性能的 3 倍。第二名的超级计算机,Summit。5nxednc

5nxednc

图 1:1.5ExaFLOPS 的前沿将成为美国第一个 Exascale 超级计算系统。(图片来源:橡树岭国家实验室)5nxednc

事实上,前 10 名变化不大,唯一的新进入者是排名第十的微软 Azure 超级计算机 Voyager-EUS2。该系统基于 AMD EpycRome CPU 和 NVIDIA A100 GPU。5nxednc

本轮值得注意的新来者还包括排名在第 19 至第 43 之间的四个俄罗斯超级计算系统。5nxednc

总体来看,本轮中国500强系统从186个下降到173个,而美国从123个上升到150个。5nxednc

MLPerfHPC 分数

大会还公布了AI基准套件MLPerfHPC的测试结果。该基准旨在衡量人工智能的性能——人工智能在科学工作中的份额越来越大。与上一轮提交相比,最佳基准测试结果提升了 4 到 7 倍,这表明新一代超级计算机在硬件、软件和系统规模方面都有了很大的提升。5nxednc

所有提交的作品均由 Nvidia 的 GPU 加速器提供支持,但 Fuyaku Japan 除外,它由基于 Arm 的 CPU 提供支持,不使用加速器,特别是 P100、V100 和 A100。5nxednc

Nvidia 也是 CosmoFlow 和 DeepCAM 基准测试的赢家。CosmoFlow 用于从宇宙图像数据中估计物理量。最好的 CosmoFlow 测试结果是 1024 个 NVIDIA A100-SXM4-80GB GPU 可以在 8.04 分钟内完成训练,而富岳使用 512 个 CPU 可以在 114.35 分钟内完成训练。5nxednc

DeepCAM 用于识别气候模拟数据中的飓风和大气流。在这里,Nvidia 仍然位居榜首,这一次使用相同的 GPU,但数量翻了一番,达到 1.67 分钟。5nxednc

劳伦斯伯克利国家实验室使用相同 Nvidia GPU 的 512 个 40GB 版本,训练时间为 111.86 分钟,优于新的 OpenCatalyst 基准测试。OpenCatalyst 主要用于基于图的连通性来预测分子构型的能量。作者表示,包含图网络很重要,因为它反映了材料科学和化学工作负载的最新水平。它的计算属性不同于其他类型的神经网络,因为它们往往是稀疏的,并且不同的数据集导致网络具有不同的结构和连接性,这可能导致负载不平衡,从而难以有效地并行化它们。5nxednc

此外,在测试中引入了一个新的性能指标——弱缩放模式意味着系统能够同时训练同一模型的多个实例。目标是捕捉对存储系统和互连等共享资源的影响。5nxednc

多芯片 GPU

就在本次SC21大会之前,一些半导体公司发布了一些重要公告。5nxednc

会议前不久,AMD 推出了其首款多芯片 GPU。AMDInstinctMI200 将包含两个通过新的2.5D 硅桥技术(Elevated Fan-Out Bridge,EFB)连接的GPU 芯片。该公司表示,与嵌入式硅桥架构的竞争技术不同,该技术支持标准基板和组装技术。5nxednc

MI200 将是第一款基于 AMD 第二代 CDNA2 架构的 GPU,该架构针对计算密集型 HPC 和 AI 工作负载进行了优化。与去年的第一代产品 MI100 相比,这款新设备的体积要大 1.8 倍如何用mike软件计算水面线,拥有 220 个计算单元和 880 个矩阵内核。MI200 还将拥有多达 8 个 HBM2e 内存堆栈,使其成为第一款拥有 128GB HBM2e 内存的 GPU。它的内存容量是MI100的4.7倍,内存带宽是MI100的2.7倍。其FP64向量运算峰值性能为47.9TFLOPS,FP64矩阵数学峰值性能为95.7TFLOPS。5nxednc

5nxednc

图 2:AMD 的第一款多芯片 GPU,MI200。(图片来源:AMD)5nxednc

据报道,美国第一台 Exascale 超级计算机 Frontier 将使用 AMDInstinctMI200GPU。5nxednc

“当我们思考我们这一代人面临的最重要挑战时,例如能源转型、气候变化和克服我们目前面临的 COVID-19 大流行,Frontier 将使我们能够利用支持机器来应对这些重要挑战,”Frontier 所在地橡树岭国家实验室的实验室主任 Thomas Zacharia 说。“这使得 MI200 成为当今科学家可用的最强大的处理器。它的单个 GPU 的性能比整个节点的顶​​点还要强大。美国最快的超级计算机。” 5nxednc

Zacharia 说 Frontier 将很快上线,并在明年初向科学家提供。5nxednc

模拟地球

英伟达 CEO 黄仁勋在英伟达 GTC 大会上的开幕主题演讲中透露,公司将打造新的超级计算机 Earth2如何用mike软件计算水面线,它将成为地球的数字孪生体,主要用于模拟和预测气候变化(图 3) Jen-Hsun Huang 还透露,将由 Nvidia 全额资助的 Earth2 将与 Nvidia 内部的 Selene 超级计算机和用于医学研究的 Cambridge-1UK 设施的规模大致相同。他补充说,Earth2 的架构将使它是“有史以来最好的”最节能的超级计算机”,然而,这台超级计算机的具体位置还有待确定。5nxednc

5nxednc

图 3:Earth2 将致力于模拟和预测气候变化。(图片来源:英伟达)5nxednc

(原文发表于EDN姊妹网站EE Times,参考链接:,FranklinZhao编译。) 5nxednc

本文为《电子技术设计》2022年1月号文章,版权所有,禁止转载。单击此处申请免费杂志订阅。5nxednc

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论