2021年全球超级计算大会：中国团队采用同一测试基准-老王博客

在2021年全球超级计算大会（SC21））上，来自中国的团队获得了享有盛誉的戈登·贝尔奖，相当于超级计算领域的诺贝尔奖。该团队的论文《Closing the QuantumSupremacyGap》：AchievingReal-TimeSimulationofaRandomCircuitUsingaNewSunwaySupercomputer”（Bridging the Quantum Hegemony Gap: Real-Time Simulation of Random Circuits with the New Sunway Supercomputer）描述了他们如何使用新的超级计算机来模拟随机量子电路。5nxednc

事实上，谷歌在 2019 年研发的 Sycamore 量子计算机自称是“量子霸权”，这在当时颇有争议，而这一次中国团队使用了相同的测试基准。谷歌声称，平面树量子计算机可以在200秒内完成的计算任务，像萨米特（Summit）这样的经典超级计算机需要1万年才能完成。这一说法当时被 IBM 驳斥，认为实际数字可能只有 2.5 天。结合中国团队算法研究的最新中国超级计算机，可在304秒内完成相同的计算任务。看起来量子计算机仍然比经典超级计算机略胜一筹，但差距无疑正在缩小。5nxednc

根据论文，基于神威的超级计算机具有 1.2ExaFLOPS 的单精度性能。虽然这并没有正式证实传闻中的中国百亿级性能（1.2ExaFLOPS 是单精度，而“百亿级”这个词需要双精度性能的 1ExaFLOPS），但新的超级计算机似乎确实是世界上最强大的超级计算机之一。虽然尚未命名，但可以肯定的是，该研究使用了 4190 万个神威 RISC 处理器内核进行计算。5nxednc

500强超级计算机发布

世界上第一个 Exascale 系统备受期待，但前 10 名在前 500 名 HPC 基准测试中几乎没有变化。中国尚未签约其基于神威的新超级计算系统，而将于 2021 年底推出的美国 1.5ExaFLOPS 系统 Frontier 似乎还没有准备好（图 1）.5nxednc

在中国新超级计算机缺席、美国边疆缺席的情况下，前 500 强仍然是卫冕冠军富岳，这是自 2020 年 6 月以来一直保持的纪录。日本超级计算机的 HPL（High Performance Linpack）基准测试成绩为 442PFLOPS，是日本超级计算机性能的 3 倍。第二名的超级计算机，Summit。5nxednc

5nxednc

图 1：1.5ExaFLOPS 的前沿将成为美国第一个 Exascale 超级计算系统。（图片来源：橡树岭国家实验室）5nxednc

事实上，前 10 名变化不大，唯一的新进入者是排名第十的微软 Azure 超级计算机 Voyager-EUS2。该系统基于 AMD EpycRome CPU 和 NVIDIA A100 GPU。5nxednc

本轮值得注意的新来者还包括排名在第 19 至第 43 之间的四个俄罗斯超级计算系统。5nxednc

总体来看，本轮中国500强系统从186个下降到173个，而美国从123个上升到150个。5nxednc

MLPerfHPC 分数

大会还公布了AI基准套件MLPerfHPC的测试结果。该基准旨在衡量人工智能的性能——人工智能在科学工作中的份额越来越大。与上一轮提交相比，最佳基准测试结果提升了 4 到 7 倍，这表明新一代超级计算机在硬件、软件和系统规模方面都有了很大的提升。5nxednc

所有提交的作品均由 Nvidia 的 GPU 加速器提供支持，但 Fuyaku Japan 除外，它由基于 Arm 的 CPU 提供支持，不使用加速器，特别是 P100、V100 和 A100。5nxednc

Nvidia 也是 CosmoFlow 和 DeepCAM 基准测试的赢家。CosmoFlow 用于从宇宙图像数据中估计物理量。最好的 CosmoFlow 测试结果是 1024 个 NVIDIA A100-SXM4-80GB GPU 可以在 8.04 分钟内完成训练，而富岳使用 512 个 CPU 可以在 114.35 分钟内完成训练。5nxednc

DeepCAM 用于识别气候模拟数据中的飓风和大气流。在这里，Nvidia 仍然位居榜首，这一次使用相同的 GPU，但数量翻了一番，达到 1.67 分钟。5nxednc

劳伦斯伯克利国家实验室使用相同 Nvidia GPU 的 512 个 40GB 版本，训练时间为 111.86 分钟，优于新的 OpenCatalyst 基准测试。OpenCatalyst 主要用于基于图的连通性来预测分子构型的能量。作者表示，包含图网络很重要，因为它反映了材料科学和化学工作负载的最新水平。它的计算属性不同于其他类型的神经网络，因为它们往往是稀疏的，并且不同的数据集导致网络具有不同的结构和连接性，这可能导致负载不平衡，从而难以有效地并行化它们。5nxednc

此外，在测试中引入了一个新的性能指标——弱缩放模式意味着系统能够同时训练同一模型的多个实例。目标是捕捉对存储系统和互连等共享资源的影响。5nxednc

多芯片 GPU

就在本次SC21大会之前，一些半导体公司发布了一些重要公告。5nxednc

会议前不久，AMD 推出了其首款多芯片 GPU。AMDInstinctMI200 将包含两个通过新的2.5D 硅桥技术（Elevated Fan-Out Bridge，EFB）连接的GPU 芯片。该公司表示，与嵌入式硅桥架构的竞争技术不同，该技术支持标准基板和组装技术。5nxednc

MI200 将是第一款基于 AMD 第二代 CDNA2 架构的 GPU，该架构针对计算密集型 HPC 和 AI 工作负载进行了优化。与去年的第一代产品 MI100 相比，这款新设备的体积要大 1.8 倍如何用mike软件计算水面线，拥有 220 个计算单元和 880 个矩阵内核。MI200 还将拥有多达 8 个 HBM2e 内存堆栈，使其成为第一款拥有 128GB HBM2e 内存的 GPU。它的内存容量是MI100的4.7倍，内存带宽是MI100的2.7倍。其FP64向量运算峰值性能为47.9TFLOPS，FP64矩阵数学峰值性能为95.7TFLOPS。5nxednc

5nxednc

图 2：AMD 的第一款多芯片 GPU，MI200。（图片来源：AMD）5nxednc

据报道，美国第一台 Exascale 超级计算机 Frontier 将使用 AMDInstinctMI200GPU。5nxednc

“当我们思考我们这一代人面临的最重要挑战时，例如能源转型、气候变化和克服我们目前面临的 COVID-19 大流行，Frontier 将使我们能够利用支持机器来应对这些重要挑战，”Frontier 所在地橡树岭国家实验室的实验室主任 Thomas Zacharia 说。“这使得 MI200 成为当今科学家可用的最强大的处理器。它的单个 GPU 的性能比整个节点的顶点还要强大。美国最快的超级计算机。” 5nxednc

Zacharia 说 Frontier 将很快上线，并在明年初向科学家提供。5nxednc

模拟地球

英伟达 CEO 黄仁勋在英伟达 GTC 大会上的开幕主题演讲中透露，公司将打造新的超级计算机 Earth2如何用mike软件计算水面线，它将成为地球的数字孪生体，主要用于模拟和预测气候变化（图 3） Jen-Hsun Huang 还透露，将由 Nvidia 全额资助的 Earth2 将与 Nvidia 内部的 Selene 超级计算机和用于医学研究的 Cambridge-1UK 设施的规模大致相同。他补充说，Earth2 的架构将使它是“有史以来最好的”最节能的超级计算机”，然而，这台超级计算机的具体位置还有待确定。5nxednc

5nxednc

图 3：Earth2 将致力于模拟和预测气候变化。（图片来源：英伟达）5nxednc

（原文发表于EDN姊妹网站EE Times，参考链接：，FranklinZhao编译。） 5nxednc

文章版权声明 1、本站永久网址：https://www.9im.cn
2、本主题所有言论和图片纯属会员个人意见，与本网站立场无关。
3、本网站所有源码和软件均为作者提供和网友推荐收集整理而来，对提供的源码不拥有任何权利，其版权归原著者拥有。仅供学习和研究使用,下载后请24小时内删除。不得使用于非法商业用途，不得经营非法游戏或违反国家法律。一切关于该资源商业行为与老王博客无关。
4、如果您喜欢该程序，请支持正版源码、软件，购买注册，得到更好的正版服务。如有侵犯你版权的，请邮件与我们联系处理，本站将立即改正。
5、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

喜欢就支持一下吧