超级计算迎来速度大提升日本“K”超级计算机排名第十

超级计算迎来速度大幅提升

各国竞相开发百亿亿级超级计算机

日本的“K”超级计算机目前在Top500榜单中排名第十。

图片来源:集集出版社/法新社/盖蒂

7 月初,田纳西州橡树岭国家实验室的工作人员开始用计算机“庞然大物”的组件填满一个巨大的房间:一排排整齐堆叠的计算单元、约 290 公里的光纤电缆和能源一池水。美国能源部 (DOE) 希望k在计算机里是多少,当这台价值 8 亿美元、被称为 Vertex 的机器明年上线时,它将让美国重新获得自 2012 年以来失去的头衔:世界上拥有最多快速超级计算机的国家。

按照设计,Vertex 将以 200 petaflops 的峰值速度运行,即每秒 200 petaflops。这将使 Vertex 比目前位于中国的世界纪录保持者快 60%。

然而,对于许多计算机科学家来说,完成“顶点”就相当于完成长跑的第一圈。在世界各地,工程师和科学家团队都在瞄准处理能力的下一个飞跃:百亿亿次计算,运行速度达到惊人的 1,000 petaflops 或更快的计算机。目前,来自4个国家或地区的团队正在与该地区的计算机行业合作,朝着这个宏伟的目标迈进。中国计划在 2020 年运行第一台百亿亿次机器;美国计划到 2021 年通过 DOE 的“百亿亿级计算项目”建造至少一台机器;欧盟和日本将紧随其后。

速度不是一切

对于计算机科学家来说,“exascale”的含义是值得深思的。最简单的定义是一台能够以 1 exaflop(相当于 1,000 petaflops)处理一组特定线性代数方程的计算机。自 1993 年以来,一组研究人员使用这个被称为 LINPACK 的基准来生成排名前 500 的超级计算机列表 (Top500).

因此,LINPACK 已成为超级计算机的代名词。自2013年6月以来,中国制造的超级计算机一直位居榜首。然而,据田纳西大学计算机科学家、Top500 榜单创始人杰克·唐加拉(Jack Dongarra)所说,速度并不是一切。他将超级计算机的峰值比作汽车速度表上的最高速度。虽然能够达到每小时 300 公里的速度可能令人印象深刻,但真正赋予大多数汽车价值的是它们在日常驾驶中的表现。

同样,计算机执行某些线性代数运算的速度不一定反映其预测药物活性、训练大脑中的神经网络或执行复杂模拟的能力。所有操作对处理能力、可以并行处理的操作类型以及移动的数据量都有不同的要求。美国能源部科学办公室高级科学计算研究副主任 Barbara Helland 表示,Top500“并不能衡量硬件在实际应用中的表现如何”。

去年从英特尔公司退休的计算机科学家 Shekhar Borkar 表示,现实世界的科学应用程序可能会利用 10% 的这个速度,但更常见的是只利用 1.5%~ 3%。根据 Borkar 的预测,这个限制在百亿亿级超级计算机上仍然存在。

图片[1]-超级计算迎来速度大提升日本“K”超级计算机排名第十-老王博客

担心峰值速度和实用性之间的脱节

在美国,人们越来越担心峰值速度和实用性之间的脱节,这促使将百亿亿次计算定义为应用程序驱动的不同定义。DOE 的目标是使第一台 exascale 计算机比该国目前最快的系统 17.6 petaflop Titan 快约 50 倍。例如,这可能意味着在给定时间段内筛选的潜在太阳能材料比以前多 50 倍,或者在模拟全球气候时空间分辨率提高 50 倍。

为了实现这些目标,能源部正在与来自学术界、政府和工业界的数百名研究人员合作。它有 25 个团队,每个团队负责设计软件。这些软件可以使用百亿亿级机器来解决特定的科学或工程问题,例如发动机设计。阿贡国家实验室计算、环境和生命科学副主任 Rick Stevens 表示,美国百亿亿级超级计算机成功的主要标准将是“其运行 25 个应用程序的性能得分的几何平均值”。

在开发此类计算机的同时,该机构还试图改善使用超级计算机的人、编写软件的人以及制造硬件的半导体公司之间的合作。领导该项目的橡树岭国家实验室的计算机科学家 Doug Kothe 说,通过 DOE 的百亿亿次计划,“我们正在将不同的圈子聚集在一起。” 这种联合用户和建设者的策略(所谓的协同设计)并不新鲜。但 Kothe 说,“它从未像现在这样被广泛使用”。

华盛顿国家核安全局 (NNSA) 超级计算研究和运营项目经理 Thuc Hoang 说:“我从事这项业务已有 20 年了,我第一次看到这种类型的合作和支持。” .

避免成为“噱头”机器

尽管如此,Borkar 和其他一些观察家仍然担心,正在建造的百亿亿次系统可能会变成在实践中表现不佳的“噱头”机器。“拥有更高的应用程序性能意味着以不同的、更现实的方式设计机器,”Borkar 说。“这显然会损害 LINPACK 的性能,并使机器从营销角度看起来很糟糕。”

他还表示,希望美国坚持早在 2008 年制定的计划,将百亿亿级的变化视为更彻底地重新思考计算行业发展的机会。“进化方法将失败,”博卡尔说。“你需要一种革命性的方法。” 史蒂文斯认为,巨大的变化正在悄然进行。据他预测,能源部将在圣诞节前后或之后完成与英特尔的正式合同。更少的是,“我无法透露我们在做什么,但它非常具有创新性”。

尽管如此,仍有一些因素限制了对超级计算的积极推动。对于每一代新一代的超级计算机k在计算机里是多少,程序员都必须以他们拥有的软件为基础。“我们有一些遗留代码,”在 NNSA 运行项目的 Hoang 说,这些项目依靠超级计算机来保持美国武器库遵守禁止测试核武器的规定。“鉴于我的办公室正在做的事情,我们不能丢弃需要 10 年开发和验证的旧代码。”

同时,预算限制对美国的百亿亿级计划具有决定性影响。按照计划,Aurora 将是一台 180 petaflop 的机器,并将于 2018 年在阿贡开始运营。但是,美国能源部没有足够的资金将百亿亿级超级计算机硬件的生产外包给外部公司。为此,该机构并未发布公开招标公告,而是更改了与英特尔和 Cray 在 Aurora 上签订的合同,要求后者在 2021 年之前供应一台百亿亿级机器。

与此同时,其他百亿亿次级项目正在取得进展。中国仍计划在 2020 年首先建造一台百亿亿级超级计算机,并正在称重三台原型机。Dongarra 说,其中两个正在超级计算设施中建造,这些设施已经拥有该国一些最快的机器,并且可能是该国首创的轻型结构的变体。第三个是由“黎明”公司建造的。该公司与高性能芯片开发商 AMD 建立了良好的关系,因此它可能会收购后者的主力微架构。Dongarra 认为,这台机器可能具有新功能,并且不同于轻量级结构。

研究人员还在考虑如何在未来几十年内超越百亿亿次并建造更快更好的超级计算机。建造这样一台超级计算机可能意味着采用仍处于早期发展阶段的技术:以大脑中神经元功能为模型的神经形态电路,或量子计算。

然而,许多研究人员关心的一个主要问题是确保百亿亿次系统以及为其开发的科学应用程序在百亿亿次系统启动时能够正常运行。“让 exascale 系统启动并运行,”Helland 说,“这就是让我在晚上辗转反侧的原因。”

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论