2021年度MLPerf诞生95个固定任务冠军,浪潮AI服务器斩获44项第一

2021年,人​​工智能仍在经历从技术开发到应用落地的过渡。虽然这不是什么新鲜事,但人工智能落地的速度仍然比大多数人预期的要慢。站在工业人工智能时代的门口,产业链厂商正在探索加速人工智能落地的途径。

近日,MLPerf 2021年第四次性能测试正式结束,也标志着今年所有测试的完成。MLPerf 2021年共有95个固定任务冠军诞生,浪潮AI服务器共获得44个第一名,在MLPerf 2021冠军榜中排名第一。

这意味着,在人工智能训练和推理场景中,浪潮信息实现了更高的效率、更快的速度、更强的性能,带来更真实的落地预期。那么,浪潮信息是如何推动工业人工智能的呢?

训练与推理双冠军,尽显霸气

MLPerf 由图灵奖获得者 David Patterson 联合顶级学术机构创立,也是最具影响力的国际 AI 性能基准。MLPerf 的测试主要分为两个方面,AI 训练基准和 AI 推理基准。

此外,MLPerf AI 训练基准测试分为集群测试和单机测试两种场景。只检查完成 AI 任务训练的时间。时间越快,性能越好。MLPerf AI推理基准测试从多个维度考察单机在数据中心和边缘场景下的推理性能。

在AI训练基准方面,MLPerf训练V1.1个任务分为图像分类(ResNet)、医学图像分割(U-Net3D)、目标物体检测(SSD)、目标物体检测(Mask R-CNN) )、语音识别(RNN-T)、自然语言理解(BERT)、智能推荐(DLRM)和强化机器学习(Minigo),一共8类AI应用场景,也是比较常见的人工智能应用场景。

12月1日,MLPerf公布了最新的训练名单V1.1。浪潮信息提交了AI服务器全部8个单机测试的固定任务(Closed Division)结果,并拿下了其中的7个。

在 AI 推理基准方面,最新的 MLPerf inference V1.1 AI benchmark 固定任务(已关闭)包括两个场景:数据中心(共 16 项)和边缘(共 14 项)。在数据中心场景设置6个模型,分别是图像识别(ResNet50)、医学图像分割(3D-UNet)、目标物体检测(SSD-ResNet34)、语音识别(RNN-T) )、自然语言理解(BERT)和智能推荐(DLRM),其中Bert、DLRM和3D-Unet具有高精度(99.9%)模式。除了医学图像分割任务,只有离线推理场景考虑除了性能,其他模型任务根据Server在线推理和Offline离线推理两种应用场景进行性能测试。

同样,在最新推理榜V1.1的最受关注封闭任务(Closed)测试中,浪潮获得15个冠军,占据冠军榜的半壁江山。

根据MLPerf 2021年度测试数据,不难发现,浪潮信息显示出非常突出的优势:2021年,浪潮AI服务器将在MLPerf数据中心AI推理场景的32个任务中获得17个冠军,并在边缘AI推理场景共31个任务,获得16个冠军,从云端领先到边缘;浪潮AI服务器在单机AI训练场景的16个任务中共获得11个冠军。

浪潮信息凭什么夺冠?

首先,浪潮信息的优势在于“人一无所有,我有”。在MLPerf V1.0 to V1.1推理列表中,浪潮是唯一一家率先支持8xA100-80GB-500W GPU服务器的厂商,提供液冷和风冷两种型号。相比之下,虽然其他厂商也提供了支持A100-80GB-500W GPU服务器的测试结果,但能支持的GPU数量只有4个。

其次,在“人有我”的情况下,浪潮信息进一步实现了“人有我的优势”。在 V1.1 训练测试中,Supermicro 还推出了单机 8 500W 卡的模型。这是除浪潮之外的公司首次出现在MLPerf。) 楷模。

虽然主要配置相近,但浪潮NF5688M6大幅领先超微,说明服务器是内部交互系统,硬件堆叠无法达到最佳效果。硬件的拓扑结构、硬件的优化和软件的优化也会影响服务器性能。

最后不得不提的是,浪潮的信息系统级构建能力实现了服务器软硬件的全栈优化,这也是浪潮AI服务器在训练和推理场景中都能保持优势的原因。

此外,在深度学习算法层面,结合GPU Tensor Core单元的计算特性,浪潮信息通过自研的通道压缩算法,成功实现了模型的极致性能优化。包括在散热层面上的优化,针对业界最高功率的A100-SXM-80GB(500W)GPU,浪潮信息首创的先进冷板液冷系统确保GPU在全功率下仍能稳定工作甚至在负载下,并集成了AI计算系统的性能最大化。

图片[1]-2021年度MLPerf诞生95个固定任务冠军,浪潮AI服务器斩获44项第一-老王博客

基于场景的人工智能是实用的人工智能

在这一轮人工智能发展的前半段,计算能力、算法和数据不断被提及。如果以2020年为节点,下半年出现的高频词是知识、行业诀窍和应用。是人工智能不再贪婪,从服务一个场景开始,实现人工智能的实用性。

对于当前的人工智能行业来说,应用端是千变万化的,很难用一种解决方案完全覆盖。人工智能的落地需要根据具体的场景和环节做具体的工作,浪潮信息也是这样做的。

每个测试任务都对应着AI在实践中实现的各种业务场景。不同的任务场景需要不同的计算类型,不仅在硬件层面,在算法和数据结构上也是如此。浪潮信息可以极大地满足不同的需求。AI计算的负载需求。

从训练到推理,浪潮的场景优先方法取得了不错的效果。

最新训练测试结果显示,浪潮AI服务器图像分类训练每秒可处理27400张图片,目标物体检测训练每秒可处理12600张图片,语音识别训练每秒可处理8000条语音。.

在单机系统测试的8个任务中,与半年前V1.0比赛的最好成绩相比,浪潮信息在医学图像识别、语音识别、智能推荐和自然语言理解任务分别提高了 18%、14%、11% 和 8%。

最新推理测试结果显示,浪潮获得15项全球第一迭代尺度算法中的w收敛,涵盖医学图像识别、自然语义理解、图像识别、语音识别、智能推荐、目标物体检测(SSD-ResNet34)和目标物体检测)。(SSD-MobileNet) 所有 7 个 AI 模型任务。

即使在相同的服务器配置下,各种任务的性能也有了很大的提升。比如图像识别(ResNet50)和语音识别(RNN-T)的模型性能比半年前的V1.0比赛的表现要高。成绩提高了4.@ >75% 和 3.83%。

人工智能只有在实际落地时才能形成真正的商业价值,而落地依赖于多种因素。在这个过程中,浪潮信息不仅充当了算力提供者的角色,更凸显了顶级AI服务器在AI模型训练和推理效率方面的巨大价值。还可以为人工智能的落地提供场景化思维,推动人工智能产业生态的发展。

工业人工智能:离客户越近,离竞争越远

随着人工智能的商业化,场景化已成为公认的趋势。当人工智能在千行百业落地时,不仅要实现人工智能+,还需要场景化AI,每个场景都会落地AI。

研究人员、工业制造商等从未放弃探索通用 AI 的可能性。比如现在大热的大模型就是一个典型代表,但我们不得不承认,现在的AI为了达到更好的效果,只限于一些固定的场景。

换个角度思考,即使是一般的AI也只能做到“万能”,并不能达到最好的效果。以x86架构为例,x86因其计算通用性得到了广泛的推广,但不同厂商的x86服务器在同一个任务上还是有区别的,浪潮信息对此深有体会。

这揭示了一个古老的真理:你离客户越近,你离竞争对手就越远。尤其是在价值由场景决定的人工智能业务中,对客户场景的深入理解是厂商竞争力的关键。

根据IDC最新发布的全球服务器市场季度报告(2021年Q3)),浪潮服务器出货量在中国连续两个季度保持全球第一,领先优势进一步扩大,年销售额。增长15.0%,出货量同比增长14.@>0%,市场份额占比10%。

同时,浪潮信息AI服务器市场占有率全球第一,中国市场占有率连续五年排名第一。浪潮信息过去在服务器市场的经验,在AI时代得到放大和输出,在人工智能业务场景中有所收获。

浪潮信息在MLPerf表现出色的关键,也是基于对客户应用场景的理解。在产品开发、客户需求和实际应用中获得的洞察力和理解指导着浪潮信息的测试策略。同时,浪潮在MLPerf测试中的探索和创新也帮助浪潮更好地回报行业客户的实际应用,从而形成良性循环。

比如,浪潮在连续获得MLPerf冠军的同时,还将比赛中探索的高效优化方法回馈给MLPerf社区,推动AI技术的共同进步。

在MLPerf Training v0.7中,浪潮首创了更高效的ResNet收敛优化方案:在ImageNet数据集上,只用了85%的迭代步数就达到了75.9%的目标准确率,这个优化将训练性能提高 15%。目前,该方案已被社区成员采用迭代尺度算法中的w收敛,并广泛应用于 MLPerf Training V1.0 测试中,这也是 MLPerf 中 RenNet 任务性能得到大幅提升的重要原因。

深耕行业将是未来一段时间人工智能行业的主线。离客户越近,就越了解客户的痛点。工业人工智能需要一场“场景革命”。浪潮信息在MLPerf中的表现证明其在不同场景的AI计算解决方案中处于领先水平。浪潮信息根据场景适配解决方案,将对业务场景的理解转化为AI训练和推理层面的价值提升。人工智能与千行百业的高效融合开辟了新的路径,最终将工业人工智能的进程推向了一个新的高度。返回搜狐,查看更多

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论