安谋邹伟:凭何改变高性能计算方式?(组图)

近日,在易微讯主持的第九届中国电子ICT媒体论坛暨2021产业与技术展望研讨会上,Arm科技高级FAE经理邹伟为业界深度解读Arm历经十年打磨针对不同级别算力需求和机器学习(ML)开发路径发布的新一代Armv9架构,不仅是Arm架构演进的又一里程碑,也将成为Arm在未来推动行业创新的基础十年甚至更久。

安谋科技高级FAE经理邹伟现场演讲

Armv9:如何改变高性能计算方式?

纵观过去十年半导体设计的发展,尤其是在终端消费领域,算力带来的生产力提升,通过移动互联网将大量算力送到了每一位消费者的手中。与此同时,在第五次计算浪潮中,传统上依赖人工数据收集和分析的流程正在演变为机器对机器的数据收集、存储、分析和服务。由此产生的海量数据需要在云端和边缘端配置更强大的计算能力,并通过数据中心对获取的数据进行分析、构建和决策。

除了成为移动浪潮的主流架构之外,Arm 还进入了边缘和云等新场景。其独特的定位可以为行业提供坚实的安全基础,同时确保开发人员能够以最简单、最快的方式使用 Arm 的安全技术。据邹伟介绍,截至2020年底,基于Arm IP的芯片已累计售出1800亿颗,覆盖各行各业的每一个角落、每一个地方。共享数据必须由 Arm 处理器在一个或多个环节进行计算,无论是用于数据采集的 IoT 设备、手机、智能计算机定义新运算怎么做,甚至是日常使用的服务器或超级计算机。

根据 Arm 的预测,未来十年,基于 Arm 芯片的合作伙伴出货量将超过 3000 亿颗,无论是在终端还是在云端,100% 的共享数据都将在 Arm 芯片上处理。因此,需要一种新的处理器架构来改变未来十年的计算方式,以提供更高的性能、改进安全功能并增强工作负载能力。

邹伟现场介绍Armv9架构新特性

“为此,Arm正式推出了未来十年的新一代架构Armv9。在已经广泛使用的Armv8的基础上,继续使用AArch64作为基准指令集,保持向后兼容. 这里在此基础上,在安全性、AI和ML、可扩展的向量扩展和DSP方面进行了改进,扩大了应用范围。”邹伟表示,“Armv9架构实现的处理器可用于移动计算、HPC高性能计算、汽车和人工智能等领域,满足全球对日益强大的安全、人工智能和专业化处理的需求,这意味着基于 Arm 架构的计算技术也将在智能手机以外的市场获得领先地位,借助移动生态系统带来的巨大规模优势,打造笔记本电脑、台式机和云等应用领域的领先解决方案。”

Arm 的综合计算解决方案可实现终极数字体验

尽管近年来全球半导体产业发生了变化,但提供先进的计算能力一直是产业发展的根本目标。从这个角度来看,芯片设计公司将面临哪些挑战?邹伟分析定义新运算怎么做,首先,CPU的负载越来越复杂,不同场景的需求也会不同,各个环节面临的挑战也不同;并且虽然摩尔定律放缓,但市场对性能和功耗的需求仍然不同。追求没有停止,这也是一个很大的挑战;此外,高昂的掩模价格和较长的生产周期,设计5nm芯片的成本会很高,生产周期会很长。 “我们希望芯片设计不仅涵盖当前的应用,还涵盖未来的应用,以实现更长的生命周期,这就要求我们通过架构、设计和 IP 来应对这些客户遇到的挑战,”他强调说。

如果实现终极数字体验是 Arm 构建计算未来愿景的驱动力,那么 Arm 最新的综合计算解决方案是 Armv9 时代下一个十年的第一步。 Arm 综合计算解决方案采用跨硬件 IP、物理 IP、软件、工具和标准的全系统整体优化方法,为 Arm 合作伙伴提供更广泛的用例选择和跨所有终端细分市场的成本,使他们能够快速充满信心地通过最新技术将高性能产品推向市场。

作为 Arm 综合计算解决方案的基石,全新 Arm Cortex CPU 包括 Arm 最强大的 Arm Cortex-X2、首款基于 Armv9 架构的大核 CPU Arm Cortex-A710 和 Arm 过去的第一高- 四年内高效小核 Arm Cortex-A510 和 Armv9-A CPU 集群。为了支持生态系统对性能的需求,Arm 的全球合作伙伴正在努力确保到今年年底所有应用程序都支持 64 位。正如邹伟在演讲中所说,在算力多元化的时代,Arm认为CPU的算力水平还是很重要的,它已经为数字化未来打下了基础。

每一代CPU性能提升20-30%的背后,是Arm不懈追求在频率、带宽、延迟、缓存、进程级别等指标上的一点点提升,计算基础设施的创新一​​直在带动行业进步。因此,Arm的综合计算解决方案除了提升CPU性能外,还希望在系统层面进行改进,为客户带来更好的设计体验。

此外,视觉体验是消费者与设备互动和享受设备的关键。据悉,最新的Arm Mali系列GPU搭配Armv9 CPU,形成全面的计算解决方案,能够提供出色的用户体验。据邹伟介绍,未来Mali系列GPU将继续超越大家的预期,带来光线追踪技术、可变速率着色VSR技术等先进的渲染技术。

Arm 的互连技术对于提高系统性能也至关重要。最新的 CoreLink CI-700 相干互连技术和 CoreLink NI-700 片上网络互连技术与 Arm CPU、GPU 和 NPU IP 无缝协作,以提高跨 SoC 解决方案的系统性能。 CoreLink CI-700 和 CoreLink NI-700 为新的 Armv9-A 功能提供硬件级支持,同时支持更高的安全性、改进的带宽和延迟。

引入新的安全功能来保护数据核心资产

随着全球联网设备的激增,芯片安全性变得越来越重要。对安全性的根本需求是重新思考如何处理安全性,Armv9 架构通过引入 Arm 机密计算架构 (CCA) 重新设计了安全应用程序的工作方式。机密计算通过创建一个安全的基于硬件的操作环境来执行计算,该环境可以保护部分代码和数据不被访问或修改,即使是特权软件也是如此。

邹伟进一步解释,Arm CCA 将引入动态创建秘密领域(Realms)的概念,该领域对所有应用程序开放,并在独立于安全或非安全环境的环境中运行,存储数据和代码执行。动态安全区与操作系统或hypervisor的特权模式分离,以达到保护数据安全的目的。例如,在商业应用中,机密域可以保护系统中的商业机密数据和代码,无论它们是在使用、空闲还是在传输中。 Arm 机密计算架构基于 Arm 的 TrustZone 技术,是软件容器的硬件版本,允许应用程序在不同系统上轻松运行。例如,在非安全区域运行的应用程序可以动态申请机密区域以保护其算法或数据。

“Arm 还与合作伙伴共同开发了平台安全架构 PSA,作为一套标准的威胁模型、措施和时序,提供给终端设计人员使用。结合分级认证,可以让该设备的购买者对资产的安全更有保障。例如,在中国,我们与中国信息通信研究院泰尔实验室合作,支持大规模部署基于PSA框架的安全物联网解决方案。”邹伟补充道。

构建新计算时代的大型计算平台

除了安全之外,机器学习也被视为 Armv9 的重要组成部分,随着未来几年越来越多的机器学习工作负载将变得司空见惯,在机器学习方面 Armv9 架构支持 BFloat16 格式,为了更好地支持 BFloat16 的 Int8 计算和机器学习; Scalable Vector Extension 2的引入(SVE2)可以更好地帮助开发者开发高端应用场景,在处理5G时,对于虚拟和增强现实、图像和语音识别等工作负载有显着的提升。

纵观瞬息万变的数字世界,智能设备不仅需要具备高灵活性和低功耗的特点,还要满足 AI/ML 的工作负载需求。这些挑战正在推动更安全和专用处理的发展,同时也是打开新市场和新机遇的关键。 Armv9 架构和基于安全技术的综合计算解决方案的发布将开启整个生态系统的新体验,并为未来十年构建值得信赖的数字服务。

邹伟总结道:“下一代 Armv9 架构将使开发人员能够通过弥合硬件和软件之间的关键差距来构建和编程未来的可信计算平台,帮助我们的合作伙伴实现更快的上市时间和实现成本控制的平衡,Arm中国致力于全面推进从技术到生态的算力革命,并将加大自研架构的投入,继续与生态伙伴合作,依托领先的Arm全球生态深化并加强本地研发,持续赋能本地产业创新的企业战略。”

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论