Arm发布新一代CPU、GPU产品和互联技术Arm要用-A55

雷锋网消息,今年3月,Arm推出了面向未来十年的新一代架构Armv9。今天,Arm 发布了新一代的 CPU、GPU 产品和互连技术。Arm 将使用全新的综合计算产品组合来满足智能手机、高性能 PC 和可穿戴设备等众多应用的计算需求和设计挑战。

新的 CPU 内核包括 Cortex-X2,高性能内核 Cortex-X1 的升级版,Cortex-A710,Cortex-A78 的继任者,以及新的小内核 Cortex-A510,升级到四年后的 Cortex-A55。

三个新的CPU核心基于今年3月推出的Armv9架构,可谓一键三连。因此,在提高性能和效率的同时,它还将具有扩展 SVE(Scalable Vector Extensions)、机密计算架构、内存标签等扩展特性。

Arm新一代Mali GPU产品包括高端系列Mali-G78的后继产品Mali-G710、中端系列Mail-G57的后继产品Mali-G510、高能效Mali-G310 .

新的GPU系列依然采用2019年发布的Valhall架构,该架构最早是在2019年由Mali-G77使用。去年发布的Mali-G78略有升级,麒麟9000、Exynos 2100和联发科天玑Mali使用了-G78。

Arm 终端设备事业部高级副总裁兼总经理 Paul Williamson 告诉雷锋网,“之所以推出新的产品命名规则,主要是因为引入了 Armv9 架构,希望新的命名将表明这种新架构将给市场带来的变化。”

除了新的 CPU 和 GPU,Arm 还宣布 CoreLink CI-700 相干互连技术和 CoreLink NI-700 片上网络互连技术与 Arm CPU、GPU 和 NPU IP 相结合,以提高跨 SoC 解决方案的系统性能。

三款全新Armv9架构CPU7,嵌入式中pc和ip的区别?,平均性能提升30%以上

2023 年完成向 64 位应用程序的过渡

雷锋网之前的文章指出,Armv9架构分为三个系列,分别是通用计算的A系列、实时处理器的R系列和微控制器的M系列。预计未来两代移动基础设施CPU的性能提升将超过30%。. 首款基于 Armv9 架构 CPU 的移动处理器最快将于今年年底问世,可能来自联发科。

新 Cortex 内核的第一个问题是兼容性。自谷歌在 2019 年宣布 Google Play 商店将要求开发者上传 64 位应用程序以来,该行业一直在向 64 位应用程序过渡,而谷歌表示将在今年夏天晚些时候停止 64 位设备与 32 位应用程序的兼容性。

Arm 表示,2023 年,为了支持生态系统的性能需求,将仅提供 64 位移动应用大核和小核。因为在 Armv9 架构的新三款 CPU 中,Cortex-X2 和 Cortex-A510 只支持 AArch64 微架构,无法再执行 AArch32 代码,Cortex-A710 仍将支持 AArch32。

Arm 解释说,这主要是为了满足中国市场的需求,因为中国移动应用市场缺乏像 Google Play Store 这样的生态系统,而中国的供应商和应用需要更多的时间来过渡到 64 位应用。

这意味着如果你想在使用 Arm 的新 Cortex 内核的 SoC 上运行 32 位应用程序,它只能在 Cortex-A710 内核上运行。

还有待观察的是,新的Armv9架构产品X2和A710总体上保持了X1和A78的目标,X系列愿意在合理的范围内权衡功耗,通过微架构提升性能。A710更注重PPA(性能、功耗、面积)的平衡,通过更智能的设计提升性能和效率。小芯A510,四年来首次更新,全新紧凑设计。

Cortex-X2性能优势进一步扩大

Cortex-X2 进一步拉大了与 Cortex-A710 在性能和功耗上的差距。Arm表示,X2不仅可以用于智能手机SoC,还可以用于大屏计算设备、笔记本电脑等性能要求更高的终端。X2核心基于Armv9架构,从前端分支预测改进、调度优化到后端流水线做了很多改进。

单核性能方面,在SPECint2006测试中,相同工艺和频率下,X2的综合性能相比X1提升16%,机器学习性能提升高达2倍。不过,由于 Arm 将 8MB L3 缓存设计与 4MB L3 设计进行比较,目前尚不清楚 6% 的性能提升是更大的缓存还是核心性能提升。

在性能和功耗曲线方面,要实现16%的性能提升需要更高的功耗,这将给三星、高通等移动SoC设计公司带来更大的挑战。

Cortex-A710 能效提升 30%

由于也采用了最新的Armv9架构,Cortex-A710也从前端到内核的后端进行了改进,不同的是A710还支持AArch32。

优化的结果是 Cortex-A710 相比 Cortex-A78 实现了高达 10% 的性能提升和 30% 的能效提升。同样,与 4MB 三级缓存设计相比,8MB 三级缓存设计也有 10% 的性能提升。由于 Cortex-A710 可用于中端或低端 SoC,这意味着使用较小的缓存,因此 10% 的性能提升可能并不容易实现。

相对于性能的提升,稍微降低频率可以带来功耗的大幅度降低。 Arm 声称,在相同的性能下,A710 的功耗比 Cortex-A78 低 30%。这将有利于时钟频率适中的 Cortex-A710“中间”内核,以实现持续的性能和电源效率。

总体来说,X2和A710的性能和功耗指标都适中,是近年来提升最少的。 Arm 解释说,由于迁移到 Armv9 导致的较大架构变化对通常的效率和性能改进产生了影响。

X2 和 A710 都是这个 Austin 微架构家族的第四代,所以我们面临着越来越少的好处和成熟的设计障碍。

Cortex小核四年来首次更新

小核时隔四年终于迎来更新,因为上一代小核Cortex-A55早在2017年就发布了。新的Cortex-A510来自Arm Cambridge团队,使用了很多已经在使用的技术较大的核心。Arm 表示,新的 Cortex-A510 内核的单核性能和频率与之前的旗舰内核 Cortex-A73 非常相似,但功耗明显降低。

图片[1]-Arm发布新一代CPU、GPU产品和互联技术Arm要用-A55-老王博客

据悉,Arm采用了一种叫做“合并核心”的设计方法,这是一种非常复杂的方法,最多有两个核心对,它们共享L2缓存系统以及它们之间的FP/NEON/SVE管道。

Arm 指出,共享管道对硬件是完全透明的,并且还使用了细粒度的硬件调度。在同时使用两个内核的实际多线程工作负载中,与每个内核的专用管道相比,性能影响和不足仅占百分之几。

乍一看,Arm 的方法与十年前 AMD 在其 Bulldozer 内核中对 CMT(集群多线程)所做的改进有一些非常相似的地方,但在某些重要方面却大不相同。

查看性能指标,将 Cortex-A55 与 32KB L1、128KB L2 和 4MB L3 与 Cortex-A510 与 32KB L1、256KB L2 和 8MB L3 进行比较。相同核心频率下,SPECint2006性能提升35%,SPECfp2006性能提升50%。提升非常显着,但从复合年增长率来看,提升并不那么可观。

对比IOS功耗和性能,Cortex-A510性能提升10%,功耗可降低20%。

值得注意的是,A510 和 A55 的曲线在较低的工作点几乎重叠。虽然 A510 的整体性能更好,但这似乎主要是因为将效率曲线扩展到更高的功率水平。在任何结构化基准测试中重现这些更真实的工作负载实际上是极其困难的。

需要注意的是,Armv9-A CPU 集群的主干是全新的 DynamIQ Shared Unit DSU-110,它具有可扩展性,在确保高效性能的同时支持多达 8 个 Cortex-X2 核心配置。 .

Paul Williamson 说:“通过共享系统级缓存,能源消耗最多可降低 15%。”

旗舰Mali-G710 GPU成为关注焦点,中低端GPU性能跃升

新的 GPU 系列延续了 Valhall 架构,旗舰 Mali-G710 是 Mali-G78 的继任者,目标是相对简单的世代进化,是 Arm 架构师在 Mali GPU 中取得的最高性能。

Mali-G610对于Mali GPU这个品牌有着积极的意义,G610继承了Mali-G710的所有功能,微架构相同,但价格更低。G610不到七核,可以帮助合作伙伴更好地将旗舰与“高端”产品区分开来。

AnandTech 指出,新的 G710 微架构看起来非常有趣,特别是解决了与 Arm 的 Mali GPU 的 API 开销相关的一些弱点。它将如何发挥还有待观察,但在性能和功耗方面,它似乎是一个坚实的改进,即使这还不足以改变移动市场的竞争格局。

总的来说,对于大部分消费者来说,此次 Arm 升级的三款 GPU 的重点依然是旗舰 GPU Mali-G710。作为 Valhall GPU 架构的延续,新 G710 的执行引擎与上一代 Mali-G77 和 Mali-G78 大致相同。与上一代 Mali-G78 GPU 相比7,嵌入式中pc和ip的区别?,Arm 承诺性能提升约 20%,功耗可能降低 20%,机器学习性能提升 35%。

Mali-G510和Mali-G310是基于上一代G57和G31产品的迭代升级。Mali-G510 是 Arm 中端产品组合的重大升级。G510 可从 2 核扩展到 6 核,在高端智能手机、旗舰智能电视和机顶盒上实现 100% 的性能提升和 22% 的节能优化,延长电池寿命。

新的 Mali-G310 是一款基于 Valhall 的新低端产品,针对低面积效率的市场,包括数千亿的低成本设备和其他嵌入式市场,如入门级智能手机、AR 设备和可编程设备。可穿戴设备。G310 的一个关键价值在于它代表了 Mali GPU 架构从 Bifrost 架构到新 Valhall 设计的重大转变。

这些新设计代表了微架构的重大新突破,可在 Arm 的中低端产品中实现显着的性能提升。与G54相比,G510性能翻倍,能效提升22%,机器学习性能翻倍。与G31相比,G310图形变形性能提升4.5倍,Vulkan性能提升4.5倍,Android UI性能提升2倍。

有趣的是,Anandtech 认为 Arm 的高端 GPU 前景看起来不太乐观,因为缺乏较大的变化或步进功能升级,三星已经确认 AMD RDNA GPU 在下一代 Exynos GPU 中,并且正在使用海思麒麟 SoC。暂停键被按下。联发科是最后一家采用 Mali 高端 GPU 的公司,但他们还没有推出真正的旗舰 SoC,因此高端 Mali-G710 产品可能不会出现。

Arm Mali GPU 设计理念一直是一把双刃剑,尤其是当他们试图用非常相似的微架构来满足如此广阔的市场时。高端市场看起来有些黯淡,但中低端产品看起来很有前景。

Arm 表示,到 2020 年,他们已经出货超过 10 亿颗 Mali GPU,拥有 80% 的 DTV 市场份额和超过 50% 的智能手机市场份额。

综合计算时代系统性能更重要

Arm于2019年首次提出全面计算战略,随着新架构产品的发布,Arm的全面计算战略进一步升级。Arm 认为,综合计算设计策略的三个关键原则是——计算性能、开发人员可访问性和安全性。同时满足这三个关键原则需要提供出色的性能、安全性、可扩展性和效率。

“我们正在努力将 Armv9 技术带入各个领域,通过系统级设计最大限度地提高性能。基于 Arm 架构的计算技术正在建立超越智能手机市场的领导地位,利用移动生态系统带来的大规模优势,创造领先的应用解决方案“如笔记本电脑、台式机和云。这些灵活的解决方案将用于 Arm 合作伙伴的各种应用中,开启新一代沉浸式交互体验。” 保罗威廉姆森说。

综合计算对于功能丰富的移动设备和AI产品非常重要。因此,需要 Arm 的 Cortex CPU 和 Mali GPU,以及对提高系统性能至关重要的新互连技术。

今天推出的 Arm 的 CoreLink CI-700 和 CoreLink NI-700 为新的 Armv9-A 功能(例如内存标记扩展)提供硬件级支持,并支持更高的安全性、改进的带宽和延迟。

Paul Williamson 指出,“过去,计算能力是通过对标来衡量的,但在综合计算时代,PPA 的重要性越来越低,提供更好的用户体验和更高的系统将变得更加重要Arm 新的综合计算解决方案采用系统范围的整体方法进行优化,涵盖硬件 IP、物理 IP、软件、工具和标准,以解决所有终端市场领域的用例和成本范围。”

对计算能力的需求越来越高,应用也越来越丰富。这是一个可以看到的趋势。在变化越来越快的5G、AI、数字化时代,芯片巨头纷纷转向多芯片组合竞争的时代。产品组合可满足不同应用的性能需求。当然,还有制造工艺、异构集成、封装等一系列问题,需要全产业链共同面对。

Arm 的综合计算战略能取得多大的成功?

注意,文中图片来自Arm

相关文章:

Arm急于出击服务器市场

Arm新十年,CPU计算“规则”能否实现?

雷锋网原创文章未经授权禁止转载。有关详细信息,请参阅重印说明。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论