中国制造的 128 核 Arm 芯片在整数工作负载中整体性能领先


中国制造的 128 核 Arm 芯片在整数工作负载中整体性能领先

当阿里巴巴的T-Head子公司推出其由600亿个晶体管组成的128核倚天710处理器并在台积电的N5节点上生产时,它在CPU世界中引起了相当大的轰动。本周,阿里巴巴在工业基准 SPEC.org 上发布了该芯片的官方性能结果,并透露该芯片实际上是SPEC CPU2017整数工作负载中世界上最快的处理器,正如ServeTheHome所指出的那样。

阿里巴巴的 T-Head 倚天 710 数据中心片上系统集成了 128 个 Arm v9 内核,工作频率高达 3.20 GHz,每核心 1MB 二级缓存,每芯片 128MB 三级缓存。SoC 包含 8 个 DDR5-4800 内存通道,可提供高达 307.2 GBps 的带宽,以及 96 个 PCIe 5.0 通道,用于连接高性能固态存储、网卡和其他设备。该芯片由阿里云独家使用,阿里云专门为倚天710 SoC开发了专有的盘九服务器,盘九既可用于通用,也可用于加速AI工作负载,但为了测试SPEC CPU2017基准中的CPU,盘九纯粹用作数字运算机。

测试的阿里云盘九服务器基于128核的倚天710,工作频率为2.75 GHz,并与512GB的DDR5-4800(使用八个64MB模块)配合使用。该机器运行安装在240GB SATA SSD上的Anolis OS版本8.6。

中国制造的 128 核 Arm 芯片在整数工作负载中整体性能领先

该机器的基准 SPEC CPU2017 整数速率达到 510(每核 3.984),但没有峰值分数的基准。与此同时,与AMD的64核EPYC 7773X处理器相比,即使510也高出15%,后者的基线结果为440分(每核6.875)。英特尔的36核至强铂金8351N处理器达到的最高基准结果是266(每核7.38),而Ampere的Altra 80核机器的最佳命中率为301(3.7625)。


中国制造的 128 核 Arm 芯片在整数工作负载中整体性能领先

虽然倚天和EPYC的每核结果看起来不如他们的基线结果那么令人激动,但大量的内核和整体整数能力不言而喻。如果一个人需要一个极端的整数率,那么阿里巴巴T-Head的128核怪物看起来是首选的处理器。

现在,虽然倚天710在SPEC CPU2017中的整数率非常壮观,但由于某种原因,阿里云没有提交其平台的任何浮点结果。也许,处理器的浮点单元不如其整数单元那么令人印象深刻,或者软件和/或CPU微码仍然需要优化。无论如何,目前CPU2017浮点率由AMD的基于EPYC 7773X的机器主导。

阿里云将于今年9月开始提供由配备倚天710处理器的盘九服务器提供支持的实机。目前,云服务公司提供精选客户试用基于倚天710的机器。

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章