根据中国科学家的一项新研究,华为技术公司的Ascend芯片是中国最强大的人工智能(AI)处理器,在某些任务中可以超过Nvidia的旗舰V100芯片,但也有一些严重的缺点。
研究人员评估了Ascend处理器在各种应用中的表现,首次深入了解了中国在人工智能芯片技术方面不断增长的水平以及弱点。
尽管在整体性能上没有完全达到与国际旗舰芯片接轨的水平,但研究人员表示,华为Ascend处理器可用于大多数现有应用,在某些情况下甚至超过了竞争对手的性能。
这项评估由中国人民大学和清华大学的研究人员进行,于8月发表在同行评议的《中国计算机杂志》上。
图形处理单元(GPU)最初是为了在视频游戏中渲染图像而开发的,但在过去十年中,它们已被科学家和互联网公司越来越多地部署在最大的超级计算机中。基于高端GPU的人工智能算法可用于自动驾驶、机器人制造、实时翻译和医学图像分析。
人工智能算法已经取得了令人印象深刻的进展,但其应用受到了硬件性能的限制。为了扩展算法的性能,硅谷的公司,如Nvidia,已经开始开发像V100这样的加速器芯片来替代GPU。
加速器芯片部署了一个特殊的架构,将其计算能力集中在AI计算上。几年前,华为也开发了他们的加速器芯片——Ascend 910和Ascend 310,与Ascend计算平台一起。
Ascend 910处理器采用了台积电的7纳米技术,在基本数据类型INT8的精度下,可以达到每秒640Tera运算(TOPS)。Ascend 910被认为是中国最强大的人工智能处理器,能够进行自我管理的任务安排。
Ascend 310是一款轻量级推理芯片,采用台积电的12纳米FinFET Compact(FFC)制造技术。
杜晓勇教授和人民大学的一个团队使用通用算法和公共数据集作为基准来评估这两种芯片。结果显示,Ascend芯片更适合密集算法的工作负载。此外,这些芯片比GPU的功耗低,而在运行特定模型时,其性能超过了Nvidia的旗舰产品V100芯片。
Ascend芯片也有缺点。根据研究论文,由于其架构,处理器不适合于稀疏的工作负载。因此,它们在现实世界的应用中的作用将受到限制,如自动驾驶,因为最近汽车行业的许多算法都使用稀疏计算来减少计算资源的压力。
研究人员还开发了使用Ascend芯片的优化策略。例如,用户应该先编译计算模型,以便充分使用运算器。对于训练模型,研究人员建议用户采用混合精度配置,或将其算法转换为16位精度。
研究人员表示,这是计算机研究界的第三方对Ascend处理器的首次全面分析。“这些优化策略将有助于华为有针对性地对其进行调整,”他们在论文中说。
| 留言与评论(共有 0 条评论) “” |