以色列初创AI芯片公司Habana Labs发布AI训练芯片，冲击英伟达GPU市场地位--粉丝服务平台-粉丝头条-fensifuwu.com

以色列初创AI芯片公司Habana Labs发布AI训练芯片，冲击英伟达GPU市场地位

科技 06-24 来源：界面新闻

记者 | 彭新
编辑 |

以色列AI芯片公司Habana Labs上周宣布，推出人工智能处理器Gaudi，专供机器学习训练（inference）任务。公司首席执行官David Dahan 称Gaudi“带来了业界最高的性能”，基于Gaudi训练系统，可实现比拥有相同数量的GPU系统高近四倍的处理能力。

此前在2018年，Habana Labs推出Goya推理处理器。至此Habana Labs在AI处理芯片的训练、推理两端初步形成完整产品线。在训练端，Gaudi将对英伟达旗下GPU产品形成威胁。

Habana Labs创立于2016年，总部位于以色列特拉维夫，全球拥有约150名员工。官方介绍称该公司专精于使用人工智能提升芯片处理效能，同时降低芯片成本与电力消耗。2018年11月，在英特尔旗下创投基金英特尔资本（Intel Capital）的领投下，该公司完成7500万美元的B轮募资，迄今募资约1.2亿美元。

AI计算大致分为两个层面，首先是对模型进行训练（training），整个过程可能耗时数天；之后是训练出的模型响应实际请求，做出推理（inference）。目前，英伟达旗下的GPU（图形处理器）占据训练市场，多数推理任务则仍由传统的英特尔CPU承担。

“人工智能处理器的性能包括两点，计算性能和延迟。” Habana Labs首席商务官艾坦·麦地那 (Eitan Medina)认为，，原用于通用计算的GPU和CPU，适用于人工智能计算处理时，在架构上存在“先天不足”。从性能端来看，针对AI计算的专用芯片存在优势。

艾坦·麦地那表示，AI模型训练所需的计算能力每年呈指数增长。因此，提高生产率和可扩展性，解决数据中心和云计算对算力的迫切需求成为至关重要的任务。“为什么客户要选择Gaudi？第一，Gaudi给客户提供了更强的处理能力，以及更好的性能功耗，第二，就是我们通过内置RDMA以太网处理单元，给客户提供了一种以前无法实现的可拓展能力。”

在AI训练中，可扩展能力主要与网络相关。在拓展性方面，Habana Labs称，由于Gaudi处理器集成RoCE v2（RDMA over Converged Ethernet）网络规范，并可搭载最多20个以太网接口，架构上可几乎实现无限扩展。“与Habana的标准设计相比，基于GPU的系统依赖于专有的系统接口，对系统设计人员来说，这从本质上限制了可扩展性和选择性。” 艾坦·麦地那说。

Gaudi也将支持主流深度学习框架，包括谷歌开发的TensorFlow、Facebook开发的PyTorch和MXNet等。软件端，通过Habana Labs自有的SynapseAI软件栈对训练模型输入进行分析和优化，其工具链保持开放，供客户添加专有内核。同时，Habana Labs也添加了Linux驱动支持。

在过去，数据中心里的计算芯片几乎都由英特尔、英伟达等芯片大厂供应。11年前英伟达推出了CUDA，作为用GPU做并行计算的框架体系。2012年之后的人工智能浪潮，把英伟达推到了一个独特地位。鉴于GPU芯片在AI计算市场如此成功，全球不断有公司试图进入，打破英伟达市场地位。

随着谷歌在2016年专门为机器学习打造了TPU（张量处理器），并在自家云平台上展现出独特优势后，AI定制芯片层出不穷。亚马逊AWS于2018年11月发布了公司定制设计的AI芯片AWS Inferentia，用于AI推理。华为、阿里、百度等中国科技巨头也公布了各自AI芯片计划。

对于市场竞争，艾坦·麦地那向媒体表示，AI的应用才刚刚开始，市场前景巨大，目前主旋律不是竞争，而是共同把蛋糕做大。

艾坦·麦地那认为，面向对高性能AI芯片拥有刚需的数据中心领域，Habana Labs已经将其产品组合从AI推理处理器扩展到AI训练处理器，以高性能、低功耗、可扩展、可编程等特性，提供又一种新的云端AI芯片选择。他预计，在未来的人工智能计算应用上，Habana Labs旗下产品可从CPU和GPU中获得一定市场。