以色列初创AI芯片公司Habana Labs发布AI训练芯片,冲击英伟达GPU市场地位

记者 | 彭新

编辑 |

以色列AI芯片公司Habana Labs上周宣布,推出人工智能处理器Gaudi,专供机器学习训练(inference)任务。公司首席执行官David Dahan 称Gaudi“带来了业界最高的性能”,基于Gaudi训练系统,可实现比拥有相同数量的GPU系统高近四倍的处理能力。

此前在2018年,Habana Labs推出Goya推理处理器。至此Habana Labs在AI处理芯片的训练、推理两端初步形成完整产品线。在训练端,Gaudi将对英伟达旗下GPU产品形成威胁。

Habana Labs创立于2016年,总部位于以色列特拉维夫,全球拥有约150名员工。官方介绍称该公司专精于使用人工智能提升芯片处理效能,同时降低芯片成本与电力消耗。2018年11月,在英特尔旗下创投基金英特尔资本(Intel Capital)的领投下,该公司完成7500万美元的B轮募资,迄今募资约1.2亿美元。

AI计算大致分为两个层面,首先是对模型进行训练(training),整个过程可能耗时数天;之后是训练出的模型响应实际请求,做出推理(inference)。目前,英伟达旗下的GPU(图形处理器)占据训练市场,多数推理任务则仍由传统的英特尔CPU承担。

“人工智能处理器的性能包括两点,计算性能和延迟。” Habana Labs首席商务官艾坦·麦地那 (Eitan Medina)认为,,原用于通用计算的GPU和CPU,适用于人工智能计算处理时,在架构上存在“先天不足”。从性能端来看,针对AI计算的专用芯片存在优势。

艾坦·麦地那表示,AI模型训练所需的计算能力每年呈指数增长。因此,提高生产率和可扩展性,解决数据中心和云计算对算力的迫切需求成为至关重要的任务。“为什么客户要选择Gaudi?第一,Gaudi给客户提供了更强的处理能力,以及更好的性能功耗,第二,就是我们通过内置RDMA以太网处理单元,给客户提供了一种以前无法实现的可拓展能力。”

在AI训练中,可扩展能力主要与网络相关。在拓展性方面,Habana Labs称,由于Gaudi处理器集成RoCE v2(RDMA over Converged Ethernet)网络规范,并可搭载最多20个以太网接口,架构上可几乎实现无限扩展。“与Habana的标准设计相比,基于GPU的系统依赖于专有的系统接口,对系统设计人员来说,这从本质上限制了可扩展性和选择性。” 艾坦·麦地那说。

Gaudi也将支持主流深度学习框架,包括谷歌开发的TensorFlow、Facebook开发的PyTorch和MXNet等。软件端,通过Habana Labs自有的SynapseAI软件栈对训练模型输入进行分析和优化,其工具链保持开放,供客户添加专有内核。同时,Habana Labs也添加了Linux驱动支持。

在过去,数据中心里的计算芯片几乎都由英特尔、英伟达等芯片大厂供应。11年前英伟达推出了CUDA,作为用GPU做并行计算的框架体系。2012年之后的人工智能浪潮,把英伟达推到了一个独特地位。鉴于GPU芯片在AI计算市场如此成功,全球不断有公司试图进入,打破英伟达市场地位。

随着谷歌在2016年专门为机器学习打造了TPU(张量处理器),并在自家云平台上展现出独特优势后,AI定制芯片层出不穷。亚马逊AWS于2018年11月发布了公司定制设计的AI芯片AWS Inferentia,用于AI推理。华为、阿里、百度等中国科技巨头也公布了各自AI芯片计划。

对于市场竞争,艾坦·麦地那向媒体表示,AI的应用才刚刚开始,市场前景巨大,目前主旋律不是竞争,而是共同把蛋糕做大。

艾坦·麦地那认为,面向对高性能AI芯片拥有刚需的数据中心领域,Habana Labs已经将其产品组合从AI推理处理器扩展到AI训练处理器,以高性能、低功耗、可扩展、可编程等特性,提供又一种新的云端AI芯片选择。他预计,在未来的人工智能计算应用上,Habana Labs旗下产品可从CPU和GPU中获得一定市场。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();