2019 年 1 月的 AI 语音芯片市场十分热闹,1 月 2 日,云知声召开发布会推出多模态 AI 芯片战略,并公布今年布局的 3 款 AI 芯片。1 月 4 日,思必驰召开发布会发布其第一代 AI 语音芯片 TAIHANG。1 月 21 日,猎豹移动旗下 AI 公司猎户星空联合瑞芯微电子宣布推出专门针对智能音箱和物联网设备的 AI 语音芯片。
加上此前出门问问、Rokid 已经发布的 AI 语音芯片,AI 语音芯片的竞争正在走向白热化。这不禁让人疑问,为什么 AI 公司或者说 AI 语音公司都开始争相推出 AI 芯片?
研发 AI 语音芯片是自然趋势
猎户星空首席战略官王兵博士接受雷锋网专访时表示,AI 公司纷纷推出 AI 语音芯片有几方面的原因,一方面是语音市场需求增长非常快,仅看智能音箱,去年整个市场的出货量就超过 2000 万,并且还在保持增长。另一方面,AI 语音算法现在已经相对比较成熟,做算法的输出竞争已经有点白热化的状态,所以许多公司就开始研发芯片,因为芯片相对而言商业化的潜力更大,这是一个非常自然的趋势。
他同时指出,由于 AI 语音芯片并不需要像 AI 视觉那么强的计算能力,也不需要最先进的工艺制程,因此相对而言 AI 语音芯片不仅研发的门槛低一些,开发周期也相对较短,这也是许多公司推出 AI 语音芯片的原因。
不过,猎户星空最终决定研发 AI 芯片还有更多的考虑。此前猎豹移动董事长兼 CEO 傅盛接受采访时提到推出 AI 芯片的两方面考虑,第一,没有针对某个 AI 场景的专用芯片,例如英伟达 GPU 是为游戏设计芯片,高通的 SoC 是为手机设计,为 AI 或者一些专属设备设计的芯片很少。第二,如今 28nm 工艺已经很成熟,成本也非常低,做一款集成语音算法的芯片可能只有几美金,流片几百万元人民币。但在产品中加入这样一块芯片,主芯片的负载就可以明显降低,用原来为手机设计的芯片光语音处理可能就要消耗 40% 的算力。
当然,猎户星空能推出 AI 语音芯片也与自身的积累密不可分。王兵表示:" 猎户星空已掌握麦克风阵列、语音唤醒、语音识别、语义理解和语音合成等全套远场语音技术,也拥有自研全链路的远场语音交互系统猎户语音 OS,作为全技术链条的公司,芯片是必须涉足的领域,这有利于我们在垂直领域建立优势。同时,在中国人工智能产业发展联盟(AIIA)公布的国内智能音箱智能化评级结果中,猎户语音 OS 占据了获评产品前五强中的三席,这说明了我们在语音市场的影响力。还有,实现芯片的自主可控也是大趋势。因此,研发芯片成为了非常自然的事情。"
联合研发 AI 语音芯片是好选择
AI 语音公司研发 AI 芯片是自然趋势,芯片的研发却可以有多种选择,包括完全自主研发、联合研发以及完全交由第三方设计。值得注意的是,猎户星空选择的方式是与瑞芯微联合研发,与此类似,思必驰与中芯国际下属投资公司中芯聚源成立合资公司上海深聪智能联合研发。这是否意味着联合研发 AI 语音芯片是个好选择?
对此,王兵表示:" 对比而言,从开发周期和成本的角度,联合研发确实是一个更好的方案。因为比较成熟的芯片公司已经有积累,很多东西不需要重新去设计,能够缩短开发周期,另外,对许多公司而言,芯片的生产和管理也没必要亲自介入。"
至于为什么选择和瑞芯微合作,王兵表示,瑞芯微在低成本芯片方面有很多年的经验,我们评估了包括自行研发以及与其它厂商合作的方案之后,最终发现瑞芯微的方案成本最低,并且,我们的算法与他们的硬件能力的结合也比较合适。
具体的合作分工上,猎户星空负责芯片架构、算法以及系统软件的设计,瑞芯微提供一些硬件的成熟方案以及对后期芯片的生产和管理。王兵表示,在合作的过程中,由于猎户星空有有许多来自知名芯片公司经验丰富的工程师,因此他们对于芯片该如何去设计以及如何与瑞芯微沟通都非常清楚,双方的合作还比较顺利。
雷锋网了解到,猎户星空在 2018 年上半年启动芯片项目,目前猎户星空语音算法团队的规模接近 200 人,芯片团队包括软件和系统团队大约有 30 人。那么,从项目启动到芯片正式推出时间还不到一年,猎户星空的 AI 语音芯片竞争力如何?
芯片不一定最便宜,但一站式解决方案便宜且灵活
据了解,猎户星空与瑞芯微联合研发的 AI 语音芯片 OS1000RK 基于 28nm 工艺,采用 64 位 4 核 ARM Cortex-A35 CPU,整合高性能 CODEC(8 通道 ADC+2 通道 DAC), 可以低成本地支持 8 个麦克风阵列,硬件语音检测模块(VAD)可实现很低的待机功能,专用指令集能让神经网络的运行更加优化。
OS1000RK 主打功耗低、通用性强,能够实现从语音唤醒、语音理解、语音合成等全链条的语音交互能力。
另据了解,在功耗的降低方面 OS1000RK 的在没有任何声音的时候,除了 VAD 其他部分都不耗电,芯片还会根据需实现变频工作,让 OS1000RK 实现较低功耗。通用能力则是王兵重点强调的优势,他表示:" 我们的 AI 芯片是一个通用性很强的产品,目前可以看到的规模较大的语音应用,基本都可以用它来实现,现在市面上还没有其他 AI 语音芯片的通用能力特别强。"
" 除了芯片,作为全链条 AI 公司,客户需要什么算法我们都能提供,我认为目前行业内其他人还不能做到这一点。这一能力来源于我们在算法上的巨大投入,还有数据的积累,猎户星空从 2016 年成立之初就开始做语音的算法。" 王兵补充道。
另外,有一个 AI 芯片公司都不得不面临的问题就是 AI 算法的不断更新。对此,王兵表示:" 我们用互联网的思维做硬件,我们不认为一个硬件出售之后功能就不会变,而是需要不断更新,因此我们的芯片可以通过 OTA 在线更新,以此来保持芯片的竞争力。"
但是,芯片的通用性、性能和成本不可兼得。猎户星空高通用性还能具备成本优势吗?王兵指出,成本需要看系统成本,而不是只看芯片成本,这也是为什么我们要推出一站式解决方案的原因,这种模式能让系统成本最低。也就是说,如果只强调硬件成本,做一款特别专用的芯片成本可能是最低,但灵活性不行,这将导致最终的系统不管是从性能还是成本的角度可能都比不过一站式的解决方案。因此,我们芯片不一定最便宜,但一站式解决方案一定是最便宜,而且是最灵活的。
王兵所指的一站式方案包括从芯片到芯片上的算法以及芯片上的系统软件,再到云端的软件、应用软件、内容体系。他还举例表示,如果有客户想推出智能音箱,我们从电路板的设计到操作系统再到云端软件的算法都可以提供,客户基本上主要去做特定场景的内容优化以及渠道推广就可以。
视觉 AI 芯片在自研路上
目前,OS1000RK 已经搭载在小雅 Nano 智能音箱中,预计将在今年年底达到百万的出货量。这也意味着猎户星空的 AI 语音芯片今年底的出货量将在百万级别。王兵也表示:" 从目前的订单看我觉得百万应该没有太大问题,我们下一代的小豹 AI 音箱也会搭载这款芯片。除了智能音箱,语音控制的智能家电,比如美的新一代的冰箱,儿童故事机、儿童教育机器人等其他机器人等都将采用我们的语音芯片。"
不仅仅是语音芯片,猎户星空还在自主研发视觉、导航等更多领域的专用芯片。王兵表示,选择自研的原因也是因为机器人视觉和导航还处于非常早期的阶段,没有特别好的专用芯片,自己研发能够把性价比做到最优。
至于视觉和导航芯片为什么选择自研而不是联合研发,他表示," 语音芯片已经有一些公司有积累,但视觉和导航到的芯片目前成熟的东西比较少,可能都需要自己设计,因此选择自主研发。目前我们在这些领域我们也有了一些积累,也引进了一些资深人才。"
最后,在谈到 AI 芯片热潮以及资本寒冬是否会影响 AI 芯片公司的时候。王兵表示 AI 芯片是热在投资阶段,但 AI 芯片能够真正量产和商业化的比较少。资本寒冬可能对于 O2O 或者互联网领域会有影响,对 AI、机器人、视觉、导航等不会有影响。
雷锋网小结
AI 芯片领域此前更受关注的是 AI 视觉芯片,但随着语音算法竞争的白热化,为了能够保持竞争力并建立优势,越来越多的算法公司开始推出自研 AI 芯片。此时我们看到,包括猎户星空和思必驰都采用联合研发的方式而非完全自研,这在很大程度上证明了这种方式的可行性和性价比。
语音算法输出以及 AI 芯片竞争的白热化,让更多 AI 语音的场景更成为各方争夺的焦点,这也意味着我们离 AI 语音真正改变生活更近了一步。
| 留言与评论(共有 0 条评论) |