ASSEMBLYAI:人工智能即服务如何改变语音识别市场|前哨

你好,这里是科技前哨,继续跟你分享新兴科技企业有关的新鲜见闻。


语音识别正在成为我们生活的一部分,现在我们提到语音识别,大多数人甚至会觉得很正常,因为我们的手机,智能音响,聊天机器人等等具有语音识别功能的设备正越来越多的被使用,但是要知道,语音模型的训练和语音数据的挖掘分析并不是一个小工程,所以需要一个将语音识别人工智能当服务来卖的公司,AssemblyAI 就是这样的一家创业公司,他在巨头纷争的语音市场活了下来,它有什么独门秘籍?科技前哨今天带你一探究竟。


1.名牌孵化公司的又一次成功孵化


谈到今天的公司ASSEMBLYAI就不得不提到一个大家熟悉的传奇孵化公司公司Y Combinator,ASSEMBLYAI就是这家孵化公司孵化的产物。这家孵化公司共孵化了380家创业公司,这些公司累计获得投资额超过数十亿美元,其中包括云储存服务提供商Dropbox和房屋短期租赁网站Airbnb等出名的公司,前哨科技在6.27发布的文章里的估值73亿的人工智能公司ScaleAI也是出自这家孵化公司。


ASSEMBLYAI的创始人是Dylan Fox,Fox在思科工作了了2 年后创立了 AssemblyAI,在那里他致力于协作产品的机器学习。在此之前,他创办了 YouGive1,该组织与公司合作,通过提供产品来奖励客户以换取非营利组织的捐款。


Fox在工作的时候一直在为项目寻找语音识别和自然语言处理 (NLP)的简便服务,然而当时的人工智能在方便部署、价格便宜、高准确性上不可兼得,于是他有了自己做语音识别人工智能的想法。


Fox后来在采访里说道“我的目标就是开发最好的人工智能模型,并将这些模型以非常简单的方式,比如 API 的形式提供给开发人员”。


2017年1月,Fox创立了AssemblyAI,然而语音在人工智能领域已经是非常成熟的领域,他只获得了17万美元的种子轮融资。


ASSEMBLYAI:人工智能即服务如何改变语音识别市场|前哨

2.只需要一个简单的API接口就可以


创业一开始资金很少,硬件资源不足,AssemblyAI的人工智能模型训练甚至用不少GPU,只能靠 CPU缓慢迭代。


好在他们获得了知名孵化机构Y Combinator的支持,通过Y Combinator的资源AssemblyAI搭建起了自己的GPU服务器。


有了硬件后,AssemblyAI开始寻找模型训练的数据,由于是初创公司,它没法像谷歌或亚马逊那样调用大量用户的数据,所以他们开发了 Harvest 自主架构,用来在网络上收集音频数据。


Harvest能够在网络上寻找并标注可以用于训练 AI 模型的数据。由于该架构的高准确性,使得 AssemblyAI 可以用高标准的数据来训练模型,在几个星期之内,AssemblyAI 已经收集了数百万条高质量的音频剪辑,用作其神经网络的训练数据。


经过几年发展,AssemblyAI 已经可以为80多种语言提供基于 API 的人工智能服务。它有自动转录、主题检测和内容审核以及“自动章节”功能。


所谓“自动章节”就是将音频和视频文件分解为“章节片段”,并为每个章节提供摘要等功能,能让音频、视频软件被自动管理。


AssemblyAI不仅可以实现语音识别里最常见的语音转录文字功能,它还可以实现音频智能,可以对音频进行情绪分析,分析每句话发言者的情绪;实体检测,识别音频文件中的各种实体,例如个人和公司名称、电子邮件地址、日期和位置等等;章节摘要,对音频进行实时的内容总结和内容审核,对音频中的敏感内容进行检测。


操作方法简单,开发人员只需要一段API代码,比如“识别此对话中的说话者”或“检查此音频是否有禁止内容”等就能获得智能语音服务,每次调用付一小笔费用就可以了,最低每秒只要 0.00025 美元。


当大多数人在卷算法的时候,AssemblyAI从需求切入,把智能语音变成好用又便宜的服务,在巨头纷争的语音市场杀出了一条血路。

ASSEMBLYAI:人工智能即服务如何改变语音识别市场|前哨

3.市场和资本都给了正向反馈


AssemblyAI 推出之后在市场上广受好评,华尔街日报,Spotify,BBC等知名公司都是它的客户。


Fox 表示,AssemblyAI 现在用户已经突破1万名, 2022 年初以来用户群增长了3倍,他们的收入也增长了近3倍。


现在他们每天要处理数百万个 API 调用,计划在未来六个月内将AI 研究团队扩大 3 倍,并在 GPU 硬件上投资数百万美元,来训练更大、更复杂的 AI 模型。


2020年AssemblyAI 获得了500万美元的投资;2022年的3月在资本寒冬中,AssemblyAI 又获得了2800万美元的A轮融资;7月,AssemblyAI又获得了3000万美元的B轮融资。


Fox在最近的一次采访中有点凡尔赛地表示“我们几乎没有动用 A 轮融资的钱”,在这轮严冬中,他们有足够的资源提高自己的技术实力,扩张自己的市场范围。

ASSEMBLYAI:人工智能即服务如何改变语音识别市场|前哨


过去科技前哨和大家分享过各种利用API创业的例子,Stripe利用API提供金融服务,MongDB利用API提供数据服务,如今AssemblyAI 的例子向我们展示,人工智能同样可以通过API的方式创业。


随着人工智能应用的进一步成熟,这种创业方法必然还会有更多的人采用,人工智能即服务会诞生越来越多的创业公司。


以上就是今天的内容,希望你能有所收获,如果你喜欢我们的节目,欢迎分享给你的朋友,这会对我们非常有帮助,更多精彩内容明天再见~


科技前哨,每天都为你点亮。

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章