
智能语音正在慢慢侵入我们的生活
虽然业内许多人可能认为技术中的“下一件大事”是区块链,人工智能取代人类工作者或增强现实,但有一种关键技术被低估:语音入口。
研究表明,到2020年,50%的搜索查询将通过语音搜索完成。然而,这项研究低估的是,语音入口的微小改进有可能彻底改变当前的人机交互范式。
这些改变将不仅限于通过语音入口来代替传统的搜索,或者只是将语音入口深度集成至图形用户界面及应用程序。
语音入口允许人们通过智能音响和其他设备(例如搭载小度、Alexa、谷歌等语音助手的设备)以自然语言与设备进行对话。
对话是我们交代他人完成工作的基本方式,将来,通过与计算机对话来完成工作也将至关重要。语音将主导我们与软件和设备的交互,甚至变得与图形用户界面一样重要。
然而,这还只是一个边缘观点。许多行业专家都认识到,语音入口仍然是一种新奇技术,尚未实现完美的产品-市场契合。例如,一些著名的风险投资公司认为,在实现普遍的人工智能之前,语音技术将永远是非常小众的。
由于语音助手目前存在许多局限性,人们很难将语音视为下一波技术。今天的语音技术的现状类似于90年代早期的拨号网络。

当今的语音交互体验就好90年代的拨号上网
那时候,上网体验非常糟糕,人们还无法想象一旦带宽得到改善将给我们的生活带来怎样的改变。当时的思想领袖对互联网进行了各种各样的预测,得出来的结论在今天看来显得非常保守 ——一些专家甚至预测,网络对经济的影响不会超过传真机。
人们对语音的期望今天也同样保守,部分原因是语音体验仍然非常粗糙。有假设认为在实现广义人工智能之前,机器人将不可能在对话中表现良好——并且在聊天机器人能够与用户进行接近自然人对话之前,该技术将永远称不上伟大。
然而,关于广义人工智能需求的这种假设是有缺陷的:有一些方法可以让聊天机器人使用现有技术实现接近人类级别的对话。
对于广义的智能语音,所涉及的话题非常广泛,它们需要几乎完全自学。不幸的是,目前的技术还不足以自动创建可以处理与人类进行多轮对话的自学机器人。
如果这种技术确实存在,我们就能够直接向语音机器人提出后续问题。但是,让智能机器人自行构建就像试图让智能手机应用程序在没有任何人为参与的情况下自行构建 - 目前是根本不可能的。
还有另一种方法可以实现与机器人进行接近人类的对话:极大的缩小对话范围。就像应用程序一样,开发人员可以为特定任务创建复杂的机器人,通过人工编程让机器人参与有意义的对话。
正是凭借这些特定领域的机器人才能实现语音技术的突破:智能音响,手机和其他设备将搭载这些机器人,这为先行者提供了大好机会。
解决今日语音机器人的问题
为了直观了解当前语音机器人的体验与未来语音机器人之间的差异,我们首先需要了解为什么语音设备目前相当于当年通过拨号来上网。
首先,与语音机器人的基本交互仍然很差。你必须用专门的热词来唤醒设备,之后你必须等待机器人是否成功激活。如果它被激活,你需要在哔哔声之后以缓慢但一致的速度说话并保障你的句子包含所有必要的参数 - 几乎就像你在SQL语句中说话一样。如果你在中途任何时刻停下来思考,互动将失败,对话需要重回起点。

当前的语音机器人交互体验非常粗糙
让我们看一个现实生活中的例子:
你说,“嘿,谷歌。”
当你等待确认设备已被激活时,会有暂停。
如果激活,你继续提出要求:
“在YouTube上播放Katy Perry的《Dark Horse》,在客厅的电视机上。”
当设备处理你所说的内容时,还有另一个延迟。
如果你的请求成功,你的客厅电视上就会开始播放Katy Perry的《Dark Horse》。
如果它不成功,你必须回到起点再试一次,也许是用不同的句子结构,不同的词句,或者只是试着说得更清楚。
这种体验充满了延迟,潜在的错误,并且可能需要多次重新尝试才能完成任务。此外,语音机器人还不够聪明到可以响应有关你正在做的事情的相关命令或查询。
一种与语音机器人交互的新方法
想象一下,未来我们与语音机器人的交互就像与人类操作员的对话一样。
第一个区别在于互动的速度。你可以以正常速度与人类操作员对话,没有暂停或延迟响应,而如果你在说话时暂停,也没有任何问题。你也可以在句子中间提及操作员 - 例如,“我想看电视,Alexa,帮我打开Youtube。”事实上,你可能不必说出他们的名字(唤醒词)让他们回应。
这个类似人类的机器人在与人互动方式方面也会非常灵活:
你:“Alexa,我想看Youtube。”
Alexa:“好的,在哪台电视上?”
你:“在厨房的电视上。想听Katy Perry的歌。”
Alexa:“你有特定的要求吗?”
你:“你有什么建议吗?”
人类:“《Roar》?《Dark Horse》?我在屏幕上提出了更多建议。”
你:“太棒了,谢谢。播放《Hot and Cold》。”

未来的语音机器人的交互体验应该和与真人互动无异
这是机器人互动的未来:无缝、流畅,轻松谈论手头的任务或主题。想象一下这些机器人的广阔世界,拥有同样庞大的便宜、商品化的语音设备。这就像在每个房间和每个设备旁边都有一个人类操作员。未来仍然会有大量的图形用户界面,但通过机器人可以更容易地使用它们。
踏入语音技术的未来
今天,通常会看到地铁站、机场和超市等地方为使用自助式触摸屏的人提供帮助的员工 - 例如,帮助使用值机机器的机场工作人员。

机场的自助值机设备旁边往往配有人工助手
但是,想象一下,这个人实际上可以直接与值机程序连接 - 这意味着在办理登机手续的过程中,你可以告诉机器你想要更改座位,应用程序则直接为你打开相关的界面 - 所有这些都无需人类助手的帮助。
这就是未来:语音机器人将嵌入你想要参与的每个设备或服务中,或者可以访问,并立即执行您的命令。你不再需要掏出你的手机或笔记本电脑来完成任务 - 相反,你需要做的就是大声说出你需要的东西,一切都将落实到位。
简单易用将是语音技术终极命题。在我们的现代世界中,人们希望以最少的麻烦快速做事,速度比以往任何时候都更重要。
尽管与聊天机器人行业相关的大多数人目前还没有预料到这一点,但我们这些正在研究和开发该技术的人预计会对业务运营,营销,销售,品牌推广,产品分销等产生巨大影响。
语音是技术的未来,我们已踏上征程。

语音入口,将是下一个科技界的下一个重大事件
Source: Sylvain Perron
Speaking the future into existence: why voice is the next big thing in tech
| 留言与评论(共有 0 条评论) |