服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

清华大学集成电路学院《Nature》子刊:智能语音交互人工喉!

日期: 来源:材料科学与工程收集编辑:


近日,清华大学集成电路学院任天令教授及合作团队在智能语音交互方面取得重要进展,其研发的可穿戴人工喉可以感知喉部发声相关的多模态机械信号以用于语音识别,并依靠热声效应播放对应的声音,研究结果为语音识别与交互系统提供了一条新的技术途径。


该成果以“使用可穿戴人工喉的混合模态语音识别与交互”(Mixed-modality speech recognition and interaction using a wearable artificial throat)为题,于2月24日在线发表在《自然·机器智能》(Nature Machine Intelligence)上。


论文链接:
https://www.nature.com/articles/s42256-023-00616-6

图1. 基于智能可穿戴人工喉的语音交互范式
语音是人类交流的重要方式,但说话人的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。研究人员一直在改进语音识别和交互技术以应对微弱的声源或嘈杂的环境。多通道声学传感器可以显著提高声音识别的精度,但会导致更大的设备体积。而可穿戴设备能够获取高质量的原始语音或其他生理信号。然而,目前尚无充分的证据表明喉部肌肉的运动模式和反映在体表的发声器官振动中隐含着可识别的语音特征,且尚无实验证明其作为语音识别技术的完备性。

图2. 人工喉器件设计和性能表征

图3. 人工喉器件与麦克风采集的语音信息标注和共振峰特征分析
为解决这一问题,任天令团队成员开发了一款基于石墨烯的智能可穿戴人工喉(AT),同商业麦克风和压电薄膜相比,人工喉对低频的肌肉运动、中频食管振动和高频声波信息有很高的灵敏度(图1、图2),同时也具有抗噪声的语音感知能力(图2)。对声学信号和机械运动的混合模态的感知使人工喉能够获得更低的语音基频信号(图3)。此外,该器件还可以通过热声效应实现声音的播放功能。人工喉的制作过程简单、性能稳定、易于集成,为语音识别和交互提供了一种新的硬件平台。

图4. 人工喉语音识别性能
团队还利用人工智能模型对人工喉感知的信号进行语音识别和合成,实现了对基本语音元素(音素、声调和词语)的高精度识别,以及对喉癌患者模糊语音的识别与再现,为声音障碍者的沟通和交互提供了一种创新的解决方案。实验结果表明,人工喉采集的混合模态语音信号可以识别基本语音元素(音素、音调和单词),平均准确率为99.05%。

同时人工喉的抗噪声性能明显优于麦克风,在60dB以上环境噪声下仍能保持识别能力。任天令研究团队进一步演示了它的语音交互式应用。通过集成AI模型,人工喉能够识别一名喉切除术患者模糊说出的日常词汇,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。

图5. 使用智能可穿戴人工喉进行无声语音交互
该人工喉还有很大的优化和拓展空间,例如提高声音的质量和音量,增加语音的多样性和表情,以及结合其他生理信号和环境信息实现更自然和智能的语音交互。研究团队希望通过进一步的研究和合作,让人工喉造福更多的声音障碍者和语音交互的用户。

论文通讯作者为清华大学集成电路学院任天令教授、田禾副教授、杨轶副教授和上海交通大学医学院罗清泉教授,清华大学集成电路学院2019级博士生杨其晟、上海交通大学医学院2019级博士生金伟秋为共同第一作者。该项目得到了国家自然科学基金委、科技部、教育部霍英东基金、北京市自然基金委、清华大学国强研究院、清华大学佛山先进制造研究院、清华大学-丰田联合研究院、清华-华发建筑光电子技术联合研究院等的支持。


来源:清华大学集成电路学院

推荐阅读:

麻省理工:核辐射居然也可能缓解晶界腐蚀

欢迎微信后台回复“应聘编辑”加入我们

实用!Origin软件使用经典问题集锦

免费下载:18款超实用软件轻松搞科研

合作 投稿 点击此处

欢迎留言,分享观点。点亮在看

相关阅读

  • 财政部印发《服务业发展资金管理办法》

  • 点击上方“财政部”蓝色小字,可订阅本微信。关于印发《服务业发展资金管理办法》的通知财建〔2023〕9号 各省、自治区、直辖市、计划单列市财政厅(局),新疆生产建设兵团财政局: 
  • 【创业】我型我秀Module's Glasses

  • 我型我秀Module's Glasses项目团队团队成员:顾诗韵、汪安吉、王周仪、龚天傲、方妙惠、朱星桦指导教师:蔡莉莉、修慧丽所属院校:上海市工业技术学校市场痛点1.大量难以降解塑料
  • 追剧追综三月看什么?优酷福气日历抢先知!

  • 本文来源于:优酷为好内容 全力以赴本月酷的海量在播内容,已为你准备好啦!关注《福气日历》,每天都要有新片看!(具体信息以实际播出为准)关注我们集合数百家主流媒体资源汇聚数千家
  • 马斯克将开发ChatGPT竞品 痛批OpenAI变质

  • 数智世界风起云涌,互联网新旧迭代,元宇宙蓬勃而出。m360互联网日报,从更全面的视野、更广阔的视域,洞察行业跌宕起伏,在趋势前瞻中把握市场脉动,引领敏捷增长风向标!今日核心看点:1
  • 媒介资讯丨《白夜追凶2》将改名《白夜破晓》

  • 点击上方蓝色上海前景传媒,发现更多精彩影视消息 2023年3月2日《心想事成》定档0309由青春你好影视制作,苏蓬任总编剧、刘一志执导的38集都市平民生活剧《心想事成》将于3月9
  • 刚刚公布!保定博野新增34例阳性感染者轨迹→

  • 点击蓝字↗进入公众号主页→点右上角「···」→「设为星标」 ★,您将第一时间收到最新推送!请加星标,看河北新闻网上新!博野县应对新冠肺炎疫情工作领导小组办公室关于新增34
  • 河北最新督查公告!7市联系方式公布

  • 点击蓝字↗进入公众号主页→点右上角「···」→「设为星标」 ★,您将第一时间收到最新推送!请加星标,看河北新闻网上新!省第三督查组督查公告根据省委统一部署,省第三督查组对

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 国家级认定名单公布!钢铁行业这些企业上榜

  • 2月22日,国家发展改革委网站发布了《关于印发第29批新认定及全部国家企业技术中心名单的通知》(以下简称《通知》)。根据该《通知》,目前全国共有国家企业技术中心1826家(其中112
  • 【夜读】把握好自己的人生节奏

  • 点击上方“财政部”蓝色小字,可订阅本微信。请相信,一切自有安排。北风潜入悄无声,未品浓秋已立冬。万物冬藏,岁月沉香。看到一段留言:“夜已深,此刻独自一人在公司加班,享受工作带