百度大秀AI肌肉:人工智能听懂民乐,合成人声,讲话中文夹英语

百度大秀AI肌肉

​2019年7月3日,在“Baidu Create 2019”百度AI开发者大会主论坛上,百度CTO王海峰一句道出了百度大脑5.0的价值——在助力各行各业的产业开发者,加速产业智能化的道路上,百度要“授人以渔”。

王海峰已经是百度技术的标志性人物,负责了AI 技术平台体系(AIG)和基础技术体系(TG)以及百度研究院,现任百度CTO。

百度大秀AI肌肉

​王海峰博士介绍,百度大脑是公司从2010年就开始布局的AI技术,比如自然语言处理的技术,语音的技术,机器学习等等。应该说从2010年公司开始就初步形成了百度大脑的技术布局的雏形。发展到2016年就已经形成了较为完整的布局,并且逐步把AI能力开放出来。2017年的标志是百度AI能力全面开放。如果去年朋友们来过百度AI开发者大会的现场的话,还记得百度发布了百度大脑的3.0,它的核心是多模态深度语义理解。

百度大秀AI肌肉

​2019年,百度大脑 已经5.0 形成了包括基础层、感知层、认知层、平台层和 AI 安全五大部分的核心架构。它是软硬件一体的 AI 大生产平台。在算法和算力的双轮驱动下狠狠向场景发力。

​比如,语音识别算法的流式多级截断注意力模型(SMLTA)使识别准确率和响应速度都有大幅提升。风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音。现场人工智能创造时光倒流的之感,为英雄老兵制作了逼真的已故战友的声音。再比如综合应用语音和视觉技术,机器可以自动合成虚拟形象。人工智能让舞台上的虚拟人物栩栩如生。在认知层的语言与知识技术方面,知识图谱让机器“听懂”音乐纪录片《大河唱》。怎么才叫听懂?影片中的角色、角色关系、音乐曲种、取景地,直到影片主题等信息,都被识别。音乐通过特征被人工智能所理解。但是不要惊慌,对于艺术之美的理解,机器还很肤浅,但是不得不说很准确。

百度大秀AI肌肉

​另外,现场,百度语音技术部高级总监高亮演示了搭载SMLTA技术的百度输入法精准识别中英文混合输入,就是中英夹杂的说“洋泾浜”式的中文。比如“新model的效果很好”,“人工智能的value就是……”,感觉现场放起了香港TVB连续剧。而且机器识别的效果还很好。整个现场大秀AI肌肉,也让科技迷和科技开发者大呼过瘾。

百度还有很多新亮点

百度还有很多新亮点,等小编慢慢整理,另外读完文章别忘click下赞啦,我们都会默默地say thank you的。(完)

亲爱的数据

出品:谭婧

美编:黄楠

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();