近年来,我国越来越重视技术与教育的落地结合,各方也正在形成合力,积极推动人工智能与教育深度融合,发挥人工智能在促进教育公平、推动教育高质量发展的积极作用。
教育科技公司猿辅导一直以来致力于在教育科技领域推动人工智能与教育的深度融合。这家公司十年的发展离不开其科技基因的支撑。
自公司成立之初,科技基因就深深植根于其血液之中。猿辅导是业内第一家组建AI研究院的教育公司,并将科研成果广泛应用于公司产品。早在2014年初,猿辅导就成立了涵盖视觉实验室、自然语言理解实验室、语音实验室、音视频实验室和基础支撑五个实验室的AI研究院。研究团队来自清华、北大、中科院、微软等知名学府和顶尖机构,致力于全球尖端科技在教育场景的研发和探索。目前已向业界开源共享超过5项自主研发技术。
值得一提的是,猿辅导的AI团队还在2021年的声学、语音和信号处理国际会议(ICASSP)信号处理挑战旗舰任务、全球首个小资源音色克隆挑战赛——多说话人多风格音色克隆大赛(M2Voc)中,战胜19名来自各大高校及企业的竞争对手,获得冠军。作为声学领域的殿堂级比赛,M2VoC挑战赛的含金量非同小可。能在全球19支顶级参赛团队中拔得头筹,猿辅导对语音克隆技术的掌握水准可见一斑。
实际上,猿辅导此次比赛中呈现的并非实验室技术,而是一个早已在猿辅导多个产品中使用的成熟技术,主要用于英语发音、题干读题等场景。比如读一个数学题,有些幼龄的小朋友字认不全,需要读出来让孩子理解;另外,老师们也可以设定一个题目,根据题目的文字合成一个音频。尤其是在英语听力上的应用,发音要求更为严苛。此前,一线老师反馈称,比以往大大提高了效率。以前,由老师出题,然后找正规的英音、美音老师录制,一般外包公司制作一周才返回语音包。如果有修改,那就最少2周,遇到节假日就更不可控了。现在通过语音合成,一句10秒长度的句子,不到1秒就可以完成语音转化,效率上有很大的提升。
一般来说,通用的语音合成技术,大都将目光聚焦在合成字眼的准确性。其他有如准确发音、韵律情绪、适当停顿等问题通常不会顾及。可以说是一个“感情的朗读机器”。但在教育领域,这些平时容易忽视的痛点,就变成了技术团队重点攻克的对象。既要保证在遇到类似多音字这样的情况时,发出正确的读音,又需要在面向低龄儿童的教学场景中,让拼读更加自然、富有韵律不生涩。猿辅导对这一点的关注也获得了主办方、评委会的肯定。
“从用户需求出发,去想用户需要什么样的产品,然后推演我们需要具备什么样的能力。如果还不具备,那就去构建这样的能力。”猿辅导研发工程师张鹏说道。
作为科技赋能教育领域的佼佼者,相信猿辅导未来也将继续从用户出发,持续聚焦科技与教育深度融合领域,将自身的教育资源与科技基因进行深度融合和创新,让技术带着温度融入教育,让教育变得更加高效快乐,助力我国教育事业高质量发展。
| 留言与评论(共有 0 条评论) “” |