文/超脑智能
近日,再次入榜《财富》公布的世界500强企业阿里巴巴集团,宣布旗下云计算公司阿里云将开放人工智能机器翻译技术能力,通过云平台为客户提供机器翻译商用服务,包括解决跨语言广告,辅助翻译,移动翻译、网页翻译、跨语言电子商务等难题。
在人工智能技术方面,阿里巴巴很少提及机器翻译,这也导致大众对机器翻译的认知更多停留在Google(谷歌)、百度、科大讯飞品牌上。
按照阿里巴巴官方公布信息看,阿里巴巴的机器翻译能力主要在于商业用语的沟通、商品信息的翻译、电商平台上的。“阿里巴巴走的是商业业务翻译的道路,与目前市场上已有的翻译平台道路完全不同”,阿里巴巴机器翻译相关负责人表示。
在Google、百度、科大讯飞等一众强手如林的翻译市场,阿里巴巴俨然是一名新秀,有何底气站出来抢夺翻译市场?阿里巴巴给出了两条答案。
杀手锏一:全球首个电商实时翻译AI 翻译量超过Google 亚马逊
据了解,阿里巴巴AI机器翻译已经为阿里巴巴集团内十几条业务线提供机器翻译和本地化支持,覆盖了Alibaba.com 、 AliExpress 、 Lazada 、钉钉、阿里云、优酷、支付宝、菜鸟、天猫精灵、高德、飞猪等众多产品。机器翻译在阿里巴巴内部可以达到每天翻译出几十亿量级的产品信息,每天的线上翻译请求到达数亿次,在双11时每秒钟的翻译请求大概有几万次,每天翻译的词语个数超过2000亿,而根据Google 2016年披露的数据,其每天翻译的词语个数大概是1400多亿,阿里巴巴要比谷歌的多600亿。
据网上公开数据,世界电商巨头亚马逊2017年的商品总量为3.9亿,但亚马逊采用分国家运营的策略,因此需要翻译的商品数量远少于此。而阿里目前需要翻译的商品总量超过4亿,总量也远远高于亚马逊。
5月18日,阿里巴巴在跨境电商中正式上线对话实时翻译功能,破解买卖家语言不通难题。这是全球首个电商领域的实时翻译AI产品。平均翻译一句话耗时在200毫秒左右,肉眼之下完全看不出滞后。
对话沟通实时翻译系统运用了业界最新的神经网络模型,融合了达摩院机器翻译、语义理解、自动语种识别等多项AI技术,并且可根据上下文语义、语法理解进行自动纠错。甚至比人还聪明,可一秒识破用户在使用非母语交流,并自动提醒用户开启实时翻译功能。
该系统目前支持中、英、俄、西四种语言,预计下半年将陆续扩展泰语、阿拉伯语、越南语、土耳其语等小语种的翻译服务。
“语言”是跨境交易头号拦路虎。在阿里巴巴国际站,7成买家以英语沟通,还有30%为小语种。而卖家端的调研数据显示,大约96%的卖家对小语种无能为力。
电商专业能力:机器翻译模型往往在特定领域对领域相关的专业术语翻译不是很准确,为了解决这个问题,语料平台构建了多语言分领域知识库。阿里通过众包和自动挖掘的方式构建了大规模电商多语言知识库,在14个语向上积累了700百万对术语,并研发了基于此研发了融合外部知识的神经网络翻译模型,在跨境电商场景下翻译更精准。目前支持的语向包括英俄、英俄、中英、英泰、英印尼、中泰、中印尼。
比如下面的句子:
车缝走线能保证整齐吗
阿里翻译:Can a sewing line be guaranteed to be neat?
百度翻译:Can the seams and lines be neatly guaranteed
谷歌翻译:Can the sewing thread be neat?
由于使用了特有的电商术语知识库,我们可以准确捕捉到“车缝走线”这样的专业术语,产生更加准确的译文。
杀手锏二:5项国际机器翻译大赛冠军 为阿里机器翻译加持
在5月底刚刚结束的 WMT2018 国际机器翻译大赛上,阿里巴巴机器智能-NLP 翻译团队力压群雄,打败了多个国外巨头与研究机构。在全部的14项比赛中,阿里巴巴共提交5项,并全数获得冠军,成为斩获冠军数最多的参赛者。各项比赛以一个语言方向的机器翻译质量作为指标,阿里巴巴机器翻译团队在英译中,英译俄,英译土,俄译英,土译英5个语向的自动评测指标 BLEU 值上都位居第一。
(备注:WMT 全称 Workshop on Machine Translation,是国际公认的顶级机器翻译赛事之一,也是各大科技公司与学术机构展示自身机器翻译实力的平台。2018 年更吸引了包括翰霍普金斯大学、爱丁堡大学、亚琛工业大学、马里兰大学、微软、腾讯等在内的几十个团队参与。)
据了解,阿里云机器翻译还将在翻译模型上向“统一化,多任务化,多模态化”方向发展,产品形态上除了目前基于文本的翻译外,会扩展跟多模态的翻译产品,例如语音翻译、图像翻译等领域,同时还针对具体应用场景例如搜索、实时沟通、旅游推出相关接口服务,解决国际化过程中的语言问题。
关键词:阿里巴巴、google、机器翻译、科大讯飞、翻译、人工智能、亚马逊、谷歌
| 留言与评论(共有 0 条评论) |