服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

吴滔:翻译需求每天1.4亿次 覆盖1000万用户

日期: 来源:金融界收集编辑:搜狗

金融界网站5月19日讯 2018年5月18 -19日,第二十一届科博会主题报告会暨中国科技创新论坛,在全国政协礼堂召开,本届论坛主题是“引领高精尖产业发展,推动科技创新中心建设”。

在人工智能与智能经济的分论坛上,搜狗副总裁吴滔表示, 翻译的需求,每天差不多1.4亿次,已经覆盖超过1000万的用户,这个量是非常大的。

搜狗副总裁吴滔

以下是演讲全文:

吴滔:各位来宾,各位朋友,大家早上好!

今天非常荣幸来到这里给大家分享一下搜狗在AI的这个路径以及落地的产品。

我首先给大家介绍一下搜狗公司,从我们一般是一个2C的产品公司,从产品来看的话,搜狗应该是中国互联网第四大的公司,仅次于BAT,主要的用户就来源于后面两个,一个是搜索,我们塞在是在这个国内的第二大搜索引擎,如果从流量的角度来看,我们现在从整个全球来排应该是第三仅次于谷歌和百度,然后最后一个是大家可能熟知搜狗的这个明星产品,搜狗输入法,整个在中国输入法是处于垄断的一个地位。

下面快速分享一下搜狗在AI的战略布局。

从产品角度来讲的话,搜狗是围绕语言的输入和输出为核心的一家技术公司,所以说我们在AI布局上的话,整体来讲也是围绕语言为核心来做的,上面是一个感知层面的东西,从语音,输入的感知,到视觉输入的感知,下面是对话,这是一个认知,从感知到认知,从认知到最后的话,能够跨国语言平台的交流,这是整个搜狗在AI方面以语言为核心的一个布局,下面会在每个区域的话,为大家简单介绍一下,我们在上面的成果。

最近的话,我们在各个领域拿到的一些奖项,一个是PAscal VOC,我们在其中的一个子任务里面拿到了全球第一,打破了世界纪录,第二是刚刚在上个月NLPCC,这是语义理解的大赛,搜狗也拿到了第一,2017年的NT,这是在日本相关的这个大赛,在这个大赛也是拿到全球第一的,下面是一个中英翻译的一个国际上的这个大赛,也是拿到全球第一,同时在我们2016年应该是第一个首家推出了实时的神经网络翻译同传技术,应该是2016年底乌镇大会推出的,同时我们在业界也是首次推出了跨语言的一个搜索,搜狗的英文搜索。

在这种语音的识别上,大家已经不是那么的兴奋,因为这个技术其实相对来讲比较成熟了,准确率达到97%,这个是非常高的一个指标了,我们有大量的用户每填使用我们的数据,积累大量的这个数据,迭代我们的一个模型,现在每天搜狗能搜到语音的这个请求次数突破3亿,每天产生的预料规模24万小时,我们基本上可以说在中国的话是首屈一指的。

然后这块是基于图像的识别,因为我们名字叫搜狗,所以说我们真的做了一个搜狗的这个产品,把一个狗的图片,植入到这个搜索引擎里,快速识别这个狗,到底是什么历史,资料的这个介绍,下面就是和搜狗一个类似的事情,就是花卉的,大概采集几十万,这个样本的话,采集了几十万,做到超过80%的一个准确率。

在去年年中推出一个唇语的识别,现在有一些前沿的科技产品,我们搜狗的唇语识别在开放的综合语序上可以达到60%,比如说在行车的这个封闭场景里,居家的封闭场景的话,我们通过视觉的唇语识别的话我们大概达到90%左右的一个准确率,唇语的识别的话,大家可以知道的话,主要的几个核心观点,第一个是要检测人脸,这个已经有相对比较成熟的技术了,真正的难点是这个唇形的这个提取,以及做一个识别引擎然后从刚才我们整个的战略布局来看的话,实际上就是在整个对于视觉和听觉的这个感知上的话,把我们两个核心的产品,作为一个AI化的升级,其实对话方面的话,输入法其实就是我们一直现代在每天使用的一个对话引擎,输入法差不多从推出到今天的话已经有11年的历史,超过300项的专利,在中国用户渗透率超过98%,每年笔输入的字数大概15万亿。

在输入法中间的话我们用过搜狗输入法的朋友可以感受到中间有很好玩的一些体验,比如说第一个我们把它叫做诗词补全,你忘了可以在里面进行诗词补全,比如说你想跟女朋友聊天撩妹的话,你没有找到很好的语言表达的话,我们可以把你想表达的意思,通过语义的这个理解,以及上下文的观点,给你替换一个更好的说法,比如说原来这个输入法,一直是一个填空题未来我们在语义的这个尝试,变成选择题,理解对方在讲这个话的时候,可以给他更好的答案,给他智能回复的这个功能,轻轻的点一下,不需要自己输入了。

后面还有一个智能分享,在整个输入的这个场景中,用户的需求是非常发散的,在对于一些垂直化的这个需求,有很多的这个直接要去跳出输入法满足的需求,比如说要定一个位置,查看一个电影院,或者定一些餐的话,可以通过本身在输入法面板里,不挑这个软件,就可以通过智能分享完成很多的事情。

下一个是问答,搜索本身就是一个问答的体现,未来的话,我们也能感觉到,搜索的下一步,也就是体验,为什么给大家提供一个搜索的列表,那是因为之前的技术可能还不能做到直接给你一个唯一的答案,其实更好的体验就是直接告诉你一个答案就好了,这方面我们把这个搜狗做了比较有意思的事情。

第一我们跟天工研究院做了一个合作,参加了这个江苏卫视一站到底,战胜真人选手20+次,所有的这个选手都会研究他,怎么会战胜它,但是发现一旦等汪仔理解这个题的时候,基本上是战胜不了,选手就会找一些技巧说,因为人的推理能力还是很强的,你说一句题目的前两个字,甚至前5个字的时候,就猜这个题目,快速的强大,在这样的场景下,最后这个汪仔还是败给了人类。

第二是搜狗的立知,在大量垂直的这个文献以及文本的预料里,其实我们在搜索目的中,实际上是帮你过滤一些觉得你想要的东西,然后自己再去寻找搜索结果想象到的这个答案,自己对于语义的这个理解,问题的分析,最后形成知识图谱,最后帮助人们输入一个搜索的一个需求的时候,因为搜索引擎还是一个相对比较智能的,大家知道搜索引擎有一个很关键的叫关键词,引擎不能很好的理解你,被迫你人需要有一种更机械的方式去交互,要把问的问题,经验的关键词,能够说成理解语,自然的交互还是会输一些问题,所以搜狗的这个立知的话,让你很自然的去问他,你的问题是什么,这个时候可以告诉你一个答案,目前来讲搜狗体系有8到20个点可以明确给出一个答案。

然后最后一个的话这个也是蛮有趣的事情,今年年初的时候有一波非常狂热的直播答题,最后去抢钱和分钱的这个活动,我们又做了一个答题助手的这个应用,只要把搜狗的这个答题助手打开之后,我们是调用了整个视频流、音频流,听出这个主持人到底是问的什么问题,然后支部找出OCR给出的这个答案,在两秒以内就可以给出正确的答案。准确率达到95%左右,只要用了搜狗的答题助手,基本上都可以分享现金的,所有的这个直播平台联合把我们封杀掉了。

我们在翻译的这个布局,搜狗本身是让用户获取和表达信息更简单,翻译呢,就是说我们让用户跨语言和表达信息更简单。

可以看到从软件上在我们自己核心用户群里面,我们大量的已经把我们的技术融合到产品体验中,输入法、浏览器、翻译APP,机器同传,我们推出搜狗旅行翻译报,叫做录音翻译笔,包括后续会有1到2款新产品退出。

时间关系我就不介绍一些这个端到端的这个分析,端对端神经机器翻译模型,使得一个完全不可控的这个翻译模式在可视化的情况下,可以针对性的进行调优,包括交互方式,语音、文字、对话、图像都可以翻译了,还有这个日军翻译,这个数字涨得非常的快,在最早的话是需要大量的这个语料的,因为我们在做搜索引擎,但是作为一些小语种来讲是很难获得这些语料,所以我们现在就在自己的这个语料的这个情况下做一些技术的这个突破,通过这个搜狗语言,不断的进行迭代,使得这个模型,接近相对比较优的状况,然后在快速的翻译语种进行快速扩充的这个主要的原因。

翻译的需求,每天差不多1.4亿次,已经覆盖超过1000万的用户,这个量还是非常大的。

我们简单看一下在输入法的这个翻译,只要用了搜狗输入法,这是一个语音输入的场景,说语音就行了,就可以识别,你说中文就可以直接的识别看到这个效果,这个只能分享也是一个,你只要点一下的时候,可能会给你一个智能分享,包括多语言的选择等等。

然后这个英文搜索,我觉得这个还是挺革命的一个事情,曾哥中文的信息占到全球信息的储备量的话,其实应该是不到10%的,接近10%,而且本身从我们自己淄博自身的搜索引擎我们看到的需求量来讲的话,接近15个点,其实是有跨语言的搜索的需求的,所以基于这个点的话我们就做了一个能够跨语言的搜索,我们把海外一些相对比较优质的,比如说和医疗相关的,人文相关的,科技相关的咨询的话,通过我们的这个搜索引擎可以收录其中,然后对照翻译,只要在里面输入一些,比如说这个细胞免疫疗法,这些比较专业的,就可以直接有这个结果,看原文译文,双语的对照,应该是今年的,也是近期吧,我们把英文这个扩大到日和韩,语种,比如说搜索日本的名人的时候,下面就已经有我们从海外别的这个网站里搜到的信息,使得你更好的了解全球的资讯。

这是翻译APP,其实也是因为,现在翻译APP也是蛮多的,在OCR上我们的准确率达到96个点,因为OCR其实是在计算视觉上是非常难的点,因为跟你的拍摄,包括跟你的光线、角度,这些都是蛮有挑战的事情,前面的对话、文本,我觉得这是传统的,从现在的角度来讲,传统的翻译技术,没有可多讲的,然后这个OCR的话,有兴趣的朋友可以去体验一下,当你在国外看到一些,比如说菜单啊,路牌这些牌照翻译就非常的方便,不光是英文,日文我们也支持了日文的OCR。

然后机器同传,商业化的技术已经讲了,是搜狗第一家去推出来,在乌镇互联网大会上,是我们CEO王小川先生第一次去演讲的时候,同时把这个英文和中文的这个语音的字幕打打出来。

我们已经支持100多次机器同传的这个大会了。

下面是我们今年的这个新推出的硬件的产品,叫做搜狗旅行翻译,一听这个名字是在旅游的这个场景,因为在翻译场景的话我们可以看到其它的需求方,有学习的,也有商务的,然后旅游是很大的一类,所以我们推出这个产品,是针对这个产品来做的,现在支持24种语言,大概覆盖200多个国家,这个产品从我们自己的这个角度来讲有两大创新,第一个它是一个第一个能做到完全离线的这样一个翻译的机器,这个是一个非常非常厉害的,我们早期的话可以看到很多传统的翻译模型,是基于统计模型,我们把它是叫做SMT,那个听上去就很明显,但是效果非常差,我们是第一个可以完整的,放到这个模型上去,识别准确度,是跟云端基本上保持一致的。第二个是OCR的翻译,在我们之前的话,其实也是有友商推出这个相似的产品,我们是第一个做到OCR视觉的这个翻译的,其实直到整个的这个我们在自闭里面特别是东方人,他还是比较含蓄的,即使你有语言的这个机器,有什么事遇到去问一下挑战还是蛮大的,所以能需要自己搞定就自己搞定,所以视觉非常的这个重要,包括你看到商品信息的时候直接拍照我们就可以直接把它翻译成想要的信息。

简单的分享一下我们离线翻译,这个是非常独特的一个技术,首先来讲的话在一个翻译机上的话,虽然我们是叫翻译器,其实中间有三个核心技术,第一个是做到的语音的一个识别,第二个才是翻译,第三个是做的TPS语音的这个合成。我们现在有很多家都是类似的这个技术,但是我们的技术是建立在云端之上的,为什么现在机器学习很厉害,是因为我们算力带宽非常的足够,你要把这个神经网络模型压缩到小的类似于这个手机的这个模型,非常非常的大。

而我们现在像我们翻译机差不多可以把3个模型放到1.5G的这个里面,接近线上的水准,这个是非常具有挑战的,我们把翻译模型压缩,压缩之后有两种,如果压的很厉害,效果会跌得非常的大,如果模型很大,效率也很低,三角的话是互相牵制的,第一要把模型压的非常的小,第二使得这个效率要非常的高,第三的话,我们怎么把这个准确性给找回来,这个我觉得是直到今天我们就可以非常自豪的来讲,我们在整个行业是最厉害的。

然后这个是OC恩日的这个实景拍照,其中会有一些技术上的这种挑战,比如说你的光线不是特别好,然后有一些什么样的曲面之类的话,我们现在已经陆陆续续通过这种大数据的回收,能够做到不光是你拍一个东西知道这个是什么,还可以给你相关的简介,不光是中英,而且都是离线的,也都可以去完成。

这是我们翻译报主要的功能,我就不会花太多的这个时间讲,主要就是核心,离线的,然后离线的OC恩日,然后多语种工具,未来会做一些和旅行相关的助手功能。

最后简单的说一句,因为我们刚才讲了半天的语言,我认为语言的话,首先它是一个民族,它的文化的一个载体,它可能决定这部分人,他的思维模式是什么,价值观是什么,另外一个角度来讲,是人与人之间非常方便的这个工具,大部分人在学这个语言的话,其实是需要我们跟别的国家的人,跟别的人更好的去交流,我觉得这部分以后从技术上就可以完全的实现,这些包括交给搜狗的公司就可以了,谢谢大家,我的分享就到这。

相关阅读

  • 冲上云霄,说说南阳机场的故事

  • 2022年12月,南阳机场通航30周年,从第一次通航、第一个训练高峰,到第一张“电子登机牌”、第一次“百万”吞吐量,30年间创下了多个“第一次”的辉煌业绩,见证了机场从通用飞行向运
  • 新疆第一个高高原机场通航

  • 天山网快讯 12月23日10时59分许,随着中国南方航空集团有限公司CZ5193航班平稳降落在塔什库尔干红其拉甫机场,标志着新疆第一个高高原机场正式通航。(记者

热门文章

  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 太行“小村医”守护乡亲“闯大关”

  • “把它喝上,这是个排痰用的往出咳痰的!”怕72岁的炳来大爷听不清张雪峰举着药,戴着N95口罩凑到大爷耳根子底下用家乡话大声说:“这个药是个排痰
  • 莆田:年味渐浓 年货市场火火红红

  • 购置年货是中国人的传统习俗,兔年春节临近,年味渐浓,莆田市的超市、批发市场各种年货提前热销,呈现出一派红红火火的景象。在莆田市各大超市,记者感受到了一股浓浓的中国“年味
  • 牧区健身热【5】

  •   1月8日,人们在西乌珠穆沁旗的一家瑜伽馆健身。  近年来,在内蒙古锡林郭勒盟西乌珠穆沁旗,随着牧区生活水平的提高,瑜伽等健身运动逐渐流行起来,人们参与其中,享受健康生活。
  • 太子山保护区东湾保护站开展森林防火应急演练

  • 近日,甘肃太子山国家级自然保护区管护中心东湾保护站开展森林防火应急演练,进一步提高森林防火大队的业务素质和技能,确保一旦有火灾发生,能够迅速集结、快速出动。此次演练首先
  • 石家庄至承德高铁更换复兴号智能动车组

  • 1月7日,由石家庄开往承德南的G7818次列车更换为复兴号智能动车组,本次列车是由中国铁路北京局集团公司石家庄客运段高铁一队担当乘务工作。复兴号智能动车组的更换,对于发挥高
  • 康乐县为群众免费发放碘盐550吨

  • 1月4日,康乐县人民政府地方病防治领导小组办公室通过公开招标采购优级加碘食用盐面向全县农村居民免费发放仪式在苏集镇举行。上午十时,记者来到苏集镇看到,两辆载满碘盐的大卡