服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

上线!谷歌翻译已支持图片中的文字

日期: 来源:CATTI中心收集编辑:CATTI中心

日前谷歌方面宣布,谷歌翻译网页版已支持直接翻译图片上的文字内容,并且翻译后的文字可直接复制,或是保存翻译后的图片。据悉,这一功能的实现得益于其使用了 AR Translate(AR 翻译)技术,目前已支持 113 种源语言与 133 种目标语言,同时 Google Lens 同样也是借助这项技术服务用户。

经验证发现,更新后的谷歌翻译网页中新增了图片翻译选项,用户选择图片翻译后、可上传图片按需选择语言进行翻译。但翻译后的图片,则有可能会出现版面及字体大小的调整。

据了解,2017 年 5 月发布的 Google Lens 目前同样也使用了 AR Translate 技术,这是一款基于图像识别与 OCR 的人工智能应用,能够借助摄像头识别物体后提供搜索服务,功能也已从最初的物体识别更迭到可货币化搜索。此前在今年 2 月,谷歌方面在一场人工智能主题的活动中透露,Google Lens 每月的搜索量已达 100 亿次。

此外,近日谷歌相关团队在还联合柏林工业大学推出了一款视觉语言模型 PaLM-E,该模型通过 PaLM-540B 语言模型与 Vit-22B 视觉 Transformer 模型结合后的最终参数高达 5620 亿,不仅能进行简单的问答对话,还能指导机器人完成相对复杂的指令。同时谷歌方面还表示,其公布的通用语音模型 USM 也已实现升级,目前能检测和翻译包含英语、汉语在内的多种语言。在谷歌官方博客中还透露,与 OpenAI 的语音模型 Whisper 相比,USM 的数据训练时长更短、错误率更低。


相关阅读

  • 咱是有求必应!六款小众却很实用的良心神器!

  • 前言最近看到后台有网友留言,希望来一款和PDF处理有关的软件,那我们肯定得满足呀,这不,它今天来了~在线 PDF 文件处理工具总感觉不能满意?那就试试今天这款在手机上轻松操作的PDF
  • ChatGPT是现代社会的镜子

  • © Boboshko-Studio / Shutterstock利维坦按:这波由ChatGPT引发的AI争论之所以如此火热,很大一部分原因是因为它再次掀起了语言领域的“恐怖谷效应”。就像曾经的硅胶高仿真人
  • 一个机器人和机器人对话的世界

  • 我们看到了一个人类和机器人用自然语言对话的世界,但是看到更大的突破是机器人和机器人对话的世界。未来会有多少机器人?首先做一个判断,未来世界上会有多少对话机器人(Bot)?我的

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 上线!谷歌翻译已支持图片中的文字

  • 日前谷歌方面宣布,谷歌翻译网页版已支持直接翻译图片上的文字内容,并且翻译后的文字可直接复制,或是保存翻译后的图片。据悉,这一功能的实现得益于其使用了 AR Translate(AR 翻译
  • 家长注意!云南疾控发布最新提示

  • 新的学期伊始,各个医院出现发热、咽痛及口腔、咽峡部疱疹的儿童也多了起来。医生说,有时它是手足口病,有时它又是疱疹性咽峡炎,你别说,这一看它两个还真有点像。那么,它们真的是一
  • 十堰市2023年“金口碑”商业榜发布 37家企业上榜

  •   十堰广电讯(全媒体记者 黄子怡 特约记者 姜益民)为树立各行业品牌典型,优化消费环境,提振消费信心,为企业打造“金字招牌”,3月15日上午,2023年十堰金口碑榜发布仪式在六堰人民