服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

到底哪款OCR软件最强?免费版居然表现最佳?

日期: 来源:胡萝卜周收集编辑:麻花

浏览网页经常会遇到一些无法复制的文档,或者偶尔需要复制某些图片上的文字,你们一般会怎么解决呢?

这种情况一般来说最简单,最直接的方式还是使用 OCR 软件比较好,毕竟 OCR 是一种非常知名又常见的文字识别技术。

即使是腾讯这种大公司,也可以随处见到 OCR 的身影,就比如微信和 QQ 就早已内置了 OCR 文字识别技术。

使用微信、QQ 截图或者打开某张图片之后,就能够看到「翻译」「提取文字」这样的功能。

这里腾讯就借用了 OCR 技术,提取文字和翻译其实就是通过 OCR 识别出图片上的文字信息,然后翻译成其它语言。

如果没有特殊需要,在一定程度上,微信 QQ 已经足够我们使用,无非就是麻烦点,每次使用之前都需要开启聊天软件。

但是这种方式也不是万能的,可以使用的前提是存在网路,如果断网,所有功能也就全部都成了摆设。

所以个人建议还是准备一款可以离线使用的 OCR 软件比较好,随时以备不时之需。

在此之前,我们分享过几款可用的免费 OCR 软件,有些需要网络,有些则支持离线功能,不管哪款,几乎都基于开源的 PaddleOCR。

在不同开发者的二次开发之下,各款又各有特色,功能偏向也各不相同。

PearOCR(点击跳转)主打网页端 OCR 识别,无需安装任何软件,只需要上传图片至到网站即可识别,无法做到离线使用,可能存在一定隐私安全风险。

Umi-OCR(点击跳转) 绿色免安装,支持离线功能,支持批量识别,支持截图和本地图片识别,如果安装语言识别包,还可以识别更多语言。

eSearch(点击跳转)虽然也支持 OCR 识别,但是功能更加全面,还支持截图、录屏、截图搜索等多种功能,简直可以称得上全能型神器!

那么今天再给大家补充一款最新出品,仍基于 PaddleOCR 开发的第三方 OCR 软件——OcrHelper。

这款软件仍然主打离线和绿色免安装,但因为软件内置文字识别库,所以体积方面偏大一点,压缩包就有 160M,解压之后的文件夹更是达到了 400 多 M。

OcrHelper 中文名为文字识别助手,软件比较简单,不需要用户手动截图,左侧是识别区,右侧是文字区。

也不需要我们去截图什么的,识别区扫过的地方,文字识别助手即可自动识别出内容。

如果不需要自动识别,也可以关闭自动识别功能,这样每次识别都需要点击「识别」按钮。

OcrHelper 可以从图片中识别出汉字,英文,数字,准确率高达 95%,目前软件已经开源,仅支持 Windows7 及以上 64 位系统。

软件适用多种场合,比如直播间弹幕识别,聊天识别、社交群,私域流量消息管理、pdf 以及不可复制场景文字内容提取等等。

不过 OcrHelper 也有其不足之处,首先是自动识别出的内容无法复制,这是一个重大缺陷,也可能是 BUG,目前 OcrHelper 只发布了首个 v1.0 版本,只希望作者后续更新能加以改善。

其次就是特别占用电脑 CPU,开启 OcrHelper 一分钟之后,电脑散热器会呼呼作响,要是再同时开启几款软件,只怕就得死机了!

顺便提一下,最近公众号又改版了,不星标公众号可能就会错过我们的推送,如果你喜欢今天的内容,麻烦给个星标吧!

开源地址:

https://github.com/xksoft/OcrHelper

网盘下载:

https://www.123pan.com/s/6zVRVv-Mfmmd.html

相关阅读

  • 表意与表音文字生成殊途再解释

  • 如同自然科学领域有“哥特巴赫猜想”之类艰深的难题,人文与社会研究领域同样存在令人着迷却难以索解的关注热点。比如,人类语言的起源曾经是一个投入众多、至今尚未突破的研究
  • GPT-4的前世、今生和未来!

  • 文 | 王思若前言诚然,从关系数据库到互联网信息检索,每一次知识表示和调用方式的跃迁都会在科技史引起一场巨大的技术变革。当ChatGPT发布之后,生成式AI成了新的技术范式,这场变
  • 关于编码的那些事 - URL 编码

  • 背景Web 项目中经常会遇到处理 URL 中 Query 的情况,来看下下面问题你有疑惑吗?项目中发现会用到 qs、query-string、URLSearchParams、甚至 querystring 几种不同的库,其到底
  • A股市场近期呈现震荡整理走势,热点板块情绪高涨,结构性行情明显。整体来看,市场初步企稳,不过近期市场受海外因素扰动偏多,指数波动明显增大。但是国内经济复苏和政策环境较为乐
  • 谈谈架构设计

  • 作者:guisuhuang,腾讯 PCG SRE 工程师在软件行业,对于什么是架构,都有很多的争论,每个人都有自己的理解。在不同的书籍上, 不同的作者, 对于架构的定义也不统一, 角度不同, 定义
  • 腾讯发布AIGC发展趋势报告|64页PDF下载

  • 来源:腾讯研究院2022 年,从引爆 AI 作画领域的 DALL-E 2、Stable Diffusion 等 AI 模型,到以 ChatGPT 为代表的接近人类水平的对话机器人,AIGC 不断刷爆网络,其强大的内容生成能
  • 锐普最新完成的AR发布会PPT,这样的3D效果,YYDS!

  • 先来做个投票,以下两版视效,你觉得哪个更好?还挺好选?那这两页呢?不久前,我们为易现先进科技制作了这份重磅的发布会PPT。从网易事业部到AR独角兽公司,易现已经在AR+AI领域探索多年

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 自以为是

  • ​题图:春意盎然 摄影|刘涛不知道从何时开始,我意识到自己有一个非常严重的缺点,自以为是。翻开过往记录,发现这个词在日记中出现的频率非常高,时不时就会发现自己犯下相似的错
  • 到底哪款OCR软件最强?免费版居然表现最佳?

  • 浏览网页经常会遇到一些无法复制的文档,或者偶尔需要复制某些图片上的文字,你们一般会怎么解决呢?这种情况一般来说最简单,最直接的方式还是使用 OCR 软件比较好,毕竟 OCR 是一种
  • 表意与表音文字生成殊途再解释

  • 如同自然科学领域有“哥特巴赫猜想”之类艰深的难题,人文与社会研究领域同样存在令人着迷却难以索解的关注热点。比如,人类语言的起源曾经是一个投入众多、至今尚未突破的研究