仪器信息网APP
选仪器、听讲座、看资讯

利用OCR软件快速将图片转化为文本

  • 栀子花开
    2019/09/09
    分析者端木花之队
  • 私聊

论文写作和投稿

  • 利用OCR软件快速将图片转化为文本
    ——基于《扫描识别全能王》软件
    实验猿往往会遇到这样的场景,手里捧着厚厚的文献,却无法将其快速转化成文档进行利用;或者网上有丰富的文献,却需要付费或积分才能下载……遇到这些情况,以前只能抓耳挠腮,但今天这一情况却不复存在了。首先利用截图软件,将网页内容转化为图片;再利用OCR软件,快速将图片转化为文本;最后利用社交软件,将手机上的文本,传送到电脑上进行再加工和利用。下面且听我慢慢道来,如何利用扫描识别全能王及截图社交软件实现快速OCR:
    1 OCR原理
    OCR是Optical Character Recognition(光学字符识别)的缩写,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
    以前的OCR软件多是电脑版,需要先将资料扫描成图片,然后进行识别。加上OCR识别率不高,编辑校对耗时颇多,因此OCR软件利用率并不高。随着互联网技术的发展和手机软件的繁荣,手机版OCR软件也如同雨后春笋般发展,而且目前OCR软件识别效果较好,识别后的文本基本上稍作修改即可使用,因此利用率有较大程度提高。
    2《扫描识别全能王》软件简介
    这是一款非常低调的软件,打开后界面非常简单。
    首先进入的是“首页”,只有屏幕右下角一个“+”的图标,加上最下方“首页”、“发现”、“更多”三个模块。
    点“+”号,出现“批量导入”、“相册导入”和“相机扫描”三个功能。导入后,可点击下方的“×”将这三个功能的图标暂时屏蔽,需要导入时再次点击“+”即可。
    进入“发现”模块,有“文字翻译”、“文字转语音”、“拍照翻译”及“PDF生成”四个功能。
    进入“更多”模块,有“做的不好戳这里骂开发者”、“做的不错!”及“关于”三个功能。“骂开发者”实际上是用户反馈意见功能,而“做的不错”是使用者向各大应用市场提交软件使用评价功能,而在“关于”里我们可以看到软件的版本(此处是2.1)及检查更新功能,以及软件作者的邮箱。
    3图片化工具
    不管是纸质版的文献,还是网络上不可复制或下载的文献,均需要首先转化为图片才能利用OCR软件进行识别。
    对于纸质版文献,推荐采用手机拍照方式,因其像素高、速度快、可直接导入到手机版OCR软件中。当然,对于未订装的多页文件,也可用扫描仪进行连续快速扫描。
    对于网络文献,如果可以直接用手机满屏阅读的,推荐采用手机截屏,可直接导入手机版OCR软件;对于电脑上才能满屏阅读的,推荐采用QQ软件的截图功能,因其方便、不需要另外安装软件。
    4图片传输到手机
    对于手机拍照方式,此步忽略。
    对于电脑截图,可利用QQ软件的“通过QQ发送到我的手机”功能,快速将图片传输到手机上。至于截图是否传输到手机,可登录手机QQ,在“我的电脑”模块查找。
    5将图片导入OCR软件
    启动OCR软件,依次点击“+”、“批量导入”,在手机图片库中选择所需图片后确定,图片库中的图片即可导入OCR软件。需要注意的是,手机图片库中的图片,每次最多只能选择9张。如需要导入较多图片,可进行多次导入。
    每次图片导入OCR软件后,会建立一个文件夹予以识别,文件夹上行显示“新文件夹年-月-日”,
    下行显示“年-月-日 时:分:秒”。
    打开文件夹,可以看到导入的图片进行了重命名,显示格式与文件夹格式类似。
    多次导入有两种模式,一种是回到主界面点击“批量导入”,软件会再新建一个文件夹放置新导入的图片;另一种是打开一个原来的文件夹,点击“批量导入”,这时软件会在这个原来的文件夹内放置新导入的图片。两种模式没有太大的区别,各位可以根据自己的爱好随意选择。
    6识别
    对于有冗余内容的图片,识别前最好进行适当裁剪,这里需要点击图片文件图标中除识别框以外的任何地方,然后点击下方的“编辑”按钮,进入编辑状态。图片编辑其实主要就是框选需要识别的内容,可以打开右上角的“智能框选”,这样软件能自动寻找框选内容,节约框选时间。框选完成后点击屏幕右下方的“√”按钮完成编辑。然后点击屏幕下方的“识别”按钮,稍候即可完成识别。
    对于无冗余内容的图片,可直接点击“识别”按钮,稍候即可完成识别。
    7文本传送
    推荐采用QQ进行文本传送。
    识别完成后,点击屏幕右上方的“分享”按钮,然后选择“发送到我的电脑”即可完成文本传送。
    不必每传送一次就到电脑QQ上复制一次,你可以传送几篇甚至几十篇文档后,集中到QQ的“我的电脑”中,将这些文档一次性复制、粘贴到文字处理软件如WORD中。
    8清除缓存
    对于已无利用价值的文件,包括原始图片、识别后的文本等,最好及时清除。方法是回到首页,长按文件夹名,然后文件夹会自动选中。如果有多个文件夹,可以在右侧红色小方框内打勾,最后点击屏幕上方第二个图标(垃圾桶)即可。
    9软件需要改进之处
    一是在同一个文件夹中,第一次导入X个文件编号为“新文档1、2、……X”,第二次导入Y个文件编号为“新文档1、2、……Y”,导致一个文件夹内有多个“新文档1”、“新文档2”……尽管不影响使用和识别(因为有时间加以辅助识别),但总感觉怪怪的。
    二是添加文件的“+”号位于屏幕右下方,在某些特殊情况下可能与文档的“识别”按钮几乎完全重叠(本人手机在文件夹刚好6个文件时会发生这个情况),影响操作。建议将添加按钮“+”移动到屏幕左下方。
    PS:最后附上一段操作的视频文件,供参考。发布时发现视频不能直接上传,只能搞成压缩包了,辛苦大家看的时候下载解压缩后再看了。
  • 该帖子已被管理者-生活所迫设置为精华,下面是奖励记录:加20积分,加5声望
  • 该帖子已被版主-生活所迫加10积分,加2经验;加分理由:鼓励原创大赛作品
    +关注 私聊
  • 轶辰

    第1楼2019/09/10

    应助达人

    不错的软件~

0
    +关注 私聊
  • 检测老菜鸟

    第2楼2019/10/07

    应助达人

    有视频有讲解,不错

0
    +关注 私聊
  • wccd

    第3楼2019/11/08

    应助达人

    此方法不错,可以一试,学习了!

0
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...