OCR(光学字符识别)
OCR 具有广泛的潜在用途。其中包括扫描旧 准确的手机号码列表 手册或文本叙述,并能够在不重新输入整个文档的情况下对其进行更新。这可以节省更新手册、教科书和类似文档所需的人力投入。通过正确的设置和计算机“培训”,高级 OCR 甚至可以解读手写脚本。
OCR 最初的应用之一是让视障人士能够用机器阅读文本。其理念是将文本扫 描到文档中,然后由机器语音朗读。OCR 进一步被改造为将文本文档转录为盲文,并将盲文转录为文本。
OCR 的用途
使用 OCR 可以在扫描的文档中进行关键字搜索,从而减少对标签、元数据和标记的依赖,从而可以定位其中的信息。它还可以定位标签或元数据中可能未提及的细节。
OCR 可用于以下用途:
- 将文本转换为语音
- 将 PDF(便携式文档格式)转换为文字处理器文件以供编辑
- 编辑和填写 PDF 表单
- 编辑 PDF 文件的大小
- 标记和注释 PDF 文件
- 提取、旋转和剪切 PDF 页面
- 创建数字签名
- 为 PDF 文档添加书签和超链接
OCR 已添加到 DMS 文件夹
如果您使用过世界上最用户友好 AGB目录 的文档管理系统Folderit ,您就会知道这个云文档管理系统在节省时间、改善沟通和合作项目效率方面有多大的价值。添加基于 OCR 的内容搜索文档管理软件可进一步提高原本就很有帮助的业务 DMS 的效率。
OCR简史
与许多计算机系统一样,OCR 或光学字符 识别并非新鲜事物。事实上,第一台 OCR 机器是由维也纳的 Gustav Tauschek 于 1928 年发明的,而通用电气公司的 Paul Handel 于 1931 年发明了一台类似的机器。这两台机器都使用光电管光识别来“读取”印刷材料。1949 年,RCA 实验室发明了一台可以大声朗读印刷文本的机器,为视障人士创造了一种新的读写方式。David Shepherd 使用这项技术为美国军方创建了机器可读的印刷信息。Lawrence Robert 创造了机器读取多种简单字体的方法。读者文摘和 RCA 于 1960 年开发了第一台商用 OCR。1974 年,Kurzweil 阅读机将 医生的最佳网络营销策略 平板扫描仪和语音合成器相结合,创造了一台可以大声朗读印刷页面的机器。该成果后来被施乐公司收购并以 Scansoft 的名义销售。下一个发展是 PDA(个人数字助理),这是一种可以读取触摸屏上手写字母的手持设备。当然,这些字母必须是以特定方式书写的印刷体字母,但这是向机器可读手写体迈出的又一步。
OCR 和美国邮政服务
OCR 是如何使用的?它不只是一台语音阅读机器。也许您年纪大了,还记得邮政编码成为邮寄地址标准的时间。小学生学会了以固定格式书写地址,打字班的学生学会了在信封上输入地址的位置和方法。邮政编码始于 1943 年,到 20 世纪 60 年代中期已成为标准。这些数字有助于使通过邮件系统发送的数百万封邮件可被机器读取,从而更容易分类,从而节省了人工工作者数小时的辛苦工作。
地址末尾的五位数字对于机器来说要比城市名称、街道地址和人名的复杂字母组合更容易读取,但即便是这些字母组合,也可以用计算机读取——前提是它们要用大写字母书写,并且间距要合理。如果你参加过机器评分的考试,你可能已经在考试表上填写了姓名和地址,并将信息打印在间距合理的方格中。如果你曾经好奇过为什么要教学生清晰地打印,以及为什么漂亮的铜版草书(曾被称为手写体)已经基本消失,这就是部分原因。草书字母表中的连线字母的流畅形状对机器来说要难得多。
使用 OCR
当涉及文件时(手写或手印的笔记、打字稿或类似材料),这些页面通常会被扫描到计算机中并转换为 PDF(便携式文档格式),然后转换为可在文字处理器中编辑的 Word 文件。这两个文件并排显示,然后手动更正错误。语法和拼写检查器有助于标记出没有意义的单词和句子,但正如大多数计算机用户所知,这些自动程序并不完美,而且有时可能会在没有人为干预的情况下使组织良好的句子变得毫无意义。
OCR 和手写材料
当材料是用手写或草书书写时,计算机很难区分字母。为了解决这个问题,出现了 ICR,即智能字符识别,这是新一代的 OCR。这是一个重要的发展,因为虽然你可以训练一些人在小方框中整齐地打印,但这个过程对其他人来说不太成功。收到援助申请的大型政府组织经常会遇到文件填写不正确或不完整的问题。当手写条目不太清晰时,可能会导致原本可以接受的申请被系统拒绝。ICR 可以解码大部分条目,从而减少处理所需的数百小时人工时间。
OCR 的进步
此类软件的最新一代是智能单词识别。该软件不是解读每个字母,而是识别整个单词。与语音转文本程序一样,OCR、ICR 和 IWR 也是可训练的。这意味着您在计算机上使用程序翻译文档的时间越长,它的效果就越好。计算机“记住”字体、印刷体或手写体,甚至可以更好地识别客户或顾客的笔迹。这项技术并不完美,但它每一代都在不断改进。
市场上有各种 OCR、ICR 和 IWR 程序。其中一些是免费的,而另一些则相当昂贵。
一些 OCR 程序
One Note:如果您已经在使用包含 One Note 的 Microsoft Office Suite,那么您手头就有 OCR 程序。要使用 One Note 的 OCR 功能,您可以使用手机或平板电脑拍摄相关页面的照片。将图片导入 One Note,然后您就可以从图片中复制文本并将其粘贴到 Word 页面上 – 这将允许您编辑文本。然而,One Note 远非完美,可能会向用户展示需要大量编辑的文本。
Google Keep:这是另一款具有 OCR 功能的软件程序。如果您是常规用户,此程序还允许您复制图片中的文字,将其粘贴到文档中并编辑文档。评论表明,Google Keep 比 One Note 做得更好,但仍需要进行一些编辑。
Tesseract:另一个开源 OCR 程序,支持 100 多种语言 – 开箱即用。它有可在 Linux、Windows 和 Mac 系统上运行的版本,并且可以与 Google 配合使用。除了支持 100 多种语言外,它还可以学习新语言。此外,它不仅可以读取从左到右呈现的文本,还可以读取从右到左书写的文本,例如阿拉伯语。
返回 Folderit 和 OCR
然而,当您需要字符识别软件时,您可能希望它能够与您的所有文档软件兼容。这正是 Folderit 的用武之地,因为我们可以帮助您将 OCR 与您现有的 Folderit 应用程序集成。
Folderit OCR 在哪里以及如何为您节省时间和金钱?
让我们回顾一下 OCR、ICR 和 IWR 的应用。