信不信由你,有些人仍然在实际的纸上打印文档。光学字符识别(OCR)软件会获取这些打印的文档,并将其立即转换回机器可读的文本。我们找到了一些最好的免费OCR工具,并在这里为您进行了比较。
没有OCR程序是完美的,因此您必须检查结果并解决一些问题。尽管如此,它比将整个文档重新输入计算机要快得多。这些免费的OCR软件工具均具有自己的优势。他们都将完成工作。
方法论
为了比较这些工具,我拍摄了PCPC.me的“隐私"页面的屏幕截图,并将其另存为JPG文件。
然后,我使用JPG来测试以下OCR服务。
但是,如果您要编辑的话,也可以扫描打印的文档。
如果如果您采用这种方法,那么如果页面具有常用字体(例如Times New Roman或Arial),则效果最佳。另外,在扫描图像之前,请确保图像正面朝上。还要针对文件大小也小于2 MB的扫描材料。
现在,让我们深入研究!
Google云端硬盘和Google文档
Google云端硬盘集成了OCR支持。它取决于Google用于扫描书籍和理解PDF文件中文本的OCR引擎。
首先,将要通过OCR发送的图片保存到计算机中。
下一步,打开Google云端硬盘网站并将文件上传到应用程序中。
专业提示:如果您是Gmail用户,还可以附加扫描的文档到一封电子邮件。附件带有一个按钮,可让您无需离开收件箱即可将文件传输到Google云端硬盘。
将文件放入Google云端硬盘后,找到它并右键单击。然后选择打开方式并选择 Google文档。
您的扫描图像随后在 Google文档中显示为新的可编辑文本文档! 。Google会将您的原始图片保留在文档的顶部,并使用OCR在其下方自动创建可编辑的文本。
Google云端硬盘和Google Docs的结合在这里起到了很好的作用。它很难理解网址,但是所有经过测试的工具就是这种情况。
许多免费的在线OCR工具(如Free OCR)都会限制您的上传。 Google Docs具有优势,因为它没有页面上载限制。
Microsoft Document Imaging
Microsoft还提供对OCR的支持,但仅适用于Windows用户。您是否使用2010年或更早版本的Microsoft Word?它已经具有Microsoft Document Imaging。
否则,您需要安装SharePoint Designer 2007。
好吧,现在,在我们深入了解这一点之前,请务必注意为了使此OCR方法真正起作用,需要具有Microsoft Word。
Microsoft Word不是免费程序,我知道。但是,由于这种OCR方法非常有效,而且访问Word非常容易(可以访问任何图书馆或大学校园),因此我要做出行政决定,无论如何都要将其包括在我们的免费OCR工具列表中。
继续…
通过转到此URL [Broken Link Removed]来安装SharePoint。点击下载时,系统会为您提供一些选项。单击 SharepointDesigner.exe 字段,然后单击下载。
接受软件许可证后,选择自定义选项。
在屏幕上框的左上角找到安装选项标签(该标签应为程序使用的默认标签)。请注意许多选项左侧的下拉菜单。
找到 Microsoft Office SharePoint Designer , Microsoft Office共享功能的下拉菜单
strong>和 Office工具。为所有它们选择不可用选项。
展开 Office Tools 的部分,然后找到 Microsoft Office Document Imaging 选项。选择从本机运行全部选项。注意不要在下拉菜单中选择措辞类似的“从本机运行"条目。
最后,单击立即安装按钮。在整个安装过程中使用的对话框的右下角。 (注意:此安装可能需要几分钟。)
您现在可以使用MODI功能了!
下一步是扫描文档或从中保存图像网络。然后,将其转换为TIFF文件。
Microsoft Paint是免费的TIFF转换选项的一个示例。只需在Paint中打开文件并单击另存为。选择其他格式。
从下拉菜单中选择TIFF格式并保存图像。
然后,在计算机上启动MODI。
只需在计算机上搜索 Microsoft Office Document Imaging ,然后打开程序。
然后,单击文件,然后打开并找到您的图像文档。
然后,单击菜单栏上的 OCR按钮。
程序完成OCR,单击“工具"菜单,然后选择“将文本发送到Word"。
该程序将自动打开一个新的Word文档并将您的OCR文本粘贴到其中。
结果可以在您熟悉的程序中为您提供可编辑的文本。
必须先下载辅助软件,否则可能会有些吓人。但是,该过程本身并不难,并且Microsoft在识别文本方面比Google云端硬盘做得更好。例如,此程序可以在PCPC.me的网站URL上找到它,并且不会把任何单词混在一起。
一个主要缺点是,尽管MODI对于Mac计算机不可用。如果您使用的是Mac,请查看以下替代方法。
下载: MDI到TIFF文件转换器和> SharePoint Designer 2007(对于Windows是免费的)
OnlineOCR .net
也许您只是刚开始使用OCR工具,并且想要一个非常简单,非平台特定的选项(就像最好的在线文字处理程序一样)。一个名为OnlineOCR.net的网站可以满足这些需求。
它支持40多种语言,如果您的文档中包含英语以外的其他语言,这是个好消息。
寻找蓝色的选择文件按钮。因为您可以上传最大15 MB的文件,所以此服务非常适合处理图形繁重的材料。
此后,请使用下拉列表并选择所需的输出语言。查看该菜单的右侧,注意有三种文件格式选择。您可以选择Microsoft Word(这是我采用的途径),Microsoft Excel或纯文本。
在使用包含图形的扫描价格表时,Excel选项可能很有用。这对于其他带有数字的原始资料也可能有帮助。 OnlineOCR也支持带有表和列的文档。
调整选项后,单击转换按钮。然后,下载该工具弹出的输出文件,瞧!可编辑的文本触手可及。
此免费工具与其他两个工具一样无法正常工作,但由于您无需注册即可使用OnlineOCR,因此超级便捷。另外,它确实可以识别我图像中的文字。如果您想尝试使用工具而不做任何承诺或提供任何信息,这是一个明智的选择。
此免费选项还允许每小时最多转换15个文档。这样的好处使其适合中等容量的OCR任务。
判决书
每个程序都有其优势。
使用任何工具,一旦完成OCR流程,就可以使用。如果您只是刚开始使用工具而又不知道它是否准确,那就尤其如此。
根据您的用途,您甚至可能根本不需要OCR文档。例如,您可以在不进行OCR的情况下将纸质书转换为电子书。
哪种OCR软件最适合您?您是否有其他我们在这里没有提到的最喜欢的OCR程序?留下评论并告诉我们。
您知道吗,您还可以使用OCR将手写文字转换为文本,以与OCR配合使用。
图片来源: nikolay100 / Depositphotos
最初由克里斯·霍夫曼(Chris Hoffman)于2012年3月撰写。