免软件 提取在线图片中的文字

2017-11-03 21:15老万
电脑爱好者 2017年18期
关键词:中文信息列表网页

老万

现在很多单位都开始推行无纸化办公,这样很多时候就需要将文字信息转换为数字信息,而在转换的过程中必须要使用到OCR这类的软件,可是通常情况下这类软件不但需要收费,而且有的时候操作起来也比较麻烦。如果临时急用,在不用安装软件的情况下,我们也能进行图片文字的提取。

在线分析快捷简单

通过浏览器打开“ Free Online OCR ”这个云服务网站(https://www. onlineocr.net/),这项云服务的操作非常的简单,用户只需要根据页面中的向导一步步进行操作就可以了。首先点击网页中的“Select File”按钮,在弹出的对话框里面选择需要扫描的文件。这款云服务支持的文件类型非常丰富,不但可以对图片信息进行扫描,而且也可以对PDF文件进行扫描。

接下来在“Select language and output format”列表里面选择扫描文字的类型,通常我们都是扫描中文信息,所以选择“Chinesesimplified”这一项就可以了。如果扫描的内容里面还包括有英文等其他文字信息的话,我们就看哪种信息比较多就选择哪一种文字选项。接下来在列表中选择扫描出文字信息的保存文件格式,可以将其导出为纯文本格式以及Word文档格式(图1)。

我们要转换前需要输入网页上出现的验证码,再点击“Convert”按钮就可以开始进行相关的扫描转换操作了。扫描分析出的内容会及时地显示在网页下方的文本框里面,通过对比發现除了少数英文字母的内容出现错误以外,中文信息都完整地被识别出来了。最后点击“Download Output File”按钮就可以将其保存,再对这些内容重新进行编辑排版即可(图2)。

多语言支持更准确

虽然云服务的操作非常方便,但是由于可能会遇到服务器宕机或升级等问题,所以我们还是最好选择一个其他的在线云服务进行备份。而另外一款同样名为“Free Online OCR”的云服务也非常的不错。现在访问它的网站链接http://www.newocr.com/,点击网页中的“选择文件”按钮后,选择需要分析扫描的文件。接下来在“Recognition language(s)”列表中,点击选择要扫描文字的类型。这个云服务和前一个最大的不同之处在于,它可以同时选择多种文字类型,比如同时选择中文和英文等等(图3)。

选择完成以后点击“Upload”按钮进行上传操作,我们之所以不马上进行扫描分析,是因为有的时候在上传的过程中图片会出现翻转等问题。所以当文件上传完成以后,我们要首先对图片进行预览,查看它是否正常进行显示。如果不正常的话,还可以通过旋转的方式进行调整。当所有的调整完成以后,点击“OCR”按钮就可以开始在线分析扫描了。相对于之前那个云服务,该服务的分析结果并没有改变原有的排版格式。而且可以直接在网页的编辑框里面,对扫描结果进行在线编辑以及在线翻译等操作(图4)。endprint

猜你喜欢
中文信息列表网页
学习运用列表法
中国中文信息学会2019年活动计划2019年活动计划表
基于CSS的网页导航栏的设计
中国中文信息学会2018年学术活动计划
基于URL和网页类型的网页信息采集研究
网页制作在英语教学中的应用
10个必知的网页设计术语
不含3-圈的1-平面图的列表边染色与列表全染色
书 讯
COLING 2010即将在北京召开