【京华论坛】怎样才能提取PDF中的文字

2016-05-30 09:42 千龙网

打印 放大 缩小

PDF是当下最常用的文件格式,这种格式阅读性强,和纸质媒介最相似,受到了广大网友的喜爱。我的一个大学同学现在开始要写硕士毕业论文了,下载了好多PDF格式的论文期刊资料,放在手机里学习。不过他发现虽然PDF格式的文章浏览的时候很方便,但是里面的字不能复制利用,而靠手动输入感觉又不现实。于是他向我请教有什么好的方法帮助他把PDF中的文字提取出来。

其实我的同学的这个问题并不算什么问题,利用现在先进的OCR文字识别技术就能解决。。下面就来介绍用捷速OCR文字识别软件,来帮助我的同学完成提取PDF文字的工作。

它的操作步骤也很简单:

1、下载安装好捷速OCR文字识别软件后,打开软件;

2、点击软件上的“读取”按钮,找到需要识别的文件,选择文件并点击打开按钮即可完成文件的添加工作。用户还可以将文件直接拖拽到软件上方进行添加,这样操作更简单一些;

3、在打开的文件上选取要提取的部分,先按住鼠标左键不放,拖动,选后好再放开左键即可选取成功;

4、识别内容选取好之后,点击软件上方的“识别”按钮,开始对选取的内容进行一键识别;

5、识别结束,软件下方会出现识别的结果,用户可以根据原文进行核对,查看是否有不一致的地方。如果没有,则可以点击“word”按钮将识别结果保存为word文件。

详情点击:http://bbs.qianlong.com/thread-9727452-1-1.html

责任编辑:陶国琪(QT0003)

猜你喜欢