怎样将影印版PDF转化成文本文档啊?希望好心人解答一下

栏目:古籍资讯发布:2023-10-18浏览:2收藏

怎样将影印版PDF转化成文本文档啊?希望好心人解答一下,第1张

影印版PDF是格式的,需要用到OCR(光学字符识别)工具对其中的文件进行识别,识别成功后转换成文本形式。

所以关键在OCR的识别成功率,但遗憾的告诉你,网上你能找到的OCR工具不可能有比较高的识别成功率。

你还是放弃吧,影印版PDF只要清晰的话,还是不错的,只是文件大了些,你可以用PDF浏览器中的拍照工具进行截取其中的,然后在WORD中粘贴,文字还是老老实实人工输入吧。

一:用Office2003实现PDF文件转Word文档:可以利用 Office 2003 中的 Microsoft Office Document Imaging 组件来实现PDF转换成Word文档,也就是说利用Word来完成该任务。

操作步骤:

首先用Adobe Reader打开想转换的PDF文件 ,然后选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”,确认后将该PDF文 件输出为 MDI格式的虚拟打印文件。

二:用PDF转换器来将PDF文件转Word文档

PDF转换器的使用步骤

  步骤一选择需要转换的目标文件类型。可转换的类型有的PDF转Word、PDF转换Excel、PDF转等,点击图标勾选即可。

  步骤二添加需要转换的PDF文件。点击“添加文件”按钮,将PDF文件添加到程序界面,可一次添加多个PDF文件,进行批量转换。  步骤三选择文件转换后的存储位置。PDF转换器默认将转换出来的文件保存在原文件夹内,或者自定义文件夹存储路径,最后点击右侧“开始转换”即可完成转换。

分类: 电脑/网络 >> 电脑常识

解析:

PDF文件如何将繁体转为简体

family1chinaok/2006-05/19282

首先,你需要把PDF文件转换为DOC或文本文件,这方面,Solid Converter PDF(fixdown/soft/20963)非常不错。当然,你也可以把PDF的文字拷贝出来,直接存成文本文件。做完这些转换后,就可以使用Word的简繁转换功能,或者专用的简繁体转换软件,如ConvertZ(alf-lipcdiscuss/c_convertz)将繁体转换为简体,然后再用PDF制作软件,重新转回PDF格式。

不过有些PDF文件并不能以此种方式进行操作,当你使用Solid Converter PDF转换,或直接拷贝其文本时,会出现乱码现象,这是由于在制作PDF时,制作者将文本转成了路径。如果再想将文本拷贝出来,是根本不可能的。不过我们可以借助于另外的方法,就是先将需要拷贝的文本内容部分打印成,再使用OCR识别。微软Office System 2003带的Microsoft Office Document Imaging可以帮助你完成这种工作。完成之后,将繁体转为简体,再转回PDF即可。

第一步:PDF转Word

其实PDF转Word的工具和方法都非常多,由于我们主要目的是字体转换,所以专门去下载软件就比较费劲了,可以使用在线免费转换的方法,打开就能直接用。

首先打开浏览器搜索speedpdf后找到并打开这款在线转换工具官网首页,接着选择页面中第一个PDF to Word进入转换;

然后根据页面提示上传需要转换的PDF文档,多个文件也可以一起添加,点击文档后对应的convert开始转换即可;

转换一般都比较快,由于我们没有注册登录所以转换期间不要关闭网页,稍微等几分钟转换完成后就能快速下载并打开了。

第二步:繁转简

打开我们上一步中转换的Word文档,接着点击工具栏“审阅”选项卡中的“繁转简”就能将字体快速转换过来了。

然后将字体转换后的文档快速预览并且简单修改一下,然后进行保存。

第三步:Word转PDF

处理完成后再将Word以PDF格式导出就可以了,选择另存为后将类型勾选PDF文档即可。

怎样将影印版PDF转化成文本文档啊?希望好心人解答一下

影印版PDF是格式的,需要用到OCR(光学字符识别)工具对其中的文件进行识别,识别成功后转换成文本形式。所以关键在OCR的识别成功率,但遗...
点击下载
热门文章
    确认删除?
    回到顶部