如何将PDF文件转换成可编辑的Word文档?

像一些直接网上下载来的PDF文件,譬如下图的这个PDF文档,它的原始格式就是word。

其实也就是跟图片差不多吧,无法复制不可编辑。

一般像这种文字居多的或者掺杂图片较少的PDF文档,要转换成可编辑的word文档还是比较容易也比较多方法可以实现的。

新版的office是支持直接打开并转换PDF的,不过往往会有这个提示。超出word支持的页面大小,无法打开。你可以先试试。

word打开不行,那用acrobat的文字识别功能。先识别一下文档。

基本上这种都能直接识别出文字,识别率还是蛮高(因为文档文字居多,也没啥难度)咱们直接复制到记事本去一下格式,再粘贴到word里面。效果还是蛮不错。

但就不要识别后直接用acrobat直接另存为word了,这样没有效果。

会出现一些识别错误的现象,这当然也在所难免的。还是需要对比原文档来修改更正一下。另外字体原格式和排版肯定是要牺牲了。

我们来将难度提高一下。扫描件PDF。

一样还是上面的识别文档再到word。然后是下图这样子。

文档复杂时acrobat便不行了,毕竟OCR文字识别并不是acrobat的强项。

这里我们可以用ABBYY这个软件来进行PDF转换,就目前来说它可算是OCR文字识别界中的佼佼者。

直接拖拽进来让它自动识别就可以了,有三百多页,过程有点久。它会直接扫描PDF文档的图片识别出文字。并且此工具还较大程度上保留原始格式的样式和编排。

识别完成后直接将它另存为word文档下。

效果还是非常的好。

你可能想看:
分享给朋友: