2
我有一份从硬拷贝扫描的pdf文件。因此,pdf文件具有硬拷贝的图像。现在,当我尝试将PDF转换为单词时,我没有得到可编辑的文档,而是得到了一个坐在word文档上的图像。有什么办法可以编辑一个可编辑的文档吗?任何软件程序或将帮助我做到这一点?将包含文本的图像转换为可编辑文本
我有一份从硬拷贝扫描的pdf文件。因此,pdf文件具有硬拷贝的图像。现在,当我尝试将PDF转换为单词时,我没有得到可编辑的文档,而是得到了一个坐在word文档上的图像。有什么办法可以编辑一个可编辑的文档吗?任何软件程序或将帮助我做到这一点?将包含文本的图像转换为可编辑文本
这就是所谓的光学字符识别OCR
有大量的软件包,可以做到这一点 - 这样做在程序尝试http://code.google.com/p/tesseract-ocr/
应张贴在[超级用户(HTTP://超级用户。 COM /) – 2011-02-24 05:05:10