2011-11-21 68 views
5

我有阿拉伯文PDF文件,它的编码似乎有错误。修复PDF编码

当我尝试在PDF对里面的字进行搜索,但没有发现结果

,当我尝试将PDF内容导出到Excel中使用其他程序是在一个陌生的编码数据导出

当我将PDF中的数据复制到记事本中时,记事本显示奇怪的编码。

我正在开发将使用这些PDF(约950文件)的解决方案,所以我必须找到一种方法来修复编码。

在此先感谢

+0

你能请分享一个链接到你的一个文件? – Bobrovsky

回答

1

声明:我从来没有编辑过阿拉伯文件。

你是如何将.pdf内容导出到Excel的?

不能直接打开.pdf文件既不与Word/Excel中/写字板也不记事本, 是奇怪编码你看到的很可能是一个选择的字体资源的特定编码。

您可以使用此 this 工具来检测编码

但我真的建议你阅读有关 Unicode and Character Sets

从此最低限度,考虑到文件的涉案金额,好解决方案似乎是 PyODConverter

对于少量的文件, Free PDF to Word Converter将照顾你的ne编者:

+0

亲爱的Joao,我的主要问题是修复PDF文件,当我在任何PDF阅读器中打开它时,我可以很容易地阅读它,但是当我搜索任何单词时,我发现它告诉我“找不到结果” –

+1

但是,编码这些.pdf正在使用?检查这个问题,也许它会让你跟踪:http://superuser.com/questions/119393/search-pdfs-with-non-standard-character-encodings –

+0

是的,这是确切的我的情况,谢谢 –