我有阿拉伯文PDF文件,它的编码似乎有错误。修复PDF编码
当我尝试在PDF对里面的字进行搜索,但没有发现结果
,当我尝试将PDF内容导出到Excel中使用其他程序是在一个陌生的编码数据导出
当我将PDF中的数据复制到记事本中时,记事本显示奇怪的编码。
我正在开发将使用这些PDF(约950文件)的解决方案,所以我必须找到一种方法来修复编码。
在此先感谢
我有阿拉伯文PDF文件,它的编码似乎有错误。修复PDF编码
当我尝试在PDF对里面的字进行搜索,但没有发现结果
,当我尝试将PDF内容导出到Excel中使用其他程序是在一个陌生的编码数据导出
当我将PDF中的数据复制到记事本中时,记事本显示奇怪的编码。
我正在开发将使用这些PDF(约950文件)的解决方案,所以我必须找到一种方法来修复编码。
在此先感谢
声明:我从来没有编辑过阿拉伯文件。
你是如何将.pdf内容导出到Excel的?
您不能直接打开.pdf文件既不与Word/Excel中/写字板也不记事本, 是奇怪编码你看到的很可能是一个选择的字体资源的特定编码。
您可以使用此 this 工具来检测编码
但我真的建议你阅读有关 Unicode and Character Sets
从此最低限度,考虑到文件的涉案金额,好解决方案似乎是 PyODConverter
对于少量的文件, Free PDF to Word Converter将照顾你的ne编者:
亲爱的Joao,我的主要问题是修复PDF文件,当我在任何PDF阅读器中打开它时,我可以很容易地阅读它,但是当我搜索任何单词时,我发现它告诉我“找不到结果” –
但是,编码这些.pdf正在使用?检查这个问题,也许它会让你跟踪:http://superuser.com/questions/119393/search-pdfs-with-non-standard-character-encodings –
是的,这是确切的我的情况,谢谢 –
你能请分享一个链接到你的一个文件? – Bobrovsky