我正在使用将大.pdf文件拆分为较小部分的工具,并且它使用Ghostscript来减小新生成文件的大小。 今天我运行了这个工具来分割来自itext-paulo-155的pdf,并且所有文件似乎都已经正确创建。然而,当我选择和新的和小.pdf文件的字符复制到文本编辑器,它们都遭到了损坏这样的:Ghostscript 9.15 - 从大.pdf文件中分割出来的文件已损坏
ỘỔỎồỌỐỗ ờ. ỌộỏỌ
ọχτφσ Ởωχκκω, Ọυω. • Ọσσ Ọχητχ, ỘỔ
ζσιζς@βςξθν.κιβ •
我更新了我的ghostscript版本到最新的一个9.15,它仍然发生。我给自己定了以下PARAMS在我的代码:
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dBATCH -dQUIET -sOutputFile=
的Ghostscript显然不能支持这种似乎是常见的.pdf文件,他们没有扫描图像。你有什么想法是什么会导致这种奇怪的行为,我该怎么做才能使ghostscript不腐败的字符? 感谢您的帮助。
感谢您的完整答案。原始.pdf文件具有Identity-H编码。我想知道这是否有所作为。是否有另一种解决方法的文件有这种类型的编码? – mariana 2015-02-10 19:51:42
与编码没有任何关系。正如我已经说过的,它最有可能缺少一个ToUnicode CMap以及一个子集字体指令。如果您不希望发生这种情况,请勿将字体分组。 – KenS 2015-02-11 08:01:54