2016-08-03 44 views
0

几周前,我们的用户指出一些大型OCR PDF(ABBYY生成的)加载非常缓慢,并要求我们对其进行一些优化。PDF优化:pdftops -passfonts - 它是如何使PDF加载方式更快?

经过一番调查后,问题似乎是由嵌入在PDF中的复杂文本造成的。我尝试了不同的脚本来优化PDF文件,如ghostscript,qpdf等...

我发现的唯一一个做了显着改进的是使用pdftops(来自poppler)和-passfonts选项并将其转换回来使用ghostscript ps2pdf进行PDF:pdftops -passfonts intput.pdf output.ps & & ps2pdf output.ps output.pdf。

然而,问题是我不知道-passfonts如何使PDF加载速度较快,无论是做一个副作用,我不知道......

所以可以将PDF大师阐明一些灯光这种优化背后的原因/逻辑?

谢谢大家! 杰弗里

+0

你可以分享示例文件和街道优化之前? – mkl

回答

0

http://linux.die.net/man/1/pdftops

-passfonts

默认情况下,在PDF文件非嵌入式的8位字体引用替换为最近的 “黑体”,“时间─罗马“或”Courier“字体。此选项通过对PostScript文件

当文件打开时,读者会看系统的非嵌入字体,并且当它发现他们加载它们传递给非嵌入字体引用。这些非嵌入式字体越多,它所做的检查就越多。某些时候,由于法律原因,字体没有嵌入,有时它们并没有嵌入,因为它们使文件大小不成比例以及其他各种原因。通过使用更常见的字体代替非嵌入字体,我会说你迫使PDF加载较少数量的字体,并且可能迫使PDF使用具有较小存储器尺寸的字体导致更快的加载时间。

比较前后的字体列表。也许这将会带来更多的光明。 如果您在使用Adobe Acrobat打开文档: 文件 - >属性 - >字体

要与字体替换谨慎!它可能会完全毁掉文档的外观和感觉。