我有一个文件夹,其中多个客户端上传多个PDF文件。其中一些正在使用嵌入式字体,有些则不。
我一直在努力优化(在文件大小方面)该文件夹中的PDF文件的服务。
每个用户可能上传大约400个文件,重量介于80K到10M之间,我的任务是优化所有文件,尽可能减小文件大小,减少质量损失。如何检查PDF文件是否使用嵌入字体?
PDF库在这方面做得很好。我唯一的问题是,我无法从所有文件中删除所有嵌入的字体,因为某些文件可能会使用这些字体,结果将成为我无法使用的文件。
所以我的问题是:
- 我如何检测哪些文件使用,哪些文件不使用嵌入字体?
- 优化使用嵌入字体的文件时,如何才能删除未使用的字体?
我想要实现的是从大多数文件中删除所有嵌入字体,但将嵌入字体保留在实际需要它们的文件中。我知道这取决于我在我的系统中使用的字体(这些文件应该保留在一个系统中,因此可移植性对我来说并不重要),所以我试图找到一种方法来在优化之前识别哪些文件看起来OK没有嵌入字体,以及我需要保留嵌入字体的文件。
的建议@mjwills感谢。我想这可能是可能的,但我有点希望避免使用多个第三方课程。 PDF库是由Adobe编写的,已经支付了,所以我希望我可以得到一个解决方案,只基于此... –
@mjwills对不起,但没有。首先,我正在寻找一种方法来删除未使用的嵌入字体,而不是添加嵌入字体(如您提供的链接的注释中的描述),其次,我不会说cpp ... –
我不喜欢不认为第一个可用,但第二个是(我可以得到一个嵌入式字体列表)。但是,这不是问题。从该列表中我想知道是否在文档中没有使用嵌入字体,以便我可以删除它们,或者更好,然后查明是否可以安全地删除所有嵌入字体。我的目标是最小化文件大小,所以如果我能从哪些文件中找到可以安全删除所有嵌入字体的文件,它可以对输出文件产生非常显着的影响。 –