2011-04-27 23 views
3

我们使用存储在CMS中的RGB图像生成PDF文档。用Python替换PDF文档中的图像?

作为PDF处理的一部分,我们有时需要将RGB图像 转换为CMYK(用于打印作品)。

使用LittleCMS和PyLittleCMS绑定(加上RGB输入和CMYK输出设备的ICC颜色配置文件),将图像从RGB转换为CMYK似乎是可行的。

但是,是否有一些基于Python的选项来遍历PDF中的图像,提取图像数据并将其替换为处理过的CMYK变体?

回答

1

我不认为有任何免费的Python工具可以完成你想要的功能。以下是一些选项:

PoDoFo没有成熟的Python绑定,但可以读取和写入PDF,具有support for PDF images and color spaces

PDFMiner是一个纯Python PDF解析器,但它对图像没有太大的作用。这是一个开始,但可能需要相当多的工作来做你想做的事情。

ReportLab的商业版本可能能够做到你想要的PageCatcher;几年后我还没有使用它,但您可能会对其进行调查。 (免费的ReportLab只写PDF,不会读取它们。)