我正在开发一个项目,我需要从多页PDF中提取每页TIFF。 PDF只包含图像,每页有一个图像(我相信它们是用某种复印机/扫描仪制作的,但没有证实)。然后使用TIFF创建文档的其他衍生版本,因此分辨率越高越好。来自PDF的高分辨率图像
我发现两个食谱,都有帮助的方面,但都不理想。希望有人能帮我调整其中一个,或者提供第三个选项。
配方1,pdfimages和ImageMagick的:
首先做的事:
$ pdfimages $MY_PDF.pdf foo"
导致几个.pbm
文件(命名为foo-000.pbm
,foo-001.pbm
)等
然后对于每个*.pbm
做:
$ convert $each -resize 3200x3200\> -quality 100 $new_name.tif
临:得到的TIFF格式是在长尺寸的健康3300+像素,(调整大小只是用来正常化的一切)
缺点:页面的方向丢失,就出来旋转不同的方向(他们遵循逻辑模式,所以他们可能是他们被送到扫描仪的方向?)。
配方2 ImageMagick的独奏:
convert +adjoin $MY_PDF.pdf pages.tif
这给我的单页TIFF(pages-0.tif
,pages-1.tif
,等等)。
专业:取向留!
Con:结果文件的长度是< 800像素,它太小而不实用,看起来好像应用了一些压缩。
我该如何消除PDF中图像流的缩放比例,但保留方向? ImageMagick中是否还有一些我失踪的magick?还有其他的东西吗?
你是否愿意使用非免费的解决方案? – BitBank 2012-01-12 00:35:16
也许 - 它需要有一个API(没有GUI)并且要合理地集成;我正在处理数以万计的文档。你有什么考虑? – JStroop 2012-01-12 03:03:23
写信给我的细节,我会看看我是否可以帮忙([email protected])。 – BitBank 2012-01-12 03:28:57