2016-11-23 76 views
0

我有大约400本PDF格式的电子书,我的任务是从每个PDF(这是每个PDF的第一页)中提取封面,并且将它们全部导出为单独的图像(PNG或JPEG)文件提取多个PDF的第一页并将它们保存为图片

因此,我最终将获得400本电子书和400封电子图书。

我有Windows

任何建议非常感谢。

+0

好的 - 那你到目前为止写了些什么?这已经在很多地方讨论过了。你尝试的哪一部分没有工作? – gravity

回答

0

以下线程适合您的请求。将pdf文件转换为jpeg图像

一种解决方案是使用第三方库。 ImageMagick也是一款非常受欢迎的免费软件。你可以在这里得到一个.NET包装器。原ImageMagick下载页面在这里。使用固体骨架 http://www.print-driver.com/howto/convert_pdf_to_jpeg.html通用文档转换器 http://www.makeuseof.com/tag/6-ways-to-convert-a-pdf-file-to-a-jpg-image/ 6种方式要转换PDF的JPG图片 你也可以看看这个线程

http://www.codeproject.com/KB/library/pdftoimages.aspx转换PDF页面的图像文件:如何打开从页面C中pictureBox中的pdf文件#

如果使用此过程将PDF转换为tiff,则可以使用此类从tiff中检索位图。

0

使用ghostscript从pdf中呈现tiff或jpg。你对结果有很好的控制。

如果这是商业应用,您需要拥有商业许可。如果您在商业上使用该应用程序,但是在您的组织内部,则可以使用ghostscript的GPLed版本。

Ghostscript可以在这里找到。许多开源软件包中的PDF解释器都依赖于gs PDF解释器。 Imagemagick例如需要ghostscript库。

下载GS在这里:http://ghostscript.com/download/gsdnld.html

使用C#Process类来执行Ghostscript的,有一个在这个SO话题在这里How to run a C# console application with the console hidden

为TIFF命令行是:

D:\gs\gs9.20>bin\gswin64c.exe -sOutputFile=d:\some%02d.tiff -dBATCH -dNOPAUSE -sDEVICE=tiff24nc -sCompression=lzw -r150 -sPageList=1 d:\PDFReference.pdf 

这将以150dpi分辨率在d:\上创建一个some01.tiff文件。

相关问题