0
A
回答
2
我相信你可以用itextsharp来做到这一点。
我有这个代码存储在我的机器上,但从来没有使用过它。我从论坛上得到了它,但没有经过测试,但我相信你可以使它工作。
using iTextSharp.text;
using iTextSharp.text.pdf;
#region ExtractImagesFromPDF
public static void ExtractImagesFromPDF(string sourcePdf, string outputPath)
{
// NOTE: This will only get the first image it finds per page.
PdfReader pdf = new PdfReader(sourcePdf);
RandomAccessFileOrArray raf = new iTextSharp.text.pdf.RandomAccessFileOrArray(sourcePdf);
try
{
for (int pageNumber = 1; pageNumber <= pdf.NumberOfPages; pageNumber++)
{
PdfDictionary pg = pdf.GetPageN(pageNumber);
PdfDictionary res =
(PdfDictionary)PdfReader.GetPdfObject(pg.Get(PdfName.RESOURCES));
PdfDictionary xobj =
(PdfDictionary)PdfReader.GetPdfObject(res.Get(PdfName.XOBJECT));
if (xobj != null)
{
foreach (PdfName name in xobj.Keys)
{
PdfObject obj = xobj.Get(name);
if (obj.IsIndirect())
{
PdfDictionary tg = (PdfDictionary)PdfReader.GetPdfObject(obj);
PdfName type =
(PdfName)PdfReader.GetPdfObject(tg.Get(PdfName.SUBTYPE));
if (PdfName.IMAGE.Equals(type))
{
int XrefIndex = Convert.ToInt32(((PRIndirectReference)obj).Number.ToString(System.Globalization.CultureInfo.InvariantCulture));
PdfObject pdfObj = pdf.GetPdfObject(XrefIndex);
PdfStream pdfStrem = (PdfStream)pdfObj;
byte[] bytes = PdfReader.GetStreamBytesRaw((PRStream)pdfStrem);
if ((bytes != null))
{
using (System.IO.MemoryStream memStream = new System.IO.MemoryStream(bytes))
{
memStream.Position = 0;
System.Drawing.Image img = System.Drawing.Image.FromStream(memStream);
// must save the file while stream is open.
if (!Directory.Exists(outputPath))
Directory.CreateDirectory(outputPath);
string path = Path.Combine(outputPath, String.Format(@"{0}.jpg", pageNumber));
System.Drawing.Imaging.EncoderParameters parms = new System.Drawing.Imaging.EncoderParameters(1);
parms.Param[0] = new System.Drawing.Imaging.EncoderParameter(System.Drawing.Imaging.Encoder.Compression, 0);
// GetImageEncoder is found below this method
System.Drawing.Imaging.ImageCodecInfo jpegEncoder = GetImageEncoder("JPEG");
img.Save(path, jpegEncoder, parms);
break;
}
}
}
}
}
}
}
}
catch
{
throw;
}
finally
{
pdf.Close();
}
}
#endregion
#region GetImageEncoder
public static System.Drawing.Imaging.ImageCodecInfo GetImageEncoder(string imageType)
{
imageType = imageType.ToUpperInvariant();
foreach (ImageCodecInfo info in ImageCodecInfo.GetImageEncoders())
{
if (info.FormatDescription == imageType)
{
return info;
}
}
return null;
}
#endregion
0
请记住图像可能不存在作为图像,但作为一组的斑点(即原始数据,色彩空间数据,ICC配置文件或颜色空间),你将需要放在一起。原始图像也可以在显示器中操作(即缩放,旋转,倒置,蒙版,剪辑)。
相关问题
- 1. jQuery如何抓取元素?
- 2. 使用C从PDF中提取图像#
- 3. 用d3js抓取元素
- 4. 使用DOMXpath抓取节点元素
- 5. PDF使用图像C#.NET
- 6. C#XDocument,帮助匿名抓取元素
- 7. 如何抓取像素矩形
- 8. 如何使用C#获取xaml元素?
- 9. 如何抓取图标图像
- 10. 抓取图像元素从元素的背景作为DOM资源
- 11. 如何使用SAX抓取Nokogiri的元素内容
- 12. 如何抓取XML元素并将其存储? Objective C
- 13. 用cURL抓取图像php
- 14. C++读取图像像素
- 15. 如何抓住你抓住的元素内部的元素?
- 16. 抓取Soundcloud图像
- 17. 使用jQuery从页面抓取图像
- 18. 使用IMDB-抓取图像不显示
- 19. 从中心抓取元素
- 20. Scrapy抓取元素太深
- 21. Python抓取表元素
- 22. Cloudflare抓取,查找元素
- 23. Python Web抓取 - 如何找到地图元素的坐标?
- 24. C#抓取图像 - 的Canopus ADVC-55
- 25. 如何从这个大div元素获取图像元素?
- 26. 如何抓取屏幕NSWindow的图像?
- 27. 如何抓取Nutch中的图像?
- 28. 如何抓取PHP生成的图像
- 29. 如何使用Java(不使用pdfbox)从pdf中提取图像
- 30. 如何使图像DOM元素响应