我必须将PDF文件中的数据放入特定的数据库结构中。这要求我能够从PDF文件中获取某些数据。由于pdf没有任何标签等......我想知道是否有可能获得基于颜色的文本。举例来说,我想要所有的红色文本。或者我想要文档中的所有斜体文字。这在C#中可能吗?或者是否有其他方法可以轻松过滤PDF文档中的数据?如何从pdf中获取某种颜色的文本c#
3
A
回答
0
我采取了不同的方法。我将pdf转换为excel文件。这是很容易搜索彩色文本
0
通过使用这个库http://www.codeproject.com/KB/files/xpdf_csharp.aspx?msg=3154408 你必须每一个字风格的访问(字体,颜色...)
this.pdfDoc.Pages[4].WordList.ElementAt(143).ForeColor
0
的iText的PdfTextExtractor(以及所有它依赖于代码)不不跟踪当前的颜色。哎哟。这不会是所有是难以增加,所以你可以自己修改的iText:
- 添加笔触和填充颜色成员对GraphicState类(适当地更新各种构造函数)。你可能需要为'g','G','rg','RG','K'和'k'添加
ContentOperator
类(也可能是CS,cs,SC,sc,SCN,scn ),修改笔触和填充颜色。 - 将方法添加到TextRenderInfo以获取当前描边和填充颜色。
0
尝试PdfLibTET http://www.pdflib.com/products/tet/
它应该能够获得有关的文字信息。
相关问题
- 1. 如何从qplaintextedit获取文本颜色?
- 2. 如何获取PDF文件的文本背景颜色(RGB值)?
- 3. 如何获取文本的颜色?
- 4. 如何获取QLabel的文本颜色?
- 5. 获取PDF文件中特定文本的背景颜色
- 6. 如何从C#中的硒webdriver中的颜色调色板中获取颜色#
- 7. 从ruby-ncurses中获取256种颜色
- 8. C#算法为某种颜色着色
- 9. 如何从c#中的文本文件中获取某些行?
- 10. C#:如何从某种文化中获取资源字符串
- 11. 更改PDF文本颜色C#
- 12. 从Silverlight获取文本颜色RichTextBox
- 13. 从范围获取文本颜色
- 14. 颜色的某些文本
- 15. 如何恰当地获取文本的文本和颜色以在4种颜色之间切换/更改?
- 16. 将自动文本颜色替换为选中的某种显式颜色
- 17. 如何从RTF文件获取文本大小和颜色?
- 18. 如何使用win32com从word文档获取颜色文本?
- 19. 如何从闪存as3获取文本和矩形的颜色?
- 20. 如何从C#精简框架中的颜色名称获取颜色?
- 21. 如何从PDF页面获取文本?
- 22. 如何从Rich Text Box中删除第二种颜色的文本c#
- 23. 在PHP中获取PDF颜色
- 24. 如何从pdf获取pantone颜色编号?
- 25. 如何让图像中的某种颜色变成黑色?
- 26. 如何从文本中获取某个字符串。 C#
- 27. 从.png文件中获取颜色的HTML颜色代码?
- 28. 如何从PDF中检测颜色Python
- 29. PsychoPy中有多种颜色的文本
- 30. 同一文本中的多种颜色
您使用的是什么PDF库? – Oded 2011-05-03 15:43:34
iText pdf,但还没有找到我要找的功能。所以我对任何有关图书馆的建议都是开放的 – Ojtwist 2011-05-03 15:45:00