5
A
回答
4
您可以使用Docotic.Pdf(我为Bit Miracle工作)。
下面是如何在PDF文本搜索的例子:
PdfDocument doc = new PdfDocument("file.pdf");
string textToSearch = "some text";
for (int i = 0; i < doc.Pages.Count; i++)
{
string pageText = doc.Pages[i].GetText();
int count = 0;
int lastStartIndex = pageText.IndexOf(textToSearch, 0, StringComparison.CurrentCultureIgnoreCase);
while (lastStartIndex != -1)
{
count++;
lastStartIndex = pageText.IndexOf(textToSearch, lastStartIndex + 1, StringComparison.CurrentCultureIgnoreCase);
}
if (count != 0)
Console.WriteLine("Page {0}: '{1}' found {2} times", i, textToSearch, count);
}
你可能想,如果你想进行区分大小写的搜索删除第三个参数为IndexOf
方法。
3
你检查过itextsharp了吗? http://itextsharp.sourceforge.net/
编辑: 为了阐述,在TOC中,我看到了一个部分上: 15.3.3:与PdfReaderContentParser和PdfTextExtractor
提取文本而下PdfReaderContentParser: http://api.itextpdf.com/com/itextpdf/text/pdf/parser/PdfReaderContentParser.html 有一个选项来处理每页的pdf内容。
因此,它似乎是一个关于方式的过程,但是您可以遍历每个页面,在内容中搜索所需的单词,然后返回您找到的单词。
相关问题
- 1. 文本搜索PDF
- 2. 搜索PDF文本文本
- 3. pdf文件文本阅读和搜索
- 4. 搜索PDF文件中的文本
- 5. 使用C#搜索OCR(可搜索)PDF
- 6. PDF文本搜索和分库
- 7. 文本搜索和替换PDF
- 8. PDF视图 - 如何搜索文本?
- 9. 在iphone中搜索文本pdf
- 10. 如何编辑可搜索PDF的搜索文本?
- 11. Datagrid文本框搜索C#
- 12. 可搜索的PDF文件(图像+文本PDF)验证
- 13. 如何检测pdf是文本搜索还是非文本搜索?
- 14. 如何在C#中搜索pdf中的文本(执行匹配)#
- 15. Marklogic PDF文档搜索
- 16. Xamarin.iOS Pdf搜索
- 17. C#在文本文件中搜索
- 18. c#搜索大文本文件
- 19. Drupal 7索引pdf文件搜索
- 20. 使用Cloudera索引PDF文档搜索
- 21. 搜索文本
- 22. 搜索文本
- 23. 调用从shell脚本弹性搜索索引pdf文档
- 24. html/php搜索多文档内的文本PDF文件
- 25. 搜索pdf文件中的文字
- 26. 通过文本框搜索datagridview c#.NET
- 27. c#Listview使用文本框搜索
- 28. Redis使用C完全搜索文本#
- 29. C#文本框搜索自动完成
- 30. 如何搜索PDF?
我没有看到搜索选项itextsharp文档。 – Shoban 2011-02-04 02:24:44
@Shoban编辑答案是更多的信息。我没有尝试过自己,只是建议让OP开始。 – Joe 2011-02-04 02:32:01