2012-01-25 50 views
0

我希望能够搜索整个文件系统,甚至只搜索包含文本字符串的图像的目录。这当然会使用OCR(光学字符识别)。在文件系统中搜索图像中的文本

理想情况下,这将在后台运行并创建所有图像中所有文本的索引。

我的推理是我有很多包含文本的屏幕截图,我希望能够搜索它们。

有谁知道现有的解决方案?如果没有,我正在考虑自己使用OCR库。有关如何实施它的任何建议?

主要目标平台是Windows 7.

+0

你的意思是内置Windows搜索或任何第三方应用程序会做什么? – Tomato

+0

Windows内置搜索不会在图像本身上执行OCR。我正在寻找第三方Windows服务,该服务将自动创建在计算机上或导演及其子目录中的所有图像中找到的单词索引,以便我可以快速搜索它们。 – stuckintheshuck

+0

这里是Windows搜索的插件,可以使图像搜索文本:http://www.abbyy.com/recognition_server/OCR_IFilter_for_Microsoft/ – Tomato

回答

1

VietOCR监视新的输入图像文件的监视文件夹并对它们执行OCR。它不支持索引。该计划是开源的;您可以将其功能扩展到您的要求。

+0

它看起来像VietOCR使用谷歌的Tesseract OCR库。看起来这是最接近的。我将不得不建立一个使用它的索引系统。现在我将这个标记为答案。 – stuckintheshuck

0

当然,您提供了很多解决方案。 首先,有一类称为“文档管理系统”的产品,它允许索引计算机或网络中的所有文档。其中许多可选择提供OCR和图像文本索引功能。其次,还有一套“企业搜索系统”产品,它们也提供这样的选项(even Google has one)。最后,看看at e-discovery term。它是专门用于美国法律需求的文档管理系统的一个子类。

我相信这些都是相当昂贵的企业解决方案,也许某处有SoHo版本,试着用google搜索上面提到的东西。

相关问题