2013-09-26 39 views
-1

我对如何在互联网上挖掘信息以及如何从图像中提取文本感兴趣。关于如何在互联网上挖掘信息并从图像中提取文本的建议

所以我正在寻找如何做到这一点的信息,我想自己编程。是否有任何文件能够提供关于采矿和开采的良好解释?

有人可以帮助我的方式吗?

亲切的问候,

+0

你能提供一些你想要的OCR想象吗? –

+0

要求推荐的问题,特别是涉及到库时,在Stack Overflow中是无关紧要的。但是,如果你确实尝试编写代码并有更具体的问题,人们会很乐意提供帮助。 – Renan

+0

各种图像,它可以是一个带有文字的照片。 – user1007522

回答

-1

你可以看看Tess4J这是Tesseract Java包装。也就是说,图像处理(文本提取)通常需要先进行一些预处理,删除颜色和部分,这些颜色和部分不包含最常见的文本。