我试过在这张图片上的tesseract和一些带矩形内文字的扫描图片。但每次都会有一些垃圾文本作为输出失败。并纠正没有框周围的文字。请告诉我如何处理图像或tesseract?请帮助
回答
正方体的图像转换分级前为灰度,所以粉色系很可能被拾起为文本。
仅提取从图像中黑色像素,并且你应该罚款。您可以使用ImageMagick。
正如之前所说的,你应该得到这样做OCR前摆脱粉色系(他们仍然有用 仿佛字符边界)
一旦你extacted您gliphs和二元化他们(转换为位图),您可以启动到 使用tesseract就可以了。请记住,tesseract使用形状提取方法并依赖于字典支持 - 您可以通过不变时刻获得更好的结果(和更快的处理时间),如Hu
如果您对java base方法感兴趣,那么这里是我们的OCR库这只是在做纯Java(可移植到其他语言):
谢谢,但你能告诉我图像处理方法来删除或检测这些盒子因为我必须处理与这样的领域的图像。 –
这是基本的图像处理的东西。遍历图像并检查像素的颜色 - 如果他们的色调已关闭,则将其丢弃。你也可以计算积分inmages(在同一个y坐标中的所有粉红色像素的总和 - 它会给你峰值,你必须切割宝石),我会建议让你的冈萨雷斯(或类似的书)。您还可以看看javaocr,项目提供的样品有可能是你 –
好,谢谢我wiil尝试DAT一些线索 –
- 1. 为什么此CGRectContainsPoint失败?
- 2. 为什么此传送命令失败?
- 3. 为什么此CMP指令失败?
- 4. 为什么此页面方法失败?
- 5. 为什么此CollectionAssert.AreEquivalent()测试失败?
- 6. 为什么此更新失败?
- 7. 为什么此测试失败?
- 8. 此代码为什么编译失败?
- 9. 为什么此SPF记录失败?
- 10. 为什么此SQL查询失败
- 11. 为什么此PDO连接失败?
- 12. 为什么此cpp程序失败?
- 13. 为什么此Lucene.Net查询失败?
- 14. 为什么此XDocument验证失败?
- 15. 为什么tesseract-ocr在这种情况下会失败?
- 16. 为什么图像消失?
- 17. 为什么图像消失?
- 18. 为什么不绘制此图像?
- 19. 为什么不显示此图像?
- 20. 为什么不显示此图像?
- 21. 为什么图像上传失败php的is_uploaded_file检查?
- 22. AS3 ios cameraUI保存并加载图像失败,为什么?
- 23. 为什么SerialPort.Open()失败?
- 24. 为什么AVAudioRecorder prepareToRecord失败?
- 25. 为什么av_write_trailer失败?
- 26. 为什么assert_called_with失败?
- 27. 为什么file.exists()失败?
- 28. 为什么CToolBar :: LoadToolBar失败?
- 29. 为什么用'['失败?
- 30. 为什么JSON.parse(“串”)失败
后无论你已经试过.. –
我曾尝试用去除其像素值的矩形。 –
he he:D .. ithe marathi允许ahe ka? btw mala yacha uttar mahit nahi kaaran mi tesseract var kaam kela nahi。抱歉! –