我已经在印地文中实现了文本检测算法,并且它工作得非常好,并且已经本地化了文本区域。现在我正在寻找将文本区域转换为Google翻译API可以使用的数字格式。有关如何将其转换为数字格式的帮助? (我看了SVM,ANN等)非英文文本识别
Q
非英文文本识别
0
A
回答
0
我会考虑OCR。
Tesseract OCR引擎(开源)具有包括印地语在内的许多语言的语言数据,所以这可能是一个很好的开始。它也可以集成到OpenCV中。
如果您只想使用OpenCV,那么机器学习方法(KNN,SVM)中的一种可能是最好的,您需要自己培训以识别字符。
几个环节:
https://code.google.com/p/tesseract-ocr/(正方体)
https://opencv-code.com/tutorials/how-to-read-the-digits-from-a-scratchcard/(OpenCV中+的Tesseract)
http://blog.damiles.com/2008/11/basic-ocr-in-opencv/(OpenCV的只有 - KNN)
https://opencv-code.com/tutorials/how-to-integrate-tesseract-ocr-and-opencv/(集成的Tesseract & OpenCV的)
相关问题
- 1. 如何在文本,文档,PDF文件中识别文本是英文的?
- 2. 识别文本
- 3. 识别替代密码随机密钥。 (英文文本)
- 4. 从非英文文件名和非英文文本中读取C++
- 5. Speech Framework是否只识别英文?
- 6. android语音识别旁边英文
- 7. Python中的英文字母识别
- 8. 检测文本是否为非英文
- 9. IE8和jQuery中的非英文文本
- 10. drupal中的非英文url别名
- 11. 石英不识别石英jar文件中的模式job_scheduling_data_2_0.xsd
- 12. Bluemix语言识别不识别英语
- 13. Android中的文本识别
- 14. 访问VBA - 识别文本
- 15. 使用nlp识别文本
- 16. Tesseract - 识别文本问题
- 17. 实时文本识别(OCR)
- 18. 语音到文本识别
- 19. 文本块内容识别
- 20. REGEX仅识别纯文本
- 21. 如何用中文Windows7上的SAPI5.4识别英文句子
- 22. 为什么在视图中识别非英文字符串,但在Rails 3中没有识别助手?
- 23. 如何处理非英文文件名与非英文文件名
- 24. 如何近似Java的Character.isLetterOrDigit()来识别Javascript中的非英文字母,数字?
- 25. Vuforia文本识别和OCR的区别?
- 26. EntityFramework更新或插入中文或非英文文本
- 27. C#阅读非英文文本文件,并写入ListView控件
- 28. Erlang:读取非英文字符的文本文件
- 29. 蛮力识别英语
- 30. 编码非英文字体
我正在寻找实现KNN或SVM的基础ed方法,但如果tesseract可以为此工作,我会尝试,谢谢你。 (对不起,我没有足够的代表upvote这否则我wudve :)) – 2015-03-31 10:36:18
没问题,我认为你可以通过接受答案来关闭问题。我还添加了另一个关于将Tesseract集成到OpenCV中的链接,这可能会有所帮助。 – user3510227 2015-03-31 10:58:02