5
我必须分析包含英文和日文文本的图像。当我默认运行tesseract(eng)时,一些日文字符丢失了。否则,如果我用日语(-l jpn)运行tesseract,则会丢失一些英文字符(e.p.电子邮件)。 如何运行一个识别英文和日文字符的进程。 谢谢。Tesseract:如何运行多种语言的tesseract一次
我必须分析包含英文和日文文本的图像。当我默认运行tesseract(eng)时,一些日文字符丢失了。否则,如果我用日语(-l jpn)运行tesseract,则会丢失一些英文字符(e.p.电子邮件)。 如何运行一个识别英文和日文字符的进程。 谢谢。Tesseract:如何运行多种语言的tesseract一次
由于tesseract 3.02可以为-l参数指定多种语言。
-l lang要使用的语言。如果没有指定,则认为是英语。可以指定多种语言,用加号字符分隔。 Tesseract使用3个字符的ISO 639-2语言代码。
一个例子:
tesseract myscan.png out -l deu+eng
希望这将有助于:https://github.com/rmtheis/tess-two/issues/28 –
见https://stackoverflow.com/questions/16508796 /何灿我使用的,多语言支持上,Android的使用,正方体 – sashoalm