2016-12-29 64 views
-1

我在Windows 7中通过命令行使用tesseract.exe,并在扫描OCR图像时,以连续行显示输出。我希望它能够完全按照它在图像中的方式进行换行。有没有这种变化的命令行参数?任何帮助将不胜感激。Tesseract命令行上的OCR换行符

回答

1

这是因为Tesseract在行的末尾放置了换行符,而不是像Windows'记事本所预期的那样回车+换行符。一个简单的方法就是将结果输出到标准输出,这输出重定向到一个文件:的

tesseract.exe eurotext.tif - > result.txt 

代替

tesseract.exe eurotext.tif result 
+0

尝试过。 它创建2个文件。 -.txt与它中的数据相同,即全部在单行和result.txt中,这是一个空文件 –

+0

- 适用于版本为3.05的我。你也可以尝试stdout而不是 - 。或者,您可以通过'TYPE result.txt |在Windows中将LF转换为CR + LF FIND“”/ V> result1.txt'。 – Stef