-1
我在Windows 7中通过命令行使用tesseract.exe,并在扫描OCR图像时,以连续行显示输出。我希望它能够完全按照它在图像中的方式进行换行。有没有这种变化的命令行参数?任何帮助将不胜感激。Tesseract命令行上的OCR换行符
我在Windows 7中通过命令行使用tesseract.exe,并在扫描OCR图像时,以连续行显示输出。我希望它能够完全按照它在图像中的方式进行换行。有没有这种变化的命令行参数?任何帮助将不胜感激。Tesseract命令行上的OCR换行符
这是因为Tesseract在行的末尾放置了换行符,而不是像Windows'记事本所预期的那样回车+换行符。一个简单的方法就是将结果输出到标准输出,这输出重定向到一个文件:的
tesseract.exe eurotext.tif - > result.txt
代替
tesseract.exe eurotext.tif result
尝试过。 它创建2个文件。 -.txt与它中的数据相同,即全部在单行和result.txt中,这是一个空文件 –
- 适用于版本为3.05的我。你也可以尝试stdout而不是 - 。或者,您可以通过'TYPE result.txt |在Windows中将LF转换为CR + LF FIND“”/ V> result1.txt'。 – Stef