ocr

1热度

1回答

我在文档中有一个单词的数组，其坐标位置是文本，我想将它们转换为句子。我阵列输入： [ { "bounds": [ { "x": 10, "y": 10 }, { "x": 15, "y": 10 }, { "x": 15,

0热度

3回答

正在使用OCR。我可以导入asprise_ocr_api，我想在这方面努力： from asprise_ocr_api import * Ocr.set_up() ocrEngine = Ocr() ocrEngine.start_engine("eng") s = ocrEngine.recognize("1.png", -1, -1, -1, -1, -1, OCR_RECOGNIZ

1热度

2回答

谷歌愿景ocr：垂直和水平线文本识别

我们使用谷歌视觉ocr从收据中收集文本。在某些情况下，收据有一些垂直写入的文本，如增值税信息和其他一些。问题是，谷歌视觉只有在主要方向（水平的例子）有效地阅读文本，并放弃在垂直方向而不是水平写在同一收据的所有文本。是否有一个参数设置为告诉google视觉获取垂直方向的文字？我已经在网上放了一个带有两个方向文字图像的例子。 https://drive.google.com/file/d/0B

1热度

2回答

将扫描的PDF转换为文本python

我有一个扫描的pdf文件，我尝试从中提取文本。我试图用pypdfocr能靠它OCR但我有错误： "could not found ghostscript in the usual place" 搜索，我发现这个解决方案Linking Ghostscript to pypdfocr in Windows Platform后，我试图下载GhostScript的，并把它在环境变量，但它仍然有同样的错误

-7热度

2回答

是否可以在此3张照片上进行字符识别：

这是工厂需要的，他们要识别这些托盘上的文字; 到目前为止我对OCR或图像识别一无所知，所以我希望能从经验丰富的人那里得到建议，有没有可能做到这一点？免费或付费的库/服务是好的，更好的离线库，因为在工厂他们可能没有网络访问。在此先感谢！我从这些盘读取的文本： 8VEK87A DWD PPE LGA1215 LGA1217

-2热度

1回答

从扫描的发票中提取发票号码，发票日期等pdf（Java）

我不想使用Java提取发票号，发票日期，税额和发票价格。发票被扫描并保存为PDF。有没有人知道这个相对简单的可能性？

0热度

1回答

tensorflow关注ocr合成器90k数据集

我想用合成器90k测试集评估关注ocr模型可用在http://download.tensorflow.org/models/attention_ocr_2017_05_17.tar.gz。问题是评估结果很差，报告只有0.1个字符的精度。看来，对于每个输入图像模型输出与FSNS数据集的东西： python eval.py --split_name test --train_log_dir atten

0热度

1回答

从pdf获取机械化数据提取和文本识别

我有一些高度结构化的pdf文件，它们是我拥有的一些历史技术记录的扫描副本。大约有几千页（大约2K页），我试图自动提取涉及的信息。下面的链接包含我在谷歌上找到的图片。我不拥有图片，但出于说明的目的，我试图提取与类似结构化“块”中的信息，并以编程方式使用所提取的信息进行操作。所有的文本都是打印/打字的文本，理论上应该给出很好的精度。我愿意根据需要学习如何开展这项工作，但我不知道从哪里开始。我想知道

0热度

1回答

OCR与OpenCV 3交互的示例

我在OpenCV 3.1上使用Tesseract发现了有关OCR的page。问题是，给定的链接包含了较老的OpenCV版本的例子。是否有最新的OCR Tesseract使用示例？我怎么能告诉OpenCV权威？

1热度

1回答

如何给自己的数据集keras image_ocr

我知道keras image_ocr模型。它采用图像产生的图像，但是，我面临着一些困难，因为我想给我自己的数据集模型的training.vi 回购链接是：https://github.com/fchollet/keras/blob/master/examples/image_ocr.py 我已经创建数组： x和y。我的图像路径及其相应的gt是在一个csv文件中。 x被给定作为图像的尺寸： [nb_