ocr

    1热度

    1回答

    我在文档中有一个单词的数组,其坐标位置是文本,我想将它们转换为句子。 我阵列输入: [ { "bounds": [ { "x": 10, "y": 10 }, { "x": 15, "y": 10 }, { "x": 15,

    0热度

    3回答

    正在使用OCR。我可以导入asprise_ocr_api,我想在这方面努力: from asprise_ocr_api import * Ocr.set_up() ocrEngine = Ocr() ocrEngine.start_engine("eng") s = ocrEngine.recognize("1.png", -1, -1, -1, -1, -1, OCR_RECOGNIZ

    1热度

    2回答

    我们使用谷歌视觉ocr从收据中收集文本。 在某些情况下,收据有一些垂直写入的文本,如增值税信息和其他一些。 问题是,谷歌视觉只有在主要方向(水平的例子)有效地阅读文本,并放弃在垂直方向而不是水平写在同一收据的所有文本。 是否有一个参数设置为告诉google视觉获取垂直方向的文字? 我已经在网上放了一个带有两个方向文字图像的例子。 https://drive.google.com/file/d/0B

    1热度

    2回答

    我有一个扫描的pdf文件,我尝试从中提取文本。 我试图用pypdfocr能靠它OCR但我有错误: "could not found ghostscript in the usual place" 搜索,我发现这个解决方案Linking Ghostscript to pypdfocr in Windows Platform后,我试图下载GhostScript的,并把它在环境变量,但它仍然有同样的错误

    -7热度

    2回答

    这是工厂需要的,他们要识别这些托盘上的文字; 到目前为止我对OCR或图像识别一无所知,所以我希望能从经验丰​​富的人那里得到建议, 有没有可能做到这一点? 免费或付费的库/服务是好的,更好的离线库,因为在工厂他们可能没有网络访问。 在此先感谢! 我从这些盘读取的文本: 8VEK87A DWD PPE LGA1215 LGA1217

    -2热度

    1回答

    我不想使用Java提取发票号,发票日期,税额和发票价格。发票被扫描并保存为PDF。有没有人知道这个相对简单的可能性?

    0热度

    1回答

    我想用合成器90k测试集评估关注ocr模型可用在http://download.tensorflow.org/models/attention_ocr_2017_05_17.tar.gz。问题是评估结果很差,报告只有0.1个字符的精度。看来,对于每个输入图像模型输出与FSNS数据集的东西: python eval.py --split_name test --train_log_dir atten

    0热度

    1回答

    我有一些高度结构化的pdf文件,它们是我拥有的一些历史技术记录的扫描副本。大约有几千页(大约2K页),我试图自动提取涉及的信息。 下面的链接包含我在谷歌上找到的图片。我不拥有图片,但出于说明的目的,我试图提取与类似结构化“块”中的信息,并以编程方式使用所提取的信息进行操作。 所有的文本都是打印/打字的文本,理论上应该给出很好的精度。我愿意根据需要学习如何开展这项工作,但我不知道从哪里开始。我想知道

    0热度

    1回答

    我在OpenCV 3.1上使用Tesseract发现了有关OCR的page。问题是,给定的链接包含了较老的OpenCV版本的例子。是否有最新的OCR Tesseract使用示例?我怎么能告诉OpenCV权威?

    1热度

    1回答

    我知道keras image_ocr模型。它采用图像产生的图像,但是,我面临着一些困难,因为我想给我自己的数据集模型的training.vi 回购链接是:https://github.com/fchollet/keras/blob/master/examples/image_ocr.py 我已经创建数组: x和y。我的图像路径及其相应的gt是在一个csv文件中。 x被给定作为图像的尺寸: [nb_