1

我想从图像收据中提取总帐单。我可以提取图像中存在的全部数据,但现在我只能提取我需要的信息。ADHoc信息检索

这是我有的图像。

enter image description here

我从图像

m cm lnnk 3mm: :33; no 1 z m 
x Visut all! ms“; (or nulnunn mfn an an: nan. 



Sub Iota] 19.56 
TOTAL 19.56 
VISA 1956 
Fun 19.56 
D!!! You Know 0 



For ureat-tastlru dessens under 200 
cahries, try our Triple Berry Frozen 
Yogurt Sunda: a dish of Frozen Yogurt. 
or a Vanma rozen Vugurt Done. 

粘贴所提取的信息从这个数据我只是想提取的总账单。为了得到这个,我发现我可以使用Ad Hoc Normalization(Adhoc retrieval)。有人可以提供关于临时检索的任何见解。如果还有其他选项可以从图像中提取数据,请让我这样做。我正在使用tesseract来提取这些信息。有时它不会给出正确的输出。我可以用一些帮助来即兴创作tesseract给出的输出。

+0

你可以添加更多的信息吗?期望的输出是“19.56”吗?这是否需要在多个帐单上运行? – shiri

回答

0

为什么在这种情况下需要临时检索?由于您从收据中获得OCR结果,因此您可以简单地对出现在“TOTAL”旁边的项目执行常规文本搜索。

有图像文本搜索的算法,但这似乎是这样一个直截了当的应用程序的矫枉过正,除非有充分的理由这样做。