2014-10-02 44 views
0

我正在使用接收发票中所有文本的应用程序(通过处理该发票的扫描图像来获取文本)。现在,因为有几种可用的发票格式,所以我需要对应用程序接收的格式进行分类。例如,某些格式可能包含单位数量,有些则不包含(但它们都具有总成本)。发票格式识别器

我做了一些关于解析技术的研究,但没有找到可行的解决方案。你对这类问题有什么建议吗?

+0

学习使用ANTLR。 – 2015-01-09 19:09:27

回答

1

在Perl中,您可以使用Marpa,一个通用的BNF解析器 - 在BNF中描述您的发票格式,Marpa会解析您的BNF发票,参见例如。它是如何解决这个complex example与这simple code