我正在寻找从工作流的原始信用卡源中提取一些文本。我几乎已经得到了我想要的地方,但正在努力解决我试图提取的最后一条信息。使用来自银行Feed的正则表达式提取数据
新进料的一个例子是:
LEO'SFINEFOOD&WINEHARTWELLJune350.0735.00ICGROUP,INC.MELBOURNEJune5UNITEDSTATESDOLLARAUD50.07includesconversioncommissionofAUD1.469.96WOOLWORTHS3335CHADSTOCHADSTONE
我期待由上述提取此:
(ICGROUP,INC.MELBOURNE)June5UNITEDSTATESDOLLARAUD(50.07)includesconversioncommissionof
与代表两组我后括号。跨越什么,我试图提取所有实例的一致的部分是:
DIGITS (TEXT) DATE TEXT AMOUNT includesconversioncommissionof
我已经能够使用正则表达式:
([A-Z][a-z]\d)[A-Z]AUD(\d\,?\d+?.\d*)includesconversioncommissionofAUD
让我的日期和金额。我努力找到一种方法来获得上面的例子ICGROUP,INC.MELBOURNE
上面的例子我已经尝试了\d\d(.*)
之前的上述正则表达式,但由于某种原因不起作用。
如果有人能帮助我后来的事情,我会很感激!
这是什么可怕的格式?在“WELLJune350.07”部分,您怎么知道日期的结束位置以及金额的起始位置?好的,没有六月三十五号,但如果它是'June250.07'呢? 6月2日是50美元,还是6月25日0.07美元? –
这是非常艰难的,绝对会扩大可以做的事情的范围。你确定他们不能用一些分隔符向你发送数据吗? “ICGROUP,INC.MELBOURNE”之后的位置值是否始终是月份的全名,后跟数字日期? – mwp
嘿!我实际上曾多次“LEO'SFINEFOOD&WINEHARTWELL”:) – Bohemian