我试图分裂一个字符串可能看起来像这样的:正则表达式分割字符串在特定字纹
International Bank for Reconstruction & Development (NAICS: 928120; SIC: 6081) World Bank (NAICS: 928120; SIC: 6081)
这个
International Bank for Reconstruction & Development World Bank
或任何这样的:
International Bank for Reconstruction & Development International Bank for Reconstruction & Development (SIC: 6081) International Bank for Reconstruction & Development (NAICS: 928120)
分成这个
International Bank for Reconstruction & Development
可能有任何数量的匹配。
我已经尝试了几件事情,用反面的人物类不起作用:
[^\(NAICS: (\d+);\)]+
我使用C#正则表达式。
什么是你想给它*分割成*?你希望每个例子有什么结果? – ruakh 2012-03-28 22:32:52
每个“名字”进入它自己的比赛。所以国际复兴开发银行(NAICS:928120; SIC:6081)世界银行(NAICS:928120; SIC:6081)匹配这组比赛{国际复兴开发银行,世界银行} – 2012-03-28 22:45:05
一个字符类不)匹配*单个字符*,而不是*字符序列*。这个'[^ \(NAICS:(\ d +); \)] +'与这个[[^()+:; ACINS \ d] +' – Tomalak 2012-03-28 22:45:46