2013-07-20 68 views
2

我有一个字符串,其中包含由特定子字符串分隔的组。喜欢的东西:以字符串分隔的提取组

FOO10 F10 O20 FOO20 F11 O11 

我想将它分成不同的小组,同时保留组标识符,即

FOO10 F10 O20 
FOO20 F11 O11 

有没有一种方式来捕捉从字FOO任何下一FOO的左边界或行结束?

+1

是您的格式总是:'FOOx Fx的Ox'? –

回答

3
>>> import re 
>>> re.findall('FOO.*?(?=FOO|$)', "FOO10 F10 O20 FOO20 F11 O11") 
['FOO10 F10 O20 ', 'FOO20 F11 O11'] 
>>> map(str.strip, re.findall('FOO.*?(?=FOO|$)', "FOO10 F10 O20 FOO20 F11 O11")) 
['FOO10 F10 O20', 'FOO20 F11 O11'] 
3
>>> s = "FOO10 F10 O20 FOO20 F11 O11" 
>>> import re 
>>> regex = re.compile(r"FOO(?:(?!\s*FOO).)*") 
>>> regex.findall(s) 
['FOO10 F10 O20', 'FOO20 F11 O11'] 

说明:

FOO   # Match FOO 
(?:   # Start of non-capturing group: 
(?!\s*FOO) # Assert that we're not right before (whitespace) FOO 
.   # Match any character 
)*   # Repeat as needed 
相关问题