2016-07-11 51 views
-4

我有一个字符串,我想只提取它里面的一些信息。从Python中的字符串中提取信息?

例如,我有这样的:

'Won 3 Oscars. Another 80 wins & 121 nominations.' 

而且我想它在订单拆分得到像这样的列表:

['3 Oscars', '80 wins', '121 nominations'] 

怎么办我在Python呢?

由于

+0

您应该定义什么是您的提取信息的约束。数字后跟单词?每第二和第三个元素? – MisterMiyagi

回答

2

随后空间,一个然后字边界。这应该这样做:

import re 

s = 'Won 3 Oscars. Another 80 wins & 121 nominations.' 
p = re.compile(r'\d+\s\w+\b') 

print(p.findall(s)) 
# ['3 Oscars', '80 wins', '121 nominations']