2013-10-16 54 views
0

帮助这里创建使用正则表达式是页面的一个片段:需要蟒蛇

<tr id="product_34980" class="even"> 
<tr id="variant_100329" class="variantRow"> 

我想提取的34980和100329.可能有多种产品和变型。我将使用python。

感谢

+1

http://stackoverflow.com/a/1732454/ 787016 –

回答

0

链接@Kirill Polishchuk给人是SO的最爱,它明确规定,为什么你不应该使用正则表达式这一点。

然而,如果你使用正则表达式仍然存在,然后尝试:现在

<tr[^>]*id="([^"]*)"[^>]*> 

你的比赛是在捕获组#1

+0

@hwnd,很好的编辑(我有时懒,不适合SO政策),但仍然在迷路。正则表达式是错误的。它似乎做了OP所要求的。当然不介意建设性的批评。 – gwillie

+0

谢谢,我想我会采取另一种方法。 –

0
>>> p = re.compile('\d+') 
>>> m = re.search(p, '<tr id="product_34980" class="even">') 
>>> m.group() 
'34980'