>>> import re
>>> pattern = re.compile("(http://www\\.)(\\w*)(\\.com/)(\\d+)")
>>> matches = pattern.search("http://www.someDomainName.com/2134")
>>> if matches:
print matches.group(0)
print matches.group(1)
print matches.group(2)
print matches.group(3)
print matches.group(4)
http://www.someDomainName.com/2134
http://www.
someDomainName
.com/
2134
在上面的图案,我们已抓获5组 -
- 一个是与匹配
- 其余的都是完整的字符串按照括号的顺序你看..(所以,你正在寻找第二个..) -
(\\w*)
如果你愿意,你可以捕捉string
你感兴趣的只是一部分。所以,你可以从你不想和图案的其余部分去除brackets
只是不停(\w*)
>>> pattern = re.compile("http://www\\.(\\w*)\\.com/\\d+")
>>> matches = patter.search("http://www.someDomainName.com/2134")
>>> if matches:
print matches.group(1)
someDomainName
在上面的例子中,你不会有groups - 2, 3 and 4
,如上面的例子中,我们已经捕获只1 group
..是的group 0
总是捕捉..这是相匹配的完整的字符串..
“www。”怎么样?和“.com”? –
幸运的是,这总是一样的! – Loolooii
正如“我不在乎他们”一样? –