所以使用这种标准化的格式最快的方法是使用查找和切片:)。正则表达式是不值得的
例如,
>>> a = "http://example.com/2013/1520/i2013i1520p100049.html or http://example.com/2013/89/i2013i89p60003.html"
>>> lastindex = a.rfind('/')
>>> a[lastindex+1:]
'i2013i89p60003.html'
>>> a[a.rfind('/',0,lastindex)+1:lastindex]
'89'
分裂VS发现一个巨大的网址(这些是存在的,但通常不这大)
>>> a = range(10000)
>>> [a.insert(randint(0,10000),'/') for x in range(0,100)]
>>> a = str(a)
>>> b = time.time(); a.rfind('/'); time.time()-b
58493
1.8835067749023438e-05
>>> b = time.time(); d=a.split('/'); time.time()-b
0.00012683868408203125
更重要的是,你不需要做出的一个巨大的再分配/复制您的列表,当你有1000的,这并不好玩URL的