在这里挣扎着一些正则表达式。我将循环浏览几个网址,但我无法获得如何识别收入或成本并获取它们的正则表达式。本质上,输出会是这个样子:或用正则表达式和python解析url时的语法
import re
url = ['GET /ca.gif?rb=1631&ca=20564929&ra=%n&pid=&revenue=224.00&cost=',
'GET /ca.gif?rb=1631&ca=20564929&ra=%n&pid=&revenue=224.00',
'GET /ca.gif?rb=1631&ca=20564929&ra=%n&pid=&revenue=224.00&cost=13']
values = []
for i in urls:
values.append(re.search(r'(?<=revenue=)(.*?)(?=&|;)',url).group(0))
print values
[[224.00, ''],
'224.00',
[224.00, 13]]
我认为最后的列表是您的预期输出。 –