这是我的代码来访问一个网页,但我需要添加参数: 1.通过从文件 读取一行添加第一个参数2.第二个参数是一个计数器,以连续访问页面在python中添加url参数
import urllib2
import json,os
f = open('codes','r')
for line in f.readlines():
id = line.strip('\n')
url = 'http://api.opencorporates.com/v0.2/companies/search?q=&jurisdiction_code=%s&per_page=26¤t_status=Active&page=%d'
i = 0
directory = id
os.makedirs(directory)
while True:
i += 5
req = urllib2.Request('%s%s%d' % (url,id, i))
print req
try:
response = urllib2.urlopen('%s%s%d' % (url, id, i))
except urllib2.HTTPError, e:
break
content = response.read()
fo = str(i) + '.json'
OUTFILE = os.path.join(directory, fo)
with open(OUTFILE, 'w') as f:
f.write(content)
这不断创建空目录。我知道URL参数有问题。如何纠正这一点?
我认为你的问题是在你的'Request'调用中。在我头顶,字符串格式看起来不对。把你要求的网址放入一个变量中并打印出来,看看它的样子。 – willy
这就是它正在打印的内容:http://api.opencorporates.com/v0.2/companies/search?q=&jurisdiction_code=%s&per_page=26¤t_status=Active&page=%dae_az5 在最后附加参数。 – blackmamba
然后,我会添加一个答案,我确切地看到问题是什么。 – willy