试图打开一个URL时,我得到一个406错误与机械化:406错误与机械化
for url in urls:
if "http://" not in url:
url = "http://" + url
print url
try:
page = mech.open("%s" % url)
except urllib2.HTTPError, e:
print "there was an error opening the URL, logging it"
print e.code
logfile = open ("log/urlopenlog.txt", "a")
logfile.write(url + "," + "couldn't open this page" + "\n")
continue
else:
print "opening this URL..."
page = mech.open(url)
任何想法会导致出现406错误?如果我转到有问题的网址,我可以在浏览器中打开它。
没有必要使用插值:'page = mech.open(url)'会做得很好(虽然不是解决你的问题)。 –
406错误是非常特定于Web服务器。它意味着*无论如何服务器都不喜欢你的Accept头。 –
[406意味着服务器不喜欢你的头文件](http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html)你可以发布机械化发送的头文件吗? –