我有a url。当我尝试以编程方式访问它,后端服务器失败(我不运行服务器):为什么请求库在这个URL上失败?
import requests
r = requests.get('http://www.courts.wa.gov/index.cfm?fa=controller.managefiles&filePath=Opinions&fileName=875146.pdf')
r.status_code # 200
print r.content
当我看到的内容,这是一个错误页面,虽然状态代码为200。如果你点击链接,它会在你的浏览器中工作 - 你会得到一个PDF - 这正是我期望的r.content。所以它在我的浏览器中工作,但在请求中失败。
为了诊断,我试图消除我的浏览器和请求库之间的差异。到目前为止,我:
- 禁用了JavaScript
- 残疾人(或删除)饼干
- 设置用户代理是在每个
相同的,但我不能得到的在请求中正常工作或由于禁用某些东西而导致浏览器失败。有人可以更好地了解浏览器魔法帮助我诊断并解决这个问题吗?
可能是因为内容长度未指定? – Konklone
不,我认为这是普遍可以接受的,虽然皱起了眉头。奇怪,但看到我的评论下面的更大的怪异。 – mlissner