我试图下载这里的PDF文件http://elwatan.com/pdf/telecharger.php?dir=JOURNAL&file=20120524.pdf,但是,这个pdf文件需要在下载之前先登录。我能够登录,但服务器将我重定向到主页http://elwatan.com,当我尝试再次获取PDF的URL时,我无法下载,因为它似乎我没有登录!我认为我需要使用cookies,对吧?使用python下载受保护的文件urllib
如果是的话,你能解释我如何,因为我以前从未使用过它们。 ?
感谢的:)
也许这样? http://stackoverflow.com/questions/8734876/urllib2-with-cookies –
或者这个http://stackoverflow.com/questions/7162850/pass-session-cookies-in-http-header-with-python- urllib2 –