2016-04-09 207 views
0

我使用URL lib2,我需要帮助。 当我从网站上获得我需要的信息时,它可以正常工作,但如果网站上的信息发生变化,结果仍然相同,我认为我必须找到一种清理“缓存”或“ lib.close“...我不知道...有人可以帮我解决这个问题吗?谢谢需要解决方案urllib2

下面是代码:

import urllib2    

url = 'http://website.com' 

response = urllib2.urlopen(url) 
webContent = response.read() 

string = webContent.find('***') 
alert = webContent[string+11:] 

webContent = alert 
string = webContent.find('***') 
alert = webContent[:string] 
alert = alert.replace('</strong>',' ') 

print alert 

回答

0

的urllib2没有做缓存。涉及HTTP代理或缓存发生在服务器端。

检查响应标题。 X-CacheX-Cache-Lookup将意味着您通过代理连接。

+0

谢谢你的回答, 我看着X-Cache和X-Cache-lookup,我可以为我找到解决方案... 如果我更改网站上的信息并在我的电脑浏览器上刷新它,它立即更新... 您可以与我分享的更多信息? –

+0

你可以在你的问题中添加更多关于你的项目的信息/代码吗?这是你的网站主持人,对吧?你使用什么技术堆栈?这[用户](http://stackoverflow.com/a/10008270/6079540)必须欺骗他的useragent ...顺便说一句,你可以通过使用rgx来简化你的代码:'import re; alert = re.findall(r'\ * {3}(。+)\ * {3}',webContent)[0]' – dron22