需要解决方案urllib2

我使用URL lib2，我需要帮助。当我从网站上获得我需要的信息时，它可以正常工作，但如果网站上的信息发生变化，结果仍然相同，我认为我必须找到一种清理“缓存”或“ lib.close“...我不知道...有人可以帮我解决这个问题吗？谢谢需要解决方案urllib2

下面是代码：

import urllib2    

url = 'http://website.com' 

response = urllib2.urlopen(url) 
webContent = response.read() 

string = webContent.find('***') 
alert = webContent[string+11:] 

webContent = alert 
string = webContent.find('***') 
alert = webContent[:string] 
alert = alert.replace('</strong>',' ') 

print alert

来源

2016-04-09 Thiago Neves

的urllib2没有做缓存。涉及HTTP代理或缓存发生在服务器端。

检查响应标题。 X-Cache或X-Cache-Lookup将意味着您通过代理连接。

来源

2016-04-09 13:50:32 dron22

谢谢你的回答，我看着X-Cache和X-Cache-lookup，我可以为我找到解决方案... 如果我更改网站上的信息并在我的电脑浏览器上刷新它，它立即更新... 您可以与我分享的更多信息？ –

你可以在你的问题中添加更多关于你的项目的信息/代码吗？这是你的网站主持人，对吧？你使用什么技术堆栈？这[用户]（http://stackoverflow.com/a/10008270/6079540）必须欺骗他的useragent ...顺便说一句，你可以通过使用rgx来简化你的代码：'import re; alert = re.findall（r'\ * {3}（。+）\ * {3}'，webContent）[0]' – dron22

需要解决方案urllib2

回答

相关问题