我拥有的将解析网站的部分代码不起作用。urllib2不会读取整个页面
我可以将问题追溯到我的urllib2.urlopen对象的.read
函数。
page = urllib2.urlopen('http://magiccards.info/us/en.html')
data = page.read()
直到昨天,这工作得很好;但现在数据的长度始终是69496而不是122989,但是当我打开较小的页面时,我的代码工作正常。
我已经在Ubuntu,Linux Mint和Windows 7上测试过了。所有的行为都一样。
我假设在网络服务器上发生了变化;但是当我使用网络浏览器时该页面已完成。我试图用wireshark诊断这个问题,但是收到的页面是完整的。
有人知道为什么会发生这种情况,或者我可以尝试确定问题吗?
如果你认为这与Web服务器做,你怎么可以做任何事情 –
这是我在py3k的urllib得到错误:?'HTTP。 client.IncompleteRead:IncompleteRead(69496 bytes read,53493 more expected)' – SilentGhost
因为Web浏览器仍然能够显示完整的页面,我的代码也需要能够处理整个页面 – kannerke