2010-12-14 163 views

回答

3
import urllib 
print urllib.urlopen('http://www.example.com/blah').read() 
+0

有些网站使用压缩,当他们这样做时会失败。我花了很长时间才弄清楚,但是解决方法真的很难看。我会发布,如果我找到它。 +1 – Blender 2010-12-14 04:36:57

+0

那些违反http规范的网站。除非发送适当的接受编码,否则不应返回压缩数据。 – 2010-12-14 04:41:02

0

获取它(使用mechanizeurllib或其他任何你想要的),解析你(使用elementtreeBeautifulSouplxml或其他任何你想要的)东西,你有你想要的。