2014-10-28 58 views
2

我想在python但每次它会被重定向到index2.php(从网络服务器的位置标头)获取的样本页面获取和使用机械化

从而节省重定向之前HTTP响应例如代码打印从index2.php而不是index.php的反应是否有避免?

+0

你只想抓取一个网页的源代码? – DuckPuncher 2014-10-28 23:41:54

+0

是的,只是为了抢源。所以我可以解析它。 – 2014-10-29 00:05:36

回答

1

您可以使用urllib2requests更复杂的东西。

import urllib2 

response = urllib2.urlopen("http://google.com") 
page_source = response.read() 

urllib2是一个内置的模块和requests是第三方。

+0

这是不正确的,因为urllib2.urlopen将遵循重定向。虽然我不想要这样的事情发生。 – 2014-10-29 00:15:19

+1

@SamaAzari,那么你的例子中的网址不会重定向,我不想出去寻找一个网页。我只是不知道我的头顶上有什么。 – DuckPuncher 2014-10-29 00:26:28