2011-04-08 41 views
0

我想下载当我们在浏览器中右键点击查看页面源时获得的相同信息。我想要做到这一点无论是在vb.net或perl如何在vb.net或perl下载网页的页面源信息

我需要它为谷歌图片搜索结果网页。 当页面被保存时,html代码与视图页源信息不一样。 图像标签不存在。

在vb.net我想

 Dim objHttp As Object, strURL As String, strText As String 

    objHttp = CreateObject("MSXML2.ServerXMLHTTP") 

    strURL = "http://www.google.co.uk/images?as_q=aboriginal&hl=en&output=search&tbs=isch:1,iur:fmc&btnG=Google+Search&as_epq=&as_oq=&as_eq=&as_sitesearch=&safe=images&as_st=y&biw=1600&bih=799" 

    objHttp.Open("GET", strURL, False) 
    objHttp.setRequestHeader("User-Agent", _ 
     "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)", "Accept", "image/png,image/*;q=0.8,*/*;q=0.5") 

    objHttp.Send("") 

    strText = objHttp.responseText 

    objHttp = Nothing 

    RichTextBox1.Text = strText 

虽然上述方法使我在谷歌指的是短短的一句话每个图像下面的链接,搜索结果图像不返回图像标签(由图像标签图像搜索)。

有没有什么办法让在vb.net整个查看页面源信息或Perl

回答

0

我会尝试:在浏览器中

关闭JavaScript。现在去访问Google图片搜索页面(链接到您的源代码中) - 网址会稍微改变。

我猜测,加载这个稍微改变了URL的VB会给你正常的HTML,而不是一堆混淆的JavaScript。