2013-12-21 14 views
0

我们试图通过Google返回的搜索结果页面的html来检索图像的最佳猜测。 我们知道图像的最佳猜测具有类qb-b,所以我们尝试使用.select方法选择带'a'标签的元素。然而,当我们打印使用jsoup的get方法检索到的文档时,文档不包含任何“最佳猜测”字符串。如何检索来自html的图像的最佳猜测google google jsoup

我们写的代码如下。我们如何解决它?

String newUrl = connect1.getHeaderField("Location"); 

Document doc = Jsoup.connect(newUrl.toString()).get();    
Elements bestguess = doc.select("a.qb-b"); 

System.out.println(bestguess.toString()); 

回答

0

您必须设置User-Agent标头。 Google会将您重定向到主页面。试试:

String newUrl = connect1.getHeaderField("Location"); 

Document doc = Jsoup.connect(newUrl.toString()). 
          userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.76 Safari/537.36"). 
          get();    
Elements bestguess = doc.select("a.qb-b"); 

System.out.println(bestguess.toString());