2012-09-17 58 views
0

我想解析使用Jsoup的链接。它工作正常,但是当我传递参数链接,看起来像“http://translate.google.com”(包含多个点)错误生成。Jsoup连接到链接

public class HtmlProcessor { 

    public String[] getLinks(String url) throws IOException { 

     Vector <String> hrefs = new Vector <String>(); 

     try { 

      Document doc = Jsoup.connect(url).get(); 
      Elements links = doc.getElementsByTag("a"); 


      for (Element link : links) { 

       hrefs.add( link.attr("href")); 
      } 
     } catch (ConnectException ex) { 
      System.out.println(ex.getMessage()); 
     } 

     return hrefs.toArray(new String [hrefs.size()]);  
    } 
} 
+0

'httt'是一个错字吗? –

+0

对不起,是的,它是 –

+0

请你能显示一些代码吗? – Hbcdev

回答

0

我试图进入http://translate.google.com,并出现了用户代理错误。尝试这个;它为我解决了这个问题:

Document doc = Jsoup 
     .connect(url) 
     .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:17.0) Gecko/17.0 Firefox/17.0") 
     .get(); 
+0

此解决方案有效,谢谢) –

+0

好听:)如果你喜欢它,请选择它作为最佳答案! – 2012-09-18 14:06:40