2012-06-13 46 views
1

我想通过html文件搜索,然后将url获取到该页面上的图片。这个URL然后应该被保存为一个字符串 - 多数民众赞成在所有。问题是我真的不知道如何开始。解析HTML文件中的图片url

我的应用程序当然知道图像所在页面的网址。 作为一个例子让我们这个网址:


在这个页面上我所需要的大图像作为字符串的URL。当我查看源代码,我可以找到的网址,但我不知道如何代码 - 这是我需要的网址:


(只引号内的文字)。

回答

4

使用JSoup。这是一个HTML解析器,可以让你使用css选择器(如jQuery)访问DOM元素。

// Parse your HTML: 
// 1. From string: 
Document doc = JSoup.parse(htmlAsString); 

// 2. Or from an URL: 
Document doc = JSoup.connect("http://my.awesome.site.com/").get(); 

// Then select images inside it: 
Elements images = doc.select("img"); 

// Then iterate 
for (Element el : images) { 
    String imageUrl = el.attr("src"); 

    // TODO: Do something with the URL 
} 
0

好吧,这做的工作:)我现在得到的图像网址:

public class jSoupEx { 

    private static final String elements = null; 

    public static void main(String args[]){ 


     try { 
      Document doc = Jsoup.connect("http://***/index.php/Datei:***.jpg").get(); 
      Element image = doc.select("img").first(); 
      String url = image.absUrl("src"); 
      System.out.println(url); 

     } catch (IOException e) { 
      // TODO Auto-generated catch block 
      e.printStackTrace(); 
     } 
} 

}