我想通过html文件搜索,然后将url获取到该页面上的图片。这个URL然后应该被保存为一个字符串 - 多数民众赞成在所有。问题是我真的不知道如何开始。解析HTML文件中的图片url
我的应用程序当然知道图像所在页面的网址。 作为一个例子让我们这个网址:
在这个页面上我所需要的大图像作为字符串的URL。当我查看源代码,我可以找到的网址,但我不知道如何代码 - 这是我需要的网址:
(只引号内的文字)。
我想通过html文件搜索,然后将url获取到该页面上的图片。这个URL然后应该被保存为一个字符串 - 多数民众赞成在所有。问题是我真的不知道如何开始。解析HTML文件中的图片url
我的应用程序当然知道图像所在页面的网址。 作为一个例子让我们这个网址:
在这个页面上我所需要的大图像作为字符串的URL。当我查看源代码,我可以找到的网址,但我不知道如何代码 - 这是我需要的网址:
(只引号内的文字)。
使用JSoup。这是一个HTML解析器,可以让你使用css选择器(如jQuery)访问DOM元素。
// Parse your HTML:
// 1. From string:
Document doc = JSoup.parse(htmlAsString);
// 2. Or from an URL:
Document doc = JSoup.connect("http://my.awesome.site.com/").get();
// Then select images inside it:
Elements images = doc.select("img");
// Then iterate
for (Element el : images) {
String imageUrl = el.attr("src");
// TODO: Do something with the URL
}
看看jsoup HTML解析器。 SO上有相关的答案,解释了jsoup的基本用法 - https://stackoverflow.com/a/5318771/1321873
好吧,这做的工作:)我现在得到的图像网址:
public class jSoupEx {
private static final String elements = null;
public static void main(String args[]){
try {
Document doc = Jsoup.connect("http://***/index.php/Datei:***.jpg").get();
Element image = doc.select("img").first();
String url = image.absUrl("src");
System.out.println(url);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}