2012-08-09 189 views
0

我有一个html文件,如下图所示:Jsoup,如何获得属性

<a href="http://...123"><img src="http://...jpg?" border="0"/></a> 

    <a href="http://...456"> 
       . 
       . 
       . 

我想HREF链接和IMG SRC到HashMap的属性,

但一些(不是全部) <a href="">标签不符合<img src="">标签,

所以我应该如何获得属性href链接和img src的哈希映射到哈希映射?

如果href链接没有img src,则放弃该行。

回答

0

你想要标签后面没有标签吗?或其他? 如果它的另一种方式,你可以试试这个 把xpath的东西像String path =“// a [@href]/img”,另一个像“// a [@href]”。 存储href标记值并为子节点存储下一个分析结果,如果它包含img标记,则将其解析并存储为键值对。

+0

是的,我想存储链接和图像到一个HashMap, 所以如果标签没有图像资源,就放弃它。 这个概念就像'for(int i = 0; i user1531240 2012-08-09 03:55:13

+0

以及我没有做在Jsoup的HTML解析,但使用HTML清洁,并通过检查标签是否有内部标签说,例如,如果它有,我们只是向用户显示值。 – 2012-08-09 08:33:10