2013-04-01 34 views
1

我有问题,使用Jsoup从网页提取一些数据。Jsoup - 提取标签:命名空间

下面是代码:

<fb:comments-count href="" fb-xfbml-state="rendered" class=" fb_comments_count_zero"> 
<span class="fb_comments_count">0</span></fb:comments-count> 

而且,我试图提取0fb_comments_count class这一点。

+0

你打算怎么做?显示你的代码! – Cristian

+0

当我尝试提取fb | comments-count即使我解析整个网页,我也没有收到内部类。我永远无法看到内部类 – copied

回答

1

你真的需要fb:comments-count标签吗?您可以使用`doc.select(“span.fb_comments_count”)直接选择span.fb_comments_count

但是,如果你需要的外标签:

Document doc = ... 

Element commentsCount = doc.select("fb|comments-count > span.fb_comments_count").first(); 

System.out.println(commentsCount.text()); 

此打印第一匹配变量的值。如果你需要全部然后用循环代替。

+0

我已经尝试过,问题是当我第一次获得文档,并将其打印到控制台时,我无法看到span.fb_comments_count和其他一切正常,由于某些原因jsoup wont解析这个。 – copied

+0

如果仅解析问题中的html,该怎么办?同样的问题?顺便说一句。你使用什么版本? – ollo

+0

我不知道你可以使用ns |标签通过标签在命名空间中查找元素,很高兴知道http://jsoup.org/cookbook/extracting-data/selector-syntax –