2013-02-24 42 views
0

如何从此示例HTML代码中提取全名? 我只想得到以下内容。如何使用Jsoup提取特定的内容?

全名1

全名2

全部NAME3

<div class="readerP"> 
              <p><a href="link1_english.html" title="Complete" >Full name1</a><br>[ other info ]</br> </p> 
              </di           
<div class="readerP"> 
              <p><a href="link2_english.html" title="Complete" >Full name2</a><br>[ other info ]</br> </p> 
              </div> 
<div class="readerP"> 
              <p><a href="link1_english.html" title="Complete" >Full name3</a><br>[ other info ]</br> </p> 
              </div> 

我使用这个代码,但它看起来页面中所有的 'a' 标签,所以我会得到额外的信息。

首页

关于

联系

全名1

全名2

全部NAME3

等等...

try { 
     doc = Jsoup.connect("http://www.somesite.com").get(); 
     Elements links = doc.getElementsByTag("a"); 
     for (Element el : links) { 
      linkText = el.ownText(); 

      arr_linkText.add(linkText); 
     } 
    } catch (IOException e) { 
     // TODO Auto-generated catch block 
     e.printStackTrace(); 
    } 

我如何看 'DIV' 的标签,如果类= “readerP”看看“'div'内的''标签?

回答

0

我怎样才能看'div'标签,如果class =“readerP”看'div'里的'a' 标签?

使用合适的选择器,而不仅仅是通过标签进行搜索。

Elements links = doc.select("div .readerP a"); 

阅读有关Jsoup documentation中选择器的更多信息。

+0

它没有工作。我更新了我的帖子,请看看它。 – Ammar 2013-02-24 02:35:58

+0

请仔细检查我的帖子,因为之前有过更新。你必须使用'select'方法,而不是'getElementsByTag'。 – 2013-02-24 02:37:11

+0

你是老板胡安。现在它运行起来,它的速度非常快。 – Ammar 2013-02-24 02:39:14