2014-01-31 38 views
1

我想从网站中提取一些文本并存储在字符串中。jSoup提取文本的DIV标记字符串

<div class="textclass" id="textid" itemprop="itemtext">I want to get this Text</div> 

什么会进入问号?

protected Void doInBackground(Void... params) { 
      try { 
       Document document = Jsoup.connect(url).get(); 

       Elements text = document.select("???"); 

       desc = text.attr("???"); 
      } catch (IOException e) { 
       e.printStackTrace(); 
      } 
      return null; 
     } 

回答

3

在我结束后尝试使用下面的

Elements text = document.select("div"); 
String desc = text.text(); 
Log.i(".........",+desc); 

日志

01-31 04:45:15.272: I/.........(1233): I want to get this Text 

编辑:

您可以使用

Elements text = document.select("div[class=textclass"); 

或使用ID

Elements text = document.select("div[id=textid]"); 

Elements text = document.select("div[itemprop=itemtext]"); 
+0

哦对不起,我应该说,在网站上是一些div标签。你的代码不会找到我认为的正确的一个..你有一个想法如何识别正确的div? – thankyou

+0

@thankyou那么你应该编辑你的问题,并发布html和sepcify你需要什么,没有它,没有人可以回答正确 – Raghunandan

+0

@thankyou http://stackoverflow.com/questions/9218246/getting-text-from-div-tags – Raghunandan

0

你可以试试这个:

Document doc1 = Jsoup.connect(url).get(); 
    Element contentDiv = doc1.select("div[id=textid]").first(); 
    String text=contentDiv.getElementsByTag("div").text(); 

    System.out.println(text); // The result 

因此获得id为 “文本ID” 保存在变量“股利文文本”。

+0

这将是逻辑上,但应用程序crahes:/ – thankyou