2017-08-27 22 views
0

我想读从这个HTML链接日期: http://jadvalbaz.blog.ir/post/%D8%B1%D8%A7%D9%87%D9%86%D9%85%D8%A7%DB%8C-%D8%AD%D9%84-%D8%AC%D8%AF%D9%88%D9%84-%D8%AD%D8%B1%D9%81-%D8%B0Android的 - 如何用jsoup解析HTML并填充到ArrayList中?

,如果你看一下查看源代码

体育主办(Pnvmvny-肺炎)的颗粒(小蚂蚁)地毯(ELL)粒子Hybrvnha不收取基本类别(拉姆达)原子负粒子(电子)的种子(代)ZL(素食)怪(非)运输(损失)的兴趣(所有者)

我的字由< .BR分离>,我想读每个词的ArrayList,我用组件H流省略< .BR>和读的话。

这里是我的代码:

Document document = Jsoup.connect(url).get();  
     for (Element span : document.select("?").select("?")) { 
       title = span.toString();     
       name.add(title); 
      } 

如何解读他们,放什么,而不是问号。 什么建议吗?

+0

你并不需要2'选择()',仅有1选择就行了。 能否请您置HTML的一个小样本,并要提取什么。 –

回答

0

编辑模板的CSS和定义一个类你的话,然后使用Element.select(String selector)Elements.select(String selector)方法。

Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/"); 

    Element masthead = doc.select("p.words").first(); // p with class=words 

按照以下链接了解此方法提取数据的详细信息:

Use selector-syntax to find elements

+0

如果你注意我只想将它们读入arraylist.my问题是,我无法用这个标签
user7908469

+0

我无法理解你的代码,你会请解释更多阅读吗?在blog.ir – user7908469

+0

您可以添加自定义的CSS ...定义一个类,如果你不知道如何使用这个方法来检查我的回答的后续文件的链接使用此方法... –