我想知道的是它可以检索HTML标签和纯文本HTML标记和纯文本?我读here,它不被推荐。那么有没有其他方法或简单的代码可以让你像上面想要的那样检索HTML和纯文本?我仍然是Android的初学者。感谢您的帮助。如</p> <p><code><p>This is text </p></code>或<code><div></code>或<code>This is text</code></p> <p>使用<code>XmlPullParser</code>检索URL
0
A
回答
0
JSOUP是一个伟大的解析器,是最常用的一个。
另一件可能对你有帮助的事情是HTML organizer
,在编写解析器时发生的一件常见事情是由于格式错误的HTML文件造成的错误。这种情况经常发生在你期望的事情上,所以HTML organizer
可以减少错误的数量。
我用了一个优秀的组织者是:Tidy
1
我认为你最好的选择(我也使用过)是JSOUP。
JSOUP提供了一个非常方便的API来提取和操作数据,使用DOM,CSS和类似jquery的方法。 JSOUP允许您从URL,文件或字符串等中抓取和解析HTML。
jSoup:https://jsoup.org/
您在这里有一个很好的教程(不是我) http://www.androidbegin.com/tutorial/android-basic-jsoup-tutorial/
相关问题
- 1. Heredoc <<<或<<?
- 2. git“<<<<<<< HEAD”
- 3. “<<<<<<< HEAD”模板
- 4. operator <<:std :: cout << i <<(i << 1);
- 5. << <<超载
- 6. github增加<<<<<<< HEAD
- 7. 使用>>,>,> |,||,| <,<,<<,<<
- 8. 如何使用jquery/Javascript合并段落到父链接?使用jQuery</p> <pre><code><a class="link"> This is some text This is some more text And some more </a> </code></pre> <p>:
- 9. html中的可访问性:重点和说话?</p> <pre><code><body> <p><strong>IMPORTANT:</strong> This is desc text.</p> ... </body> </code></pre> <p>我想重点,讲:
- 10. Asp.net:使用的<%#或<%
- 11. 的Rails搞乱我的代码以“<<<<<<< HEAD”
- 12. <jsp:include或<@include或Tiles
- 13. 'std :: operator <<'operator <<'不匹配'std :: operator <<
- 14. std :: cout << x;和std :: cout << x << std :: endl;?
- 15. PHP操作<<<
- 16. 怎么了SVN把“<<<<<<<.mine”遍布整个地方?
- 17. 什么意思的符号在java中“<<<”“<< =”“<<”
- 18. 什么是我的档案中的“<<<<<<< head”?
- 19. THREE.Camera.prototype.lookAt</ <() -</ <是什么意思?
- 20. <%$,<%@,<%=,<%#...这是怎么回事?
- 21. PHP:<<< VS ob_start
- 22. < - ,[[< - ,$ < - 和:=与环境
- 23. PHP表达<<< EOB
- 24. HTML标记:<<< HTML
- 25. print <<< HTML in php?
- 26. “<<”用Verilog
- 27. <script>或<noscript>?
- 28. 浮动元素<br /><br /><br /><br /><br /\><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br /><br />
- 29. 使用<< END
- 30. ASP.NET <%#与<%
谢谢你把我介绍给JSOUP。它效果很好。 –