-1
A
回答
0
如果您想要从XHTML结构中提取特殊数据,请尝试jsoup。它提供了类似jquery的方法来提取和操作XHTML。你可以迭代所有html dom元素并获取文本属性。
或者,如果您想删除html标签并仅保留文本,请尝试使用正则表达式。看看这stackoverflow thread。
相关问题
- 1. 将HTML文本转换为纯文本
- 2. 将HTML转换为纯文本剃刀
- 3. 将NSAttributedString转换为纯文本
- 4. Ruby:将HTML/Redcloth转换为纯文本
- 5. 加速将RTF转换为纯文本
- 6. 如何将纯文本转换为ODF?
- 7. 将纺织品转换为纯文本
- 8. 将网页转换为纯文本..?
- 9. 将纯文本输入转换为HTML
- 10. 如何将RTF转换为纯文本?
- 11. 将html转换为纯文本jquery .ajax
- 12. 如何将纯文本转换为xsl
- 13. 将RTF转换为纯文本格式
- 14. 将表单转换为纯文本
- 15. 转换Zalgo文本为纯文本
- 16. 将xml + xsd转换为xhtml
- 17. 将PSD转换为XHTML
- 18. 将XHTML转换为XAML FlowDocument
- 19. itext将xhtml转换为pdf
- 20. 将XHTML文章转换为Docbook
- 21. 如何将解析的文本转换为纯文本
- 22. 如何将HTML文本转换为纯文本?
- 23. 如何将Sql字符串文本转换为纯文本
- 24. 如何将MySQL中的RTF文本转换为纯文本?
- 25. 如何将html文本转换为报表中的纯文本
- 26. 如何将降价(WMD)文本转换为纯文本
- 27. 如何将纯文本转换为android中的html文本?
- 28. 将纯文本转换为XML(例如CSV转换为XML)的脚本
- 29. 将jquery脚本转换为纯javascript
- 30. 通过C#将纯文本格式转换为纯文本格式?
你必须写一些代码。 – woz
XHTML到纯文本到底是什么意思? XHTML已经是一个纯文本文件。尝试在编辑器(记事本)中打开。 您的意思是删除所有标签吗?请提供更多信息 – Makky
假设我有下面的XHTML,从那我需要提取“标题”和“身体”作为明文有没有办法做到这一点使用Java/Unix脚本。 <!DOCTYPE html PUBLIC“ - // W3C // DTD XHTML 1.0 Transitional // EN” “http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”>
这是测试页。
– Aravind