我有字符串<strong>Foo</strong>
。我想从这个字符串中删除HTML标签,即使它的内容。在这个例子中,表达式必须返回""
(空字符串)。我应该怎么做?如何在Java中删除HTML及其内容?
-1
A
回答
2
如果您试图删除的html没有任何嵌套的html标签;这是一个简单的基于正则表达式的解决方案。您可以将标签名称分配给tag
以方便使用,并且正则表达式会相应地进行调整。
String tag = "strong";
String str = "This is <strong>Foo</strong>Bar.";
String regex = "<\\s*" + tag + "[^>]*>[^<]*</\\s*" + tag + "\\s*>";
System.out.println(str.replaceAll(regex, "")); // This is Bar.
正则表达式可容纳任何额外的标签属性,如<strong class="bold">
等但如果可能会破坏并更新照顾有点不舒服,HTML格式的像不必要的空格或新线在这里和那里。
0
既然你声称你没有嵌套的标签,你可以尝试使用"<([^>]+)>.*?</\\1>
String data = "bar<strong>foo</strong>yyy<strong>zzz</strong>";
System.out.println(data.replaceAll("<([^>]+)>.*?</\\1>", ""));
ouptut
baryyy
+0
@downvoter谨慎地解释你的行为? – Pshemo
相关问题
- 1. 删除HTML实体及其内容
- 2. Java - 删除文件夹及其内容
- 3. 删除标签及其内容
- 4. Codeigniter删除目录及其内容
- 5. 删除一个文件夹及其内容AWS S3 java
- 6. 如何使用NSFileManager删除目录及其内容
- 7. 如何配置apache nutch删除所有标签及其内容?
- 8. 在Ruby中删除“@”符号及其后的所有内容
- 9. 使用BeautifulSoup和lxml在Python中删除标签及其内容
- 10. 在PowerShell中删除目录对象及其内容
- 11. jquery .html()删除html内容
- 12. 如何删除某些html内容?
- 13. 如何在gradle war中排除目录及其内容
- 14. 删除XML标签及其内容之间的任何东西
- 15. 从内容中删除[html] any_string [/ html]
- 16. 删除除了某个标记及其内容之外的所有内容Python
- 17. 删除单词类及其内部<img>标签内容
- 18. 删除DB2 8.x中的模式及其所有内容
- 19. 删除文本及其内容中的方括号
- 20. 如何链接容器及其内容?
- 21. 删除HTML标记+内容
- 22. 如何从HTML块中删除链接及其文本?
- 23. 如何删除视觉工作室中的#地区及其所有内容
- 24. 如何从当前目录中删除文件夹及其所有内容?
- 25. 下载html页面及其内容
- 26. 如何在php中显示xml内容后删除html标签?
- 27. 如何在归档页面中列出内容时删除html?
- 28. 排除项目及其内容元素
- 29. 如何删除特定的html标记及其div内的内容,使用div id由jquery?
- 30. TextView及其内容
你的意思是'null',或者你的意思是一个空字符串'“” '? – jlordo
可能会被复制http://stackoverflow.com/questions/1265282/recommended-method-for-escaping-html-in-java –
我的意思是空的。 – Tony