我需要从XML文档中去除所有xml标签,但保留标签占用的空间,以便文本内容保持与在xml中。这需要用Java来完成,我认为RegExp会成为一种方式,但我没有找到简单的方法来获得与我的正则表达式匹配的标签长度。使用RegExp用空白替换XML标签(在标签的长度中)
基本上我想是这样的:
Pattern p = Pattern.compile("<[^>]+>[^<]*]+>");
Matcher m = p.matcher(stringWithXMLContent);
String strippedContent = m.replaceAll("THIS IS A STRING OF WHITESPACES IN THE LENGTH OF THE MATCHED TAG");
希望有人可以帮我用简单的方式做到这一点!
为什么,哦,为什么每个人都认为正则表达式是与角色有关的所有事情的解决方案? :( – Bombe 2009-08-26 13:41:38
因为大部分时间都是这样,对吧?;) – jhoff 2009-08-26 13:52:32