可能重复:
Using C# regular expressions to remove HTML tags正则表达式 - 删除标记
我不得不删除标记,并保持在一个XML文件中的所有其他信息。使用正则表达式时,我有点不知所措。我只能想出一行一行的读取文件,然后尝试“定位”所有标签,并用“” - 空字符串替换它们。但是,它不按预期工作:
line = Regex.Replace(line, "<.*>", "");
我能请得到一个解释这是为什么不按预期工作(我认为这应该只是找到其内部<>另外,可以符号的所有可能的组合。你应该推荐一个很好的正则表达式的介绍,我在regular-expressions.info上看了很多,但是我发现它在某种程度上是不完整和令人困惑的。
为什么不使用xml解析器? – I4V
你究竟想要留下什么?除了'<' and '>'以外的所有东西?留下属性?留下CDATA和XText? – user7116
从XML文件中删除'<>'?有些事情告诉我你并没有采用最佳方法。 –