我想从下面一个HTML字符串去掉所有锚标签之间的链接和文本:正则表达式剥离锚标记之间的一切
string LINK_TAG_PATTERN = "/<a\b[^>]*>(.*?)<\\/a>";
htmltext = Regex.Replace(htmltext, LINK_TAG_PATTERN, string.Empty);
这不是工作人有想法,为什么?
非常感谢,
编辑:正则表达式是从该链接Extract text and links from HTML using Regular Expressions
如果您尝试使用RegEx处理HTML/XML,请注意它不起作用,因为我相信HTML/XML是上下文无关语言,但不是正则语言。 – 2010-01-19 13:20:08