我有一个HTML字符串像消除HTML标签
Lorem ipsum <a href='google.com'>google <span>rulz</span></a> not sum
我想删除所有的HTML标签,我的意思是我想删除所有的HTML元素,所以字符串应该转化为(在JavaScript)
Lorem ipsum not sum
我想它的匹配(和替换)它尤斯:
<([a-z][a-z0-9]*)\b[^>]*>.+?<\/([a-z][a-z0-9]*)\b[^>]*>
的问题是,我得到
Lorem ipsum </a> not sum
因为正则表达式替换为“google rulz”,但我希望它替换孔html标记,所以我发现它发生了。
有什么想法?
你不使用的HTML解析器的原因吗? – robert 2011-02-02 12:29:34
而不是删除一个正则表达式中的打开和关闭标签,你试过替换*任何*标签:`<.*?>`?这样,打开和关闭标签将被单独移除,并且不需要担心匹配它们。 – JaredC 2011-02-02 12:32:36