2014-02-25 59 views
0

我有一个奇怪的局面附加字符凡在我使用正则表达式的表达,从我的文字剥离下来的HTML标签正则表达式剥离HTML标签添加

我有以下文字:

<div align="center">​test_gautam</div> 

这以下的正则表达式的应用

var regex = /(<[^>]*>)/ig; 
var CommentText = editor.getValue().replace(regex, ""); 

给我

"​test_gautam" 

这看起来很好,但仔细检查后发现,第一个引号和t之间有一个隐形字符。 由于这个我的另一个正则表达式失败。 有没有人有任何关于如何摆脱这个无形的角色的想法?

检查可见字符复制下面的文本,并在记事本中粘贴

"​test_gautam" 
+0

隐而不宣”来后你的编辑器有一个方法来获得没有标签的纯文本? – VisioN

+0

Notepad ++不显示“invisibile char”。还请标记您正在使用的程序语言。 –

回答

2

var regex = /(<[^>]*>)[^a-zA-Z0-9]*/ig;

应该抓住什么这是不是一个字母/数字和<