2009-07-04 30 views
6

我需要也符合中国,希腊,俄罗斯,...字母正则表达式。 我基本上想要做的是删除标点符号和数字。正则表达式的所有字母(包括中国,希腊等)

直到现在我删除标点符号和数字“手动”,但似乎并没有非常一致。

我曾尝试另一件事是

/[\p{L}]/ 

但那不是由Mozilla(我在Firefox扩展使用)的支持。

+0

你只是需要根据特定用户的语言相匹配的字母(这只是意味着你需要一个语言环境意识到正则表达式引擎),或者你需要匹配任何在任何可能的语言信? – balpha 2009-07-04 20:52:42

+2

你需要删除哪些标点符号?你需要删除O'Brien中的撇号吗? – 2009-07-04 20:56:06

回答

4

你给XRegExpUnicode plugin一试/看?

<script src="xregexp.js"></script> 
<script src="xregexp-unicode.js"></script> 
<script> 
    var unicodeWord = XRegExp("^\\p{L}+$"); 
    alert(unicodeWord.test("Ниндзя")); // -> true 
</script> 
1

你可以找到很多抱怨上没有处理Unicode字符应该的样子正则表达式当前ECMA规范。例如。一个blog entry by Scott Hanselman链接回SO问题;-)
有没有“真正”解决这个问题的呢,但看一看的Javascript + Unicode regexes的回答(你的问题或多或少的这种重复)(编辑:我拿回来,unicode插件乔纳森洛诺斯基建议看起来很不错)

相关问题