我需要也符合中国,希腊,俄罗斯,...字母正则表达式。 我基本上想要做的是删除标点符号和数字。正则表达式的所有字母(包括中国,希腊等)
直到现在我删除标点符号和数字“手动”,但似乎并没有非常一致。
我曾尝试另一件事是
/[\p{L}]/
但那不是由Mozilla(我在Firefox扩展使用)的支持。
我需要也符合中国,希腊,俄罗斯,...字母正则表达式。 我基本上想要做的是删除标点符号和数字。正则表达式的所有字母(包括中国,希腊等)
直到现在我删除标点符号和数字“手动”,但似乎并没有非常一致。
我曾尝试另一件事是
/[\p{L}]/
但那不是由Mozilla(我在Firefox扩展使用)的支持。
你给XRegExp和Unicode plugin一试/看?
<script src="xregexp.js"></script>
<script src="xregexp-unicode.js"></script>
<script>
var unicodeWord = XRegExp("^\\p{L}+$");
alert(unicodeWord.test("Ниндзя")); // -> true
</script>
你可以找到很多抱怨上没有处理Unicode字符应该的样子正则表达式当前ECMA规范。例如。一个blog entry by Scott Hanselman链接回SO问题;-)
有没有“真正”解决这个问题的呢,但看一看的Javascript + Unicode regexes的回答(你的问题或多或少的这种重复)(编辑:我拿回来,unicode插件乔纳森洛诺斯基建议看起来很不错)
你只是需要根据特定用户的语言相匹配的字母(这只是意味着你需要一个语言环境意识到正则表达式引擎),或者你需要匹配任何在任何可能的语言信? – balpha 2009-07-04 20:52:42
你需要删除哪些标点符号?你需要删除O'Brien中的撇号吗? – 2009-07-04 20:56:06