测试PHP正则表达式引擎,我发现它只考虑[0-9A-Za-z_]
是单词字符。非ASCII语言的字母(如希伯来语)与[\w]
不匹配为单词字符。是否有任何PHP或Perl正则表达式转义序列可以匹配任何语言的字母?我可以为我希望使用的每个字母添加范围,但用户总是会用意想不到的语言让我们惊讶!任何语言的字字符的正则表达式
请注意,这不是用于安全筛选,而是用于标记文本。
测试PHP正则表达式引擎,我发现它只考虑[0-9A-Za-z_]
是单词字符。非ASCII语言的字母(如希伯来语)与[\w]
不匹配为单词字符。是否有任何PHP或Perl正则表达式转义序列可以匹配任何语言的字母?我可以为我希望使用的每个字母添加范围,但用户总是会用意想不到的语言让我们惊讶!任何语言的字字符的正则表达式
请注意,这不是用于安全筛选,而是用于标记文本。
参考尝试\p{L}
。它匹配来自任何语言的任何类型的信件。如果你不想使用字符集[]
。
非常好,谢谢。我还必须添加'u'修饰符才能使其工作。 – dotancohen