我需要一个正则表达式的所有字母。我有一个输入和目标文本。他们都可以属于不同的字母。我的意思是他们可以属于中文,拉丁文,西里尔文和任何其他字母。正则表达式为所有字母
我需要一个多语言输入和多语言目标文本的正则表达式。
有没有人有这方面的想法?我怎样才能写这个正则表达式?
我将在javascript中使用它。但我认为,应该为Java和JavaScript的普通正则表达式也为这个问题。
我需要一个正则表达式的所有字母。我有一个输入和目标文本。他们都可以属于不同的字母。我的意思是他们可以属于中文,拉丁文,西里尔文和任何其他字母。正则表达式为所有字母
我需要一个多语言输入和多语言目标文本的正则表达式。
有没有人有这方面的想法?我怎样才能写这个正则表达式?
我将在javascript中使用它。但我认为,应该为Java和JavaScript的普通正则表达式也为这个问题。
我用“|”这个角色作为分隔符,所以它对我来说是特别的。键可以是除“|”以外的任何字符。它解决我的问题,谢谢你的答案。它可以与JavaScript,Java和Groovy一起使用。我测试了它,工作。
var keyPrefix ="\\|[\u0000-\u007B\u007D-\uFFEF]*";
var keySuffix = "[\u0000-\u007B\u007D-\uFFEF]*\\|";
var searchkey = keyPrefix + key.toLowerCase() + keySuffix;
一些正则表达式引擎支持特殊字符所有Unicode字母:
\p{L}
或者你可以使用\w
- 字母,数字,下划线
我不能使用“\ p {L}”来表示javascript。例如,“\ w”是不够的,输入是“ığç”,目标文本是“ığçss”。所以这对我来说不是解决方案。 – erimerturk
如果你是在Java中(不是在JavaScript!),你可以使用unicode属性,例如
\P{L}
来自任何语言的任何类型的信件。
有关更多信息,请参见regular-expressions.info/unicode。
为JavaScript:
有来自XRegExp一个lib和扩展javasript正则表达式的功能一些插件XRegExp Unicode plugins。这增加了对Unicode类别,脚本和块的支持。
使用这些库,您将可以使用带有JavaScript的\p{L}
。
见我的回答this question一个小例子
我不能使用此JavaScript的。我需要JavaScript。所以这对我来说不是解决方案。 – erimerturk
@erimerturk我更新了我的答案。 – stema
Java!= JavaScript –
真的!我知道他们不一样。正则表达式很常见,所以我可以使用相同的正则表达式来处理JAVA,JAVASCRIPT或GROOVY! – erimerturk
@erimerturk不,你不能。在[regular-expressions.info](http://www.regular-expressions.info/refflavors.html)上查看她的风味比较。 javascript是“ECMA”列 – stema