2011-10-13 140 views
1

我需要一个正则表达式的所有字母。我有一个输入和目标文本。他们都可以属于不同的字母。我的意思是他们可以属于中文,拉丁文,西里尔文和任何其他字母。正则表达式为所有字母

我需要一个多语言输入和多语言目标文本的正则表达式。

有没有人有这方面的想法?我怎样才能写这个正则表达式?

我将在javascript中使用它。但我认为,应该为Java和JavaScript的普通正则表达式也为这个问题。

+1

Java!= JavaScript –

+0

真的!我知道他们不一样。正则表达式很常见,所以我可以使用相同的正则表达式来处理JAVA,JAVASCRIPT或GROOVY! – erimerturk

+1

@erimerturk不,你不能。在[regular-expressions.info](http://www.regular-expressions.info/refflavors.html)上查看她的风味比较。 javascript是“ECMA”列 – stema

回答

0

我用“|”这个角色作为分隔符,所以它对我来说是特别的。键可以是除“|”以外的任何字符。它解决我的问题,谢谢你的答案。它可以与JavaScript,Java和Groovy一起使用。我测试了它,工作。

var keyPrefix ="\\|[\u0000-\u007B\u007D-\uFFEF]*"; 
var keySuffix = "[\u0000-\u007B\u007D-\uFFEF]*\\|"; 
var searchkey = keyPrefix + key.toLowerCase() + keySuffix; 
2

一些正则表达式引擎支持特殊字符所有Unicode字母:

\p{L} 

或者你可以使用\w - 字母,数字,下划线

+0

我不能使用“\ p {L}”来表示javascript。例如,“\ w”是不够的,输入是“ığç”,目标文本是“ığçss”。所以这对我来说不是解决方案。 – erimerturk

4

如果你是在Java中(不是在JavaScript!),你可以使用unicode属性,例如

\P{L}来自任何语言的任何类型的信件。

有关更多信息,请参见regular-expressions.info/unicode

为JavaScript:

有来自XRegExp一个lib和扩展javasript正则表达式的功能一些插件XRegExp Unicode plugins。这增加了对Unicode类别,脚本和块的支持。

使用这些库,您将可以使用带有JavaScript的\p{L}

见我的回答this question一个小例子

+0

我不能使用此JavaScript的。我需要JavaScript。所以这对我来说不是解决方案。 – erimerturk

+0

@erimerturk我更新了我的答案。 – stema