2012-10-22 29 views
5

请帮我写在记事本记事本++的正则表达式替换混合字符

我有混合了俄语和德语句子和单词的文本这类文本的正则表达式,我需要前插入俄语标记<“俄罗斯”>和在德语标记句子之前<“GERMAN”>。就像这样:

输入:

Текст на русском, раз два три, german text - русский текст: german text - some other german text русский текст = еще русский текст. Длинный текст на русском. A long text on german 

OUTPUT:

<"RUSSIAN">Текст на русском, раз два три, <"GERMAN">german text - <"RUSSIAN">русский текст: <"GERMAN">german text - some other german text <"RUSSIAN">русский текст = еще русский текст. Длинный текст на русском. <"GERMAN">A long text on german 

我想这可能在某种程度上通过搜索

cyrillics字符,如“А,а来完成, б,б,в,в,Г,г,д,д,е,е,ё,ё,Ж,ж,з,з,и,и,Й,й,к,к,л,л,М, м,Н,н,О,о,П,п,р,р,С ,с,Т,т,У,у,Ф,ф,Х,х,Ц,ц,Ч,ч,Ш,ш,Щ,щ,Ъ,ъ,Ы,ы,Ь,ь,Э,э “A,a,B,b,C,c,D,d,E,e,F,f,G,g,H,h, I,I,J,J,K,K,L,L,M,M,N,N,O,O,P,P,q,q,R,R,S,S,T,T,U, U,v,v,W,W,X,X,Y,Y,Z,Z,A,A,O,O,U,U,?”

+0

双引号看起来很可疑'<名称= Alyona22k““需要=声音”>' –

+0

我已经改变了需要的标签,以简化我的问题... –

+0

它仍然看起来怪异,但确定,接受(这并不重要得到答案) –

回答

3

标点符号&数字使这个有点不安,但你可以匹配任何西里尔字符&直到拉丁字符;

查找:([А-я].+?)([a-z])
替换:<ru>\1</ru>\2

那么其他的语言为</ru><ru>之间。

+0

谢谢亚历克斯!它有帮助! –