2013-02-13 38 views
4

我想知道是否可以为印度字符编写正则表达式?我想验证给定的字符是否是印度字母或数字。我发现这两个问题:印度字符的正则表达式

What are the unicode ranges for Hindi accented characters?

what is the range for Hindu–Arabic (ARABIC-INDIC) numeral utf8 from 0 to 9

所以我尝试这样的:\ X {0600} - \ X {叙利亚文}

但是如果我搜索这个文本(在OpenOffice的) :http://pastebin.com/mDHL69XH与此:\ X {} 0600 - \ X {}叙利亚文没有 发现...

+1

不同的正则表达式引擎是不同的。你说你想“验证给定的字符是否是印度字母或数字”,这表明你正在使用某种编程语言,但是你说你“搜索这个文本(在OpenOffice中)”,这表明你正在试图使用*不同的正则表达式引擎来测试你的正则表达式。这是一个坏主意。 – ruakh 2013-02-13 18:03:46

+0

你应该指定你正在使用的语言 – Anirudha 2013-02-13 18:08:00

+0

我从来没有真正深入正则表达式......所以不同的引擎对我来说是新的:)嗯,我其实是试图在JavaScript中做到这一点... – user568021 2013-02-14 10:40:41

回答

8

嗯,这应该做

[\u0900-\u097F]+// \uFFFF format supported by Java,.net 

[\u{0900}-\u{097F}]+// \u{FFFF} format supported by perl,pcre 

\p{Devanagari}//not widely supported 
+0

真棒...第一个完美的作品... – user568021 2013-02-14 11:14:15

相关问题