2013-05-12 49 views
3

我有一些JavaScript可以计算文本框中的字符总数。英语没问题,但是当我输入泰卢固语脚本时,它显示错误的计数。例如,如何计算印度文字泰卢固语字符

Anil = 4 
అనిల్ = 4 

但是అనిల్只是泰卢固语脚本的三个字母。我怎样才能准确地计算指示脚本字符?

+0

您能否提供您正在使用的JavaScript? – 2013-05-12 16:36:08

回答

3

我对泰卢固语一无所知,因此以下可能完全错误。让我知道。

"అనిల్".split("")打印["అ", "న", "ి", "ల", "్"]对我来说。字符#2和#4似乎是组合标记而不是字母。我们只想计算实际字母,所以让我们删除未在http://www.unicode.org/Public/UNIDATA/UnicodeData.txt称为泰卢固语信的一切,算上休息:

str = "అనిల్" 
len = str.replace(/[^\u0C05-\u0C39\u0C58-\u0C61]/g, '').length 

“3”的预期收益。

+0

是的。有几种方法可以查找文本中的字母数量。首先是按照您的建议去除组合标记。或者,可以用[అ-ఔక-హ] [diacriticmarks] *搜索该模式。 (我的手机不支持单独的变音标记,因此我不能将它们写在方括号内。) – SibiCoder 2016-04-16 08:41:31

相关问题