如何使用php在字符串中检测到希伯来语字符iso8859-8和utf8

我希望能够检测到（使用正则表达式）字符串是否包含PHP编程语言中的希伯来文字符utf8和iso8859-8。谢谢！如何使用php在字符串中检测到希伯来语字符iso8859-8和utf8

2009-11-07 ufk

这里是map of the iso8859-8 character set。范围E0 - FA似乎是保留给希伯来文的。您可以为您在字符类这些字符：

[\xE0-\xFA]

为UTF-8，range reserved for Hebrew似乎是0591至05F4。所以，你可以检测与：

[\u0591-\u05F4]

这里有一个正则表达式匹配的PHP的例子：

echo preg_match("/[\u0591-\u05F4]/", $string);

来源

2009-11-07 21:04:25 Andomar

问题是E0-FA也会以UTF-8的形式出现，但不会像nebrew字符那样运行...... – gnud

@gnud：这就是为什么你不应该使用UTF-8字符串上的iso8859-8正则表达式 – Andomar

首先，这样的字符串将完全无用 - 两种不同字符集的混合？

iso8859-8中的希伯来语字符和UTF-8中的多字节序列的每个字节的值均为ord($char) > 127。所以我会做的是找到所有字节值大于127，然后检查它们是否有意义，如is8859-8，或者如果你认为他们会更有意义的UTF8序列...

来源

2009-11-07 20:59:14 gnud

一个角色怎么能有ORD（$字符）> 255 ISO-8859-8？这是一个字节！ –

很好。我不知道为什么，但我完全搞砸了 - 非ascii介于128和255之间 - 现在已经修复。 – gnud

我想那是你同时的意思。你真幸运，我在等你投降之前等着你;-) –

这里的一个小功能来检查字符串的第一个字符是否是希伯来文：

function IsStringStartsWithHebrew($string) 
{ 
    return (strlen($string) > 1 && //minimum of chars for hebrew encoding 
     ord($string[0]) == 215 && //first byte is 110-10111 
     ord($string[1]) >= 144 && ord($string[1]) <= 170 //hebrew range in the second byte. 
     ); 
}

好运:)

来源

2010-04-12 20:42:29 Roey

好，如果你的PHP文件进行编码，UTF-8应该是个例你在里面有希伯来语，你应该使用以下至REGx：

$string="אבהג"; 
echo preg_match("/\p{Hebrew}/u", $string); 
// output: 1

来源

2012-05-17 14:50:36 talsibony

function is_hebrew($string) 
{ 
    return preg_match("/\p{Hebrew}/u", $string); 
}

来源

2012-05-21 20:54:18

如何使用php在字符串中检测到希伯来语字符iso8859-8和utf8

回答

相关问题