我试图用正常字符替换PHP字符串中的特殊字符(如替换ó用o和á用a)。我尝试使用PHP正规化::正常化的功能,如下面的代码:替换PHP字符串中的特殊字符的问题
if (!Normalizer::isNormalized($word, Normalizer::FORM_C))
{
echo "original: ".$word;
$word = Normalizer::normalize($word, Normalizer::FORM_C);
echo "\tnormalized: ".$word."<br />";
exit; // see if it worked without having to go through every file
}
然而,正规化::正常化返回null,并从该代码的输出是:
original: adiós normalized:
由于这方法似乎没有工作,我去了,并找到了一个应该删除特殊字符的函数。下面是函数:
function normalize ($string) {
$table = array(
'Š'=>'S', 'š'=>'s', 'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z', 'Č'=>'C', 'č'=>'c', 'Ć'=>'C', 'ć'=>'c',
'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E',
'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss',
'à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e',
'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o',
'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
'ÿ'=>'y', 'Ŕ'=>'R', 'ŕ'=>'r',
);
return strtr($string, $table);
}
此代码没有明显的效果,但是,并返回中传递相同的字符串
我获得在Windows 7从* .txt文件我的琴弦。我从来没有很好的编码,并希望在这个问题上的任何帮助。
normalize?你从一个字母转换到另一个字母(也可能与K交换F),这可能会使合法的单词变成垃圾。 – 2012-07-06 00:11:34
我猜正常化不是正确的词,但那是我想要的结果 - 交换字符。 – jeff 2012-07-06 00:15:20
为什么? **adiós**是正确的拼写* adios *不是 – 2012-07-06 00:25:26