2014-04-22 17 views
0

我的脚本工作很好,但今天签入日志后,我发现了一些矩阵的话,分析后我明白,有一些与utf8,文件被解析,标题提取,但结果代替俄语字是(СÐμÑ€DD°d»N preg_match UTF-8问题未知的符号,而不是cyrilic

我使用

$cont = "dasdas<title>Сериалы ТУТ! Сериалы онлайн sda</title>"; 
preg_match("'<title[^>]*?>(.*)</title>'siU", $cont, $match); 

//$match[1] = Сериалы ТУТ! СериРsda 

当我尝试添加模式修饰符/ u没有变化,相同的未知矩阵词。请。

也许有什么与PHP?

+2

[无法重现](https://eval.in/139968)。你在一个普通的(新鲜的)php文件中测试这个吗? – HamZa

+2

这给我的预期输出。 – hwnd

+0

@HamZa,是的,当我试图在网上解析器重现,一切工作顺利,但在谷歌没有信息,它为什么我认为问题可能不preg_match,但在另一个层面。 –

回答

2

这不是一个PHP或正则表达式的问题,而是一个HTML问题。要获得正确的显示,您必须在您的html代码的标题中添加<meta charset="UTF-8"/>

顺便评论:使用U改性剂是无用:

preg_match('~<title[^>]*>(.*?)</title>~si', $cont, $match); 
+0

谢谢^^ kjj –