2011-12-16 43 views
4

我在编码在我的网站有很多麻烦。

这是我的问题,现在,如果我去analize.php?dialog=árbol其代码为:

<? 
echo $_GET['dialog']; 
echo "sabía"; 

就可以了,我得到:

sabía 
sabía 

我使用ANSI,改变为UTF-8两者都打破。我不明白为什么会发生这种情况,也没有任何代码在上面。我不关心它们如何显示,因为这个文件只用于从我的数据库中获取数据。但我需要正确显示$_GET,以便我可以将其包含在查询中。

这怎么办?

+3

http://pokit.org/get/7570f6e4406588d65f28ffb3c50c4224.png – 2011-12-16 01:51:48

+1

你的源代码保存为什么编码?你解释/提供文件的编码是什么? – deceze 2011-12-16 01:53:33

回答

5

您不能在URL中发送字符“í”,URL必须使用ASCII字符集的子集。因此,在将URL发送到服务器之前,您的浏览器将URL编码为?dialog=sab%C3%ADa%C3%AD表示两个字节C3 AD,它是字符“í”的UTF-8编码。您可以用var_dump($_SERVER['QUERY_STRING']);来确认。这由PHP自动解码,结果是“sabía”的UTF-8字节序列,“í”使用两个字节C3 AD进行编码。

您的浏览器正在使用Windows-1252或ISO-8859-1字符集来解释此字节序列。字节C3在此编码中表示“×”,字节AD表示软连字符并且不可见。

两个可能的解决方案:

  1. 使用UTF-8无处不在(推荐!)

    • 你的源代码保存为UTF-8
    • 输出强制浏览器的标题将该网站解读为UTF-8:

      header('Content-Type: text/html; charset=utf-8'); 
      
  2. 转换$_GET值到Windows 1252/ISO-8859-1(或任何编码,你想在网站上使用),即使在这种情况下使用mb_convert_encodingiconv(不推荐)

    • 你正是你使用的是什么编码

总之应设置宣布到浏览器的标题,你需要确保你使用相同的编码无处不在,并指定给浏览器的编码正是是。