2012-10-12 233 views
2

我试图在我的网站上支持多种语言。某些需要翻译的内容将具有像Ç这样的实体参考。我可以使用htmlentities将其转换为Ã。但是,如果我有什么需要翻译,有一个字符串标记:有HTML的情况下的内容

"<p>Hello, <a href="">world with Ç</a></p>" 

如果我使用htmlentities,在<>将被转换了。我不想将字符串分解为标签和非标签部分,然后将htmlentities仅应用于非标签部分。这太杂乱和乏味。

+0

如何使用Unicode编码如UTF-8? – Gumbo

+0

我在IE中看到奇怪的字符。我会研究UTF-8角度。 – StackOverflowNewbie

+0

您需要[正确指定文档的字符编码](http://www.w3.org/TR/html4/charset.html#h-5.2.2)。 – Gumbo

回答

1

一个解决张贴here

通过你的字符串下面的函数,并返回的字符串工作。

function unicode_escape_sequences($str){ 
     $working = json_encode($str); 
     $working = preg_replace('/\\\u([0-9a-z]{4})/', '&#x$1;', $working); 
     return json_decode($working); 
    } 
相关问题