我运行下面的代码:DOMDocument打破编码?
$page = '<p>Ä</p>';
$DOM = new DOMDocument;
$DOM->loadHTML($page);
echo 'source:'.$page;
echo 'dom: '.$DOM->getElementsByTagName('p')->item (0)->textContent;
它输出以下内容:
资料来源:A
DOM:谩
所以,我不明白为什么当文本通过DOMDocument来时,它的编码会被破坏?
谢谢,utf8_decode做的工作。 – Mike
刚刚也遇到了这个问题,不幸的是遇到了一个utf8_decode无法帮助的情况。 iconv(“UTF-8”,“CP1252”,$ data)来拯救! (更多信息:http://us2.php.net/manual/en/function.utf8-decode.php#104907) – MBaas