2011-10-21 175 views
0

每当XMLReader试图解析这个XML文件Im喂它时,它会打破“½”并且看起来像这样的一段时间“。”XMLReader中奇怪的字符

这两个字符都是每当我尝试从xml源中删除它们时,编辑器都会首先删除它们前面的字符。所以,它们就像外国/不同的编码字符一样。

我有哪些选择可以解决它?我无法每次都编辑xml文件。非常感谢

+1

你在Feed中使用什么编码?你用什么编码来阅读? –

+1

文件的编码是什么?这可能是一个编码问题。 – Jamie

+0

feed表示UTF-8在顶部,但我不得不将它更改为ISO-8859-1,因为它打破了“é”。要阅读它,我使用XMLReader的默认值是UTF-8,我相信。谢谢。 – Michelle

回答

0

您必须修复创建“XML”文件的程序或过程。 (我将“XML”放在引号中,因为实际上,您希望它是一个XML文件,但它不是一个。)您可能能够修补或修复或恢复数据,但这不是一个长期的解。

轶事证据表明,“½”字符编码为两个字节,表示它编码为UTF-8,而“é”字符编码为一个字节,表明它编码为ISO 8859-1 。这意味着两个不同的进程已经写入文件,使用不同的编码写入它。 (也许它最初是在一种编码中创建的,然后使用不知道原始编码是什么的编辑器进行修改。)这是行不通的。