2009-12-04 44 views
3

我使用lxml读取xml文件并更改一些细节。但是,在运行时,我发现即使我只是用LXML读取该文件,然后重新写出来,如下图所示:lxml更改Unicode字符

fil='iTunes Music Library.XML' 
tre=etree.parse(fil) 
tre.write('temp.xml') 

我发现Queensrÿche的转换为Queensrÿche。有人知道怎么修这个东西吗?

回答

7

更改你的最后一行:

tre.write('temp.xml', encoding='utf-8') 

否则lxml在ASCII编码写入XML,所以它必须逃避所有非ASCII字符。

+0

工作完美,谢谢。 – Nikwin 2009-12-04 17:51:19