2011-04-11 35 views
2

我试图创建一个Web工具,可以可视化两个XML之间的差异。 difflib在创建具有差异的html方面工作得很好,但随后一些unicode文本出现在XML中,并且生成的html现在包含html编码的字母。使用Python的Unicode与XML的差异

有没有其他方法解决这个问题?

+0

你的XML和HTML编码的字符在你的HTML unicode有什么问题吗?为什么会阻止你? – JosefAssad 2012-05-07 12:15:15

回答

1

我想你是什么困扰'html character实体',而不是他们的数字对应。你可以重新映射它们,例如通过支持正则表达式(例如sed)的您最喜爱的cli工具以及unicode e-workersreference中的表格。数字实体编码可以在html和xml文件中使用。

最好的问候,carsten