2013-03-12 58 views
0

我有一个从Word插入的XML文档。来自用户的细节有点粗略,但我相信通过从Word复制来插入XML。所需的功能是将复制的MS Word格式的文本插入到xml文档中,并将其存储在数据库中以供稍后导出。除了一个奇怪的标签外,最初的XML看起来不错。来自Word的XML文档问题

<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /> 

此标记的作用是不允许在Visual Studio 2010和IE 8中解析XML。删除此标记后会出现另一个错误。

End tag 'FONT' does not match the start tag 'P'. Error processing resource 

这似乎是微软在XML标签内生成的HTML有问题。我不是XML专家.... MS从Word生成的HTML有问题吗?为什么删除标签有帮助?

回答

0

MS Word会产生可怕的标记 - 以XML格式存储是可能的最糟糕的方式。如果你必须保留不好的格式化数据,关系数据库将是更好的解决方案,否则将需要删除格式或手动更正它。

+0

@John ....是的,插入的格式化HTML存储在数据库中,然后插入到XML中。同意,丑陋! – MikeTWebb 2013-03-13 14:31:58