2017-03-16 25 views

回答

3

这不是一个编码问题,但更多的与文档类型和DTD有关。 Plain XML仅支持开箱即用的<,>,&,'"。像‘这样的实体来自HTML实体集,并且还经常用于其他(专有)DTD。您需要在文件的序言中提供本地DTD子集,将这些实体先解析为Unicode,或依赖MarkLogic的“修复”功能。

repair选项可能是最快的出路,但在这些实体来自哪里以及您想要对它们做什么的情况下,可能需要考虑更加困难。

这里是xdmp:document-load的文件,应说明repair选项:

http://docs.marklogic.com/xdmp:document-load

HTH!

+0

感谢其工作正常 – Antony

+0

既然它的工作,你能标记这个答案为接受?这给了grtjn的功劳,并明确表示这个问题已经解决。 –