我正在使用woodstox为XML文件实现StAX解析器。假设我有一个有效的XML文件,并且在我的文件系统的公共目录中有一个匹配的DTD。使用相对系统标识符声明如下其DTD /path/to/test.xml
/path/to/test.dtd
的XML引用: <!DOCTYPE test SYSTEM "test.dtd">
从验证的角度来看,一切似乎没什么问题。 (是吗?xmllin
,我很惊讶地发现,一个XML块,如: <badger>
<![CDATA[Text about a badger]]>
</badger>
犹如对待: START_ELEMENT (badger)
CHARACTERS ( Text about a badger )
END_ELEMENT (badger)
也就是说,CDATA和周围的文本被拼合成一个文本元素。没有检测到