我有一个具有以下结构的日志文件。以Java解析日志文件的库
unstructured raw text
unstructured raw text
..
..
..
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<message>
...
...
</message>
unstructured raw text
..
..
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<message>
...
...
</message>
unstructured raw text
..
..
正如你所看到的,在单个日志文件中嵌入了多个XML文档。我想知道是否有一个通用实用程序或库可以在我开始写自己的东西之前在这里重用。我需要它在Java中。
谢谢。
该设计将使你的生活比它所需要的要难得多。如果你想使用XML和XML工具链,那么你应该接受它。停止在顶层嵌入原始文本,而是使整个文件成为单个XML文档。它会使你的解析生活变得更加容易。 –
@Hank - 我没有写这个文件。我从另一个系统获取文件。我需要解析它并使用我系统中XML节点内的一些信息。 –
在这种情况下,祝你好运。你基本上会被卡住做一些丑陋的黑客手段:寻找''线,然后备份,直到你找到最后的结束标记,并删除/忽略这两个点之间的一切;之类的东西。老实说,如果有*任何*方式,你可以让他们修复上游的文件格式,这将使你的工作更容易。 –