我有一个带有XML数据块的文档,但每个块之间都有纯文本。我如何提取XML数据?将文本文件拆分为XML
即
blah blah blah
===: text text text :===
<?xml version="1.0" ?>
<Data>
<Line>information</Line>
<Line2>more information</Line2>
</Data>
===: text text text :===
blah blah blah
blah blah blah
===: text text text :===
<?xml version="1.0" ?>
<Data>
<Line>2nd information</Line>
<Line2>more information</Line2>
</Data>
===: text text text :===
blah blah blah
文本withing的===:===将永远是不同的,但不需要被包括在内。
更加具体谈谈那些'===:文字文字文字:==='线,它们是文字,总是存在于完全相同的办法? –
它每次都会有所不同,分隔符有一个时间戳和一堆其他信息 – frebbie
信息还有点短。一个文件能否以XML开头或者在第一个xml之前总会有一个'===:...:==='行? –