我有一个文件,我正在解析自己。每当我发现了一个“<”或“>”我分割字符串,像这样:解析包含文件的字符串时出错
xml = file.split("[<>]");
这会给我的标签,数据和结束标记。
一旦完成,我确定它是什么类型的标签,并以不同的方式处理它。如果它是一个物品标签,它有一个描述。像这样:
<description>
<![CDATA[
<img width="460" height="259" src="http://www.cbc.ca/gfx/images/news/topstories/2012/03/28/hi-parliament-stop-852-7931-6col.jpg"><br/><p>Finance Minister Jim Flaherty's budget will take the shine off what critics call MPs' gold-plated pensions, reports Greg Weston for CBC News.</p>
]]>
</description>
这里的问题是,它会分裂的所有“<”和“>”这样的描述,我正在寻找丢失的部分。
我该如何解决描述和其他我正在搜索的标签,其中包含多个“<”和“>”,我不在乎? (那些不是围绕开口标记和结束标记?
如果这实际上是XML,为什么不使用XML解析器? – 2012-03-29 05:44:30
我想学习如何做我自己......通过它思考和分析它自己 – BigBug 2012-03-29 05:45:27
WY不要试图一个标准的XML解析器? – Nishant 2012-03-29 05:46:13