2015-06-06 60 views
1

我的意图是从文本文件中提取单个或嵌套的XML标记。我的输入文件结构是纯文本和XML(在我的情况下是HTML)格式。我想要做的是扫描输入放弃一切,直到到达XML标记;然后将其全部提取出来(并嵌套一切)并继续这种方式直到整个文件被处理。 在尝试自己做之前,我想看看是否有一些Java库,我不知道哪些可以帮助我。从文本文件中提取XML标记

谢谢大家。

+0

也许,http://jsoup.org或许能够做到这一点......? –

回答

相关问题