2013-08-21 47 views
0

什么是最好的方法(数组,列表,Streamwriter或字典)来隐藏解析html innerTextinnerhtml(URL),以便它可以被转换成XML。最好的方法来存储解析的HTML输出在XML

这是我试图写的第一个程序,没有帮助,但我坚持这一点。我没有在这个问题中添加任何代码,所以我可以学习如何自己做。任何人可以给任何建议将不胜感激。

+3

不知道我是否正确理解你,但为什么不将它存储为'string',然后使用'XElement.Parse()'使它成为一个XML对象。 – gunr2171

+0

使用Html Agility Pack解析HTML,然后将其写为有效的XHTML。 http://htmlagilitypack.codeplex.com/ ... http://stackoverflow.com/questions/6446525/c-sharp-html-from-webbrowser-to-valid-xhtml –

回答

2

string因为HTML很少有效的XML,你需要通过一个专门的分析器运行它到尝试尽可能多地把它放到XML表单中。

但假设你能够解析它,字符串和XML之间的中间会有某种自定义树结构。在.NET中没有内置的树形结构,但这很容易创建,谷歌会指向你十亿个教程。