2011-06-30 51 views
4

我想通过创建的XMLDocument这种方式打开一个HTML文件(从一个StreamReader检索到的字符串,从网络), :打开HTML文档与xml.Load

XmlDocument doc = new XmlDocument 

doc.Load(string containing the retrieved document). 

但因为HTML文件包含这个头:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" > 

它告诉我,该文件是无效的...任何方法来解决这个问题?

回答

0

如果您肯定HTML是有效的XML,我想您可以简单地用XML替换HTML头。

+0

我不认为你总是可以积极的... ... –

0

为此,可以使用HTML Tidy Tidy.NET