我使用HtmlAgilityPack加载HTML文件是这样的:如何停止HtmlAgilityPack更改加载页面的源代码?
var doc = new HtmlAgilityPack.HtmlDocument();
doc.OptionOutputOriginalCase = true;
doc.Load(@"c:\ftp\file3.html");
然后我使用XPath来选择节点,并得到outerHTML但问题是,我得到一个修改过的页面源,例如我得到:
<font class="hello" id="price">
当真正的页面源是
<font class=hello id=price>
如何避免呢?
我认为HTML敏捷包只是自动更正格式不正确的HTML,大多数浏览器都会做类似的事情。 –