2012-03-17 96 views
1

我是来自Python背景的C#的新手。我很难弄明白这一点。在python我可以使用beautifulsoup做到这一点:从HtmlAgilityPack打印网页源代码

from bs4 import BeautifulSoup 
import requests 
r = requests.get('http://stackoverflow.com').content 
soup = BeautifulSoup(r).prettify 
print soup 

这得到stackoverflow.com的源内容,并打印到控制台。 我无法弄清楚如何在C#中做到这一点。

 var webGet = new HtmlWeb(); 
     var document = webGet.Load("http://stackoverflow.com"); 
     Console.WriteLine(document); 

这不起作用,它只打印var文档的类型。有谁知道如何做到这一点?这将不胜感激 - 我试图通过转换我的Python程序之一来学习C#,只是fyi。

+0

当使用HtmlAgilityPack,它真的* *有助于了解在.NET框架内置的XmlDocument类。他们有几乎相同的API。 – Cameron 2012-03-17 14:58:05

回答

4

使用DocumentNodeOuterHtml属性:

var webGet = new HtmlWeb(); 
var document = webGet.Load("http://stackoverflow.com"); 
Console.WriteLine(document.DocumentNode.OuterHtml);