2012-08-30 27 views
5

呈现的HTML网页源如果我用这个获得与从JavaScript

WebClient client = new WebClient(); 
String htmlCode = client.DownloadString("http://test.net"); 

我能够使用敏捷包扫描HTML,并得到大多数我需要的标签,但它缺少HTML呈现的JavaScript。

我的问题是,如何使用c#获取最终呈现的页面源代码。是否有更多的东西让WebClient在运行javascript之后获取最终的呈现源代码?

+0

我怀疑你也可以只使用C#做到这一点。 – ceejayoz

回答

1

HTML敏捷包本身并不足以做你想做的事,你还需要一个JavaScript引擎。要做到这一点,您可能需要查看诸如Geckofx之类的东西,它可以让您将全功能的Web浏览器嵌入到您的应用程序中,并允许您在页面呈现后以编程方式访问dom的内容。

http://code.google.com/p/geckofx/

+0

新的geckofx可以在这里找到:https://bitbucket.org/geckofx/geckofx-14.0/ – Tom