这是有点棘手,但这是如何去。从网站检索html
- 页负载
- 执行一些javascript产生更多的HTML代码。而源代码是我需要的。 现在我看到我不能使用html解析器,因为实际上没有运行代码的方法。 使用http我可以管理获取第一个源代码,但JavaScript不执行,所以我从来没有得到我需要的源代码。
检索之后生成的代码的最佳方法是什么?
编辑:我试图避免使用隐藏的Web浏览器。它实际上是可能的,因为它在这里作为JavaScript解释器工作,但它是非常缓慢和非常丑陋的方式。
EDIT2:添加的代码
static private string _InetReadEx(string sUrl)
{
string aRet;
HttpWebRequest webReq = (HttpWebRequest)HttpWebRequest.Create(sUrl);
try
{
webReq.CookieContainer = new CookieContainer();
webReq.Method = "GET";
using (WebResponse response = webReq.GetResponse())
{
using (Stream stream = response.GetResponseStream())
{
StreamReader reader = new StreamReader(stream);
aRet = reader.ReadToEnd();
return aRet;
}
}
}
catch (Exception ex)
{
return string.Empty;
}
}
如果你正在生成HTML,那么你有HTML。 –
你是否试图从给定和/或特定的网页下载html源代码?如果是这样,请显示您的代码也可以很容易地使用WebClient完成。也许你可以告诉我们你到目前为止,所以我们不会被所有人困惑,或者玩猜谜游戏 – MethodMan
@MethodMan我想获取特定网页的html。代码添加 –