我有网址,如:
http://www.matweb.com/search/DataSheet.aspx?MatGUID=849e2916ab1541be9ff6a17b78f95c82matweb.com:如何获取页面的源?
我想使用此代码从该页面下载源代码:
private static string urlTemplate = @"http://www.matweb.com/search/DataSheet.aspx?MatGUID=";
static string GetSource(string guid)
{
try
{
Uri url = new Uri(urlTemplate + guid);
HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create(url);
webRequest.Method = "GET";
HttpWebResponse webResponse = (HttpWebResponse)webRequest.GetResponse();
Stream responseStream = webResponse.GetResponseStream();
StreamReader responseStreamReader = new StreamReader(responseStream);
String result = responseStreamReader.ReadToEnd();
return result;
}
catch (Exception ex)
{
return null;
}
}
当我这样做,我得到:
你不似乎启用了Cookie。 MatWeb需要启用Cookie。
好吧,我明白,所以我加了台词:
CookieContainer cc = new CookieContainer();
webRequest.CookieContainer = cc;
我:
您的IP地址已经由于过度使用受到限制。当IP地址可能被公司中的许多人共享或通过互联网服务提供商共享时,问题可能会更加复杂。很抱歉给您带来不便。
我可以理解这一点,但当我尝试使用Web浏览器访问此页面时,我没有收到此消息。我能做些什么来获得源代码?一些cookie或http头文件?
哦,谢谢!这样可行 :)。顺便说一句,我怎么能得到我自己的UserAgent? – 2010-12-20 20:47:30
要获取您的浏览器发送的UserAgent,请尝试以下网站:http://whatsmyuseragent.com/ – 2010-12-20 20:53:04