2008-10-21 23 views

回答

5

这一切都是由.NET框架的默认browsercaps声明驱动的。

要设置该特定的爬取器,您需要将一个自定义的browserCaps部分添加到您的web.config以将其识别为爬网程序。

如何去这个MSDN文档是相当有据可查,here is a link.

+1

不幸的是,现在一个死链接:( – 2014-04-10 21:57:19

2

的HttpBrowserCapabilities是从一组* .browser文件填充在C:\ WINDOWS \ Microsoft.NET \框架\ V2.0.50727 \ CONFIG \浏览器。您可以在〜/ App_Browsers /中添加您自己的文件以及您的自定义爬虫的详细信息。该模式是here。基本上它包含一个正则表达式来匹配User-Agent头和一组属性值。