从谷歌的支持网站所需的正向DNS -为什么是验证爬虫
验证Googlebot作为来电:
运行使用的访问IP地址反向DNS查找从日志, 主机命令。确认域名位于 googlebot.com或google.com在域名 域名 上使用检索到的 域名上的host命令运行正向DNS查找。验证它是否与原始访问IP 地址的日志相同。
我的问题是为什么正向DNS查找是必需的?攻击者可以创建一个形式为crawl-xx-xx-xx-xx.googlebot.com
的DNS记录吗?
我实际上在我的日志中也看到了这个 - 来自其他爬虫。叶的,如果我反向DNS查找来自正确的域名,但正向查找不会返回IP。想知道这怎么可能..
谢谢,这很清楚。我看到很多百度蜘蛛UA现在也有这种确切的行为。我想知道所有主要的搜索引擎爬虫是否坚持这种做法? – WeaselFox