2012-08-09 33 views
2

有没有办法通过IP可靠地识别Facebook机器人?如何识别Facebook机器人?

我的网站越来越受到自称是Facebook的机器人的打击,但我怎么知道肯定? 我正在寻找某种官方程序来验证类似于Google为其机器人here所推荐的Facebook机器人。

我可以解析OrgNamewhois并相信吗?或者这可能是假的?

+1

您可以检查IP地址,如果它们来自正式发布的范围:http://stackoverflow.com/questions/8859013/whats-the-ip-address-range-of-facebooks-open-graph-crawler – CBroe 2012-08-09 11:11:31

回答

3

我回答这是为了在互联网中的关键字索引。

事实上,它看起来像识别Facebook的机器人(Facebook的刮板)最好的办法是通过匹配IP来宣布官方Facebook IP范围的区域,可以通过运行

whois -h whois.radb.net '!gAS32934' 
+1

来自[Facebook的网站]的更新查询(https://developers.facebook.com/docs/sharing/best-practices#crawl): whois -h whois.radb.net - '-i origin AS32934'| grep^route >>返回类似信息,但有两点区别: 1)还包括IPv6地址。 2)输出格式不同。清单前后没有杂乱的“A1063”和“C”。每个地址在一个单独的行中,包括类型(路由或路由6) – oferei 2014-11-27 10:31:28

+0

whois -h whois.radb.net - '-i origin AS32934'| grep ^路由 – oferei 2014-11-27 10:32:35

-1
收购

为什么不牛逼你只是检查user-agent,如

facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php) 

,而不是IP

+2

由于_every_ bot可以发送任何它喜欢的用户代理 - 而这个问题的主题是辨别可能的虚拟机器人_pretending_是Facebook的刮板从“真实的东西”......这正是Facebook提供访问权的原因到他们正在使用的IP列表... – CBroe 2012-08-15 13:46:04

+0

'user-agent'可以是任何你想要的 – 2016-10-22 04:37:31