2008-12-12 251 views
9

所有这些类型的网站是否只是非法刮谷歌或其他搜索引擎?
据我可以告诉他们没有'合法'的方式来获得这个数据的商业网站..雅虎! api(http://developer.yahoo.com/search/siteexplorer/V1/inlinkData.html)仅用于非商业用途,Yahoo!老板不允许自动查询等
任何想法?像Hubspot这样的网站如何跟踪入站链接?

+0

他们可以只抓取网络...像http://www.80legs.com/这样的网站使其更容易。 – 2010-07-18 21:21:52

回答

4

例如,如果你想找到的所有的链接,谷歌的主页,搜索

link:http://www.google.com 

所以,如果你想找到所有的入站链接,你可以简单地遍历您的网站的树,并为每个它发现的项目,建立一个URL。然后查询Google:

link:URL 

而且您将收集Google从其他网站链接到您网站的所有链接。

至于这种收获的合法性,我敢肯定从这个收益中获利并不是完全合法的,但这从来没有阻止过任何人,是吗?

(所以我不会刻意想知道他们是否做了这一点。只是假设他们这样做。)

3

我不知道该怎么做hubspot,但是,如果你想找出哪些网站链接到您的网站,并且您没有硬件来抓取网页,您可以做的一件事就是监控您网站访问者的HTTP_REFERER。例如,这就是Google Analytics(据我所知)如何告诉你访问者来自哪里。这不是100%可靠的,因为并非所有浏览器都设置它,特别是在“隐私模式”中,但每个链接只需要一位访问者就知道它存在!

这是通过将脚本嵌入到每个网页(通常在共同的页眉或页脚中)来实现的。例如,如果您查看当前正在阅读的页面的源代码,您会发现一个脚本,用于向Google返回有关您的访问的信息(在底部)。

现在这不会告诉你,如果有链接,在那里,从来没有人使用到你的网站,但让我们面对现实吧,他们比的那些人的实际使用少了很多有趣的。

+2

完全正确,我认为 - 看HubSpot的样本截图,你可以看到,每一个被跟踪入站链接已经从它一个来访者。为了说明,引用者数据可以从日志或通过在您的网站中嵌入内容获得。 – 2011-05-14 14:33:43