2009-12-10 40 views
9

我似乎无法找到有关Google如何确定您的内容是否为cloaking的任何信息。从技术角度来看,你认为他们是如何确定这一点的?他们是否发送了googlebot以外的内容并将其与Googlebot结果进行比较?他们是否有一组人比较?或者他们可以以某种方式告诉您已经检查过用户代理并执行了不同的代码路径,因为您在名称中看到了“googlebot”?Google如何知道你是伪装的?

这是关于legitimate url cloaking for seo这个问题。如果文本内容完全相同,但渲染是不同的(1995年风格的html与ajax vs. flash),真的存在隐形问题吗?

感谢您对此发表评论。

回答

3

据我所知,谷歌是如何生成的搜索引擎结果是保密的,不断变化的。欺骗不同的用户代理很容易,所以他们可能会这样做。对于Javascript,它们也可能实际呈现部分或整个页面。 “他们是否有一组人比较?”这是令人怀疑的。谷歌的抓取策略包括this,但是如果涉及到人类,他们只会在特定情况下被调用。我甚至怀疑这一点:花费的任何人力可能都是通过调整抓取引擎来度过的。

1

Google在展示非googlebot用户代理的同时查看您的网站。

+2

他们呢?这个其他用户代理是否仍然将自己标识为某种机器人?如果没有,Google会不会太狡猾? – Thilo 2009-12-10 02:56:25

+5

请提供源代码 – 2009-12-10 03:22:50

+0

即使不同的用户代理也不能帮助谷歌判断浏览器是否使用z-index覆盖div来隐藏某些内容 - 这是否意味着“隐藏”? – 2009-12-10 03:23:05

1

请参阅Google Chrome comic book page 11它描述的地方(甚至比外行人的术语更好)了解Google工具如何绘制网页示意图。他们可能会使用这种或类似的技术进行Google搜索索引和斗篷检测 - 至少对于它来说这将是另一个好用途。

alt text

+0

你能否解释一下这个(这是关于渲染引擎的自动化测试)与斗篷检测的关系? – Thilo 2009-12-10 03:08:11

+0

我在猜测技术可能会被重新打包,就像“浏览器认为它正在显示什么内容”一样,并且适用于Googlebot实际上所刮擦的内容。这与jQuery http://testswarm.com/的TestSwarm不同,但Google会为它使用服务器场。是啊,它在那里,但它有可行性的碎片。 – 2009-12-10 03:21:09

+0

我的解释可能不是很清楚,但基本上我说的是,如果Google(通过Chrome)能够创建技术来展示浏览器“认为”它看到的内容与实际看到的内容之间的区别,那么这个想法是不可行的他们还可以通过其他技术比较“思考”和“看”网络世界。 – 2009-12-10 03:36:40

1

实际上,谷歌的许多算法都是微不足道的,远非火箭科学。在所谓的“隐形检测”的情况下,所有先前的猜测都是基于金钱的(除了有点讽刺意味的是,John K lol)如果你不相信我设立了一些测试点(输入)和一些'隐形测试案例“(进一步的输入),将您的网站提交给Google叔叔(处理),并通过伪高级的基于人类的认知相关量子认知来测试您的非假设(< - 顺便说一句,我为娱乐价值现在我嵌套圆括号真正混淆你的想法:))AKA“检查谷歌结果,看看你是否被禁止”(输出)。 Loop直到启示== True(noob!)lol

1

Google确实聘用承包商(间接通过外部机构以极低的薪酬)手动审查作为搜索结果返回的文档,并判断其与搜索条件,质量翻译等。我非常怀疑这是他们检测隐形的唯一工具,但它是其中之一。

0

一个非常简单的测试就是比较Googlbot看到的网页的文件大小与Google的别名用户扫描的页面的文件大小,看起来像普通用户。

这将检测大多数可疑候选人进行密切检查。

0

他们使用curl等工具调用您的页面,并且在没有用户代理的情况下构建基于页面的哈希,然后他们构建另一个与googlebot用户代理的哈希。这两个哈希必须相似,他们有算法来检查哈希值,并知道它的隐形与否

+2

从技术上讲,您的回答是正确的,但最好提供回复您提供的信息的链接,以提高此答案的质量。 – 2017-07-21 08:37:59

相关问题