18

现在,我意识到最初的回应可能是“你不能”或“使用分析”,但我会继续希望有人有更多的见解。如何解码谷歌gclids

带有“自动标记”功能的Google adwords会附加一个“gclid”(大概是“google click id”)链接,将您发送到广告网站。它出现在网络日志中,因为它是查询参数,分析将其用于将访问与广告/广告系列相关联。

我想要做的是从gclid中提取任何有用的信息,以便对我们的流量进行我们自己的分析。造成这种情况的原因是:

  • 统计数据不完善,但如果我们正在整理它们,我们确切知道我们做了什么假设以及它们是如何计算的。
  • 我们可以将数据与我们其余的数据联系起来,并生成更准确的转换率数据。
  • 我们不必依靠javascript来进行转换。

现在很清楚gclid是base64编码(或一些紧密变体),并且它的某些部分变化比其他更多。除此之外,我还没有能够确定它涉及到什么。

有没有人对我如何解决这个问题有所了解,或者有人已经将gclids与compaigns甚至账户相关联?

我已经和谷歌的几个人谈过了,尽管他们的“不要做坏事”的座右铭,他们完全不愿意讨论泄露这些信息的可能性,即使是在NDA的情况下。看起来他们喜欢他们拥有的我们的网站统计的垄断地位。

+0

尽管它看起来没有相关的评论,但请允许它。谷歌在Adword中的座右铭是“变得邪恶”。谷歌吸所有中小企业主的钱就像血腥的吸血鬼。 – Mani 2016-05-12 07:54:07

+0

有这样的解释:https://deedpolloffice.com/blog/articles/decoding-gclid-parameter – bastien 2017-03-23 14:28:37

回答

1

嗯,这不是答案,但方法类似于你如何解决任何密码学问题。

可能性1:它们只是随机的,在这种情况下,你被搞砸了。这类似于一次性垫。

可能性2:他们“意味着什么”。在这种情况下,你必须控制环境。

  1. 获取它们的好数据库。为您的网站和其他人查找gclids。记录所有点击发生的时间,以及任何其他潜在有用的数据
  2. 破解!正如你已经开始,开始回顾你收集的数据对你的已知,并看看你是否可以找到模式使用解密技术
  3. 开始刮随机gclid的,看看他们带你。

虽然我不会抱着很高的希望,但我希望你好运!

+0

Re 1 - 我相当确信他们不是随机的。我们的gclids是相似的,其他人也很相似,但与我们不一样。他们绝对不是一个简单的递增ID。 2.1 - 这是*难*因为有很多gclids你没有看到(如果他们不点击它们)。 ... – Draemon 2008-12-13 23:11:38

+0

...我已经从日志中收集了一个大列表,并且我已经确定哪些字节的变化比其他字节更大,我的大脑喊叫着“这不是随机的”,但除此之外,什么都没有导致任何地方。 2.2/2.3 - 我很喜欢任何技术或工具的链接 - 本能并没有让我走得很远。 – Draemon 2008-12-13 23:14:01

+0

tbh我也不抱太大希望,但它会非常酷 - 我真的不认为这是谷歌应该垄断的东西。我只是有一个小小的感觉,“如果你知道如何,这很容易” – Draemon 2008-12-13 23:15:13

21

到目前为止,最简单的解决方案是使用Google Analytics活动跟踪参数(utm_source,utm_campaign,utm_medium等)手动标记链接,然后提取数据。

gclid不仅仅依赖于AdWords帐户/广告系列/等。如果您点击两次相同的adwords广告,它可能会给您不同的gclids,因为还有各种与该特定点击相关的会话和费用数据。

Gclid可能不是100%随机的,但如果可以从该数字中提取所有Adwords数据,我会非常惊讶和担心。这将是一个巨大的安全缺陷(即任意用户可以查看您的Adwords数据)。更有可能的是,每次展示都会生成一个伪随机gclid,如果该广告被点击,则gclid会记录在Adwords中(否则会被抛出)。事实之后,Google Analytics会使用该数字与Adwords协调数据。除此之外,gclid号码本身没有内在价值。

关于您的最后一点,Google Analytics和Google Adwords服务条款明确禁止试图破解或反向设计此信息,并且是永久禁止的理由。此外,您在注册这些服务时同意的TOS表示,您的数据不是以您想要的任何方式使用。 Google提供免费服务,因此附加了字符串。如果你不喜欢不完全控制你的数据,那么有很多其他的解决方案。但是,您将为这种控制支付溢价。

谷歌几乎从销售广告中赚取所有的钱。 AdWords是他们最大的赚钱产品。他们不会给你关于它是如何工作的机密信息。他们不知道你是谁,也不知道你将如何处理这些信息。如果你签署了保密协议并且他们有合法的追索权来起诉你并不重要,如果您将这些信息泄露给竞争对手,那么您的生活不足以偿还您将失去他们的金钱。

对不起,打破了它,但“不要变成恶魔”,谷歌是一个企业,而不是一个慈善机构。他们没有成为世界上最成功的公司之一,因为他们将搜索算法交给了第一个要求获得该公司的人。

8

仅供参考,我刚从我的网站上发布了一些关于this post的glcid数据的快速分析。 gclid确实有一些结构,但很难破译。

+0

感谢您的信息 - 很高兴知道别人好奇!在查找模式之前,您确实需要对字符进行解码,因为base64会将源字节分散到相邻的编码字节上。我对自己做了类似的分析,同样也相信自己有某种模式,但不知道是什么。 – Draemon 2009-04-20 22:32:06

+0

角色分析非常有趣,基本证明了这些gclids中有数据编码......非常酷。 – ojrac 2009-08-19 19:26:16

0

一种不同的方法是简单地查看引用数据,它至少会提供被搜索的关键字。

0

我同意奥菲尔和克里斯。我的感觉是,它纯粹是一个序列号/唯一的点击ID,当Analytics(分析)和Adwords系统在幕后相互交谈时,这只会打开它的秘密。

了解了这一点后,我建议您查看引荐网址,并尽可能地从中拖拉,以便在您的后端点击跟踪设置中使用。

例如,我住在新西兰,并使用Firefox。这是从火狐谷歌工具栏的“堆栈溢出”的搜索:使用.NZ域,B)我的关键字“堆栈溢出+”,C)进出口运行火狐)IM: http://www.google.co.nz/search?q=stack+overflow&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_en-GB

你可以看到这一点。

最后,如果您还存储完整的着陆页网址,则可以存储GCLID,它会告诉您访问者来自付费用户,而如果它没有GCLID,则用户必须来自自然界搜索(如果URL标记当然启用)。

这会理论上允许您搜索广告系列中的关键字,并找出它们来自哪个广告组。尽管知道创意可能是不可能的,除非您分开测试着陆URL或以某种方式标记它们。

4

我一直在我们公司研究这个问题。我们希望能够更好地了解我们的AdWords正在做什么,但我们对分析中的局限性感到沮丧。

我们目前的解决方案是使用正则表达式在Apache访问日志看GET请求:

.*[?&]gclid=([^$&]*) 

如果存在,那么我们就来看看引荐字符串来获取关键字:

.*[?&]q=([^$&]*).* 

另一种方法是更改​​Apache Web日志以开始记录google设置的__utmz cookie,该cookie应该在utmctr中包含关键字的一部分。谷歌__utmz cookie,你应该能够找到大量的信息。

引用字符串的准确程度如何?不是100%。防火墙和安全设备会将其去掉。但是自己解析它会给你比Google Analytics更大的灵活性。将gclid发送到AdWords并获取数据是一项很棒的功能,但该功能看起来并不可用。

编辑:由于我写了这个我们也创建了我们自己的标签,作为请求参数附加到每个目标网址。每个标记只是文本,广告组和广告系列名称的md5哈希值。我们使用来自访问日志的正则表达式来获取它,并在SQL数据库中查找它。

0

这里有一个想法:有没有机会gclid只是一个crytographic散列,la bit.ly或其他URL缩短?

在这种情况下,哈希文本的内容将写入数据库,并替换为唯一的ID。

因为gclid缩短了一堆长文本。

注意到这个例子: www.example.com?utm_source=google & utm_medium = CPC

被转换成这样的: www.example.com?gclid=XDF

就像一个URL缩短。

人们会需要替代密码,以逆向工程加密散列......不是一件容易的事:https://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

也许有些深挖日志,寻找模式,等等

0

看起来我的代表很弱,所以我只会发表另一个答案,而不是评论。

这不是一个明确的答案。只是表达一些想法。

当您在Adwords中启用自动标记时,gclid参数不会添加到目标网址。而是由Google点击跟踪服务器在运行时将它们附加到目标网址。因此,两件事情之一正在发生的事情:

  1. 的点击服务器与Adwords实体标识符一起存储GCLID,这样分析以后可以找一找。

  2. gclid具有以某种方式编码的实体标识符,以便Google Analytics可以解码它们。

从似乎不太可能,谷歌将实施类似的选项1.强制分析“加入”任何性能的角度来看的GCLID,为AdWords标识似乎在规模非常低效的。

14

gclid参数编码在Protocol Buffers中,然后在Base64的变体中编码。

请参阅此guide to decoding the gclid并对其进行解释,包括您可以使用的(Apache许可的)PHP函数。

里面基本上有3个参数编码,其中一个是时间戳。另外2个还不知道。

就理解这些其他参数的含义而言,将其与ei参数(encoded in an extremely similar way(基本上为Protocol Buffers,其中的按键被除去))进行比较可能会有帮助。 ei参数也有一个时间戳,看起来像是微秒,还有两个其他整数。

0

这是一个非程序的方式来GCLID参数进行解码。有可能您只是试图找出推动点击和转化的广告系列,广告组,关键字,展示位置和广告。为此,您可以将GCLID作为单独的转化类型上传到AdWords,然后按转化类型细分为深入到触发转化的条件。这些步骤:

  1. 在AdWords界面,进入工具 - > Conversions->添加转换与“从点击导入”源
  2. 访问有关导入转换https://support.google.com/adwords/answer/7014069,并创建一个批量加载文件与AdWords帮助主题的在左侧导航GCLID值,分配转换到你新的“导入自点击”转换型
  3. 上传转化导入到AdWords中的工具 - > Conversions->转换动作(上传)
  4. 前往广告活动分页,Segment->转换 - >转换名称
  5. Fi在分段列表中找到新的转换名称,这是转换的来源。继续在广告组和关键字标签上的相同流程,直到您知道GCLID始发标准