2012-09-19 30 views
0

我的一个网站是针对不接受Cookie的旧手机,因此它使用基于URL的会话ID。如何阻止Google将URL中的会话ID编入索引?

但是,Google正在为会话ID编制索引,因此当我的网站在Google上搜索时,所有结果都会显示特定的会话ID。

在大多数情况下,当客人点击它时,会话ID不再有效,但我至少有一个客户点击了来自Google的链接并实际将其记录到其他人的帐户,这显然是一个巨大的安全缺陷。

那么我该如何阻止Google将会话ID编入我的URL?如果有帮助,Google的网站站长工具中会话ID始终设置为“代表URL”。

回答

0

你可以通过把一个robots.txt文件在您的根Web目录告诉Googlebot和其他爬虫不要与该属性检索的网址做到这一点。

下面是一个例子:

比方说,你要阻止的URL是形式:

http://www.mywebsite.com/page.html?id=1234 

的robots.txt语法来阻止与id属性的网址是:

User-agent: * 
Disallow: /*id 

你可以找到更多有关robots.txt的http://www.robotstxt.org

阅读更多关于此的在http://www.seochat.com/c/a/Search-Engine-Optimization-Help/Preventing-Duplicate-Content-on-an-ECommerce-Site-from-Session-IDs/1/

+0

此解决方案的问题是,我的所有URL(就Google而言)都在URL中具有会话ID,因此会阻止来自Googlebot履带的所有页面。我需要的解决方案是让Google在没有会话ID的情况下编制URL索引。这甚至有可能吗? – ProgrammerGirl

+0

您仍然需要使用相同的robots.txt文件,以便抓取工具跟踪具有会话ID属性的URL的入站链接。我建议在您的网站上添加网站地图,并确保使用Google的webwaster工具注册的网址是没有会话ID属性的网址。我发布的答案中的第二个链接显示了如何在robots.txt中指定站点地图。 – stuckintheshuck