2013-02-09 43 views
1

谁能告诉我如何从谷歌索引中删除子域名,链接到主域名。如何从Google索引中删除子域名,链接到主域名

可以说我的域名是www.myweb.com,我的子域名是cdn.myweb.com。现在这里子域的Document Root与主域相同。所以我不能使用robot.txt来停止谷歌索引,因为它会删除主要域链接的索引。

我在google,bing和stackoverflow上搜索,但是我找不到问题的完美答案。有没有解决你的方面?

回答

4

您可以为此使用动态robots.txt。 事情是这样的......

httpd.conf文件(的.htaccess):

RewriteRule /robots\.txt$ /var/www/myweb/robots.php 

robots.php:

<?php 
header('Content-type: text/plain'); 

if($_SERVER['HTTP_HOST']=='cdn.myweb.com'){ 
    echo "User-agent: *\n"; 
    echo "Disallow: /\n"; 
}else{    
    include("./robots.txt");  
} 
1

我使用nginx的,并且在同多个子域服务器块。我想将www子域名纳入Google的索引,并将其他子域名排除在外。

首先,在我的nginx配置服务器块中,我添加了以下内容以根据域为/robots.txt提供2个不同的文件。

location ~ /robots.txt { 
    if ($host = 'www.example.com') { 
     rewrite ^/robots\.txt /robots.www.txt last; 
    } 
    } 

然后在我的站点的根目录下,有以下2个文件:

  • 的robots.txt哪些块爬行,是所有子
# Do not crawl subdomain 
User-Agent: * 
Disallow:/
默认
  • robots.www.txt,允许所有网站的爬行,并且只在担任www.example.com/robots.txt
User-agent: * 
Disallow: 
+0

如何为IIS服务器上托管的网站完成此类操作? – Krunal 2013-07-09 15:40:54

0

的第一件事是添加的robots.txt但对我来说,因为我的网页是已经用CDN子域名索引,机器人已经太晚了。我发现的最好方法是去谷歌网站管理员工具,添加我的cdn域(cdn.mysite.com)。然后转到Google索引 - >删除网址,并删除网址的/。生效需要几天时间。