2012-07-11 118 views
0

我们目前正在托管一个大型joomla网站。 Google已为我们网页的数百个“打印”版本编制索引。htaccess从url中删除print.html

例如,如果我们有一个网址的文章: www.mysite.com/funnyarticle.html

的Joomla网站自动创建: www.mysite.com/funnyarticle/print.html

我们移动了网站并删除了这些网页,因此他们现在从Google获得404错误。 我们希望重定向或重写(不知道什么是正确的术语)“打印”网址到他们各自的文章。

我想用htaccess的删除: /print.html

,取而代之的是: 的.html

我所看到的例子,但不能让他们正常工作。 所以我希望我可以得到具体的建议,如何删除和替换上面的确切代码。

谢谢你的时间。

问候,

Aforantman

回答

0

你可能想使用RewriteRule。请参阅Apache的指南,了解如何使用它们:http://httpd.apache.org/docs/2.0/rewrite/rewrite_guide.html

但是,如果您只是希望谷歌(和其他搜索引擎)忽略这些打印版本,请在您的相应条目robots.txt。这样你就不需要用Joomla的方式来生成和访问你的访客的打印版本。

1

您可以使用以下几行创建一个robot.txt文件。

User-agent: * 
Disallow: /*/print.html 

这将不允许搜索引擎机器人访问名为print.html的文件。

0

你需要把这些线在你DOCROOT/.htaccess文件:

RewriteEngine On 
RewriteBase /

RewriteRule ^(.*?)/print.html $1.html [L,R=301] 

这将重定向任何谷歌用户通过点击这些网页,以正确的文章之一。如果您的文章名称可以包含/然后从上面删除?;该规则仍然有效,但可能需要更多μS运行时:-)

0

您可以使用robots.txt作为Jishnu说的。这是执行此操作的最佳方法。

User-agent: * 
Disallow: /*/print.html 
+0

这不向Jishnu的答案提供任何其他信息,如果您支持答案,请给它添加评论。如果你没有代表评论,那就去赢取它。 – Patrick 2014-05-10 16:21:50

+0

你为什么这么粗鲁? – user3146425 2014-05-14 15:39:28