在许多不同的网址上拥有相同资源的含义(SEO-wise)有什么含义? 我见过一些几乎从不显示404页面的网站。任何错误的URL路径将简单地呈现主页。 其他网站,例如,重定向http://example.com/path/到http://example.com/path - (无尾斜杠),反之亦然,以避免重复的URL。不同网址上的相同网页
这是一个很好的做法,为什么(不)?
在许多不同的网址上拥有相同资源的含义(SEO-wise)有什么含义? 我见过一些几乎从不显示404页面的网站。任何错误的URL路径将简单地呈现主页。 其他网站,例如,重定向http://example.com/path/到http://example.com/path - (无尾斜杠),反之亦然,以避免重复的URL。不同网址上的相同网页
这是一个很好的做法,为什么(不)?
在许多不同的网址上拥有相同资源的最大含义是您的搜索结果(特别是谷歌,我不确定搜索引擎优化如何适用于其他搜索引擎)将被稀释/分割。而不是将搜索结果相关度较高的资源进行排名,即使指向相同资源,多个网址排名也会较低。
标准化SEO的URL通常是一种很好的做法。大多数网站管理员支持规范化URL的问题在于,它有时需要对其URL结构进行重大更改,而这并非总是可行。为了缓解有直接更改网址,有是一个的谷歌的WebCrawler的支持link标签规范-url属性:
http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html
这是朝着正确方向迈出的一步。有关标准化的URL的更多信息,维基文章是有帮助的:
http://en.wikipedia.org/wiki/URL_normalization
至于结尾的斜杠,我不知道,如果网络爬虫明显算上这些变化。如果在你的例子中,http://example.com/path/是一个目录,那么它应该有一个尾部的斜线。如果path是文件的名称,则应该省略尾部的斜线。至少在IIS中,当省略尾部斜线时,服务器首先搜索文件,如果找不到文件,则检查该名称的目录是否存在。如果该目录存在,则通过添加尾部斜线在内部重定向。这意味着如果您在页面上生成内部链接,那么Web服务器的最终工作就不必要了。
“Demystifying the 'duplicate content penalty'”是关于各种重复内容问题的不错文章。谷歌的Duplicate Content help page似乎保持最新的技术角度来处理它的最佳方式。