2015-07-05 62 views
1

我目前正在为列出产品的网站重新建立内部搜索引擎。这个搜索引擎有3个类别,多选择选项,客户希望他的搜索是“搜索引擎优化友好”,因此他希望搜索选项在名称中的URL,因为他认为这将使其搜索引擎友好。搜索引擎优化和大量的表单/ Javascript链接的搜索功能

问题是,搜索产生的URL可能会破坏2000个字符,而且有多少选项可能会无穷无尽,我认为有超过10000个组合。搜索网址当前通过Javascript发送给浏览器,而不是通过带提交按钮的表单元素。我怀疑搜索引擎甚至会抓住后者。

我不认为有可能使这种搜索搜索引擎友好。我相信重复内容的数量可能会导致惩罚。除了SE不检索搜索链接之外,什么是合适的解决方案?

回答

0

从用户的角度来看,我认为> 2000个字符的网址是您最大的问题,因为例如IE will only handle URLs up to 2083 characters。我相信这应该是一个交易断路器。

前段时间我们(Google)写了一篇关于分面导航的文章,我认为这适用于您的案例:Faceted navigation best (and 5 of the worst) practices。最糟糕的做法,部分提到:

最差实践#2:使用目录或文件的路径,而非参数列出不会改变网页内容的值。
最差做法:
example.com/c123/s789/product?swedish-fish
(其中/ C123 /是类别,/ S789 /是不改变网页内容的会话ID)

良好做法:
example.com/gummy-candy/product?item=swedish-fish&sid=789
(目录/ gummy-candy /,以有意义的方式更改页面内容)

最佳实践:
example.com/product?item=swedish-fish&category=gummy-candy&sid=789
(URL参数允许搜索引擎更大的灵活性来决定如何有效地抓取)

这是困难的自动化程序,如搜索引擎爬虫,区分有用的值(例如,“橡皮糖的糖果”)从无用的(例如,“sessionID”)值直接放在路径中。另一方面,URL参数为搜索引擎提供了灵活性,以便快速测试并确定给定值何时不需要爬虫访问所有变体。

的JavaScript一般不应该是一个问题,至少在大的搜索引擎,谷歌和必应承认都渲染HTML,获取外部资源的必要,就像将一个标准的浏览器。在这里你必须密切关注robots.txt指令所禁止的资源。如果搜索引擎无法抓取关键资源进行渲染,他们可能完全误解了该页面。