我正在开发搜索引擎。为搜索引擎索引内容和同义词
我在考虑从产品描述中获取唯一的单词,并对API进行调用以获取同义词并为它们编制索引。
“快速和强大的笔记本电脑”
将产生以下结果...
当然“快速和强大的笔记本电脑” ,并以“加速能够上网本”
同义词另一场当然不会显示给用户,但仅用于帮助使搜索结果更相关。
您对这个想法有什么看法?你看到的任何陷阱?有人这样做吗?
我正在开发搜索引擎。为搜索引擎索引内容和同义词
我在考虑从产品描述中获取唯一的单词,并对API进行调用以获取同义词并为它们编制索引。
“快速和强大的笔记本电脑”
将产生以下结果...
当然“快速和强大的笔记本电脑” ,并以“加速能够上网本”
同义词另一场当然不会显示给用户,但仅用于帮助使搜索结果更相关。
您对这个想法有什么看法?你看到的任何陷阱?有人这样做吗?
带有多个同义词的单词最终会膨胀搜索。如果你有5个单词,每个单词有10个synomyms,你现在正在搜索50个单词。
我们可以使用潜在语义索引来帮助吗? – 2010-06-18 14:29:14
这不会完全破坏同义词的目的吗? – Wildhorn 2010-06-18 14:54:46
这些方法的一个挑战是当一个单词有多个潜在的同义词,意义广泛不同。例如,在查询“如何装运箱子”中,“ship”这个词可能具有诸如“船”和“发送”之类的同义词。 – 2010-06-18 14:18:46