2010-06-18 117 views
1

我正在开发搜索引擎。为搜索引擎索引内容和同义词

我在考虑从产品描述中获取唯一的单词,并对API进行调用以获取同义词并为它们编制索引。

“快速和强大的笔记本电脑”

将产生以下结果...

当然

“快速和强大的笔记本电脑” ,并以“加速能够上网本”

同义词另一场当然不会显示给用户,但仅用于帮助使搜索结果更相关。

您对这个想法有什么看法?你看到的任何陷阱?有人这样做吗?

+0

这些方法的一个挑战是当一个单词有多个潜在的同义词,意义广泛不同。例如,在查询“如何装运箱子”中,“ship”这个词可能具有诸如“船”和“发送”之类的同义词。 – 2010-06-18 14:18:46

回答

0

带有多个同义词的单词最终会膨胀搜索。如果你有5个单词,每个单词有10个synomyms,你现在正在搜索50个单词。

+0

我们可以使用潜在语义索引来帮助吗? – 2010-06-18 14:29:14

+0

这不会完全破坏同义词的目的吗? – Wildhorn 2010-06-18 14:54:46