2012-11-09 74 views
2

我正在处理这个问题,我需要根据他们正在寻找的内容来集群搜索短语(现在,让我们假设他们正在寻找只有地方,如书店,超市等..)集群搜索短语

”我在哪里可以找到芝士蛋糕?
能拿概率聚集到“甜点”,“餐厅”,...

“我在哪里可以购买食品?”
能拿概率聚集到“超市”,“蔬菜”,...

承担年初,一组什么样的搜索短语可以得到分类到,已经存在。

我看着主题建模,但我觉得我可能会走错方向。任何关于如何开始/看看什么的建议都会非常有帮助。

非常感谢。

+2

这看起来像'查询重写'。 http://www.slideshare.net/lundjohnson/2011-07-27-bay-area-search – greeness

+0

你有什么样的数据可用? –

回答

0

主题建模当然提供了一种可能的解决方案。从大型语料库中引入主题模型,尽可能地代表您正在索引和搜索的文本。然后将每个查询表示为给定查询的主题的后验。如果你想获得一个查询集群,那么你可以在这个缩减集合上做,或者如果你在做IR,你可以使用结果向量而不是原始的单词。

如果这不是你想要的,你能详细说明一下问题吗?你希望如何处理群集查询?