4

什么是快速“如果用户A和用户B喜欢产品C,他们可能有兴趣相互关注”算法。我不认为在运行时计算它们的相似性足够聪明,因为它会减慢响应速度。另一方面,计算隔夜指数需要进行(N * N-1)次不同的运行,其中N是用户的数量...也不是很聪明。此外,每当用户喜欢新产品或新用户注册时,索引都必须重新计算。关于推荐引擎

什么是最聪明的东西,可以在这里应用?某种超快哈希,然后只添加新项目?

回答

0

在Uni的一门课程中,我研究过的算法当中,有一个处理这样的事情。他们推荐的方法是为每对用户计算一个“相似性”指数(我认为这是你提到的N * N方法),然后根据这个指标确定特定用户最接近哪些用户。

当然,您不需要立即重新计算每次更改的相似性索引,只是偶尔一次,有点像搜索引擎爬虫的作品。事实上,一旦你计算了初始索引,就可以使用各种启发式方法来更频繁地重新计算那些快速改变他们的偏好的用户,而对于那些只是很少改变他们偏好的用户来说,这种方法要慢得多。

0

你有没有想过一个RDF数据库? Like OWLIM