2011-04-05 103 views
1

我在谈论像电影/物品推荐,但似乎房地产更棘手。在访问网站并搜索RE时,应该向用户提出一些建议。我们将这项任务分成两个任务:如何实现房地产推荐引擎?

a)用户还没有输入任何个人信息 - 基于物品的推荐 b)用户已经输入了他/她的详细信息,如收入,位置等 - 项目/基于用户的推荐

我认为任务a)的第一件事是开始建模RE功能,但使用一些范围而不是精确值。例如:

  1. 在2区

    • 40 - 50,我们可以将其标记为 “1”
    • 50 - 70是 “2”
    • 等...
  2. 价格:

    • 20 - 30对数千名€将被标记为1
    • 30 - 40将是2
    • 等...
  3. 接近市中心:

    • 1为RE在市中心
    • 2为区域2或距离中心最多2/3公里
    • 3为区域3或距离中心7公里

所以具有范围让我们指定一个矢量到每个RE属性这将允许我们使用:欧几里德距离,Pearson相关和一些最近邻算法。

请评论我的方法或建议一个新的。

+0

为什么你在课堂上使用任意的基数标签?在我看来,你可以使用trunc(area/20)和trunc(income/10000)来获得更一般的,更自然的映射。强迫从中心到数学公式的距离似乎不那么直观,但我认为它可以完成。 – tripleee 2011-08-07 10:21:15

回答

2

如果您已拥有足够流量的网站,则可以尝试纯粹的协作过滤方法,即查看此属性的人也查看了这些其他属性。您可以使用Pearson相关性来获得良好的结果。 RE

相似度之间2可以当用户正在观看属性RE可以被示出基于所述相似性得分与性质的所有其它RE属性进行排序,并示出了前几名被定义为

 
     number of people who viewed both RE1 and RE2 
sim = --------------------------------------------- 
     number of people who viewed either 1 or both 

你可以在这个顶部添加一些明显的过滤器,如属性的位置,价格范围等。

您也可以定义相似,你建议,并从两个从那些没有如果使用纯协同过滤算法中获得的机会很高新的稀土项目良好的代表性结果混合。