0

我不确定哪个数字在下面用于问题我试图解决这个问题涉及到使用Pearson相关公式。Pearson相关问题

A B C D E F 
Bob 4 5  4 2 
Fra 2 2  2 3 2 
Lee 2 4 3  5 
Cha 5 4  4 1 

F‘“使用Pearson相关和加权平均值来产生鲍勃是否会喜欢的预测描述一个社区为基础的方法’。你的答案应该勾勒出基于邻里方法的主要步骤和显示要求的步骤生成预测“

所以我想知道鲍勃是否会喜欢F ...(5 =喜欢1 =不喜欢) 我明白皮尔逊公式,但我不确定其他'用户'比较鲍勃与,或者如果我应该考虑所有用户的意见。

我也明白如何回答类似家庭作业的问题是不鼓励的,但我花了几个小时去网上试图弄清楚这一点。

任何帮助将不胜感激,在此先感谢。

+0

http://stats.stackexchange.com/和http://math.stackexchange.com/ – 2011-05-08 08:24:51

回答

0

可能需要查看问题的具体细节才能得出问题本身的最佳答案,但似乎可行的一种方法是计算Bob与彼此之间的相互关系peson(Fra,Lee和Cha),并通过这些相关性对F的分数进行加权。

在这种情况下,因为你只有得分F代表法兰克福机场和Lee,只取(corr_(Bob, Fra) * 2 + corr_(Bob, Lee))/2

+0

注意还有可能找到'F'与'A','B','C','D'和'F'之间的相关性,并且同样发现你自己也有一个加权的值给Bob 。如果您的问题的正确解决方案使用两种机制的组合,我不会感到惊讶。 – afranz409 2011-05-07 19:12:46

+0

几年前在Netflix奖项中的BelKor团队使用Pearson相关性作为他们获奖解决方案的许多输入的一个方面。请参阅他们的论文:http://69.147.108.248/files/BellKorIcdm07_0.pdf。第2页上的等式(2)可能会对您特别感兴趣。 – afranz409 2011-05-07 19:16:27

+0

我编辑了问题以准确显示要查询的内容。谢谢 – mmmbaileys 2011-05-07 20:51:12