2014-06-13 38 views
0

难道有人能给我举一个例子,说明每个人是如何工作的,以及他们的错误措施如何不同?谢谢!使用RMSE和nDCG评估推荐系统的区别?

+0

我会建议此举迁移到http://datascience.stackexchange.com/,您可能会提出更具体的问题。你可以在互联网上找到两个例子。 –

回答

0

标准化折扣累积收益(NDCG)根据推荐实体的分级相关性度量推荐系统的性能。它从0.0到1.0变化,1.0代表实体的理想排名。该度量标准通常用于信息检索和评估网络搜索引擎的性能。

均方根误差(RMSE)可能是在评估预测评级准确性时使用的最受欢迎的度量标准 。系统生成预测评级 Rui对于已知其实际评级Rui的用户项目对(u,i)的测试集合T。 通常,Rui是已知的,因为它们隐藏在离线实验中,或者因为它们是通过用户研究或在线实验获得的。它从0.0到1.0变化,较低的值表示较少的错误(因此“更好”)。

您很可能会看到学术论文包含RMSE,虽然NDCG确实有它的位置,但您并不经常看到NDCG,尤其是当您使用强大的信息检索组件检查推荐系统时。均方根误差并非特定于应用程序,因此在评估推荐系统的预测准确度时,大多数学术文献都倾向于将其纳入其中。

此信息是容易通过谷歌访问,所以请在未来花一些时间做一些研究,然后再发布这样的问题。有大量的工作示例,公式详细清楚地显示在每个维基页NDCG:http://en.wikipedia.org/wiki/Discounted_cumulative_gain#Normalized_DCG和RMSE:http://en.wikipedia.org/wiki/Root-mean-square_deviation