我已经使用Elo和Glicko评分系统以及比赛结果来为球员生成评分。在每场比赛之前,我可以根据各自的评分,为每名球员产生一个期望值(0和1之间的浮动值)。我想测试如何准确的这个期望是,有两个原因:如何衡量使用Python/Pandas进行预测的准确性?
- 为了比较差的评价系统
- 要调整的变量(如的Elo K系数)用于计算评分
有从国际象棋值得几个不同点是意识到:
- 可能的结果是胜(其中我治疗如1.0),损失(0.0),用非常偶然的(< 5%)d原料(各0.5)。每个单独的比赛都是被评分的,而不是象国际象棋这样的系列赛。
- 玩家有更少的比赛 - 很多不到10个,少去了25个,最多是75
思考相应的功能是“相关性”,我试图在一列中创建包含预测的数据帧(0,1之间的浮点数)和另一个结果(1 | 0.5 | 0)并使用corr()
,但基于输出,我不确定这是否正确。
如果我创建了一个DataFrame,其中包含期望和结果,仅包含匹配中的第一个玩家(由于我的数据源结果将始终为1.0或0.5,所以失败者从不首先显示),corr()返回非常低:< 0.05。但是,如果我为每个比赛创建一个包含两行的系列,并且包含每个玩家的期望和结果(或者随机选择要附加的玩家,所以结果将为0,0.5或1),则corr()要高得多:〜0.15到0.30。我不明白为什么这会有所作为,这让我怀疑我是在滥用功能还是完全使用错误的功能。
如果有帮助,这里是一些真正的(不是随机的)样本数据:http://pastebin.com/eUzAdNij
我想你应该添加代码,否则是不容易知道你在做什么,究竟 – ead
也许你应该考虑正确的预测结果的数量作为测量,相关性可能不是那么好这里 – ead