2017-03-22 14 views
0

当我使用count:poisson而不是rmse时,我看到的值为nloglikelihood。现在我不确定如何将这些数字与rmse或mae进行比较。xgboost poisson run中的nloglikelihood值后面的直觉

肯定会更好的价值..但没有得到实际的错误直觉,我们与rmse或湄获得。

例如 - >train-poisson-nloglik:2.01885 val-poisson-nloglik:2.02898

在这里,我们可以说,实际值由2.02错误不同。 有人可以用小例子来解释。 谢谢。

回答

0

上有值的计算好的帖子here

只是要更详尽,值是:

mean(factorial(label) + preds - label*log(preds)) 

如果用负对数似然的真奶粉比较,它应该是sum而不是mean。我想他们选择平均值,以便列车和测试值更具可比性。

最后,要回答这个问题,可能性是数据来自具有特定参数的分布的概率。在泊松模型中,参数只是一组预测值。所以你的预测越好,概率越大,相关的负对数似然值越小。

rmsemae基于预测与真值之间的差异的预期,而负对数似然性正在查看概率。