2014-05-20 49 views
0

我有数据有一个关联的二进制结果变量。自然,我运行逻辑回归以查看参数估计值和优势比。我很好奇,要从二进制结果中改变这些数据来计算数据。然后我对计数数据进行了泊松回归(和负二项回归)。比较泊松回归与逻辑回归

我不知道如何比较这些不同的模型,但我所看到的所有比较似乎只涉及嵌套模型。

如何决定在这种情况下使用的最佳模型?

+1

这个问题似乎是题外话题,因为它是关于统计。 – timrau

回答

1

基本上两个模型将大致相等。真正重要的是你的目标是什么 - 你真正想要预测的是什么。如果你想确定有多少病例是好的还是坏的(1或0),那么你可以进行逻辑回归。如果你真的对案件将要做多少(计数)感兴趣,那么做泊松。

换句话说,这两个模型之间唯一的区别是逻辑变换和logistic回归试图最小化误分类错误(-2对数似然)的事实。简而言之,即使运行线性回归(OLS)对二元结果的影响,除了结果可能不在0和1之间(例如RoC曲线下的面积将与逻辑模型相似)之外,您不应该看到与您的逻辑模型有很大差异。总之,不要担心这两个模型中的哪一个更好,它们应该与捕获功能信息的方式大致相同。想一想,优化,计数或可能性更有意义。如果您考虑非线性模型(例如随机森林或神经网络等),答案可能会有所不同,但您所考虑的两者都是(几乎)线性的 - 所以不用担心。

1

需要考虑的一件事是样本设计。如果您正在使用病例对照研究,那么逻辑回归是因为它的logit连接函数,而不是像泊松回归中那样记录比率。这是因为,在病例对照研究中存在过度抽样的情况下,odds ratio是没有偏见的。