2015-09-10 145 views
-1

我有逻辑回归模型的R输出。似乎只有截距和psa在统计上显着。这是否意味着我应该从我的模型中删除sorbets_psa和cinko并创建一个新模型new.model = glm(status ~ psa,family = binomial(link ="probit"))如何解释逻辑回归输出?

Call: 
glm(formula = status ~ psa + serbest_psa + cinko, family = binomial(link ="probit"), 
data = data) 

Deviance Residuals: 
Min  1Q Median  3Q  Max 
-2.3285 -0.6773 -0.6261 -0.5604 1.9500 

Coefficients: 
      Estimate Std. Error z value Pr(>|z|)  
(Intercept) -0.9697009 0.2409856 -4.024 5.72e-05 *** 
psa   0.0444376 0.0094368 4.709 2.49e-06 *** 
serbest_psa -0.0440718 0.0250486 -1.759 0.0785 . 
cinko  -0.0006923 0.0016984 -0.408 0.6835  
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

(Dispersion parameter for binomial family taken to be 1) 

Null deviance: 534.27 on 477 degrees of freedom 
Residual deviance: 477.07 on 474 degrees of freedom 
AIC: 485.07 

Number of Fisher Scoring iterations: 6 
+0

你的问题真的取决于你的目标,因为在现实生活中,没有正确的模型,但是你的目标是正确的方法。那么,你的客观预测能力?解释?根据您的洞察力创建一个好故事来说说?限制输入变量的数量?你在这里得到的信息就是在“psa”存在的情况下,其他2个变量没有主要影响。 – AntoniosK

+0

我对什么会影响响应变量感兴趣。我想在这种情况下,它只是psa,对吧? –

+0

嗯。在这种情况下 - 我的意思是这些变量的组合 - 这是您获得的主要洞察力。但是,这些变量中的每一个都可能会影响您的响应变量。那是你想知道的吗?如果是,为每个输入变量运行3个不同的'y〜x'模型。你对互动有兴趣吗?为每一对尝试'y〜x1 * x2'。很多事情要进行调查,因为您可以通过各种不同的方式来组合变量。 – AntoniosK

回答

2

号模型中的自变量的数量应取决于可用的自由度的数量,的多重共线性自变量以及模型的拟合。然而,这不是一个真正的R编程问题,所以你可能想在Cross Validated上提出这个问题。