有人可以向我推荐线性回归包,它不仅可以运行回归,还可以计算每个回归系数的显着性标准(std/mean),并将它们与适当的(Nk)“自由度”的p值?或者至少会提供可用于计算的输出结果?回归系数的显着性检验
理想的情况下,为Python但需要R作为以及
谢谢!
有人可以向我推荐线性回归包,它不仅可以运行回归,还可以计算每个回归系数的显着性标准(std/mean),并将它们与适当的(Nk)“自由度”的p值?或者至少会提供可用于计算的输出结果?回归系数的显着性检验
理想的情况下,为Python但需要R作为以及
谢谢!
在R中,lm()
将拟合线性模型,并且summary()
给出全部输出,包括系数估计值,标准误差,t-统计量和p值。 https://stat.ethz.ch/R-manual/R-patched/library/stats/html/lm.html
太棒了!谢谢! Python中没有东西(例如scipy)? – Toly
我不太熟悉Python函数。 –
statsmodels提供了线性回归和其他估计模型的所有标准推论。
输出下面是这款笔记本 http://statsmodels.sourceforge.net/stable/examples/notebooks/generated/formulas.html
一些解释一个博客复制:
http://www.datarobot.com/blog/multiple-regression-using-statsmodels/
mod = ols(formula='Lottery ~ Literacy + Wealth + Region', data=df)
res = mod.fit()
print(res.summary())
OLS Regression Results
==============================================================================
Dep. Variable: Lottery R-squared: 0.338
Model: OLS Adj. R-squared: 0.287
Method: Least Squares F-statistic: 6.636
Date: Tue, 02 Dec 2014 Prob (F-statistic): 1.07e-05
Time: 12:52:16 Log-Likelihood: -375.30
No. Observations: 85 AIC: 764.6
Df Residuals: 78 BIC: 781.7
Df Model: 6
Covariance Type: nonrobust
===============================================================================
coef std err t P>|t| [95.0% Conf. Int.]
-------------------------------------------------------------------------------
Intercept 38.6517 9.456 4.087 0.000 19.826 57.478
Region[T.E] -15.4278 9.727 -1.586 0.117 -34.793 3.938
Region[T.N] -10.0170 9.260 -1.082 0.283 -28.453 8.419
Region[T.S] -4.5483 7.279 -0.625 0.534 -19.039 9.943
Region[T.W] -10.0913 7.196 -1.402 0.165 -24.418 4.235
Literacy -0.1858 0.210 -0.886 0.378 -0.603 0.232
Wealth 0.4515 0.103 4.390 0.000 0.247 0.656
==============================================================================
Omnibus: 3.049 Durbin-Watson: 1.785
Prob(Omnibus): 0.218 Jarque-Bera (JB): 2.694
Skew: -0.340 Prob(JB): 0.260
Kurtosis: 2.454 Cond. No. 371.
==============================================================================
Warnings:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
你看'lm' /'summary.lm'?在基地R? (技术上它在'stats'包中,但是当你运行R时会自动加载) –
我会推荐谷歌搜索“python linear regression example”,其中[first hit](http://www.dataschool.io/)线性回归在python /)带你到[这iPython笔记本](http://nbviewer.ipython.org/github/justmarkham/DAT4/blob/master/notebooks/08_linear_regression.ipynb),它提供了详细的演练Python中的线性回归。 [统计学习入门](http://www-bcf.usc.edu/~gareth/ISL/)是一个很好的R资源。 – Tchotchke
@Tchotchke - 伟大的链接!谢谢!使用那里的术语,我正在寻找一个“连续的,无监督的”模型,它将使用系数显着性标准来提供“降维”。我看到的问题是,当使用预构建的包时,并非所有的统计信息都很方便(甚至根本不可用)。更糟糕的是,获取可用于扩大假设检验的数据非常困难甚至不可能。 – Toly