我试图运行使用statsmodels和熊猫数据框的多重OLS回归。对于不同的行,在不同的列中有缺失的值,并且我不断收到错误消息: ValueError:数组不能包含infs或NaNs 我看到了这个SO问题,它与此类似,但并不完全回答我的问题:statsmodel.api.Logit: valueerror array must not contain infs or nans使用statsmodels忽略多个OLS回归中的缺失值
我想要做的是运行回归并忽略所有行中缺少我在此回归中使用的变量的变量。现在我有:
import pandas as pd
import numpy as np
import statsmodels.formula.api as sm
df = pd.read_csv('cl_030314.csv')
results = sm.ols(formula = "da ~ cfo + rm_proxy + cpi + year", data=df).fit()
我想要的东西就像失踪=“下降”。 任何建议将不胜感激。非常感谢。
'〜'做什么? – Roman