真正的日期我有一个CSV与价值观一样预测,使用R dataframes,动物园和结果
ref_date;wings;airfoil;turbines
2015-03-31;123,22;22,77;99,0
2015-04-30;123,22;28,77;99,0
2015-05-31;123,22;22,177;02,0
2015-06-30;56,288;22,77;99,0
,我读入数据帧,并将其转换为一个时间序列,与
df_agg = aggregate(df$wings, by=list(date=df$ref_date), FUN=mean)
df_agg['date'] = as.Date(df_agg[['date']], format='%Y-%m-%d')
tt = xts(df_agg[,c('x')], order.by=df_agg$date)
所以现在我有tt
,xts
对象。要使用forecast
包,我必须把它转换为ts
对象,所以我用zoo
:
pred = forecast(zoo(tt))
df_pred = as.data.frame(pred)
但是,为了能够得到的结果与列的日期,而不是数字序列,我必须把它转换回来
zoo(df_pred, as.Date(as.numeric(rownames(df_pred))))
,现在我有一个像
Forecast Lo 80 Hi 80 Lo 95 Hi 95
2015-07-30 12 10 15 11 14
2015-08-31 13.4 11 15.4 11.2 13
结果有没有办法来完成相同的,而不必再次在数据框,xts,动物园,ts和动物园之间来回移动?
在Python,这将是像
from statsmodels.api import sm
df = pd.read_csv(file_csv)
df.index = pd.to_datetime(df.date, format='%Y-%m-%d')
y_pred = sm.ARIMA(df)
为什么Python大熊猫标记在这里? R有一个内置的[ARIMA方法](https://stat.ethz.ch/R-manual/R-devel/library/stats/html/arima.html)。 – Parfait
Python被标记为因为许多使用Python的数据科学家可以与R一起工作,并且Python示例可以帮助理解我试图用问题实现的内容。 – Ivan