我正在尝试获取前一周的输入的相关值到下一周的输出。如何抵消熊猫皮尔逊与日期时间索引的相关性
为了这个例子我已经设置了它,每周的输入是下一周的输出,df.corr()
应该给出1.000000
的结果。
我原来的数据是这样的:在这里上传
Date Input Output
1/1/2010 73 73
1/7/2010 2 73
1/13/2010 3 2
1/19/2010 4 3
全样本数据: https://drive.google.com/open?id=0B4xdnV0LFZI1MzRUOUJkcUY4ajQ
这里是到目前为止我的代码:
import pandas as pd
df = pd.read_csv('pearson.csv')
df['Date'] = pd.to_datetime(df['Date'], errors = 'coerce')
df = df.set_index(pd.DatetimeIndex(df['Date']))
df = df[['Input', 'Output']]
x = df.corr(method = 'pearson', min_periods=1)
print(x)
而作为一个新手在这里就是我卡住了。我没有看到该函数中内置的shift
选项,并且不知道如何执行此操作。
任何和所有的帮助表示赞赏。
谢谢你,我
BTW这是每6天。 – piRSquared