我从下面的熊猫数据框开始,我希望每天都进行分组,并创建一个名为'label'的新列,它用一个连续的数字标记组。我该怎么做呢?如何为熊猫群分配一个顺序标签?
df = pd.DataFrame({'val': [10,40,30,10,11,13]}, index=pd.date_range('2016-01-01 00:00:00', periods=6, freq='12H'))
# df['label'] = df.groupby(pd.TimeGrouper('D')) # what do i do here???
print df
输出:
val
2016-01-01 00:00:00 10
2016-01-01 12:00:00 40
2016-01-02 00:00:00 30
2016-01-02 12:00:00 10
2016-01-03 00:00:00 11
2016-01-03 12:00:00 13
所需的输出:
val label
2016-01-01 00:00:00 10 1
2016-01-01 12:00:00 40 1
2016-01-02 00:00:00 30 2
2016-01-02 12:00:00 10 2
2016-01-03 00:00:00 11 3
2016-01-03 12:00:00 13 3
仅供参考,我需要因为'sklearn.cross_validation.LabelKFold' –