我有两个数据框,一个是Price,另一个是Volume。他们都是小时工,并且在同一时间段内(一年)。两个数据帧随机按日分组而不是小时
dfP = pd.DataFrame(np.random.randint(5, 10, (8760,4)), index=pd.date_range('2008-01-01', periods=8760, freq='H'), columns='Col1 Col2 Col3 Col4'.split())
dfV = pd.DataFrame(np.random.randint(50, 100, (8760,4)), index=pd.date_range('2008-01-01', periods=8760, freq='H'), columns='Col1 Col2 Col3 Col4'.split())
每一天都是一个SET,意味着值必须保持在一起。样品生成时,需要一整天。因此在这个数据集中会有一个样本(例如2008年2月2日的24小时)。我想为dfP生成一个185天(50%)的样本集,并从相同的日子获得卷,因此我可以生成一个总和产品。
dfProduct = dfP_Sample * dfV_Sample
我迷失在如何做到这一点。任何帮助表示赞赏。
OP想要采取年份样本,这不是正确答案,请再次阅读该问题 –