2017-06-22 12 views
0

当您运行s.expanding().func时,它将在系列尺寸不断增加的情况下运行func。 我有一个系列s索引是一个MultiIndex。重要的级别是日期。许多日期重复。我想运行expanding,以便每次迭代不会扩展1行,它会在整个下一个日期之前扩展。如何进行分组展开

这样做的哈克方法是按日期排序的列表上运行扩展,然后采取每个日期的最后一个实例,但我想知道是否会有更干净的方式做到这一点?

编辑: 我上面列出的方法是超慢,因为它在每一个位置计算,而不是每隔一次,所以我期待找到一种方法使其更快,并可能坚持与本地Numpy或熊猫功能

回答

0
cur_dat = pd.DataFrame() 
ret = {} 
for key, new_dat in df.groupby(group_keys) 
    cur_dat = cur_dat.append(new_dat) 
    #DO STUFF 
    ret[key] = return_Value 

这也给了你很多控制你想如何组合数据回来。有时候我会一直弹出,直到它的一系列并附加它(如meltR)。

简单的解决方案,只需要读取GroupBy和core.Windows中所有的熊猫源代码就可以了:)