1
我有一个熊猫数据框(df
)与我想基于另一个熊猫DataFrame(dfIdx
)中的信息相加的信息与相同的列和索引。特别是,如果df
的形式如下:累积和熊猫DataFrame与指标DataFrame
df = pd.DataFrame([[172770, 1442, 114581],[35464, 67062, 175285],[124399, 14294, 44104],[50608, 58802, 189253],[1000, 10000, 100000]],columns=['A','B','C'])
和dfIdx以下形式的:在df
dfIdx = pd.DataFrame([[0, 0, 1], [0, 0, 0], [0, 1, 0], [1, 1, 0],[0,0,1]],columns=['A','B','C'])
我想要的结果是行的累积和的行之前和包括在dfIdx
中值为1
。所以结果应该是这样的:
A B C
0 0 0 114581
1 0 0 0
2 0 82798 0
3 383241 58802 0
4 0 0 508642
对于额外的信用,我想就能够灵活地累积和如何追溯到包括贡献。例如,如果累积和窗口为1
,然后我只希望在一个最上一行包括,赋予结果:
A B C
0 0 0 114581
1 0 0 0
2 0 81356 0
3 175007 58802 0
4 0 0 289253
我意识到我给原来的例子并没有提供所有的我想要的行为例子,因此,建议的解决方案是不完整的。我用另一行增加了数据以提供更多不同的行为。
如果有帮助,提出的解决方案如果我将'df_group'修改为'dfIdx.loc [list(reversed(dfIdx.index))]。cumsum()。loc [dfIdx.index,x.name]'',下面的@ScottBoston似乎可以工作。还有其他建议吗? – DrTRD