1
包含在大熊猫GROUPBY聚合的输出所有可能的值或值的组合缺失值的组合。
例
例大熊猫据帧有三列,User
,Code
,并Subtotal
:
import pandas as pd
example_df = pd.DataFrame([['a', 1, 1], ['a', 2, 1], ['b', 1, 1], ['b', 2, 1], ['c', 1, 1], ['c', 1, 1]], columns=['User', 'Code', 'Subtotal'])
我想对User
和Code
组,并得到一个小计的每个组合User
和Code
。
print(example_df.groupby(['User', 'Code']).Subtotal.sum().reset_index())
我得到的输出是:
User Code Subtotal
0 a 1 1
1 a 2 1
2 b 1 1
3 b 2 1
4 c 1 2
我怎么能包括表缺少组合User=='c'
和Code==2
,即使它不存在example_df
?
优选输出
下面是优选的输出,具有零线为User=='c'
和Code==2
组合。
User Code Subtotal
0 a 1 1
1 a 2 1
2 b 1 1
3 b 2 1
4 c 1 2
5 c 2 0