2014-09-04 20 views
4

我有一个很大的数据框。我想在数据框中对三列进行分组,然后对每个组应用一个函数。但是,我也对一些不在数据框中的组和键感兴趣。我如何将这些添加到groupby对象中,所以我可以在所有组上统一使用groupby.apply()熊猫python初始化groupby对象与空组

+0

如何合并,然后GROUPBY?你能给个例子吗? – Noah 2014-09-04 04:25:40

回答

4

我想我会在事后可能重新索引:

In [11]: df = pd.DataFrame([[1, 2, 3], [2, 1, 6], [2, 2, 9]], columns=['A', 'B', 'C']) 

In [12]: s = df.groupby(['A', 'B']).sum() 

In [13]: s 
Out[13]: 
    C 
A B 
1 2 3 
2 1 6 
    2 9 

例如,这里s没有对结果(1,1)。我们可以在“总量”指标与饲料MultiIndex.from_product(或者,如果你独立地具有它,在饲料):

In [14]: m = pd.MultiIndex.from_product([[1, 2], [1, 2]], names=['A', 'B']) 

In [15]: s.reindex(m) 
Out[15]: 
     C 
A B 
1 1 NaN 
    2 3 
2 1 6 
    2 9 
+0

这正是我想要做的。谢谢。 – svenkatesh 2014-09-04 13:20:22