2014-03-02 108 views
11

有没有办法像DataFrameGroupBy.agg函数一样将函数列表应用于DataFrame中的每一列?我发现了一个丑陋的方式做到这一点是这样的:熊猫如何将多个函数应用于数据框

df=pd.DataFrame(dict(one=np.random.uniform(0,10,100), two=np.random.uniform(0,10,100))) 
df.groupby(np.ones(len(df))).agg(['mean','std']) 

     one     two 
     mean  std  mean  std 
1 4.802849 2.729528 5.487576 2.890371 

回答

11

大熊猫0.20.0或更新的版本,使用df.agg(感谢艾汉的pointing this out):

In [11]: df.agg(['mean', 'std']) 
Out[11]: 
      one  two 
mean 5.147471 4.964100 
std 2.971106 2.753578 

对于旧版本,你可以使用

In [61]: df.groupby(lambda idx: 0).agg(['mean','std']) 
Out[61]: 
     one    two   
     mean  std mean  std 
0 5.147471 2.971106 4.9641 2.753578 

另一种方法是:

In [68]: pd.DataFrame({col: [getattr(df[col], func)() for func in ('mean', 'std')] for col in df}, index=('mean', 'std')) 
Out[68]: 
      one  two 
mean 5.147471 4.964100 
std 2.971106 2.753578 
+1

'agg'现在可以作为一个数据帧的方法所以这个作品,未经伎俩:'df.agg( ['mean','std'])''。 – ayhan

+0

@ayhan:非常感谢您的改进。 – unutbu

5

在你有任意函数和列名一般情况下,你可以这样做:

df.apply(lambda r: pd.Series({'mean': r.mean(), 'std': r.std()})).transpose() 

     mean  std 
one 5.366303 2.612738 
two 4.858691 2.986567 
相关问题