2016-07-13 128 views
2

我需要一些帮助来构建数据。所以我有以下DataFrame(称为df): the original dataframe熊猫用旧的列名创建一个新的数据框

我想根据Mean_CArea,Mean_CPressure和Mean_Force将我的数据帧分组。但是,我得到了以下结果:

wrongresult

正如你可能会看到列名不0,1,2 NATIVE_RH,ANATOMICAL_RH和NON_ANATOMICAL_RH。有没有办法从原始数据框中获取正确的列名称?

这里是我到目前为止的代码:

def function(self, df): 
    d = dict() 
    for head in df.columns.tolist(): 
     RH, j_mechanics = head 
     if j_mechanics not in d: 
      d[j_mechanics] = df[head] 
     else: 
      d[j_mechanics] = pd.concat([d[j_mechanics],df[head]], axis=1, ignore_index=True) 
    for df_name, df in sorted(d.items()): 
     print(df_name) 
     print(df.head()) 

提前非常感谢!

+0

您是否检查过'groupby'函数? http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html – jbndlr

回答

2

IIUC您可以通过列(axis=1),并通过第一级使用swaplevelgroupbylevel=0):

df = pd.DataFrame({('B', 'a'): {0: 4, 1: 10}, ('B', 'b'): {0: 5, 1: 11}, ('B', 'c'): {0: 6, 1: 12}, ('A', 'a'): {0: 1, 1: 7}, ('A', 'c'): {0: 3, 1: 9}, ('A', 'b'): {0: 2, 1: 8}}) 

print (df) 
    A   B   
    a b c a b c 
0 1 2 3 4 5 6 
1 7 8 9 10 11 12 
df.columns = df.columns.swaplevel(0,1) 

for i, g in df.groupby(level=0, axis=1): 
    print (g) 
    a  
    A B 
0 1 4 
1 7 10 
    b  
    A B 
0 2 5 
1 8 11 
    c  
    A B 
0 3 6 
1 9 12 
+0

非常感谢!这正是我正在寻找的! – arnold

+0

@arnold如果你觉得这篇文章有用,你可以加入它。 – piRSquared

1

你想用xs

df.xs('Mean_CArea', axis=1, level=1) 

df.xs('Mean_CPressure', axis=1, level=1) 

df.xs('Mean_Force', axis=1, level=1) 
+0

感谢您的帮助!它也可以工作! – arnold

+0

@arnold如果你觉得这篇文章很有用,你可以加入它。 – piRSquared

相关问题