2014-01-29 117 views
13

pandas具有多层次的列名的支持:熊猫:多级列名

>>> x = pd.DataFrame({'instance':['first','first','first'],'foo':['a','b','c'],'bar':rand(3)}) 
>>> x = x.set_index(['instance','foo']).transpose() 
>>> x.columns 
MultiIndex 
[(u'first', u'a'), (u'first', u'b'), (u'first', u'c')] 
>>> x 
instance  first      
foo    a   b   c 
bar  0.102885 0.937838 0.907467 

这个功能是非常有用的,因为它允许在同一数据帧的多个版本,以与第一级附加“水平”列名(在我的示例instance)区分实例。

想象我已经有一个这样的数据帧:

    a   b   c 
bar  0.102885 0.937838 0.907467 

有一个很好的方式来增加另一个层次的列名,类似这样的行索引:

x['instance'] = 'first' 
x.set_level('instance',append=True) 
+2

我不*认为*有,但肯定应该有。我认为在github上有这个功能请求... –

+1

虽然它引发了一些有趣的问题,例如“如何在列级命名有两级时选择特定列?”。 – LondonRob

+2

x ['first'],x [(first','a')or x.xs('a',axis = 1,level = 1)? :s –

回答

19

试试这个:

df=pd.DataFrame({'a':[1,2,3],'b':[4,5,6]}) 

columns=[('c','a'),('c','b')] 

df.columns=pd.MultiIndex.from_tuples(columns) 
+0

有人可能会喜欢这个答案Romain [here](https:// stackoverflow.com .com/a/40225796/8508004)做类似的事情,但没有元组,因为所有相同的级别被添加。 – Wayne