我有以下数据框:大熊猫,重命名一个多指标列(数据的顺序被改变)
{'e1.data_280': {0: 10, 1: 20, 2: 30},
'e1.data_603': {0: 7, 1: 8, 2: 9},
'e2.data_280': {0: 30, 1: 20, 2: 10},
'e2.data_603': {0: 8, 1: 9, 2: 1}}
后:
df.columns = df.columns.str.split('.', expand=True)
它看起来像:
现在我想摆脱短语data_
:
落后下划线的三个数字:
cols = [item.split('_')[1] for item in df.columns.get_level_values(1)]
cols
['603', '280', '603', '280']
如果我取代旧的标签:
df.columns.set_levels(cols, level=1, inplace=True)
的数据被更改:
我看到cols
比第1级多重索引的名称多:
MultiIndex(levels=[['e1', 'e2'], ['data_280', 'data_603']],
labels=[[0, 0, 1, 1], [1, 0, 1, 0]])
但是,如何重命名数据框中第一级多索引列?
编辑:一种解决方法
df.unstack().reset_index()
与重命名列和分裂的列值一起工作:
我在运行代码时似乎得到了你想要的结果。 – GiantsLoveDeathMetal
但是,当我通过'inplace = True'时遇到错误,但是所需的df是我没有它的时候得到的。 – GiantsLoveDeathMetal
@GiantsLoveDeathMetal你运行的是什么熊猫版本? – Moritz