2017-02-27 19 views

回答

0

使用Pandas进行阅读时,您可以手动指定列名。

import pandas as pd 

file_name = r"/foo/bar/data.xlsx" 
columns = ["Foo", "Bar", "Baz"] 

df = pd.read_excel(file_name, header=None, skiprows=7, names=columns) 

设置辑阵级列:

df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]}) 
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")] 
df.columns = pd.MultiIndex.from_tuples(columns) 
+0

好的,但是数据集中的每一列都根据多个标题出现在不同的类别下,所以我如何能够保留层次结构?例如“Autumn”栏位在“Rice”标题下,并且在“Cereals and Millets”下再次出现。 –

+0

这就是为什么我问你认为什么是正确的。见编辑的答案。 – Batman

+0

好吧!我第一次处理这种类型的文件有点困惑,即使我不知道什么是适当的格式。感谢您的建议,我会尝试使用这一个。 –

相关问题