0
我刚开始使用熊猫今天。我发现了一个教程,我可以创建一个看起来像从多维数据集列表的字典中获取熊猫数据框
foo one two
bar a b c
2 0 0 0
4 0 0 0
6 0 0 0
从代码
import numpy as np
import pandas as pd
arrays = [np.hstack([ ['one']*1, ['two']*2]), ['a', 'b', 'c']]
columns = pd.MultiIndex.from_arrays(arrays, names=['foo', 'bar'])
df = pd.DataFrame(np.zeros((3,3)), columns=columns, index=['2','4','6'])
print df
我想重复同样的事情,但创建一个字典数据框的表。
d={'a':[0,0,0], 'b':[0,0,0], 'c':[0,0,0]}
dd = pd.DataFrame(d, columns=columns, index=['2','4','6'])
print dd
但是我得到
foo one two
bar a b c
2 NaN NaN NaN
4 NaN NaN NaN
6 NaN NaN NaN
省略columns=columns
产生一个数据帧预期,但没有multiindexed列。关于如何在从字典创建的数据框中实现这些多索引列的想法?该文档似乎只包含具有多重索引的numpy数组。我会使用numpy,但是当创建数组的时候,如果不是每一行的长度都相等,我会遇到问题。我只得到一个1D numpy数组。我的数据大多数可能是字符串,如果这影响任何东西。
谢谢。我认为这是沿着这些线,但我不知道如何指定名称。 – Shatnerz