2017-05-05 29 views
4

我有这样一本字典:快译通到大熊猫数据框 - 改变多指标行是列

my_dict = {'Key': {'Service': {'Number': 61, 'Percent': 2.54 }, 'Service2': {'Number': 42, 'Percent': 2.2 } }, 'Key2': {'Service3': {'Number': 8, 'Percent': 2.74}, 'Service2': {'Number': 52, 'Percent': 2.5 } }} 

我试图将其转换为一个数据帧大熊猫。我得到这个解决方案正常工作

pandas.concat(map(pandas.DataFrame, my_dict.itervalues()), keys=my_dict.keys()).stack().unstack(0) 

不过,我的问题是,我得到一个表,其中行索引服务&数/百分比的multindex。相反,我希望索引只是出现的不同的服务(而不是多索引),并且希望列像现在一样成为键,但1列部分为Number,第2列部分为所有键与百分之,如果这是有道理的。转置不是我想要的,因为我不希望整个索引改变,只是数字/百分比部分。我希望它看起来像这样,将它转换为我上面写的字典中的数据框后:

  Number   Percent 
      Key Key2 Key  Key2 
Service 61  NaN  2.54 NaN 
Service2 42  52  2.2  2.5 
Service3 NaN 8  NaN  2.74 

对此的任何建议?

+2

你能告诉所需的输出(和格式化代码块)? – IanS

+0

对不起,现在更新包括。 – jagold1

回答

3
pd.concat({k: pd.DataFrame(v) for k, v in my_dict.items()}) 

       Service Service2 Service3 
Key Number  61.00  42.0  NaN 
    Percent  2.54  2.2  NaN 
Key2 Number  NaN  52.0  8.00 
    Percent  NaN  2.5  2.74 

pd.concat({k: pd.DataFrame(v) for k, v in my_dict.items()}, axis=1).stack(0).T 

     Number  Percent  
      Key Key2  Key Key2 
Service 61.0 NaN 2.54 NaN 
Service2 42.0 52.0 2.20 2.50 
Service3 NaN 8.0  NaN 2.74 

这并不依靠内涵

pd.DataFrame(my_dict).stack().apply(pd.Series).unstack() 
# pandas.DataFrame(i).stack().apply(pandas.Series).unstack() 

     Number  Percent  
      Key Key2  Key Key2 
Service 61.0 NaN 2.54 NaN 
Service2 42.0 52.0 2.20 2.50 
Service3 NaN 8.0  NaN 2.74 
+0

谢谢你 - 我似乎得到了一个SyntaxError,当我尝试它时,它似乎指向了“for” - 关于为什么的任何想法? T.swaplevel(0,1,1).sort_index(1) ^ SyntaxError:无效的语法 – jagold1

+0

@ pandas.concat({k:pandas.DataFrame(v)for k,v in i.items()}) jagold1是的,你有一个错字'pandas.concat({k:pandas.DataFrame(v)for k,v in my_dict.items()})。T.swaplevel(0,1,1).sort_index(1)' – piRSquared

+0

对不起 - 错字在哪里?我指出的“我”与my_dict相同。我用相同的语法作为你的回应,我相信,但我使用的是熊猫而不是pd,否则应该这样工作? --- pandas.concat( {k:pandas.DataFrame(v)for k,v in my_dict.items()} ).T.swaplevel(0,1,1).sort_index(1) – jagold1

相关问题