2014-10-01 23 views
3

因此,我有一个分层信息存储在一个熊猫数据框中,我想根据这些信息构建和可视化分层树。用熊猫创建和绘制Python中的分层树

例如,在我的数据帧的行具有列标题 - [“动物门”,“类”,“订单”,“家庭”,“属”,“种类”,“亚种”]

我想在每一行创建一棵树,其中所有'Subspecies'都是唯一的字符串,并且应该在树中离开。有人可以指点我最好的方法/包等...为此?理想情况下,输出将是一个matplotlib对象。先谢谢你!

回答

1

您可以轻松地让他们在一个层次式指数与GROUPBY:

taxons = ['Phylum','Class','Order','Family','Genus','Species','Subspecies'] 
hierarchical_df = my_dataframe.groupby(taxons).sum() #sum or whatever is most appropiate for your data 

从那里,我也想这样做显示,层次结构有意义的情节 (见Hierarchic pie/donut chart from Pandas DataFrame using bokeh or matplotlib?