2012-04-18 63 views
5

我已经使用熊猫数据框聚合数据。以下是显示的一些实际数据以及我如何汇总它。大熊猫聚合数据到一个numpy数组:数据结构转换

fdf.groupby(['row',col'])['percent'].sum()

http://pastebin.com/R8XWpgtU

我想这样做是创建这个(行=行,列= COL)的2D numpy的阵列。任何光滑的方式来做到这一点?

另一种方式我做了类似的事情是创建数据透视表

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

在这种情况下,我想转换此数据透视表到2d numpy的阵列。有没有办法让我索引到这张表的每个单元格。如果是这样的话,我可能会对桌子本身好。

回答

6

尝试:

result = fdf.groupby(['row',col'])['percent'].sum() 
result.unstack('col').values 

或者:

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values