2016-05-02 239 views
1

从以下数据集: enter image description here熊猫.groupby自动selecing列

我试图用.groupby创建一组从哪里获得每用户位置的平均状态计数。我已经通过使用

groupLoc = df.groupby('User Location') 
groupCount = groupLoc.mean() 
groupCount 

自动选择了用户位置和跟随者计数。现在我正在尝试为用户位置和状态计数做同样的事情,但它会再次自动包含跟随者计数。

enter image description here

任何人都知道如何解决这一问题?提前致谢!

回答

1

我认为你需要groupbymean

print df.groupby('User Location', as_index=False)['Follower Count'].mean() 
    User Location Follower Count 
0   Canada  1654.500000 
1   Chicago  9021.000000 
2  Indonesia  1352.666667 
3   London  990.000000 
4 Los Angeles CA  86.000000 
5   New York  214.000000 
6  Singapore  106.500000 
7   Texas  181.000000 
8    UK  2431.000000 
9  indonesia  316.000000 
10   null  295.750000 

print df.groupby('User Location', as_index=False)['Status Count'].mean() 
    User Location Status Count 
0   Canada 39299.000000 
1   Chicago 6402.000000 
2  Indonesia 12826.000000 
3   London 4864.666667 
4 Los Angeles CA 3230.000000 
5   New York 2947.000000 
6  Singapore 6785.500000 
7   Texas 901.000000 
8    UK 81440.000000 
9  indonesia 17662.000000 
10   null 29610.875000 
+0

工作就像一个魅力!谢谢 – user3394131

+0

超级,我尝试'as_index = False'来改进解决方案,以返回'DataFrame'。 – jezrael