熊猫.groupby自动selecing列

我试图用.groupby创建一组从哪里获得每用户位置的平均状态计数。我已经通过使用

groupLoc = df.groupby('User Location') 
groupCount = groupLoc.mean() 
groupCount

自动选择了用户位置和跟随者计数。现在我正在尝试为用户位置和状态计数做同样的事情，但它会再次自动包含跟随者计数。

任何人都知道如何解决这一问题？提前致谢！

来源

2016-05-02 user3394131

我认为你需要groupby与mean：

print df.groupby('User Location', as_index=False)['Follower Count'].mean() 
    User Location Follower Count 
0   Canada  1654.500000 
1   Chicago  9021.000000 
2  Indonesia  1352.666667 
3   London  990.000000 
4 Los Angeles CA  86.000000 
5   New York  214.000000 
6  Singapore  106.500000 
7   Texas  181.000000 
8    UK  2431.000000 
9  indonesia  316.000000 
10   null  295.750000 

print df.groupby('User Location', as_index=False)['Status Count'].mean() 
    User Location Status Count 
0   Canada 39299.000000 
1   Chicago 6402.000000 
2  Indonesia 12826.000000 
3   London 4864.666667 
4 Los Angeles CA 3230.000000 
5   New York 2947.000000 
6  Singapore 6785.500000 
7   Texas 901.000000 
8    UK 81440.000000 
9  indonesia 17662.000000 
10   null 29610.875000

来源

2016-05-02 12:54:04 jezrael

工作就像一个魅力！谢谢 – user3394131

超级，我尝试'as_index = False'来改进解决方案，以返回'DataFrame'。 – jezrael

熊猫.groupby自动selecing列

回答

相关问题