2016-04-02 133 views
1

我有一个包含许多列的熊猫数据框,其中一列是“电影标题”,我想查找出现在最多行中的前5名电影标题,并将它们放置为降序订购。在熊猫数据框中对列进行分组和排序

例如:

movie title 

Title 1 
Title 2 
Title 2 
Title 3 
Title 3 
Title 3 

应该改为:

movie title  count 

Title 3   3 
Title 2   2 
Title 1   1 

它可以在相同或一个新的数据帧。我可能会错过一个简单的解决方案,因为我对熊猫非常陌生。谢谢你的帮助!

+3

获取coulmn'DF [ '电影标题']计数。 value_counts()' – Zero

回答

0

尝试

df.groupby('movie title')['movie title'].aggregate(['count']).reset_index().sort('count', ascending=False) 

还是按部就班

df = df.groupby('movie title')['movie title'].aggregate(['count']) 
df = df.reset_index() 
df = df.sort('count', ascending=False) 

的 '[]' 的总内是重要的

相关问题