2013-07-09 114 views
1

我有一个熊猫数据框,它有一个包含路径数据的列。 df ['Path']里面的数据有点像下面的东西计算熊猫数据帧中的路径数据

/js/jquery.validate.js 
/paidadsimages/arangaya.png 
/images/sinhala-banner.jpg 
/js/jquery.validate.js 

我想统计唯一路径的排序和显示。我的预期输出是类似如下:

/js/jquery.validate.js 2 
/paidadsimages/arangaya.png 1 
/images/sinhala-banner.jpg 1 

无法弄清楚如何做到这一点?

回答

2

你可以简单地做:

df.groupby('Path').count().sort('Path', ascending=False) 

          Path 
Path        
/js/jquery.validate.js   2 
/paidadsimages/arangaya.png  1 
/images/sinhala-banner.jpg  1 
+0

哦!我并不觉得这很简单:( –

+0

好吧,熊猫使它看起来很简单,因为“幕后”的所有善良。:) –

+0

肯定!我在你的答案中使用了size()而不是count。:)谢谢! –