2017-10-28 206 views
0

所以我有一个数据集,看起来像:大熊猫功能操作

enter image description here

我想要聚合每个ORIGIN_CITY_NAME,算上在城市的独特运营商的数量。例如:

对于达拉斯/沃思堡,得克萨斯州:假设他们有4种不同的UNIQUE_CARRIER,如AA(美国航空),达美航空,西南航空和JetBlue。

那么输出应该是这样的:

Out[1]: 
    ORIGIN_CITY_NAME  # of unique carriers 
0 Dallas/Fort Worth,TX   4 
1 San Francisco, CA    5 
... 

任何想法?我想:

enter image description here

回答

1

所以,你需要像nunique

df.groupby('ORIGIN_CITY_NAME')['UNIQUE_CARRIER'].nunique()