1
给定一个数据帧df
,我可以通过柱获得B列分组的两个组的大小和分钟A
df.groupby(['columnA']).size()
和各组内与塔B的mimimun值获得组通过柱A中的大小
df.groupby(['columnA']).agg({'columnB':min})
或(语法糖我猜)
df.groupby(['columnA'])['columnB'].min()
,但我怎么能OBT直接使用这两列的DataFrame?
在SQL中,如果你熟悉它,这将是您的任何线索就这么简单
SELECT count(columnA), min(columnB) FROM table GROUP BY columnA
感谢。
我认为你的第一个答案'df.groupby(['columnA'])。agg({'columnA':'size','columnB':'min'})'在现实世界中更普遍和有用。我会建议将其添加回来。 – mmj
@mmj当然,我可以添加关于使用字典的blurb。 – miradulo
您可能有兴趣处理此问题的后续处理:http://stackoverflow.com/q/42399574/694360 – mmj