2017-06-19 48 views
1

考虑这种情况:功能,其复制dplyr GROUP_BY(多变量)函数中的R

Python pandas equvilant to R groupby mutate

dplyr

df = df%>% group_by(a,b) %>% 

意味着第一数据帧由a列分组然后通过b

在我的情况下,我想首先按group_name列将我的数据分组,然后按user_name,然后按type_of_work。有三列以上(这就是为什么我感到困惑),但我需要按照这三个标题按照相同的顺序分组数据。在这个阶段之后,我已经有了一个算法来处理列。我只需要一个算法来创建根据这三列分组的数据帧。

在我的情况下,重要的是序列被保存为dplyr函数。

我们有什么类似的pandas数据框?

+0

您是否阅读过[docs](http://pandas.pydata.org/pandas-docs/stable/groupby.html)? – EdChum

+0

试试df.groupby? –

+0

@EdChum我在使用groupby和apply方法时被卡住了,因为显然groupby不能轻松地分配给数据框。 –

回答

0

分组= df.groupby([“一”,“B”])

了解更多关于“裂应用于-结合”策略,在大熊猫文档,看看这些问题大熊猫如何处理相比于R 。

从您的评论看来,你似乎要分配分组帧。您可以通过API使用groupbyobject,例如grouped.mean(),也可以迭代groupby对象。您将在每个循环中获得名称和组。