功能，其复制dplyr GROUP_BY（多变量）函数中的R

Python pandas equvilant to R groupby mutate

在dplyr：

df = df%>% group_by(a,b) %>%

意味着第一数据帧由a列分组然后通过b。

在我的情况下，我想首先按group_name列将我的数据分组，然后按user_name，然后按type_of_work。有三列以上（这就是为什么我感到困惑），但我需要按照这三个标题按照相同的顺序分组数据。在这个阶段之后，我已经有了一个算法来处理列。我只需要一个算法来创建根据这三列分组的数据帧。

在我的情况下，重要的是序列被保存为dplyr函数。

我们有什么类似的pandas数据框？

来源

2017-06-19 Binamrata Sharma

您是否阅读过[docs]（http://pandas.pydata.org/pandas-docs/stable/groupby.html）？ – EdChum

试试df.groupby？ –

@EdChum我在使用groupby和apply方法时被卡住了，因为显然groupby不能轻松地分配给数据框。 –

分组= df.groupby（[“一”，“B”]）

了解更多关于“裂应用于-结合”策略，在大熊猫文档，看看这些问题大熊猫如何处理相比于R 。

从您的评论看来，你似乎要分配分组帧。您可以通过API使用groupbyobject，例如grouped.mean（），也可以迭代groupby对象。您将在每个循环中获得名称和组。

来源

2017-06-19 09:43:11

功能，其复制dplyr GROUP_BY（多变量）函数中的R

回答

相关问题