1
考虑这种情况:功能,其复制dplyr GROUP_BY(多变量)函数中的R
Python pandas equvilant to R groupby mutate
在dplyr
:
df = df%>% group_by(a,b) %>%
意味着第一数据帧由a
列分组然后通过b
。
在我的情况下,我想首先按group_name
列将我的数据分组,然后按user_name
,然后按type_of_work
。有三列以上(这就是为什么我感到困惑),但我需要按照这三个标题按照相同的顺序分组数据。在这个阶段之后,我已经有了一个算法来处理列。我只需要一个算法来创建根据这三列分组的数据帧。
在我的情况下,重要的是序列被保存为dplyr
函数。
我们有什么类似的pandas
数据框?
您是否阅读过[docs](http://pandas.pydata.org/pandas-docs/stable/groupby.html)? – EdChum
试试df.groupby? –
@EdChum我在使用groupby和apply方法时被卡住了,因为显然groupby不能轻松地分配给数据框。 –