我想在电子表格中执行一些看起来很容易的事情,但我无法在熊猫中找到语法。我有一个可以分组的数据集。我想确定每个组的聚合统计信息,但是然后使用聚合在原始数据框中创建一个新列。使用熊猫将聚合应用到原始数据框中
例如,如果我的数据帧是这样的:
d = pandas.dataframe({'class', : ['f1', 'f2', 'f3', 'f1'],
'user': ['jack', 'jen', 'joe', 'jan'],
'screen': [12, 23, 13, 15] })
是它比我的数据集
我想这样做
d['gp'] = d['screen'].apply(d.groupby('class').stdev())
,并保证要小得多d.groupby()。stdev()实际上是该行的该类的stdev。换句话说,我不想在计算类f2的gp时使用类f1的stdev。
我的大脑正在以电子表格模式或python for循环思考。我知道必须有一个简单的熊猫语法才能做到这一点 - 但到目前为止,我没有在我的搜索中找到任何似乎符合我的用例的东西。
没错。我有我的信 – Dark
不一样的信。我需要将聚合操作应用于原始数据框。但每个同意op(平均值,标准开发)必须为每个组计算 - 因此该组按 –
您是否需要'd ['screengrade'] = d.groupby('class')['screen']。transform lambda x:x /(x.std()+ x.mean())* 200)'?我只用手机,所以未经测试。 – jezrael