我有一个熊猫数据帧与数千行的,和这些的cols:熊猫据帧GROUPBY采用聚集
Name Job Department Salary Date
我想回到一个新的DF两个的cols:
Unique_Job Avg_Salary
的代码我用来做到这一点:
jobs = df.groupby(['Job'])
dict = {}
for a,b in jobs:
dict.update({a: b['Salary'].mean()})
dfJobs = pd.DataFrame(dict.items(), columns=['Unique_Job', 'Avg Salary'])
但是,我知道必须有更好的办法。想法?谢谢。
你刚刚在'jobs ['Salary']。mean()'上面,因为你已经在作业上分组了,所以我不明白是否需要再次迭代作业? – EdChum
我认为EdChum将它击中鼻子。 mean()将聚合每个组的数据。 – zach