1
我期待在数据框被分组之后得到某些数据框中某些值的总和。了解pandas中的groupby
一些样本数据:
Race officeID CandidateId total_votes precinct
Mayor 10 705 20 Bell
Mayor 10 805 30 Bell
Treasurer 12 505 10 Bell
Treasurer 12 506 40 Bell
Treasurer 12 507 30 Bell
Mayor 10 705 50 Park
Mayor 10 805 10 Park
Treasurer 12 505 5 Park
Treasurer 12 506 13 Park
Treasurer 12 507 16 Park
要获得的选票为每名候选人的总和,我可以这样做:
total_votes = df.groupby('officeID').sum().total_votes
print total_votes
officeID
10 110
12 114
:
cand_votes = df.groupby('CandidateId').sum().total_votes
print cand_votes
CandidateId
505 15
506 53
507 46
705 70
805 40
每处获得总票数
但是如果我想要得到每个候选人得票数的百分比呢?我需要在每个数据对象上应用某种功能吗?理想情况下,我想最终的数据对象的样子:
officeID CandidateID total_votes vote_pct
10 705 70 .6363
10 805 40 .37