我创建了以下代码,它计算一个人(通过他们的login_id)在一年中登录到程序的次数。Python中的计数和groupby
data1.query("'2015-12-01' <= login_date <= '2016-12-01'").groupby(['employer_key','account_id']).size().reset_index().groupby(['employer_key','account_id'])[[0]].count()
输出看起来是这样的:
employer_key account_id # times logged in
Apple X1 1
Google Y5 2
Facebook X3 4
Apple X2 2
Facebook Y2 1
我想算account_ids的数量为每个单独employer_key,这样我可以确定多个账户如何记录在每一个人的雇主在一年的时间。
输出会希望是这个样子:
employer_key user_logins
Apple 2
Google 1
Facebook 2
多少*独特*帐户? –
在我的实际数据集中,我有数千人。 – PhishFood
不,我的问题是,如果你想为每个雇主统计*独特*用户。我认为你的数据可能已经在该列中只有唯一的'account_id',所以它可能是一个争议点。 –