1
我有数据帧:熊猫:写数据帧到JSON
date id
0 12-12-2015 123
1 13-12-2015 123
2 15-12-2015 123
3 16-12-2015 123
4 18-12-2015 123
5 12-12-2015 456
6 13-12-2015 456
7 15-12-2015 456
我需要统计date
到id
我尝试df.groupby('id')['date'].count()
我需要(如日期不在ID,它等于0)
id date count
0 123 12-12-2015 1
1 123 13-12-2015 1
2 123 14-12-2015 0
3 123 15-12-2015 1
4 123 16-12-2015 1
5 123 17-12-2015 0
6 123 18-12-2015 1
7 456 12-12-2015 1
8 456 13-12-2015 1
9 456 14-12-2015 0
10 456 15-12-2015 1
而且它旁边写json
文件格式
{
"1234567890abcdef1234567890abcdef": {
"2016-06": 1,
"2016-05": 0,
"2016-04": 0,
"2016-03": 1,
"2016-02": 1,
"2016-01": 0
},
"0987654321abcdef1234567890abcdef": {
"2016-06": 1,
"2016-05": 1,
"2016-04": 1,
"2016-03": 0,
"2016-02": 0,
"2016-01": 0
}
}
我该怎么做?
你可以说,如果我有时间一定时期(例如'2014年12月1日 - 2016-07- 05'),但一些用户只有'2015-08-15'和其他日期。我怎样才能打印所有日期'df = df.groupby('id')。resample('D')。size()。reset_index(name ='val')'(不仅在某些日期之间,当他有'1') – ldevyataykina
以及如何将它添加到文件?我添加文件的结构,我该如何写这种格式? – ldevyataykina