我有一个数据集类似于下面的文件重采样与熊猫
2013-05-30 06:00:41 173.199.116.171
2013-05-30 06:05:41 61.245.172.14
2013-05-30 06:10:42 74.86.158.106
2013-05-30 06:20:42 61.245.172.14
我想重新取样,20分钟,得到一定20分钟时隙中的命中次数(例如之间。(06.00.00 -06.20.00或06.40.00-07.00.00等)。我可以打印命中计数整个数据文件,如下所示。
ips = df.groupby('IP').size()
如何获得各20个分钟时间段命中计数?继代码只是打印'06:00:00'和'06:20:00之间的所有IP地址“。
个df_s = df['IP'].resample('20t', how='count')
print df['IP'].between_time('06:00:00', '06:20:00')
什么是您的df_s样子?我不认为我可以用熊猫0.11复制它。我的6:00插槽包含三个匹配,而我的6:20插槽1.您是否尝试设置'closed ='和'label ='关键字?默认的箱子定义可能与你所期望的不同。 –
@Rutger Kassies这个怎么样?但是我必须指定时间段?新= DataFrame(df ['IP']。between_time('06:00:00','06:20:00')) t = new.groupby('IP')。size() –