我的数据可能在给定日期有多个事件,或者在某个日期没有事件。我采取这些事件,按日期计算并绘制它们。但是,当我绘制它们时,我的两个系列并不总是匹配。将缺失的日期添加到熊猫数据框中
idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max())
s = df.groupby(['simpleDate']).size()
在上面的代码IDX成为范围的说30个日期。 09-01-2013至09-30-2013 但是S可能只有25或26天,因为在给定日期没有发生任何事件。然后我得到一个AssertionError的尺寸不匹配时,我尝试绘图:
fig, ax = plt.subplots()
ax.bar(idx.to_pydatetime(), s, color='green')
什么来解决这个正确的方法是什么?我想从IDX或(我宁愿这样做)中删除没有数值的日期,并将计数为0的日期添加到系列中。我宁愿使用0值的30天完整图表。如果这种方法是正确的,有关如何开始的任何建议?我需要某种动态reindex
功能吗?
这里的小号(df.groupby(['simpleDate']).size()
)的片段,发现没有条目04和05
09-02-2013 2
09-03-2013 10
09-06-2013 5
09-07-2013 1
哇谢谢!我并不完全了解重建索引的效果。 – KHibma
'reindex'是一个了不起的功能。它可以(1)重新排序现有数据以匹配一组新标签,(2)插入之前没有标签的新行,(3)填充丢失标签的数据(包括前向/后向填充)(4)选择行按标签! – unutbu
@unutbu这回答我也有一个问题的一部分,谢谢!但是想知道你是否知道如何动态地创建包含事件日期的列表? –