我有一个数据框,其中每一行代表一个日期,其中一些事件记录在数据库中。Seaborn - 如何解释distplot中x轴的值?
每个事件都有一个它所关心的日期,所以例如一个在2017-02-03登录的事件可能属于2017-02-02(意思是它在事件发生后的第二天记录)。
我试图想象每一列的分布在distplot,获得当被记录的事件之间的距离的概念,而迄今为止,它涉及(“关于人们是否会记录事件同一天,后一天,甚至更晚?“)。
到目前为止,我已经创建了一个迭代每列并将其绘制成seaborn distplot的函数。然后
def plot(dates):
plt.figure(figsize=(45,25))
for date in dates:
sns.distplot(df[date], kde=False, bins=len(dates))
return
情节是这样的:
但是,我不知道如何解释在x轴上的值。
它显示范围从0到3500,这是什么意思?
有没有其他更好的方法来形象化?
您能更好地解释数据帧实际包含的内容吗?行中日期的含义是什么,列中日期的含义是什么,数据框中的数字是什么? – ImportanceOfBeingErnest
@ImportanceOfBeingErnest行索引是记录事件的日期,列标题中的日期是事件发生的日期。 例如在2017-02-02发生了前一天发生的1092个事件(2017-02-01)和发生在同一天的3136个事件(2017-02-02)。 行的总和会给你当天记录的总事件数,而列的总和会给出当天发生的总事件数。 – Marius
我认为这里的疑惑是,显然你可以在实际发生之前记录事件,例如,在2017-02-02有20个事件记录,只发生8天后(2017-02-10)。 – ImportanceOfBeingErnest