我想绘制Y轴上的Date
和Y轴上的Revenue
。我有大约16000个客户的数据,每周收入总计。该数据集看起来像下面的例子中数据集(除了我有大约100周,16000个客户数据):在单个图上绘制数千个观测值
CustNum Date Revenue
1 2013-01-07 35
1 2013-01-14 23
1 2013-01-21 42
1 2013-01-28 65
2 2013-01-07 78
2 2013-01-14 48
2 2013-01-21 85
2 2013-01-28 34
我想用一条线绘制该数据在一个单一的情节上代表一个情节顾客。换句话说,情节将有超过16000行,每个客户每周显示Revenue
。
现在,我明白这个阴谋将是非常混乱的16000行,我想建议什么可能是一个更好的方式来绘制这个数据,所以它不是混乱。
我尝试下面的代码没有给我想要的结果:
p <- ggplot() + geom_line(data=res,aes(x=Date,y=Revenue,color=custnum))
这并没有给我多条线路为多个客户。
所以我基本上有两个问题:
什么能代表此数据更好的办法?
我们应该如何改进我的代码以在单个图上显示16000行? (我不关心这个问题很多,如果我能得到另一种方式来表示这个数据)
任何帮助,这将非常感激。
你试图用你的情节传达什么信息?顾客之间有一种普遍的倾向?或者另一方面,变化很大?决定要显示什么,然后选择_how_来显示它。 – 2014-11-04 00:03:05
在我绘制这些信息之后,我会试图证明某些营销活动会影响到所有客户的子集,我将在同一个图上进行子集展示。因此最终会显示营销活动的效果。 – Patthebug 2014-11-04 00:04:52
也许'geom_line(data = res,aes(x = Date,y = Revenue,group = CustNum),alpha = 0.2)'? – 2014-11-04 00:05:16