2014-01-17 105 views
0

我有这种格式的数据:R:图表一总结运行总计

Count, Thread1, Thread2, Thread3, Thread4, 
10420162, 589768 
46530936, 1164357 
55563161, 275521, 12289 
56741671, 25158, 28020 
57792881, 44468, 91248 

(作为额外的线程进来玩,数据显示在其列)

我想绘制线程数据的总和(运行总数)与计数相关,例如,当x是0时,y是0;当x是10420162时,y是589768;当x是46530936时,y是1754125;当x是55563161时,y是2041935等等。

不清楚我能做到这一点 - 大概需要至少两个步骤 - 总结数据,然后绘制它?

+0

你想太概括了线程,或者您单独绘制每个威胁? – James

回答

1

您计算的数字与我的不匹配,所以我有一种感觉我没有正确理解您的问题。还是你计算错了?

df <- read.csv(tex`t`Connection('Count, Thread1, Thread2, Thread3, Thread4, 
10420162, 589768 
46530936, 1164357 
55563161, 275521, 12289 
56741671, 25158, 28020 
57792881, 44468, 91248'), header=TRUE) 


dfcumsum <- data.frame(
count = df$Count , 
cumthreadsum = cumsum(rowSums(df[,-1], na.rm = TRUE)) 
) 

输出 -

> dfcumsum 
    count cumthreadsum 
1 10420162  589768 
2 46530936  1754125 
3 55563161  2041935 
4 56741671  2095113 
5 57792881  2230829 

最基本的情节将是plot(dfcumsum$cumthreadsum)

+0

道歉,我的最终数字计算出现了一个(小的)错误 - 不知道我是如何做到的 - 现在已经修复。 我知道如何将csv数据读入框架,并且看起来您已经为我确定了问题。我会测试它。 – adrianmcmenamin