好的,第二个R问题快速连续。ddply +总结重复相同的统计功能,跨越大量的列
我的数据:
Timestamp St_01 St_02 ...
1 2008-02-08 00:00:00 26.020 25.840 ...
2 2008-02-08 00:10:00 25.985 25.790 ...
3 2008-02-08 00:20:00 25.930 25.765 ...
4 2008-02-08 00:30:00 25.925 25.730 ...
5 2008-02-08 00:40:00 25.975 25.695 ...
...
基本上通常我会用的ddply
和summarize
组合来计算歌舞团(例如意味着在整个一年每小时)。
在上面的例子中,我会创建一个类别,例如,小时(如strptime(data$Timestamp,"%H") -> data$hour
,然后跨过每一列的使用类别中ddply
,像ddply(data,"hour", summarize, St_01=mean(St_01), St_02=mean(St_02)...)
平均按类别。
,但这里是它得到粘。我有超过40列应对,我不准备将它们逐个输入为summarize
函数的参数我曾经在shell中编写一个循环来生成这段代码,但这不是程序员如何解决问题的方式吗?
所以祈祷告诉,没有人有更好的获得相同结果但键击较少的方法?
使用'numcolwise()' – Andrie
或者重塑'St'变量长,然后用你最喜欢的聚集功能'by','aggregate','ddply'由'C结合(小时,index)',其中'index'是重塑中创建的变量。 –
易点雅:-) – 2015-04-24 02:34:02