编辑 我有如下一个数据框:请注意,COL1
是有重复的条目,COL2 & COL3可以以任意顺序即它们可以在数据帧的其他列之间的任何地方发生...并且对在数据帧列的确切数目没有限制..有可能晚太所附附加列.....的R - 取决于多个条件组合数据帧行
COL1 COL2 COL3 COL5 COL6 COL7 ... ... (goes on)
10 hai 2 15 10 6 ... ...
10 hai 3 25 20 12 ... ...
10 pal 1 35 30 18 ... ...
11 rfm 9 22 32 9 ... ...
9 rtf 8 34 54 10 ... ...
我也有如下的载体:
number <- c("first", "last")
我所要的输出是这样的,如下图所示:即
COL1
应该有单独的唯一项目(10,11,9)COL2
应包含其下的合并项没有重复项目(hai pal),不应将COL1值不同的唯一行用于合并。仅重复COL1值的行应该合并...和COL2可以在数据帧中的任何地方发生(它不会永远是第二列)COL3
应包含条目(总和2 + 3 + 1 = 6)。 单独计算重复行的总和。重复的行根据COL1值来标识...并且COL3也可以发生在数据框的任何地方(它不会总是第三列)。
而对于COL5
,COL6
,COL7
(ⅰ可以具有许多的列后面所附...没有必要使我对这个条件仅3列)我需要一个广义一段代码,使得如果输入从名为“number”的向量中作为“第一个”给出时,需要从所有其余列的重复行中首次观察到的值,即第一行值。如果输入是从名为“number”的向量中作为“last”给出的,则需要从所有其余列的重复行中得到最后一次观察值,即最后一行值。
注:输出应被存储在另一数据帧
输出(如果输入被给定为 “第一”):
COL1 COL2 COL3 COL5 COL6 COL7
10 hai pal 6 15 10 6
11 rfm 9 22 32 9
9 rtf 8 34 54 10
在上面的输出:COL5,COL6, COL7包含重复条目的第一行值
输出(如果输入为“最后”):
COL1 COL2 COL3 COL5 COL6 COL7
10 hai pal 6 15 10 6
11 rfm 9 22 32 9
9 rtf 8 34 54 10
在上面的输出:COL5,COL6,COL7包含重复的条目
我无法安装v1.9.7,因为它在Rv3.2.1中不受支持....获取以下错误 – Rambo
包'data.table'不可用(对于R版本3.2.1) – Rambo
@Rambo这很奇怪。新的R版本是R 3.3.1。更新到新的R版本更好。 – akrun