我有一个R数据框,由两列组成:'基因'和'表达'。它有一些基因的重复行,但是这些重复的条目具有不同的表达式值。我想浓缩重复行,因此每个基因只有一行,并且该行具有最大的“绝对”表达式值。请参见下面的例子:有条件地从数据框中删除重复的行
对于这个数据帧...
df <- data.frame(Gene=c("AKT","MYC","MYC","RAS","RAS","RAS","TP53"),
Expression=c(3,2,6,1,-4,-1,-3))
Gene Expression
1 AKT 3
2 MYC 2
3 MYC 6
4 RAS 1
5 RAS -4
6 RAS -1
7 TP53 -3
我想这个输出..
Gene Expression
1 AKT 3
2 MYC 6
3 RAS -4
4 TP53 -3
我可以使用识别重复基因
duplicated(df$Gene)
但我不确定如何排除那些重复次数较小的绝对值。
诗 - 我在该R说大话新..
的可能重复的[R,有条件地去除重复行(http://stackoverflow.com/questions/10835284/r-conditionally-remove-duplicate-rows) – 2015-03-13 17:16:10