2014-04-05 95 views
1

我有23000行8列一个子集数据框

一个数据帧我想只用唯一标识符是在第1列我这样做的,

total_res2 <- unique(total_res['Entrez.ID']); 

这将产生17,000至其子集行只有第1列的信息。

我想知道如何提取基于此列的唯一行,并从其他7列中仅使用这些唯一行获取信息。

回答

1

这返回的total_res包含每个Entrez.ID值的第一个出现的行:

subset(total_res, ! duplicated(Entrez.ID)) 

还是你的意思是你只需要行其Entrez.ID不重复:

subset(total_res, ave(seq_along(Entrez.ID), Entrez.ID, FUN = length) == 1) 

下一次请提供测试数据和预期输出。

+0

非常感谢,完美的工作! – user3294511