1
我有23000行8列一个子集数据框
一个数据帧我想只用唯一标识符是在第1列我这样做的,
total_res2 <- unique(total_res['Entrez.ID']);
这将产生17,000至其子集行只有第1列的信息。
我想知道如何提取基于此列的唯一行,并从其他7列中仅使用这些唯一行获取信息。
我有23000行8列一个子集数据框
一个数据帧我想只用唯一标识符是在第1列我这样做的,
total_res2 <- unique(total_res['Entrez.ID']);
这将产生17,000至其子集行只有第1列的信息。
我想知道如何提取基于此列的唯一行,并从其他7列中仅使用这些唯一行获取信息。
这返回的total_res
包含每个Entrez.ID
值的第一个出现的行:
subset(total_res, ! duplicated(Entrez.ID))
还是你的意思是你只需要行其Entrez.ID
不重复:
subset(total_res, ave(seq_along(Entrez.ID), Entrez.ID, FUN = length) == 1)
下一次请提供测试数据和预期输出。
非常感谢,完美的工作! – user3294511