PROT PEP SD
1 XXX 4,54
1 XXX 5,56
1 XXY 4,67
1 XXZ 5,67
1 XXY 5,67
1 XXX 5,68
2 XXW 4,64
2 XXZ 4,54
2 XXW 5,56
2 XXX 4,67
2 XXX 5,67
我需要找出一种方法,通过prot和pep过滤数据,但只保留pep,其中有超过1个pep的prot - >,然后再次过滤以便每个pep值只有2最高SD保持(和总结这两个/除以2)为PROT1筛选,分组数据
输出:
PROT PEP SD
1 XXX 5.56+5.68 /2
XXY 4.67 + 5.67 /2
我想这可能是这样,如果我弄清楚拉姆达X后放什么:所以它需要三个最高价值,现在它给了我一个最高价值指数。
counts = (df6.groupby(['PROT','PEP])['SD']
.apply(lambda x: x.idxmax()))
与[上一个问题](http://stackoverflow.com/questions/29636451/grouping-and-filtering-data)有什么不同?此外,接受答案的答案很常见,答案的左上方会有一个空的刻度标记。 – EdChum
不同的是,另一个我自己做错了。我试图修改它,但没有成功。另一个是 - 前两个pep,但这个是所有pep(以及所有这些都发生超过一次),但是前3个SD值不是前3个PEP值。在我看到你的评论之前,我刚好在30秒之前就明白了接受的事情。抱歉。 – Maku
不用担心,不知道为什么有人低调,但也许你需要显示你已经尝试过,为什么你的努力不会产生你想要的东西 – EdChum