2016-08-24 30 views
1

我想找出员工排名前3位的价格,但保留地方栏。按ID排名前3位价格

这一切看起来是这样的:

place<-c('Dest1', 'Dest2', 'Dest3', 'Dest4', 'Dest5', 'Dest6', 'Dest1', 'Dest2', 'Dest3', 'Dest4', 'Dest5', 'Dest6') 
rate <- c(0.5, 0.6, 0.7, 0.2, 0.5, 0.9, 0.8,0.9,0.2,0.5,0.3,0.7) 
employee <- c('A','A','A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B') 
employ.data <- data.frame(employee, rate, place) 

数据帧是这样的:

employee rate place 
1   A 0.5 Dest1 
2   A 0.6 Dest2 
3   A 0.7 Dest3 
4   A 0.2 Dest4 
5   A 0.5 Dest5 
6   A 0.9 Dest6 
7   B 0.8 Dest1 
8   B 0.9 Dest2 
9   B 0.2 Dest3 
10  B 0.5 Dest4 
11  B 0.3 Dest5 
12  B 0.7 Dest6 

如何通过employee提取前3速率和保持place列好。我知道dplyr中的group_by如何处理,但是这将消除place列。

我想最后的结果是这样的:

employee rate place 
2   A 0.6 Dest2 
3   A 0.7 Dest3 
6   A 0.9 Dest6 
7   B 0.8 Dest1 
8   B 0.9 Dest2 
12  B 0.7 Dest6 

谢谢!

+0

@akrun它不是一个重复的,但因为我想保持'place'列。我知道如何使用'group_by'。 –

+0

对不起。我重新打开并发布了一个解决方案。请检查。 – akrun

回答

1

经过'员工'分组后,我们可以从arrange'率'以降序排列,slice前3排。

employ.data %>% 
     group_by(employee) %>% 
     arrange(desc(rate)) %>% 
     slice(1:3) 

或者用filterrank通过 '员工' 分组后子集行。

employ.data %>% 
    group_by(employee) %>% 
    filter(rank(-rate) <4) 
#  employee rate place 
# <fctr> <dbl> <fctr> 
#1  A 0.6 Dest2 
#2  A 0.7 Dest3 
#3  A 0.9 Dest6 
#4  B 0.8 Dest1 
#5  B 0.9 Dest2 
#6  B 0.7 Dest6 

或用top_n这基本上是filter的包装与min_rank

employ.data %>% 
     group_by(employee) %>% 
     top_n(3, wt=rate)