之间的关系,考虑下面的数据帧:找到一个对一个,一到多,多到一列
first_name last_name
1 Al Smith
2 Al Jones
3 Jeff Thompson
4 Scott Thompson
5 Terry Dactil
6 Pete Zah
data <- data.frame(first_name=c("Al","Al","Jeff","Scott","Terry","Pete"),
last_name=c("Smith","Jones","Thompson","Thompson","Dactil","Zah"))
在这个数据帧中,有三种方式FIRST_NAME正在有关姓氏:
- 一对一(即,存在如first_name 和last_name之间的独特关系)
- 一对多(即,一个如first_name点被用于多个 last_name的值)
- 多对一(即多个FIRST_NAME值指向 一个姓氏)
我希望能够各自的三种情况,并将其输出到快速确定数据帧。因此,得出的数据帧将是:
一对一
first_name last_name
1 Terry Dactil
2 Pete Zah
一对多
first_name last_name
1 Al Smith
2 Al Jones
多对一
first_name last_name
1 Jeff Thompson
2 Scott Thompson
我想内做到这一点dplyr软件包。
你想'duplicateated()'函数 –
[这里](http://www.cookbook-r.com/Manipulating_data/Finding_and_removing_duplicate_records/)是一些使用'duplicated()'的例子代码,但我认为它会如果你能给我们一些具体的东西,请冷静一下,@RichardScriven。我并不是想解决这个问题。 TY。 –