我有一个这样的数据集(拆分与多个值与二进制值多colums单列):重塑数据
id value1 value2
1 A True
2 B False
3 A True
4 C True
我希望找出多个值的列,并将其转换为多列与真或假值。结果将是:
id value1.A value1.B value1.C value2
1 True False False True
2 False True False False
3 True False False True
4 False True False True
我不知道如何使用dcast为此。我自己写了一个函数,但它太慢了。它的代码是在这里:
to_multiple_columns <- function(col,attr_name){
elements <- names(table(col))
drops <- c("","True","False")
elements <- elements[ !elements %in% drops]
new_df <- data.frame(col) # to define data frame with nrows,ncols
if(length(elements) > 0){
new_attr_names <- paste(attr_name,elements,sep = ".")
for(j in 1:length(new_attr_names)){
new_df <- data.frame(new_df,grepl(elements[j],col))
}
drops <- c("col") #drop original col
new_df <- new_df[,!(names(new_df) %in% drops)]
names(new_df) <- new_attr_names
}
return(new_df)
}
这是简单的使用tidyverse的。 NA用填充代替。 – Bhail