我正在处理一些聚类分析结果。我正在尝试为我正在进行的每个群集分析创建群集成员表。如何创建组成员的表格或数据框(从长格式数据中按组分组)?
例如:
test_data <- data.frame(
Cluster = sample(1:5,100,replace=T),
Item = sample(LETTERS[1:20],5, replace=F))
head(test_data)
Cluster Item
1 2 R
2 5 F
3 1 T
4 5 Q
5 3 B
6 3 J
我想产生这样的:
Cluster_1 Cluster_2 Cluster_3 Cluster_4 Cluster_5
T R C P L
K O J M Q
I H B N F
D G E
S A
我第一次尝试spread
,但并没有与这些数据进行工作
spread(test_data, item,group)
错误:行重复标识符
spread(test_data, group,item)
错误:重复标识符行
然后我试图:
test_frame <- split.data.frame(test_data,test_data$group)
但是,这会导致数据帧的列表,以及每个组的数据帧。我没有能够成功地将它变成我想要的东西。
我试过unnest
和unlist
,但由于每个组的成员元素数量不同,这些功能会给出错误。
引入NA就没问题。
有没有一种简单的方法可以实现我忽略的功能?
简洁并做好工作 - 谢谢! – JLC