我有一个数据框有两列,一个用于基因符号,另一个用于功能途径。通路列具有重复值,因为每个通路都有许多基因。我想对这个数据集进行重新排序,以便每列都是单一的路径,这些列中的每一行都是属于该路径的基因。转置与重复数据帧
开始数据帧:
data.frame(pathway = c("p1", "p1", "p1", "p1", "p2", "p2", "p2"),
gene.symbol = c("G1", "G2", "G3", "G4", "G33", "G43", "G10"))
希望的数据帧:
data.frame(p1 = c("G1", "G2", "G3", "G4"), p2 = c("G33", "G43", "G10",
""))
我知道,并不是所有的列将是相同的长度,并且具有空白值优选到NAS。
由于列将不具有相同的长度,你真的最好创建一个标准的'list'而不是'data.frame',特别是因为第1行第1列与第1行第2列无关。 –