0
想要将数据从长格式转换为宽格式。 ColA总体上只需要一行。在ColB中ColB会出现重复,在这种情况下,我试图通过计数来聚合它。 ColF由sum()汇总。
s <- read_csv("sample.csv")
s_1 <- subset(s, select=c("ColA", "ColF"))
grp_by <- aggregate(. ~ ColA , data = s_1, FUN = sum)
head(grp_by)
不知道如何将列
更新的其余部分:基础上建议利用reshape2包
library(reshape2)
s <- read_csv("sample.csv")
s_1 <- subset(s, select=c("ColA", "ColF"))
grp_by <- aggregate(. ~ ColA , data = s_1, FUN = sum)
s2 <- dcast(s, ColA ~ ColB)
s3 <- dcast(s, ColA ~ ColC)
s4 <- dcast(s, ColA ~ ColD)
s5 <- dcast(s, ColA ~ ColE)
print(s2)
print(s3)
print(s4)
print(s5)
print(grp_by)
这是这些打印语句的输出。
我怎么能合并所有这些到一个数据帧?我的实际数据集是100万条记录 - 这个代码是否足够优化以便在其上运行,或者有更好的写入方式。感谢你的帮助。
看看这里http://stackoverflow.com/questions/ 5890584 /重塑数据 - 从长到宽格式 - r –
@DavidArenburg Than ks为您的建议。在使用reshape2之后更新了问题。你能否再次检查这个问题并适当地指导我。谢谢。 – prasanth
在这里看到如何提供一个可重复的例子和所需的输出http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example –