我想转置类似于下面的my.data
的数据集,然后对这些行进行求和。转置数据集
my.data <- "landuse units year county.a county.b county.c county.d
apple acres 2010 0 2 4 6
pear acres 2010 10 20 30 40
peach acres 2010 500 400 300 200"
my.data2 <- read.table(textConnection(my.data), header = T)
my.data2
所需的输出是:
counties all.fruit
county.a 510
county.b 422
county.c 334
county.d 246
我可以用下面的代码执行此操作。但是,下面的代码似乎是一定是巨大的矫枉过正。我希望有一个更简单的解决方案。
# transpose the data set
tmy.data2 <- t(my.data2)
tmy.data2 <- as.data.frame(tmy.data2)
# assign row names to the data set
my.rows <- row.names(tmy.data2)
transposed.data <- cbind(my.rows, tmy.data2)
transposed.data
# extract numbers to obtain row sums
fruit.data <- as.data.frame(transposed.data[4:dim(transposed.data)[1], 2:dim(transposed.data)[2]])
fruit.data2 <- as.matrix(fruit.data)
fruit.data3 <- matrix(as.numeric(fruit.data2), nrow=(dim(fruit.data2)[1]), byrow=F)
# sum fruit by county
all.fruit <- rowSums(fruit.data3, na.rm=T)
# create row names for summed fruit data
counties <- my.rows[4:length(my.rows)]
almost.final.data <- cbind(counties, all.fruit)
really.final.data <- as.data.frame(almost.final.data)
really.final.data[,2] <- as.numeric(as.character(really.final.data[,2]))
really.final.data
str(really.final.data)
谢谢你的任何建议。我可以使用上面的代码,但查看这个请求是一个大大提高我的编程的机会。
为什么不只是'colSums(my.data2 [,4:7])'? (这会得到一个有名的向量,但将其转换为数据帧会很容易)。真正的问题比这更复杂吗? –
感谢您的建议。我猜想,一旦我开始考虑我所关注的行数,甚至不考虑列总和。 –
如果可以的话,我会给你+10来展示你的尝试。 –