我一直在尝试自己并在网络上搜索了一段时间,并且没有成功。我有一个数据框,它是应用条件和选择投影的子集,但无法检索汇总输出。使用聚合函数来计算数据框架中的输出
数据帧mydf
:
mydf = list()
mydf = cbind(mydf,
c("New York", "New York", "San Francisco"),
c(4000, 7600, 2500),
c("Bartosz", "Damian", "Maciej"))
mydf = as.data.frame(mydf)
colnames(mydf) = c("city","salary","name")
假设给定的数据帧的一部分,与返回:
subset(mydf, city == "New York", select = c(salary, name))
它会返回一个数据帧,例如:
salary name
9 4000 Bartosz
10 7600 Damian
现在我需要计算从给定的工资a sum
,avg
并选择与来自上述数据帧,优选地使用一衬垫通过修改上面的代码至少工资雇员(我猜测这是可能的),以便它返回:
为sum
:11600
为avg
:5800
为至少4000巴尔托什
我试过的东西:(1)
subset(mydf, city == "New York", select = sum(salary))
或(2)
x = subset(mydf, city == "New York", select = salary)
min(x)
和许多组合,其仅产生错误说摘要函数仅与所有变量是一个数据帧上定义的数字(2)或相同的输出作为第一代码,而无需sum
(1)
谢谢你解释为什么在这种情况下使用列表来构造数据框是一个不好的选择。我决定重新整理我的数据框。 –