-1
我有一个.dta格式的数据集,包含棒球运动员的身高和体重。我想计算每个体重值的平均身高。 从我所能找到的,我可以使用dplyr和“group_by”,但我的R脚本无法识别该命令,尽管已安装并调用该程序包。个人X值的平均Y值
谢谢!
我有一个.dta格式的数据集,包含棒球运动员的身高和体重。我想计算每个体重值的平均身高。 从我所能找到的,我可以使用dplyr和“group_by”,但我的R脚本无法识别该命令,尽管已安装并调用该程序包。个人X值的平均Y值
谢谢!
下面是一个使用从UCLA SOCR MLB HeightsWeights数据集中获得的棒球运动员身高和体重数据在基础R中编码的示例。
清理完数据后(一个玩家缺少体重),我将它发布到GitHub上,使其无需再次清理。
theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv"
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl")
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE)
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean,
data=theData)
head(aggData)
...和输出是:
> head(aggData)
WeightInPounds HeightInInches
1 150 70.75000
2 155 69.33333
3 156 75.00000
4 160 71.46667
5 163 70.00000
6 164 73.00000
>
问候,
莱恩
则u做'基地R'方法,即'aggregate'即'骨料(高度〜 (df1,tapply(height,weight,FUN = mean))' – akrun
@DespeRate - 使用'dplyr'时会收到什么错误信息? –
Aggregate做到了! @akrun – DespeRate