2017-11-25 100 views
-1

我有一个.dta格式的数据集,包含棒球运动员的身高和体重。我想计算每个体重值的平均身高。 从我所能找到的,我可以使用dplyr和“group_by”,但我的R脚本无法识别该命令,尽管已安装并调用该程序包。个人X值的平均Y值

谢谢!

+1

则u做'基地R'方法,即'aggregate'即'骨料(高度〜 (df1,tapply(height,weight,FUN = mean))' – akrun

+0

@DespeRate - 使用'dplyr'时会收到什么错误信息? –

+1

Aggregate做到了! @akrun – DespeRate

回答

1

下面是一个使用从UCLA SOCR MLB HeightsWeights数据集中获得的棒球运动员身高和体重数据在基础R中编码的示例。

清理完数据后(一个玩家缺少体重),我将它发布到GitHub上,使其无需再次清理。

theCSVFile <- "https://raw.githubusercontent.com/lgreski/datasciencedepot/gh-pages/data/baseballPlayers.csv" 
download.file(theCSVFile,"./data/baseballPlayers.csv",method="curl") 
theData <- read.csv("./data/baseballPlayers.csv",header=TRUE,stringsAsFactors=FALSE) 
aggData <- aggregate(HeightInInches ~ WeightInPounds,mean, 
       data=theData) 
head(aggData) 

...和输出是:

> head(aggData) 
    WeightInPounds HeightInInches 
1   150  70.75000 
2   155  69.33333 
3   156  75.00000 
4   160  71.46667 
5   163  70.00000 
6   164  73.00000 
> 

问候,

莱恩