2017-09-16 23 views
1

我学习有R编程,并给出以下提示的问候季节性销售:[R和值

在新模式中,给出了两个在其他方面相同的每月周期;考虑到一月份是一月份,一月份是三月份,预测伊兰特的销售额有何差异?

我主要是在

elantra=read.csv("Week3_elantra.csv") 
train=subset(elantra, Year<=2012) 

工作与子集“火车”我为了查看ElantraSales值每月(1:12),让我知道,如果有一组表更好的方式来做到这一点,它返回一个二进制表中的每个ESales重视

table(train$ElantraSales, train$Month) 

我试图通过对1月和3相加ElantraSales值,然后减去他们找到的差异,以解决原来的问题

回答

1

如果目标是返回一个反映每个月的总销售额的对象,而不考虑年份,则这是一个潜在的dplyr解决方案。

library(dplyr) 

elantra <- read.csv("Week3_elantra.csv") 

elantra <- elantra %>% 
    filter(Year > 2012) %>% 
    group_by(Month) %>% 
    summarise(sales = sum(ElantraSales)) 

delta <- elantra$sales[which(elantra$Month == 1)] - elantra$sales[which(elantra$Month == 3)] 

如果您需要每年每个月的总销售额在group_by功能前一个月增加Year。另外 - 确保您的Year值是数字不是字符或使用as.numeric转换或过滤器将无法正常工作。