2016-06-14 88 views
-2

基于给定数据的下一个值,我代表侵犯每个year.How预测,在未来几年中的违规R.预测中的R

矢量
year <- c(190519, 223721, 235321, 101934) 

请帮我

+2

你不能。没有足够的信息来建立模型,更不用说预测模型。 – akash87

+0

如果您要实现任何预测,则需要更多的数据点和一些预测变量/解释变量 –

+0

您还可以对数据施加模型,例如, [AR(p)](https://en.wikipedia.org/wiki/Autoregressive_model),[MA(q)](https://en.wikipedia.org/wiki/Moving-average_model)或甚至收集[ARIMA(p,d,q)](https://en.wikipedia.org/wiki/Autoregressive_integrated_moving_average)模型。或者,更复杂的[状态空间模型](https://en.wikipedia.org/wiki/State-space_representation)。然而,这些模型需要更多的数据和其他假设。 – Therkel

回答

2

为了说明akash87和Dominic Comtols,这将是徒劳的很少的信息来预测所提出的意见,这里有一个线性模型的方法和可视化ggplot:

year<-c(190519 ,223721, 235321, 101934) 
df <- data.frame(year=1:4, crime= year) 
library(ggplot2) 

ggplot(df, aes(x=year, y=crime)) + 
     geom_point() + 
     geom_smooth(method="lm", fullrange=T) + 
     xlim(1,6) 

enter image description here

由于从看到通过外推6年线性模型的预测值可以在灰色区域内进行,即在-339737和537576之间。你最好只是猜测......

+0

您能否介绍一下这是如何工作的@Adam Quek –

+0

这是一个简单的线性回归模型,其中第一年有190519次违规,第二年有223721次违规,第三年有235321次违规,第四年有101934次违规(以点)。回归线对稀疏数据提供最佳拟合,而灰色区域表示回归模型的95%置信区间。 –

+1

请不要使用回归推断和预测。我这样做只是为了说明甚至尝试用4个数据点进行预测是多么荒谬。 –

1

数据集是一个可靠的预测太小了,但你可以尝试以下方法,只是为了说明上时间序列预测怎么能原则上获得的可能性:

year <- c(190519, 223721, 235321, 101934) 
library(forecast) 
yearforecasts <- HoltWinters(as.ts(year), beta=FALSE, gamma=FALSE) 
yearforecasts2 <- forecast.HoltWinters(yearforecasts,h=1) 
> yearforecasts2 
# Point Forecast Lo 80 Hi 80 Lo 95 Hi 95 
#5  190518.3 95821.09 285215.5 45691.42 335345.2 
plot.forecast(yearforecasts2) 

enter image description here

由于数据点的数量非常少,预测不准确,误差较大。正如在这个答案的开头和评论中所指出的,有用的预测需要更多的数据。出于同样的原因,用这种方法预测超过一年是不可能的。