|
前一篇和大家聊了非平稳时间序列的理论基础知识,重点介绍了ARIMA模型的建立过程。那本期将告诉大家如何用SAS软件玩转ARIMA模型,得到吃瓜群众心满意足的模型。
最近热热闹闹的里约奥运会落下了帷幕,26块金牌被我们收入囊中,虽然比不上北京奥运会时期的辉煌,但毕竟重在参与嘛。所以今天将利用历年中国运动员获世界冠军的金牌数,并试着预测未来。详见下表:
年份 1978 1979 1980 1981 1982 1983
金牌数 4 12 3 25 13 39
年份 1984 1985 1986 1987 1988 1989
金牌数 37 46 26 69 54 93
年份 1990 1991 1992 1993 1994 1995
金牌数 54 93 89 103 79 102
年份 1996 1997 1998 1999 2000 2001
金牌数 75 92 83 92 110 90
年份 2002 2003 2004 2005 2006
金牌数 110 84 101 106 141
辣么,模型的建立拆分成几个步骤:
Step1:建立数据集
4.png
(30.69 KB, 下载次数: 0)
Step2:绘制散点图
5.png
(7.57 KB, 下载次数: 0)
运行结果如下图:
6.png
(16.44 KB, 下载次数: 0)
散点图告诉我们的信息:
1. 这个时间序列是有显著的上升趋势,并非平稳时间序列;
2. 同时因该序列上升趋势近似线性,我们可采用一阶差分达到所需要的平稳化。
Step3:平稳化处理
在Step1中加入代码y=dif(x); 并绘制y*t的散点图,所以重新整合的代码为:
7.png
(44.78 KB, 下载次数: 0)
通过以上代码,我们完成了平稳化处理,再看下散点图,是不是很和谐呢?
8.png
(21.31 KB, 下载次数: 0)
Step4:平稳性检验
这步仅仅是为了更加说服自己和别人该序列是平稳的。看看我们的代码怎么来写:
9.png
(39.25 KB, 下载次数: 0)
我们可以看到:
1. 第一张图Autocorrelations告诉我们可以认为数据序列平稳;
2. P<0.001足以说明并非为白噪声序列,可进行下一步的分析;
Step5:拟合模型
Step4的结果告诉我们模型的自相关系数和偏相关函数1阶截尾,因此,我们可考虑建立AR(1)模型,继续加入代码:
建模结果如下:
13.png
(40.53 KB, 下载次数: 0)
1. Conditional Least Squares Estimation: 传达了参数估计显著,可建立ARIMA(1,1,0)模型;
2. 残差分析检验则提示ARIMA(1,1,0)模型是适应的。
Step6:模型的预测
终于到了最后的模型预测:
11.png
(19.33 KB, 下载次数: 0)
最后胜利的结果啦!
12.png
(36.76 KB, 下载次数: 0)
从图中可以看出,2007年中国冠军数为121,而实际则为123,说明预测效果很好。
如果您觉得本文不错,欢迎分享转发到朋友圈,谢绝任何形式的转载~
欢迎您邀请朋友关注微信号“统计211网( ID: tj211_com)”!
还可以扫一扫二维码关注我们哦~~
二维码.png.thumb.jpg
(26.78 KB, 下载次数: 0)
|
|