西南交通大学希望学院
摘要:本文收集自2005年1月至2016年4月我国国家财政预算收入数据进行深入分析,采用2005/01至2015/12作为分析的数据样本,进行异常值剔除以及缺失值填补后,分别通过确定性分析以及对残差序列的二次信息提取最终建立了残差自回归模型,最后根据模型对2016年1-4月的国内财政预收入数据进行预测。计算预测的相对误差,发现预测的准确性较高,进一步验证模型较为合理。
关键词:乘法模型;二次曲线回归模型;确定性模型;残差自回归模型
1引言
随着时代与社会发展,我国财政预算收入整体呈现出上升趋势,但是由于每年数据都有异常值或者是缺失值,对我国分析财政收入状况有一定的影响,因此本文基于对我国2005年1月至2016年4月的财政预算收入数据进行模型建立与分析,对财政收入数据依照建立的模型进行了预测,可以进一步证明所提模型在我国财政预算收入中有着较高的准确率。
2 实证分析
2.1样本采集
本文搜集了我国2005/01至2015/12的财政预算收入数据(见表2.1)。运用2005/01-2015/12样本容量为132的样本数据进行分析确定模型,结合2016/01-2016/04的样本数据进行模型预测。
2.2 直观分析与特征分析
2.2.1 直观分析
离群点是指一个时间序列中,远离序列的一般水平的极端大值和极端小值,会对以后的时间序列分析都会造成一定的影响,如:直接影响模型的拟合精度,甚至会导致一些虚的信息。所以,在分析数据以前,必须先检验并剔除样本中的离群点。可以很直观地发现样本数据较好,没有奇异值,不需要进行进一步的剔除。
2.2.2 特征分析
序列M0的样本均值为7567.120,中位数为7187.050,样本偏度为0.431823,样本峰度为2.270198,J-B统计量为7.244815,相伴概率为0.026718,小于0.05。
2.3相关分析
(1)自相关、偏相关系数检验
得到时间序列的样本自相关和偏相关系数图,序列M0的样本自相关系数函数具有递减的特征,说明序列具有一定的趋势性,而且样本偏相关系数不具有截尾性和拖尾性,所以,序列是非平稳的。
(2)单位根检验
由于序列M0的均值非0,而且随时间呈上升趋势,故采用具有常数项和趋势性的ADF检验对其进行单位根检验。检验t统计量的值是0.473489,大于各个显著性水平下的临界值,所以不能拒绝原假设。也就是说,序列M0存在单位根,因此该序列是非平稳的。
2.4 建立确定性模型
2.4.1 确定性分析模型
从M0的线形图可以看出,由于增长期趋势和季节波动同时作用于M0上,且季节效应和不规则因素的波动围绕长期趋势上下波动表现为大于1的系数,因此尝试采用乘法模型来拟合序列M0:
2.4.2季节效应分析
(1)计算季节指数
对序列M0进行季节调整,则季节指数如表2.2所示。从季节指数表可知:当t为某年第i个月时,为第i个月的季节指数,得到了季节效应
。
表2.2 季节指数表
月份 | 季节指数 | 月份 | 季节指数 |
1 | 1.378269 | 7 | 1.160806 |
2 | 0.831021 | 8 | 0.810117 |
3 | 0.916998 | 9 | 0.873771 |
4 | 1.222170 | 10 | 1.104455 |
5 | 1.176870 | 11 | 0.794523 |
6 | 1.162502 | 12 | 0.789718 |
(2)消除季节影响
为消除季节影响,对序列作如下处理:
消除季节影响后的新序列为M0_SA,通过季节效应分析,基本上消除了季节性因素对于原序列的影响,只剩下长期波动趋势和随机波动的影响。
2.4.3 长期趋势分析
(1)拟合模型参数
依据上图的特点,可以看出长期趋势线性变化比较明显,因此分别尝用线性函数、二次曲线和三次曲线来拟合长期趋势波动。各个模型的结构、相应模型的剩余平方和值与Adjusted R-squared值如表2.3所示。
表2.3 剩余平方和值与Adjusted R-squared值
模型名称 | 模型结构 | 剩余平方和 | Adjusted R-squared |
线性 | T=1628.970+84.80050t | 37033841 | 0.975841 |
二次曲线 | T=1883.492+73.73435t+0.080775 | 35347845 | 0.976768 |
三次曲线 | T=2446.010+25.34667t+0.960535 | 29719370 | 0.980319 |
从剩余平方和与Adjusted R-squared值可以看出:线性拟合和二次曲线拟合的结果相差不大,但比三次曲线拟合的结果好很多。根据简约原则。选择线性拟合比较恰当。
(2)模型参数显著性检验
下面对线性拟合模型的参数进行显著性检验,各个系数的t统计量与相伴概率如表2.4所示。
表2.4 线性拟合t统计量与相伴概率表
系数值 | 标准差 | t统计量 | 相伴概率 | |
一次项系数 | 84.80050 | 1.148262 | 73.85118 | 0.000 |
常数项 | 1628.970 | 90.65817 | 17.96827 | 0.000 |
从相伴概率可以得出,全部拒绝原假设,也即是所有系数显著相关,因此选择模型:
最为恰当。
(3)剩余残差分析
剔除趋势估计和季节估计,得到新的序列M0_SA_T,其中有
从序列M0_SA_T的自相关函数可以看出此序列仍然存在一定的相关性,需要进一步差分提取相关信息。
2.5 残差分析
2.5.1直观分析与特征分析
(1)直观分析
对残差序列作单位根检验,检验统计量t的值为-3.090082,小于5%和10%显著性水平下的临界值,但是大于1%显著性水平下的临界值,因此对该序列再通过游程检验判断其是否平稳。
(2)游程检验
为有效验证序列是否平稳,进一步运用对M0_SA_T进行游程检验:发现|Z|=5.314>1.96,所以该序列具有趋势性,是非平稳的。
表2.5 序列M0_SA_T游程检验结果表
检验项目 | 检验值 |
均值 | 1.0097 |
小于均值的个案数 | 72 |
不小于均值的个案数 | 64 |
总样本容量 | 136 |
游程个数 | 38 |
检验统计量Z | -5.314 |
Asymp显著性 | 0.000 |
2.5.2 残差序列平稳化处理
(1)消除趋势性
为消除趋势性成分,首先对残差序列M0_SA_T进行一阶逐期差分,即
差分后序列M0_SA_T1(t)在零点上下波动,从序列M0_SA_T1(t)的自相关系数图可以看出,当滞后期K=12、24、36时,该序列的样本自相关系数与0有显著差异。表明序列M0_SA_T1具有周期为12个月的季节波动。因此,对差分序列M0_SA_T1进行一阶季节差分,有
因此,为了消除该序列季节效应,对季节差分序列M0_SA_T1_12进行单位根检验。
表2.6 季节差分序列的ADF检验
检验项目 | 检验值 |
均值 | 0.00 |
小于均值的个数 | 61 |
不小于均值的个数 | 62 |
总样本容量 | 123 |
游程个数 | 64 |
检验统计量Z | 0.272 |
Asymp显著性 | 0.785 |
因为|Z|=0.272<1.96,这说明经过一次季节差分后的序列不具有潜在的趋势性和周期性,因此,可以判断序列M0_SA_T1_12是平稳的。
(2)对序列M0_SA_T1_12模式识别
该序列的样本均值已经为零,样本自相关系数较大,其余较小,而且当k>3时,样本自相关系数的绝对值都落在此范围内,故可以认为样本自相关系数在3步之后截尾。因此,可以用ARMA(4,3)、AR(3)、MA(3)模型对序列M0_SA_T1_12(t)进行拟合。
(3)模型的参数估计与检验
得到各个模型参数的最小二乘估计、模型的剩余平方和和模型的AIC值,具体数值如表2.7所示。结合AIC值和剩余平方和值的大小,可知零均值序列M0_SA_T1_12(t)利用ARMA(4,3)进行拟合。
表2.7 序列M0_SA_T1_12(t)的各个模型的结果
模型 | 参数最小二乘估计 | 剩余平方和 | AIC |
AR(3) |
| 0.539 | -2.519 |
MA(3) |
| 0.586 | -2.460 |
ARMA(4,3) |
| 0.415 | -2.703 |
对序列M0_SA_T1_12(t)的ARMA(4,3)模型参数进行检验。由检验可知利用ARMA(4,3)对该样本时间序列进行拟合比较恰当.故我国国家财政预算收入月度数据M0(t)的模型为ARMA(4,3)。
3 模型预测
运用以上得到的分析结论以及模型公式,计算可得2016年全年的残差序列值、趋势项值、季节项值以及预测值(见表3.1)
表3.1 预测结果表
时间 | 残差 | 趋势项 | 季节项 | 预测值 | 实际值 | 相对误差 |
2016m01 | 1.04305 | 12907.4356 | 1.378269 | 18555.8 | 17166.3 | 8.09% |
2016m02 | 1.00587 | 12992.237 | 0.831021 | 10860.2 | 10218.5 | 6.28% |
2016m03 | 0.95541 | 13077.0375 | 0.916998 | 11456.9 | 11511.2 | 0.472% |
2016m04 | 0.94255 | 13161.838 | 1.222170 | 15161.9 | 15522.9 | 2.33% |
由表3.1可知,其相对误差均较小,说明预测效果较好,进一步验证了模型的正确性。
4 结束语
本文对我国国家财政预算收入的往年数据进行了时间序列模型分析,可以预测到未来财政预算收入,通过对模型检验可以发现本文所提模型具有显著性,再对预测值与实际值进行了误差分析可以得出本文所提模型对未来我国财政预算收入的预测具有较高的精确度。
参考文献
[1]肖维泽,纪明.经济增长率跌宕下的中国民生发展—基于MS-VAR的实证研究[J].福建师范大学学报,2023(03):43-52.
[2]陈妍,田发.财政支农支出对农业经济增长的影响研究—以四川省为例[J].中国物价,2021(11):9-11.
[3]李宁,蒋玲,万鸾飞.光伏产业的投资收益的算法模型分析[J].集成电路应用,2022,39(03):122-123.
[4]朱根豪.财政支农对农民增收的影响研究[J].山西农经,2023(02):9-12.