题目:
影响云南省GDP的因素分析
影响云南省GDP的因素分析
建立模型
根据GDP的核算方法,我们首先在模型中引入四个变量,分别是:居民最终消费(X1),资本形成总额(X2),货物和服务净出口(X3),地方财政决算支出(X4)。通过查阅中国经济统计数据库,得到1990-2007年共18年的具体数据,列表如下:
表(1)云南省1990-2007年GDP及相关因素统计表
单位:亿元
| 年份 | GDP | 最终 消费 | 资本形 成总额 | 货物和服 务净出口 | 地方财政 决算支出 |
| 1990 | 451.67 | 298.97 | 132.16 | 20.54 | 90.76 |
| 1991 | 517.41 | 361.73 | 185.88 | 30.2 | 110.82 |
| 1992 | 618.69 | 413.48 | 254.15 | 48.97 | 121.59 |
| 1993 | 783.27 | 473.88 | 372.84 | -63.45 | 200.62 |
| 1994 | 983.78 | 576.5 | 437.78 | -30.5 | 203.73 |
| 1995 | 1222.15 | 697.85 | 496. | 25.66 | 235.0993 |
| 1996 | 1517.69 | 874.19 | 623.77 | 19.73 | 270.3945 |
| 1997 | 1676.17 | 1002.35 | 717.4 | -43.58 | 313.2012 |
| 1998 | 1831.33 | 1113.45 | 785. | -67.76 | 328.0023 |
| 1999 | 19.82 | 1286.18 | 761.83 | -148.19 | 378.0468 |
| 2000 | 2011.19 | 1524.48 | 746.15 | -259.44 | 414.1074 |
| 2001 | 2138.31 | 1473.3 | 957.96 | -292.95 | 496.4302 |
| 2002 | 2312.82 | 1581.97 | 920.5 | -1.65 | 526.06 |
| 2003 | 2556.00 | 1656.3 | 1188.55 | -288.83 | 587.3475 |
| 2004 | 3081.90 | 2042.43 | 1450.44 | -410.96 | 663.6354 |
| 2005 | 3461.73 | 2321.75 | 19.93 | -838.79 | 766.3115 |
| 2006 | 3988.14 | 2615.77 | 2386.22 | -995.27 | 3.5821 |
| 2007 | 4772.52 | 2908.08 | 2666.73 | -833.5 | 1135.2175 |
根据以上数据,分析被解释变量与四个解释变量的相关性,得到相关系数矩阵图表(2),如下:
表(2)相关系数矩阵图
根据变量间相关系数分析,我们先设定模型:
Y=β0+β1X1+β2X2+β3X3+β4X4+ui
对模型进行OLS检验的结果为:
表(3)回归分析结果
| Dependent Variable: Y | ||||
| Method: Least Squares | ||||
| Date: 12/21/10 Time: 17:11 | ||||
| Sample: 1990 2007 | ||||
| Included observations: 18 | ||||
| Coefficient | Std. Error | t-Statistic | Prob. | |
| C | -43.766 | 19.17224 | -2.276607 | 0.0404 |
| X1 | 1.000048 | 0.051675 | 19.35275 | 0.0000 |
| X2 | 0.9836 | 0.067192 | 14.63939 | 0.0000 |
| X3 | 1.071304 | 0.077683 | 13.79075 | 0.0000 |
| X4 | 0.157293 | 0.199096 | 0.790035 | 0.4437 |
| R-squared | 0.999637 | Mean dependent var | 1990.255 | |
| Adjusted R-squared | 0.999526 | S.D. dependent var | 1221.591 | |
| S.E. of regression | 26.59847 | Akaike info criterion | 9.629718 | |
| Sum squared resid | 9197.222 | Schwarz criterion | 9.877043 | |
| Log likelihood | -81.66746 | Hannan-Quinn criter. | 9.663820 | |
| F-statistic | 61.277 | Durbin-Watson stat | 1.656527 | |
| Prob(F-statistic) | 0.000000 | |||
整理得到模型:
Y = -43.766+ 1.000048*X1 + 0.9836*X2 + 1.071304*X3 + 0.157293*X4
(-2.276607)(19.35275)(14.63939)(13.79075)(0.790035)
R2=0.999637 DW=1.656527 F=61.277
回归结果分析:
由R2=0.999637=0.999526,可以看出模型整体上拟合程度高;F=61.277>F0.05(4,13)= 3.18(显著性水平为α=0.05),表明模型从整体上看,云南省GDP和各解释变量间线性关系显著。
四、检验和修正模型
(一)经济意义检验
根据上面的结果,云南省GDP的增长与居民最终消费的增长、资本形成总额的增长、货物和服务净出口的增长、地方财政决算支出的增长呈正相关,符合经济意义。
(二)统计检验
1.多重共线性检验
(1)多重共线性的诊断
采用简单相关系数法诊断,得到相关系数矩阵:
表(4)相关系数矩阵
由上图表(4)即相关系数矩阵图可以看出,解释变量之间存在着高度线性相关。同时,由表(3)回归分析结果也可以看出,尽管整体上线性回归拟合较好,但自变量X4的参数t值不显著,且P= 0.4437>0.05,表明模型中解释变量可能存在多重共线性。
(2)用逐步回归法修正多重共线性
第一步,分别作Y与X1,X2,X3,X4间的回归:
① Y=21.11950+1.526287X1
(0.310633) (33.75675)
R2=0.986153 DW=0.857105
②Y=442.5914+1.631546X2
(4.837336) (21.18228)
R2=0.965568 DW=0.678705
③Y=1166.873-3.432532X3
(8.1478) (-9.566390)
R2=0.851185 DW=1.020358
④Y=1.4486+4.190203X4
(2.968713) (33.72838)
R2=0.986130 DW=0.787699
可见四个一元回归模型中云南省GDP与居民最终消费额X1的线性关系最强,拟合程度最好。Y与X1、X2、X3、X4的一元回归方程的R2值依次是0.986153,0.965568,0.851185,0.986130。显然,按照R2值大小排列四个解释变量依次为X1,X4,X2,X3以此为依据,依次逐步带入各个解释变量,采用逐步回归法修正多重共线性。结合经济意义和统计检验,因云南省GDP与居民最终消费的线性关系最强,拟合程度最好,是效果最好的一元回归模型,选为初始的回归模型:
Y = 21.119495704 + 1.52628678529*X1
(0.310633) (33.75675)
R2=0.986153 DW=0.857105 F=1139.518
第二步,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程,见表(5)。
表(5)逐步回归结果表
| C | X1 | X4 | X2 | X3 | D.W. | ||
| Y=f(X1) | 21.11950 | 1.526287 | 0.985288 | 0.857105 | |||
| T值 | 0.310633 | 33.75675 | |||||
| Y=f(x1,x4) | 92.15272 | 0.769073 | 2.107857 | 0.992038 | 0.557718 | ||
| T值 | 1.7267 | 3.822759 | 3.816337 | ||||
| Y=f(x1,x4,X2) | 132.9079 | 0.778317 | 1.246040 | 0.334916 | 0.993119 | 0.737540 | |
| T值 | 2.444578 | 4.160134 | 1.7511 | 1.832370 | |||
| Y=f(x1,x4 ,x2,X3) | -43.766 | 1.000048 | 0.157293 | 0.9836 | 1.071304 | 0.999526 | 1.656527 |
| T值 | -2.276607 | 19.35275 | 0.790035 | 14.63939 | 13.79075 |
①根据R2值的大小,即模型拟合程度,在初始模型中引入X4,模型的拟合优度提高,且参数符号合理,对于β1,T统计量为3.822759,给定α=0.1,查T分布表,在自由度为n-2=16下,得临界值T0.05(16)=1.746,因为t> T0.05(16),所以拒绝H0; β1=0,表明居民最终消费对Y云南省GDP仍有显著性影响,同理,地方财政决算支出对云南省GDP也有显著性影响。
引入X2,模型的拟合优度进一步提高,参数符号也合理,虽然对于β1,T统计量降低为4.160134,给定α=0.1,查T分布表,在自由度为n-2=16下,得临界值T0.05 (16)=1.746,因为t> T0.05 (16),所以拒绝H0: β1=0,表明居民最终消费X1对Y云南省GDP仍有显著性影响,同理,地方财政决算支出X4和资本形成总额X2对Y云南省GDP也有显著性影响,所以不需要剔除任何变量。
③最后引入X3,模型的拟合优度又一次提高,参数符号依然合理,对于β3,T统计量变大为13.79075,给定α=0.1,查T分布表,在自由度为n-2=16下,得临界值T0.05 (16)=1.746,因为t> T0.05 (16),所以拒绝H0: β1=0,表明货物和服务净出口X3对Y云南省GDP有显著性影响,不拒绝X3.DW=1.656527,由n=18,k=4查表得到d1=0.93,dw=1.69,可以发现d1<DW=1.656527<dw,DW值比较接近2,相对较好。
整理得到:
Y = -43.766+ 1.000048*X1 + 0.157293*X4 + 0.9836*X2 + 1.071304*X3
(-2.276607) (19.35275) (0.790035) (14.63939) (13.79075)
R2=0.999637 DW=1.656527 F=61.277
可以看出各个统计值都有显著改善。因此,我们最终的模型就是上述表达式。
(3)异方差检验:
表(6)怀特检验结果
| F-statistic | 1.010472 | Prob. F(4,13) | 0.4374 | |
| Obs*R-squared | 4.269126 | Prob. Chi-Square(4) | 0.3708 | |
| Scaled explained SS | 6.139540 | Prob. Chi-Square(4) | 0.10 | |
| Test Equation: | ||||
| Dependent Variable: RESID^2 | ||||
| Method: Least Squares | ||||
| Date: 12/21/10 Time: 17:46 | ||||
| Sample: 1990 2007 | ||||
| Included observations: 18 | ||||
| Coefficient | Std. Error | t-Statistic | Prob. | |
| C | 12.771 | 888.8333 | 2.129501 | 0.0529 |
| X1 | -1.854390 | 2.395663 | -0.774061 | 0.4527 |
| X2 | 0.586147 | 3.115038 | 0.188167 | 0.8537 |
| X3 | -1.447885 | 3.601407 | -0.402033 | 0.6942 |
| X4 | 0.249667 | 9.230192 | 0.027049 | 0.9788 |
| R-squared | 0.237174 | Mean dependent var | 510.9568 | |
| Adjusted R-squared | 0.002458 | S.D. dependent var | 1234.635 | |
| S.E. of regression | 1233.117 | Akaike info criterion | 17.30261 | |
| Sum squared resid | 19767499 | Schwarz criterion | 17.54994 | |
| Log likelihood | -150.7235 | Hannan-Quinn criter. | 17.33671 | |
| F-statistic | 1.010472 | Durbin-Watson stat | 2.208226 | |
| Prob(F-statistic) | 0.437400 | |||
从检验结果得到Obs*R-squared=4.269126,查χ2分布表得到χ20.05(4)=9.49,在5%的显著水平下可以拒绝原假设,显然模型不存在异方差。
(4)自相关性检验
运用相关图和Q统计量检验方法得到结果如下:
图(1)相关图和Q统计量检验结果
图(1)中,虚线之间的区域是序列相关中正负两倍于估计标准差所夹成的,如果自相关值在这个区域内,则在显著性水平为5%的情形下与零没有显著区别。图(1)中的一阶自相关系数和偏自相关系数都没有超过子虚线部分,说明序列不存在一阶自相关。各阶Q统计量的P值都大于0.05,说明在5%的显著性水平下,不拒绝原假设,残差序列不存在序列相关。
(5)最终模型的确立
通过对模型经济意义和统计意义检验,我们得到的最终模型确定为:
Y = -43.766+ 1.000048*X1 + 0.9836*X2 + 1.071304*X3+0.157293*X4
(-2.276607) (19.35275) (14.63939) (13.79075) (0.790035)
R2= 0.999637 DW=1.656527 F=61.277
五、经济分析
(1)从模型中不难看出X1居民最终消费、X2资本形成总额、X3货物和服务净出口、X4地方财政决算支出对云南省生产总值都有一定的影响作用。
(2)X1消费对云南省生产总值呈现了较大的影响作用,在其他因素保持不变的情况下,居民最终消费额每增加一个单位,云南省生产总值平均增加1.000048个单位。分析结果与经济理论相适应。
(3)投资:据模型知,在其他因素保持不变的情况下,投资额每增加一个单位,云南省生产总值平均增加0.9836个单位.
(4)由模型中可以看出,X3货物和服务净出口对云南省生产总值的影响作用尤为显著,在其他因素保持不变的情况下,净出口额每增加一个单位,云南省生产总值平均增加1.071304个单位。
(5)在其他因素保持不变的情况下,X4财政支出每增加一个单位,云南省生产总值平均增加0.157293个单位。下载本文