关于国内旅游需求的计量经济学分析报告
班级:
姓名:
学号:
时间:
一、模型设定
根据旅游经济学理论,旅游需求是指在不同的价格水平下,旅游者愿意购买的旅游产品数量。旅游需求的主要影响因素包括:旅游者可支配收入、出游的偏好和动机、旅游产品的价格、非旅游消费品的价格、闲暇时间、旅游客源地与旅游目的地之间的距离,旅游地的安全状况和旅游地的形象等等。综合上述因素和变量的可观测性,我们首先建立一个多元线性回归模型:
y=b0+b1x1+b2x2+b3x3+b4x4+b5x5+u
其中:y ——国内旅游需求,使用国内旅游出游数量衡量
x1——旅游者可支配收入,使用居民可支配收入衡量
x2——经济发展状况,使用GDP衡量
x3——旅游业发展状况,使用国内旅行社职工人数衡量
x4——旅游价格指数
x5——人口数量
b0,b1,b2,b3,b4,b5,回归系数;u为随机扰动项
收集数据如下表表示:
obs | Y(万人) | x1(元) | x2(亿元) | x3(人) | x4 | x5(万人) |
1993 | 410 | 2577.4 | 34560.5 | 78172 | 114.7 | 118517 |
1994 | 524 | 3496.2 | 46670 | 77553 | 124.1 | 119850 |
1995 | 629 | 4282.95 | 57494.9 | 91592 | 117.1 | 121121 |
1996 | 0 | 4838.9 | 66850.5 | 87555 | 108.3 | 1223 |
1997 | 4 | 5160.3 | 73142.7 | 94829 | 102.8 | 123626 |
1998 | 695 | 5425.1 | 76967.2 | 100448 | 99.2 | 124761 |
1999 | 719 | 5854 | 80579.4 | 108830 | 98.6 | 125786 |
2000 | 744 | 6279.98 | 88254 | 1336 | 100.4 | 126743 |
2001 | 784 | 6859.6 | 95727.9 | 192408 | 100.7 | 127627 |
2002 | 878 | 7702.8 | 103935.3 | 229147 | 99.2 | 128453 |
2003 | 870 | 8472.2 | 116603.2 | 249802 | 101.2 | 129227 |
2004 | 1102 | 9422 | 136584.3 | 263245 | 103.9 | 129988 |
二、估计参数与模型检验
1、直接对模型进行OLS法估计,结果如下:
Dependent Variable: Y | ||||
Method: Least Squares | ||||
Date:05/29/05 Time: 11:21 | ||||
Sample: 1993 2004 | ||||
Included observations: 12 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | -29.02302 | 3247.4 | -0.0036 | 0.9932 |
X1 | 0.031596 | 0.107402 | 0.294184 | 0.7785 |
X2 | 0.006083 | 0.005900 | 1.031121 | 0.3422 |
X3 | -0.000625 | 0.000549 | -1.139018 | 0.2981 |
X4 | 3.139470 | 3.530256 | 0.8304 | 0.4081 |
X5 | -0.001390 | 0.025231 | -0.055094 | 0.9579 |
R-squared | 0.977694 | Mean dependent var | 719.9167 | |
Adjusted R-squared | 0.959105 | S.D. dependent var | 179.3065 | |
S.E. of regression | 36.26027 | Akaike info criterion | 10.32618 | |
Sum squared resid | 7888.843 | Schwarz criterion | 10.56863 | |
Log likelihood | -55.95705 | F-statistic | 52.59632 | |
Durbin-Watson stat | 3.131017 | Prob(F-statistic) | 0.000071 |
2、分析
由上表我们看到解释变量t值不显著,而可决系数R和F统计量显著,说明极有可能存在多重共线性。
3、多重共线性检验
计算解释变量之间的简单相关系数,结果如下:
x1 | x2 | x3 | x4 | x5 | |
x1 | 1 | 0.997478 | 0.940115 | -0.67771 | 0.976511 |
x2 | 0.997478 | 1 | 0.928883 | -0.67865 | 0.971951 |
x3 | 0.940115 | 0.928883 | 1 | -0.52953 | 0.902582 |
x4 | -0.67771 | -0.67865 | -0.52953 | 1 | -0.79203 |
x5 | 0.976511 | 0.971951 | 0.902582 | -0.79203 | 1 |
由表3可以看出,解释变量之间存在严重的多重共线性。
4、多重共线性修正
(1)运用OLS法逐一求y对各个解释变量的回归,发现y对x1的线性关系很强,拟合度最好,如下:
y=209.33+0.087x1
t (5.82) (14.95)
se (35.96) (0.0058)
R^2=0.957 S.E.=38.93 F=223.41212
逐步回归,将其余解释变量逐一代入:
(2)将x2代入后,
y=186.32+0.124x1-0.000462x2
t 6.31 0.438 1.5797
R^2=0.961 S.E.=36.305 F=129.659
R^2提高到了0.966,F统计量也有所提高,但对其它参数有明显影响b1下降到了0.033,此外代入x2后,t统计量的值大副下降,分别为b0:6.31,b1:0.438,b2:1.5797,因此决定舍去变量x2,保留x1。
(3)将x3代入后,
y=186.32+0.124x1-0.000462x3
t 4.28286 5.96301 -0.95
R^2=0.961 S.E.=39.116 F=111.069
R^2提高到了0.9611, 但t统计量的值有所降低,而且该变量对y的影响很小,斜率系数只有 0.000462,故将该变量舍去。
(4)将x4代入后,
y= -51.783+0.093x1+2.133x4
t -0.223223 11.92497 1.1359
R^2=0.962555 S.E.=38.359 F=115.67
R^2的值提高了,但是x4的t统计量并不显著,因为x4为旅游物价指数,因此我们发现x4的回归系数符号跟经济意义发生了背离,根据表一我们看到x1与x4的相关系数为-0.67771相关程度不高。因此推断有可能是模型的设定出现了偏差,或是数据不真实,或是模型遗漏了其它的重要影响变量。因此首先改变模型的形式,采用对数模型进行回归,回归结果如下:
Dependent Variable: Y1 | ||||
Method: Least Squares | ||||
Date: 05/29/05 Time: 14:28 | ||||
Sample: 1993 2004 | ||||
Included observations: 12 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | -2.186992 | 1.468504 | -1.4265 | 0.1706 |
Z1 | 0.750366 | 0.049570 | 15.13751 | 0.0000 |
Z4 | 0.487404 | 0.241165 | 2.021038 | 0.0740 |
R-squared | 0.978856 | Mean dependent var | 6.550016 | |
Adjusted R-squared | 0.974158 | S.D. dependent var | 0.255534 | |
S.E. of regression | 0.041079 | Akaike info criterion | -3.334340 | |
Sum squared resid | 0.015187 | Schwarz criterion | -3.213113 | |
Log likelihood | 23.00604 | F-statistic | 208.3285 | |
Durbin-Watson stat | 2.633801 | Prob(F-statistic) | 0.000000 |
回归系数符号跟经济意义仍然发生了背离。
用x4的平方值、立方值和开平方值进行回归,系数符号仍然没有改变。
于是猜想有可能是数据出现了偏差,因为由于没有直接的旅游价格指数,我们简单地使用了居民消费价格指数来代替旅游价格指数,于是改变旅游价格指数的衡量方式,首先采用交通价格指数来代替,回归后发现,系数符号仍然没有改变。再使用居民文娱价格指数来代替,回归后发现,系数符号也没有改变。此外,还有可能是缺失了某些重要的解释变量,留在异方差和自相关检验中进行分析。
(5)再将x5带入:
Dependent Variable: Y | ||||
Method: Least Squares | ||||
Date: 05/29/05 Time: 14:45 | ||||
Sample: 1993 2004 | ||||
Included observations: 12 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | 2394.378 | 1572.201 | 1.522946 | 0.1621 |
X1 | 0.122165 | 0.025856 | 4.724902 | 0.0011 |
X5 | -0.019151 | 0.013777 | -1.390133 | 0.1979 |
R-squared | 0.9730 | Mean dependent var | 719.9167 | |
Adjusted R-squared | 0.9563 | S.D. dependent var | 179.3065 | |
S.E. of regression | 37.22815 | Akaike info criterion | 10.28433 | |
Sum squared resid | 12473.42 | Schwarz criterion | 10.40555 | |
Log likelihood | -58.70595 | F-statistic | 123.0886 | |
Durbin-Watson stat | 2.381878 | Prob(F-statistic) | 0.000000 |
可以看出t统计量的值大副下降,而且x5的回归系数仅为0.019,对y影响很小,故舍去。
5、异方差检验
OLS估计法估计的参数为:
Y = -51.78329206 + 0.09309258196*X1 + 2.133003771*X4
Dependent Variable: Y | ||||
Method: Least Squares | ||||
Date: 05/29/05 Time: 15:59 | ||||
Sample: 1993 2004 | ||||
Included observations: 12 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | -51.78329 | 231.9803 | -0.223223 | 0.8283 |
X1 | 0.093093 | 0.007807 | 11.92497 | 0.0000 |
X4 | 2.133004 | 1.872765 | 1.1359 | 0.2841 |
R-squared | 0.962555 | Mean dependent var | 719.9167 | |
Adjusted R-squared | 0.954233 | S.D. dependent var | 179.3065 | |
S.E. of regression | 38.35928 | Akaike info criterion | 10.34419 | |
Sum squared resid | 13242.91 | Schwarz criterion | 10.46541 | |
Log likelihood | -59.06513 | F-statistic | 115.6749 | |
Durbin-Watson stat | 2.359411 | Prob(F-statistic) | 0.000000 |
(2)Goldfeld—Quandt检验
由于样本数目太少,不能用Quandt检验。
(3)ARCH检验
Dependent Variable: E2 | ||||
Method: Least Squares | ||||
Date: 05/29/05 Time: 17:13 | ||||
Sample(adjusted): 1996 2004 | ||||
Included observations: 9 after adjusting endpoints | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | 1878.275 | 1431.205 | 1.312373 | 0.24 |
E2(-1) | -0.257025 | 0.4359 | -0.54 | 0.5811 |
E2(-2) | 0.033429 | 0.447524 | 0.074698 | 0.9434 |
E2(-3) | -0.187427 | 0.431826 | -0.434032 | 0.6824 |
R-squared | 0.130019 | Mean dependent var | 1343.563 | |
Adjusted R-squared | -0.391970 | S.D. dependent var | 2274.618 | |
S.E. of regression | 2683.634 | Akaike info criterion | 18.92883 | |
Sum squared resid | 36009468 | Schwarz criterion | 19.019 | |
Log likelihood | -81.17975 | F-statistic | 0.249083 | |
Durbin-Watson stat | 2.1208 | Prob(F-statistic) | 0.859007 |
它远远小于临界值。说明没有存在异方差。
6.自相关的检验
对模型:y=b0+b1x1+b4x4进行估计为:
Dependent Variable: Y | ||||
Method: Least Squares | ||||
Date: 05/29/05 Time: 14:54 | ||||
Sample: 1993 2004 | ||||
Included observations: 12 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | -51.78329 | 231.9803 | -0.223223 | 0.8283 |
X1 | 0.093093 | 0.007807 | 11.92497 | 0.0000 |
X4 | 2.133004 | 1.872765 | 1.1359 | 0.2841 |
R-squared | 0.962555 | Mean dependent var | 719.9167 | |
Adjusted R-squared | 0.954233 | S.D. dependent var | 179.3065 | |
S.E. of regression | 38.35928 | Akaike info criterion | 10.34419 | |
Sum squared resid | 13242.91 | Schwarz criterion | 10.46541 | |
Log likelihood | -59.06513 | F-statistic | 115.6749 | |
Durbin-Watson stat | 2.359411 | Prob(F-statistic) | 0.000000 |
(1)图示法:
从图中看到,残差分布均匀,基本不存在自相关。
(2)DW检验
根据表7的统计结果,由DW=2.359411,对于给定的显著性水平a=0.05,查Durbin-Watson表,n=12,k’=2,得下限临界值dl=0.812,du=1.579,4-du=2.421,因为DW=2.359411大于du=1.579小于4-du=2.421,所以认为不存在自相关。
三、关于经济意义的检验
由表7看到x1的斜率系数为0.093,x4的斜率系数为2.133,从模型上来说,收入对旅游需求的影响为人均可支配收入每增加1000元,旅游需求增加93万人,符合经济意义。对于x4斜率系数为2.133003771,很明显该斜率系数的符号与经济意义不相吻合,模型中的系数意味着价格越高旅游需求越大,这完全违背的客观现实,然而单独用x4对y做回归我们看到:
Dependent Variable: Y | ||||
Method: Least Squares | ||||
Date: 05/29/05 Time: 17:42 | ||||
Sample: 1993 2004 | ||||
Included observations: 12 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | 2096.188 | 568.4445 | 3.687586 | 0.0042 |
X4 | -13.00209 | 5.354854 | -2.428094 | 0.0356 |
R-squared | 0.3707 | Mean dependent var | 719.9167 | |
Adjusted R-squared | 0.307986 | S.D. dependent var | 179.3065 | |
S.E. of regression | 149.1603 | Akaike info criterion | 12.993 | |
Sum squared resid | 222488.0 | Schwarz criterion | 13.07975 | |
Log likelihood | -75.99359 | F-statistic | 5.50 | |
Durbin-Watson stat | 0.687758 | Prob(F-statistic) | 0.035566 |
我们发现,这时候的斜率系数完全符合经济意义,但是可决系数很低,仅为0.3707。推断有可能是模型的设定出现了偏差,或是数据不真实,或是模型遗漏了其它的重要影响变量。
因此首先改变模型的形式,在进行共线性检验时,我们用x4的对数、平方值、立方值和开平方值进行回归,系数符号仍然没有改变。
于是猜想有可能是数据出现了偏差,因为由于没有直接的旅游价格指数,我们简单地使用了居民消费价格指数来代替旅游价格指数,于是改变旅游价格指数的衡量方式,首先采用交通价格指数来代替,回归后发现,系数符号仍然没有改变。再使用居民文娱价格指数来代替,回归后发现,系数符号也没有改变。在找不到旅游物价指数的情况下,这些数据都不能完全代替旅游物价指数,因此问题很有可能出在数据的误差上。
此外,由于该我们对该模型进行异方差和自相关检验的时候得出了该模型并不存在异方差和自相关。而在对x4进行单独回归的时候发现斜率系数完全符合经济意义,但是可决系数很低,仅为0.3707。此外,在模型中,x4的斜率系数为2.133003771,尽管不符合经济意义,然而可以看出它对旅游需求的影响很大,在单独回归中斜率系数甚至高达-13。综合上述分析,我们认为很有可能旅游需求与收入x1和价格x4之间存在的并非是线性关系,它们之间很有可能是一种非线性关系。
四、模型运用
由于无法通过经济意义的检验,该模型甚至与现实的经济理论相悖,因此该模型不能运用与实际的经济计量分析。然而上述分析也为旅游需求的分析提供了一些可能有用的思路,包括:旅游需求与可支配收入存在很大关系。研究旅游需求应该建立合理的旅游物价指数核算体系。最后,关于旅游需求与旅游物价之间存在的很有可能是一种非线性关系。下载本文