(注意:试卷涉及的所有检验的显著性水平都为5%,最后的答案保留两位小数)
| 得分 |
1、存在异方差情况下回归系数的OLS估计量是有偏的。
错误
存在异方差情况下回归系数的OLS估计量是无偏的,因为参数估计的无偏性仅依赖于基本假设中的零均值假定(即)。所以异方差的存在对无偏性的成立没有影响。
2、在模型中增加解释变量会使得判定系数()、调整的判定系数()都增大。
错误
在模型中增加解释变量会使得判定系数()增大,而调整的判定系数()不随解释变量的个数变化而增加。在样本容量一定的情况下,增加解释变量必定使得自由度减少,而调整的判定系数将残差平方和和总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。
3、杜宾—瓦尔森检验能够检验出任何形式的自相关。
错误
杜宾—瓦尔森检验只适用于有常数项的具有一阶自相关的回归模型,并不能检验多阶自相关和解释变量中含滞后被解释变量的回归模型。
二(24分)通过收集某省1990~2010年的白酒销量调查数据,考察白酒需求()与居民的可支配收入()、白酒价格()之间的依赖关系,回归得到如下模型:
( )
( )
请回答以下问题:
(1)填出括号中的数字,并写出你的计算过程(保留4位小数)(4分)
= =(4分)
(2)回归系数(不包括截距项)是否统计显著(6分)
,,查表临界值;(2分)
,所以否定,认为显著不等于零,即认为白酒的价格对白酒的需求量有显著的影响;(2分)
,所以不否定,即认为居民可支配收入对白酒的需求量没有显著的影响。(2分)
(3)检验回归方程的显著性(3分)
查表得临界值,因为,所以否定,总体回归方程存在显著的线性关系。即白酒的需求量与白酒的价格和居民的可支配收入之间的线性关系是显著的。(3分)
(4)请判断该模型是否存在着一阶序列相关(5分)
,,查表得,,因为,依据判别规则,认为误差项存在正的一阶自相关。(5分)
(5)如果模型存在自相关,求出相关系数,并利用广义差分变换写出无自相关的广义差分模型。(6分)
(3分)
其广义差分模型为:(3分)
三(18分)2011年中国31省建筑业总产值(X)和建筑业企业利润总额(Y)关系的OLS估计结果
| 得分 |
对该问题进行异方差的怀特检验,结果如下:
请回答问题:
(1)、解释回归系数(不包括截距项,下同)(4分)
平均来说,建筑企业总产值每提高1元,其总利润提高0.034980元。(4分)
(2)、试判断原回归式误差项中是否存在异方差。(8分)
给定和自由度为2,得临界值,而white统计量
,则拒绝原假设,原方程存在异方差。(8分)
(3)、修正异方差的方法有哪些?(6分)
异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。(6分)
四(16分)2005年中国各省市区城镇居民人均年可支配收入(X)与人均年交通通讯消费支出(Y)
| 得分 |
将样本数据X递增排序,去掉中间7个数据, 分为“1-12”和“20-31”两个样本分别回归。得到如下:
样本区间1-12的回归 样本区间20-31的回归
请解决以下问题:
(1)用Goldfeld-Quanadt检验上述模型是否存在异方差?(8分)
计算F统计量,即,对给定的,查F分布表,得临界值,因为,所以模型存在异方差,而且为递增型的异方差。(8分)
(2)根据下表所给的资料,请回答所做的是一项什么工作,其结论是什么(8分)
这是用BG(LM)检验自相关。
给定和自由度为2,得临界值,而LM检验统计量
,则不拒绝原假设,原方程不存在自相关。(8分)
| 得分 |
假定回归模型为:
Yt =β0+β1 X1t +β2 X2 t+ ut
式中:Y=空调的销售量
X1=居民收入
X2=空调价格
如果该模型是用季度资料估计,试向模型中加入适当的变量反映季节因素的影响。(仅考虑截距变动,不考虑交互影响。)
可以往模型里加入反映季节因素的虚拟变量D。由于共有四个季节,所以可以将此虚拟变量分为三个类别。设基础类别是冬季,于是虚拟变量可以如下引入:
即,
此时建立的模型为
六(17分)对1985~2011年财政收入(CZSR)及影响因素进行分析,其中影响因素包括财政支出
(CZZC)、国内生产总值(GDP)、税收总额(SSZE),其OLS结果如下表:
| Dependent Variable: CZSR | ||||
| Method: Least Squares | ||||
| Date: 06/23/15 Time: 21:48 | ||||
| Sample: 1985 2011 | ||||
| Included observations: 27 | ||||
| Variable | Coefficient | Std. Error | t-Statistic | Prob. |
| C | -221.8540 | 130.6532 | -1.698038 | 0.1030 |
| CZZC | 0.090114 | 0.044367 | 2.031129 | 0.0540 |
| GDP | -0.025334 | 0.005069 | -4.998036 | 0.0000 |
| SSZE | 1.17 | 0.062162 | 18.93271 | 0.0000 |
| R-squared | 0.999857 | Mean dependent var | 22572.56 | |
| Adjusted R-squared | 0.999838 | S.D. dependent var | 27739.49 | |
| S.E. of regression | 353.0540 | Akaike info criterion | 14.70707 | |
| Sum squared resid | 2866884. | Schwarz criterion | 14.905 | |
| Log likelihood | -194.5455 | Hannan-Quinn criter. | 14.716 | |
| F-statistic | 53493.93 | Durbin-Watson stat | 1.458128 | |
| Prob(F-statistic) | 0.000000 | |||
上述模型可能存在多重共线性,因为该模型的拟合度非常高,方程的显著性也相当高,但有系数不显著(CZZC)和经济意义不相符(GDP的符号相反)。(6分)
(2)、解决上述问题的方法有哪些?(6分)
答:采用降低多重共线性的经验方法主要有(6分)
(1)利用外部或先验信息;
(2)横截面与时间序列数据并用;
(3)剔除高度共线性的变量(如逐步回归);
(4)数据转换;
(5)获取补充数据或新数据;
(6)选择有偏估计量(如岭回归)。
经验方法的效果取决于数据的性质和共线性的严重程度。
(3)、上述模型出现的问题,主要是由随机误差项与解释变量相关导致的。这话对吗?(5分)
多重共线性主要是由于回归模型中的解释变量之间存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。(5分)下载本文