CH1导论
1、计量经济学:
以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:
模型设定——确定变量和数学关系式
估计参数——分析变量间具体的数量关系
模型检验——检验所得结论的可靠性
模型应用——做经济分析和经济预测
3、模型
变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。
被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。
内生变量:其数值由模型所决定的变量,是模型求解的结果。
外生变量:其数值由模型意外决定的变量。
外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响,但能够影响我们所研究的本期的内生变量。
前定变量:前定内生变量和外生变量的总称。
数据:时间序列数据:按照时间先后排列的统计数据。
截面数据:发生在同一时间截面上的调查数据。
面板数据:
虚拟变量数据:表征,条件等,一般取0或1.
4、估计
评价统计性质的标准
无偏:E(^β)=β 随机变量,变量的函数?
有效:最小方差性
一致:N趋近无穷时,β估计越来越接近真实值
5、检验
经济意义检验:所估计的模型与经济理论是否相等
统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著
计量经济检验:是否符合计量经济方法的基本假定
预测检验:将模型预测的结果与经济运行的实际对比
CH2 CH3 线性回归模型
模型(假设)——估计参数——检验——拟合优度——预测
1、模型(线性)
(1)关于参数的线性 模型就变量而言是线性的;模型就参数而言是线性的。
Yi=β1+β2lnXi+ui
线性影响 随机影响
Yi=E(Yi|Xi)+ui E(Yi|Xi)=f(Xi)=β1+β2lnXi
引入随机扰动项,
(3)古典假设
A零均值假定 E(ui|Xi)=0
B同方差假定 Var(ui|Xi)=E(ui2)=σ2
C无自相关假定 Cov(ui,uj)=0
D随机扰动项与解释变量不相关假定 Cov(ui,Xi)=0
E正态性假定ui~N(0,σ2)
F无多重共线性假定Rank(X)=k
2、估计
在古典假设下,经典框架,可以使用OLS
方法:OLS 寻找min ∑ei2
^β1ols = (Y均值)-^β2(X均值)
^β2ols = ∑xiyi/∑xi2
3、性质
OLS回归线性质(数值性质)
(1)回归线通过样本均值 (X均值,Y均值)
(2)估计值^Yi的均值等于实际值Yi的均值
(3)剩余项ei的均值为0
(4)被解释变量估计值^Yi与剩余项ei不相关 Cov(^Yi,ei)=0
(5)解释变量Xi与剩余项ei不相关 Cov(ei,Xi)=0
在古典假设下,OLS的统计性质是BLUE统计 最佳线性无偏估计
4、检验
(1)Z 检验
Ho:β2=0 原假设 验证β2是否显著不为0
标准化: Z=(^β2-β2)/SE(^β2)~N(0,1) 在方差已知,样本充分大用Z检验
拒绝域在两侧,跟临界值判断,是否β2显著不为0
(2)t 检验——回归系数的假设性检验
方差未知,用方差估计量代替 ^σ2=∑ei2/(n-k) 重点记忆
t =(^β2-β2)/^SE(^β2)~t(n-2)
拒绝域:|t|>=t2/a(n-2)
拒绝,认为对应解释变量对被解释变量有显著影响。
P值是尚不能拒绝原假设的最大显著水平。 (所以P越小,显著性越好)
P值>a 不拒绝 P值(3)F检验——回归方程显著性检验,检验整个模型 原假设Ho:β2=β3=β4=0 (多元,依次写下去) F=[ESS/(k-1)]/[RSS/(n-k)]~F(k-1,n-k) 统计量F服从自由度为k-1和n-k的F分布 F> Fa(k-1,n-k) (说明F越大越好) 拒绝:说明回归方程显著,即列入模型的各个解释变量联合起来对被解释变量有显著影响一元回归下,F与t检验一致,且 F=t2 5、拟合优度检验 (1)可决系数(判定系数)R2=ESS/TSS=1-RSS/TSS 特点: 非负统计量,取值[0,1],样本观测值的函数,随机变量 对其解释:R2=0.95,表示拟合优度比较高,变量95%的变化可以用此模型解释,只有5%不准确 (2)修正的可决系数 adjusted R2=1-(1- R2)(n-1)/(n-k) adjusted R2取值[0,1] 计算出负值时,规定为0 k=1时,adjusted R2= R2 (3)F与可决系数 F=[(n-k)/(k-1)]*[ R2/ (1-R2)] adjusted R2,R2,F 都是随机变量 联系:a都是显著性检验的方法 b构成统计量都是用TSS=ESS+RSS c二者等价,伴随可决系数和修正可决系数增加,F统计量不断增加 R2 =0时,F=0;R2=1时,F趋近无穷; 区别:a F有明确分布,R2没有 b F检验可在某显著水平下得出结论,可决系数是模糊判断 6、预测 平均值预测和个别值预测 A预测不仅存在抽样波动引起的误差,还要受随机扰动项的影响。个别值预测比平均值预测的方差大。 个别值预测区间也大于平均值预测区间。 B 对平均值和个别值预测区间都不是常数。 Xf趋近X均值,预测精度增加,预测区间最窄 C 预测区间和样本容量N有关,样本容量越大,预测误差方差越小,预测区间越窄。样本容量趋于无穷个别值的预测误差只决定于随机扰动项的方差。 CH4多重共线性 后果/原因——如何检验——如何修正 1、后果/原因 (1)完全/不完全多重共线 X3=X1+2X2 完全多重共线 参数无法估计 非满秩矩阵 不可逆 X3=X1+X2+u 不完全多重共线性 (2)无多重共线性 模型无多重共线性,解释变量间不存在完全或不完全的线性关系 X是满秩矩阵 可逆 Rank(X)=k Rank(X’X)=k 从而X’X可逆(X’X)-1存在 (3)多重共线原因 经济变量之间具有共同变化趋势 模型中包含滞后变量 使用截面数据建立模型 样本数据自身原因 (4)后果 存在多重共线性时,OLS估计式仍然是BLUE(最佳线性无偏估计) 不影响无偏性 (无偏性是重复抽样的特性) 不影响有效性 (是样本现象,与无多重共线性相比方差扩大,但采用OLS估计 后,方差仍最小) 不影响一致性 2、检验 (1)两两相关系数 (充分条件) 两两相关可以推出多重共线性 反过来不一定 系数比较高,则可认为存在着较严重的多重共线性 (2)直观判断 (综合判断法) 参数联合显著性很高(通过F检验)但个别重要解释变量存在异常,t不显著,或者β为负,与经济意义违背。F检验通过, t不通过,因为方差扩大了 F是由RSS计算得出的 (3)方差扩大因子 VIFj=1/(1-Rj2) 方差与VIF正相关 VIF>10 严重多重共线 Rj2是多个解释变量辅助回归确定多重可决系数 (4)逐步回归(也是修正方法) 不会有计算,但要了解过程 针对多重共线性,没有什么特别好的修正方法,建模前要事先考虑,如果出现重要解释变量的多重共线性,可以考虑扩大样本容量 CH5 异方差 原因、后果——检验——修正(WLS) 异方差:被解释变量观测值的分散程度是随解释变量的变化而变化的。 Var(ui|Xi)=E(ui2)=σi2=σ2f(Xi) 1、原因后果 (1)产生原因 A 模型设定误差 B 测量误差的变化 C 截面数据中总体各单位的差异 异方差性在截面数据中比在时间序列数据中可能更常出现,因为同一时点不同对象的差异,一般来说会大于同一对象不同时间的差异。 (2)后果 A 参数的OLS估计仍然具有无偏性(无偏性仅依赖零均值假定,解释变量的非随机性) B 参数OLS估计式的方差不再是最小的,影响有效性(方差会被低估,从而夸大t统计量,t,F检验失效,区间预测会受影响,不显著的也有可能变显著) C 不满足有效性,则也会影响一致性 2、检验(要知道判断时原假设和备择假设;检验命题统计量;辅助回归函数形式;适用条件) 原假设:同方差 备择假设:异方差 (1)图示:简单易操作,但判断比较粗糙 (2)GQ:Goldfeld-Quanadt戈德菲尔德-夸特检验 A 大样本,除同方差假定不成立,其余假定要满足 B 对解释变量大小排序 C 去除中间C个观测值(样本的1/5-1/4),分成两个部分 D构造F统计量,两个部分残差平方和服从卡方分布,则 F=两部分残差平方和相除(大的除以小的)~F((n-c)/2-k,(n-c)/2-k) F>临界值,拒绝原假设,则认为存在异方差 E 可判断是否存在异方差,不能确定是哪个变量引起 (3)White A 大样本,丧失较多自由度 B 做残差对常数项、解释变量、解释变量平方及其交叉乘积等所构成的辅助回归 ^ei2 C 计算统计量nR2,n为样本容量,R2为辅助回归的可决系数 D 统计量服从卡方分布 nR2>卡方a(df) 拒绝原假设,表明模型存在异方差 E 不仅能够检验异方差,还能判断是哪个变量引起的异方差 (4)Arch A 用于大样本,只对时间序列检验 B 做OLS估计,求残差,并计算残差平方序列et2,et-12….做辅助回归et2~et-12…et-p2 C 计算辅助回归可决系数R2,统计量(n-p) R2 p是ARCH过程的阶数 D 统计量服从卡方分布 (统计量就是”Obs*R-squared”所显示的数值) (n-p) R2>卡方a(p) 拒绝原假设,表明模型存在异方差 E 能判断是否存在异方差,但不能诊断是哪一个变量引起的 (5)Glejser 可以忽略。 要求大样本 3、修正 (1)对模型 变换,取对数,但不能消除,只能减轻后果 (2)WLS (不考计算,主要掌握思想) 使残差平方和最小,在存在异方差时,方差越小的应约重视,确定回归线作用越大,反之同理。在拟合时应对较小的残差平方给予较大的权数,对较大的残差平方给予较小的权数。通常可取w=1/σi2 将权数与残差平方相乘后再求和 变换模型后剩余项u = ui/根号下f(Xi) 已是同方差 Var(u)= σi2/f(Xi)= σ2 CH6 自相关 原因/后果——检验(DW是唯一方法)——修正(从广义差分出发) 自相关:(序列相关)总体回归模型的随机误差项ui之间存在的 相关关系。 Cov(ui,uj)不为0 自相关形式: ut=put-1+vt ( -1 1、原因 (从时间序列出发考虑) 经济系统的惯性 经济活动滞后效应 数据处理造成的相关 蛛网现象(某种商品的供给量受前一期价格影响而表现出的规律性) 模型设定偏误(虚假自相关,可以改变模型而消除) 2、后果 (1)违背古典假定,继续适用OLS估计参数,会产生严重后果,和异方差情形类似 (2)影响有效性,一致性;但不会影响无偏性。 (3)通常低估参数估计值的方差,t统计量被高估,夸大显著性,t检验失去意义。t、F、 R2检验均不可靠,区间预测精度降低,置信区间不可靠。 3、检验 ( DW是唯一方法) (1)前提条件 A 解释变量X为非随机 B 随机误差项为一阶自回归形式 C 线性模型的解释变量中不包含之后的被解释变量 D 截距项不为零,只适用于有常数项的回归模型 E 数据序列无缺失项 (2)表达式 DW=∑ (et-et-1)2/∑et2 DW约= 2(1-^p) |^p|<=1 所以 DW[0,4] (3)判断 根据样本容量n,解释变量的数目k’(不含常数项) 查DW分布表,得到临界值dL,dU 0≦DW≦dL 正相关 dL 4-dL≦DW≦4 负相关 模型中不存在滞后被解释变量,否则用得宾h检验 4、修正(广义差分) (1)广义差分(p已知) ut=put-1+vt vt为白噪声,符合古典假定 vt=ut-put-1 所以△Yt=Yt-pYt-1 此时,模型中随机扰动项ut-put-1无自相关 (白噪声过程) (2)p未知情况下,先估计p,在使用广义差分 A 科科伦-奥科特迭代法 ^p=1-DW/2 利用残差et 辅助回归 et=^pet-1+vt 用第一次的估计p值进行广义差分,得到新的样本回归函数,继续辅助回归,直到两次估计的p值相差很小,或者回归所得DW统计量表明以无自相关为止。得到较高精度的估计p值后,再用广义差分对自相关修正效果较好。 B 得宾两步法 第一步:利用广义差分形式,做Yt对Yt-1、Xt、Xt-1的回归模型,用OLS估计参数,Yt-1对应的系数就是p的估计值。但是是有偏、一致的估计。 第二步:利用p的估计值,进行广义差分,再使用OLS对广义差分方程估计参数,得到无偏估计 CH7 分布滞后模型和自回归模型 分布滞后模型(仅用于时间序列)——自回归建立(数学:库伊克/经济:自适应预期、局部调整)——自回归模型估计 1、分布滞后模型(不含滞后被解释变量) Yt=α+β0Xt+β1Xt-1+β2Xt-2+…+βsXt-s+ut (1)分类:有限分布滞后模型/无限分布滞后模型 (2)乘数效应 短期乘数(即期乘数)β0 表示本期X变动一个单位对Y值的影响大小 延迟乘数(动态乘数)βi (i=1,2…s)表示过去各时期X变动一个单位对Y值的影响大小 长期乘数(总分布乘数)∑βi 表示X变动一个单位时,包括滞后效应而形成的对Y值的总影响 Eg.问短期乘数是多少?就是问X本期的系数β0 (3)估计(有限期滞后) 经验加权:对解释变量系数赋予一定权数,形成新的变量,再用OLS Yt=α+β0Zt +ut 常见类型 A递减滞后结构:远小近大,常见类型 B不变滞后结构:权数不变 C∧型滞后结构:两头小,中间大 特点:简单易行、少损失自由度、避免多重共线性干扰、参数估计一致性。设置权数主观性大。 通常多选几组权数分别估计,根据可决系数、F、t、估计标准差及DW值,选择最佳估计方程。 阿尔蒙法思想:为了消除共线性,用某种多项式来逼近滞后参数的变化结构,从而减少待估参数个数。 基本原理:在有限分布滞后模型滞后长度S已知的情况下,滞后项系数可以看成是相应滞后期i的函数。在以滞后期i为横轴,之后系数为纵轴的坐标系中,如果这些滞后系数落在一条光滑曲线上,或近似落在一条光滑曲线上,则可以由一个关于i的次数较低的m次多项式很好的逼近 阿尔蒙多项式变换 βi=α0+α1 i+α2 i2+…+αm im (i=0.1.2….s; m远远 Yt=α+α0 Z0t +α1 Z 1t+α2 Z 2t+…+αm Zmt+ut ut满足古典假设,可以用OLS估计 m如果取得过大则达不到通过阿尔蒙多项式变换减少变量个数的目的。 特点:新模型中变量个数少于原分布滞后模型中的变量个数,自由度得到保证,一定程度上环节了多重共线性。 2、自回归模型建立——无限期滞后模型 (1)库伊克变换 A 施加约束条件,假定滞后解释变量对被解释变量的影响随滞后期i的增加按几何衰减,即滞后系数的衰减服从某公比小于1的几何级数 βi=β0λi 长期乘数β0/(1-λ) λ为待估参数,称作分布滞后衰减率;λ越接近0,衰减速度越快;1-λ为调整速度 B将βi带入无限分布滞后模型求Yt,再将Yt滞后一期求得Yt-1 C Yt-1同时乘以λ,求得Yt-λYt-1 ,变换得库伊克模型: Yt=α(1-λ)+ β0 Xt +λYt-1+( ut-λ ut-1) Yt=α*+ β0* Xt +β1* Yt-1+ ut* (一阶自回归模型) D优点: 模型结构简化;最大限度 保证自由度;解决滞后长度难以确定的问题;缓解多重共线性 E缺陷: 假定呈几何滞后结构,某些经济变量可能不适用; 库伊克随机扰动项ut*= ut-λ ut-1 很有可能造成自相关;(最严重的!!) 将滞后一期被解释变量引入模型,不一定符合基本假设; 纯粹的数算结果,缺乏经济理论依据。 Eg.如果给你个模型,说是库伊克模型,根据这个提问,你要清楚:这是个无限分布滞后模型, 还要知道一阶自回归与原模型的对应关系 (2)自适应预期(解释变量) A假定:经济活动主体会根据自己过去在做预期时犯错误的程度,来修正以后每一期的预期,即按照过去预测偏差的某一比例对当前期望修正,以适应新的经济环境 Xt*= Xt-1*+ r(Xt —Xt-1*) = rXt + (1—r)Xt-1* B ut*= ut-(1—r) ut-1 有可能产生自相关 (3)局部调整(被解释变量) A假定:被解释变量的实际变化仅仅是预期变化的一部分,即: Yt— Yt-1=δ( Yt*— Yt-1) δ为调整系数,代表调整速度;约接近1,表明调整到预期最佳水平速度越快 B ut*=δ ut 不存在自相关,可以使用OLS估计 (4)对比 联系:库伊克、自适应预期、局部调整模型最终形式都是一阶自回归; 区别:1导出模型经济背景思想不同 库伊克:无限分布滞后模型的基础上根据库伊克几何分布滞后假定导出 自适应:由解释变量的自适应过程得到 局部调整:对被解释变量的局部调整得到 2 对应的自回归形式中,由于模型的形成机理不同,而随机误差项结构不同,对模型估计带来一定影响。 eg.如果模型分析有自相关,又是由局部调整模型引起的,则是由数据本身产生的;如果是库伊克或者自适应预期模型引起的,则会存在在模型变换中产生自相关的可能。 3、自回归模型的估计与检验 (1)主要问题: 出现了随机解释变量Yt-1,而Yt-1可能与随机扰动项相关;随机扰动项可能自相关。 如果直接用OLS,估计结果是有偏的,不是一致的。 (2)解决方法: A消除滞后一期被解释变量与随机扰动项的相关性(工具变量法); B检验是否存在自相关(德宾h检验法)。 (3)估计——工具变量法: 进行参数估计的过程中选择适当的工具变量,代替回归模型中同随机扰动项存在相关性的解释变量。 满足条件: 与所代替的解释变量高度相关;与随机扰动项不相关;与其他解释变量不相关,以免多重共线。 (4)检验——德宾h检验法 A 不能再使用DW法(其不适合方程含有滞后的被解释变量) B记忆h统计量公式:193页 Var(^β1*)表示滞后一期被解释变量的回归系数估计方差,s.e平方就可得到数值 C 假设:p=0时, h统计量服从正态分布,(原假设:无自相关) 对比临界值hα/2 ,若|h|> hα/2,拒绝原假设,说明自回归模型存在一阶自相关 D使用条件:针对大样本;可以适用任意阶的自回归模型 CH11 联立方程组模型 建立——识别——估计 1、概念及模型 (1)联立方程模型:用若干个相互关联的单一方程,同时去表示一个经济系统中经济变量相互联立依存性的模型,即用一个联立方程组去表现多个变量间互为因果的联立关系。 (2)变量类型 A内生变量:变量时由模型体现的经济系统本身所决定的,随机变量。 B外生变量:在模型体现的经济系统之外给定的,非随机变量。 C前定变量:模型中滞后内生变量或更大范围的内生变量和外生变量统称。 D:区别 单一方程中:前定变量一般作为解释变量;内生变量作为被解释变量。 联立方程模型中:内生变量既可以做被解释变量,又可以做解释变量。 (3)模型形式 A结构模型:根据经济行为理论或经济活动规律,描述经济变量之间现实的经济结构关系的模型。表现变量间直接的经济联系,将某内生变量直接表示为内生变量和前定变量的函数。 BY+TX=U B简化模型:每个内生变量都只被表示成前定变量及随机扰动项函数的联立方程组模型。在简化模型中的每个方程右端不再出现内生变量。 (可以直接做预测) Y=TX+V C特点和区别 结构:方程右端可能有内生变量;明确的经济意义;具有偏倚性不能直接OLS;不能直接用结够模型预测。 简化:右端不再出现内生变量,只有前定变量作为解释变量;前定变量与随机误差项不相关;参数反映前定变量对内生变量的直接影响与间接影响,表现了影响乘数;可以直接进行预测。 2、识别 (1)类型:不可识别;恰好识别;过度识别。 不可识别:某个结构方程包含所有的变量,则一定不可以识别(0系数) 统计形式不唯一,不可识别 不能求出简化模型的参数,不可识别 每个方程都可以识别,联立方程模型才可以识别,不包含固定方程如:Y=I+C+G (2)识别方法 阶条件(必要条件) 秩条件(充要条件) 两种方法结合使用——模型识别一般步骤: 定义: K、M:模型中前定、内生变量的个数;k、m:某方程中前定、内生变量个数; A 先用阶条件判别,如果不可识别则可做结论 判别:K-k C 系数矩阵rank(A)不=M-1 或|A|=0 则不可识别,可直接做结论 D rank(A)=M-1 则说明可以识别,再使用阶条件判别 K-k=m-1 说明模型恰好识别 K-k>m-1 说明模型过度识别 模型估计 (1)递归模型:OLS (2)恰好识别方程:ILS(间接最小二乘) A思想:先用OLS估计简化型参数,再利用简化方程和结构方程关系求解结构型参数。 (单一方程估计法,对每个方程参数逐一估计) B 统计性质:简化型参数是一致估计 小样本时,结构型参数的估计量是有偏的(渐进无偏); 大样本时,结构型参数的估计量是一致性(渐进有效); C 假定:结构型模型恰好识别;每个方程满足基本假定;简化模型中不存在多重共线性。 (3)恰好、过度识别方程:TSLS(两阶段最小二乘) A思想:用OLS估计简化方程参数,用估计值替代结构方程中作为解释变量的内生变量,再用OLS估计结构方程参数。(单一方程估计法,对每个方程参数逐一估计) B 统计性质:简化型参数是一致估计 小样本时,TSLS的估计量是有偏的(渐进无偏); 大样本时,TSLS的估计量是一致性(渐进有效); C假定:结构方程可以识别;随机误差项满足基本假定;不存在严重的多重共线,与随机误差项不相关;样本容量足够大;第一段可决系数低的话,说明很大程度受随机分量决定,TSLS估计将无意义。 (4)系统估计法 从参数估计统计性质上优于单一方程估计法;从方法复杂性和可操作性看,要麻烦。下载本文
对所有βi进行变换,带回分布滞后模型,再仿照经验加权将模型改写: