- 2022-08-19 发布 |
- 37.5 KB |
- 38页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
[经济学]计量经济学第五章-异方差
第五章异方差性\n引子:更为接近真实的结论是什么?根据四川省2000年21个地州市医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。模型估计的结果如下:(291.5778)(0.644284)t=(-1.931062)(8.340265)式中:Y表示卫生医疗机构数(个)X表示人口数量(万人)\n模型显示的结果和问题:●人口数量对应参数的标准误差较小●t统计量远大于临界值●可决系数和修正的可决系数结果较好●F检验结果明显显著表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?\n第一节异方差性的概念一、异方差性的实质(一)同方差性的含义同方差性:对所有的i(i=1,2,…,n)有既随机扰动项的方差为一个常数。因为方差是度量被解释变量Y的观测值围绕回归线的分散程度,因此同方差性指的是所有观测值具有相同的分散程度。\n(二)异方差性的含义设模型为如果对于模型中随机误差项有:则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则\n图形表示:\n(一)模型中省略了某些重要的解释变量二、产生异方差的原因(二)模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。此外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差.(三)测量误差的变化样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。\n(四)截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。\n第二节异方差性的后果一、对参数估计统计特性的影响(一)参数估计的无偏性仍然成立参数估计的无偏性仅依赖于基本假定中的零均值假定,所以异方差存在对参数估计的无偏性的成立没有影响。即仍然有(二)参数估计的方差不再是最小的同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。\n二、对参数显著性检验的影响由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的t统计量值不能正确确定,如果仍用t统计量值进行参数的显著性检验将失去意义。三、对预测的影响尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y的预测也将不是有效的。\n第三节异方差性的检验一、图形法(一)相关图形分析方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量Y与随机误差项u有相同的方差,所以利用分析Y与X的相关图形,可以初略地看到Y的离散程度与X之间是否有相关关系。如果随着x的增加,Y的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。\n用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图,其中用表示农村家庭消费支出,表示家庭纯收入。图形举例:\n(二)残差图形分析设一元线性回归模型为:(5.10)运用OLS法估计,得样本回归模型为:(5.11)由式(5.10)和式(5.11)得残差:(5.12)绘制出对的散点图:◆如果不随而变化,则表明不存在异方差;◆如果随而变化,则表明存在异方差。\n二、Goldfeld-Quanadt检验◆作用:检验递增型(或递减型)异方差。(一)检验的前提条件1、要求检验使用的为大样本容量。2、除了同方差假定不成立外,其它假定均满足。\n1、将样本(观察值)按某个解释变量的大小排序;2、将序列中间(段)约c=1/4个观察值除去,并使余下的头、尾两段样本容量相同,均为(n-c)/2个;3、提出假设:4、分别对头、尾两部分样本进行回归,且计算各残差平方和分别为k是估计参数的个数。并建立统计量(二)检验的具体做法(步骤)\n5、进行F检验分析:递增异方差,方差之比就会远远大于1;同方差,方差之比趋近于1。否则不存在异方差性。,则拒绝原假设,认为存在异方差性;\n三、White检验(一)基本思想不需要关于异方差的任何先验信息,只需要在大样本的情况下,将OLS估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。(二)检验的特点◆要求变量的取值为大样本◆不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。\n(三)检验的基本步骤:以一个二元线性回归模型为例,设模型为:并且,设异方差与的一般关系为(5.14)其中:为随机误差项。\nWhite检验:\n(检验各回归系数是否为零。等于零,不存在异方差)\n(一)ARCH过程设ARCH过程为(5.16)p为ARCH过程的阶数,并且为随机误差。(二)检验的基本思想在时间序列数据中,可认为存在的异方差性为ARCH过程,并通过检验这一过程是否成立去判断时间序列是否存在异方差。四、ARCH检验\n1、提出原假设:中至少有一个不为零2、参数估计并计算对原模型作OLS估计,求出残差,并计算残差平方序列,以分别作为对的估计。3、求辅助回归(5.17)(三)ARCH检验的基本步骤\n4、检验计算辅助回归的可决系数,并且在成立时,基于大样本,渐进服从;给定显著性水平查分布表得临界值,如果,则拒绝原假设,表明模型中得随机误差存在异方差。(四)检验的特点●变量的取值为大样本,并且是时间序列●只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。\n第四节异方差性的补救措施一、模型变换法以一元线性回归模型为例:经检验存在异方差,且模型变换法是用去除(5.17)式的两端,得:令:\n(5.20)式的随机误差项的方差为(5.21)经变换的(5.19)式的随机误差项已是同方差。\n二、加权最小二乘法以一元线性回归模型为例:经检验存在异方差,(一)基本思路区别对待不同的。对较小的给予较大的权数,对较大的给予较小的权数,从而使更好地反映对残差平方和的影响程度。\n(二)具体做法1、选取权数并求出加权的残差平方和通常取权数,当越小时,越大。当越大时,越小。将权数与残差平方相乘以后再求和,得到加权的残差平方和:2、求使满足的根据最小二乘原理,若使得加权残差平方和最小,则:其中:\n三、模型的对数变换在经济意义成立的情况下,如果对模型:作对数变换,其变量和分别用和代替,即:对数变换后的模型通常可以降低异方差性的影响:◆运用对数变换能使测定变量值的尺度缩小。◆经过对数变换后的线性模型,其残差表示相对误差往往比绝对误差有较小的差异。注意:对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。\n第五节案例分析一、问题的提出和模型设定为了对医疗机构制定规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为:其中:表示卫生医疗机构数,表示人口数。\n四川省2000年各地区医疗机构数与人口数地区人口数(万人)X医疗机构数(个)Y地区人口数(万人)X339.9医疗机构数(个)Y成都101336304眉山827自贡315911宜宾508.51530攀枝花103934广安438.61589泸州463.71297达州620.12403德阳379.31085雅安149.8866绵阳518.41616巴中346.71223广元302.61021资阳488.41361遂宁3711375阿坝82.9536内江419.91212甘孜88.9594乐山345.91132凉山402.41471南充709.24064\n二、参数估计估计样本回归函数如下:估计结果为\n(一)图形法绘制对的散点图。三、检验模型的异方差\n2、判断。由图可以看出,残差平方对解释变量X的散点图主要分布在图形中的下三角部分,大致看出残差平方随的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。\n(二)Goldfeld-Quanadt检验(1)对变量取值排序(按递增或递减)。(2)构造子样本区间,建立回归模型。在本例中,样本容量n=21,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:1—8和14—21它们的样本个数均是8个.即分别用1—8、14—21两个样本采用最小二乘法,得残差平方和的数据分别为\n(3)求F统计量值。(4)判断在下,统计量分子、分母的自由度均为6查F分布表得临界值为因为所以拒绝原假设,表明模型确实存在异方差。\n四、异方差的修正(一)加权最小二乘法(WLS)用作权数,估计结果如下:\n估计结果:结论:运用加权小二乘法消除了异方差性后,参数的t检验均显著,可决系数大幅提高,F检验也显著,并说明人口数量每增加1万人,平均说来将增加2.953个卫生医疗机构,而不是引子中得出的增加5.3735个医疗机构。\nTHANKS第五章结束了!查看更多