自相关

自相关产生的原因

(1)忽略遗漏了关键变量
(2)经济变量的滞后性
(3)回归函数模型使用错误
(4)蛛网现象
(5)对数据加工整理而导致误差项之间产生自相关性

自相关产生的后果

(1)参数估计值不是最小方差线性无偏估计
(2)MSE可能会严重低估误差项方差
(3)显著性检验失效
(4)最小二乘估计量对波动敏感
(5)模型应用错误

自相关的检验方法

图示检验法

对已有的回归模型用最小二乘法估计参数,并求出残差e,以e值做散点图
(1)以e(t)为纵坐标,e(t-1)为横坐标绘制散点图
一般当散点大部分落在一三象限的时候,存在正的序列相关;
当散点大部分落在二四象限的时候,存在负的序列相关。
在这里插入图片描述
(2)蛛网现象则是误差项随着t的的增大而不停的变换正负符号,此时也说明存在序列相关
(3)误差项随着t的增大先有几个正的而后又有几个负的
在这里插入图片描述

自相关系数法

在这里插入图片描述

DW(杜宾沃森)检验

DW检验是常用的检验序列相关的一种检验方法,但是它仅限于小样本的检验并且只能适用于随机扰动具有一阶自回归的情况。
首先记自相关系数为p
则DW值可以近似等于**DW = 2(1-p)***
由于自相关系数的取值范围一般是在-1 到 1之间,所以DW值的取值范围在 0 到 4之间
根据样本量n和解释变量的数目可以查DW的分布表,记临界值上界为dU,临界值下界为dL
(1)当 0 <= DW <= dL,存在正自相关;当 4-dL <= DW <= 4,存在负自相关
(2)当 dL < DW <= dU 或 4 - dU <= DW < 4-dL,不能判定是否存在相关
(3)dU < DW < 4-dU ,误差项无自相关
即在DW = 2左右 时,一般模型不存在自相关。

通过上述范围可以看到,DW检验是存在一定的局限性的:
首先,他有两个不能判定是否存在自相关的区域,这时的解决办法只能是增大样本量,或者改用其他方法;
其次,DW的临界表中要求样本量n > 15

自相关的消除

迭代法

假如我们有两个函数表达式,
y2 = a + bx2 +c2 (1)
y1 = a + bx1 +c1 (2)
记自相关系数为 p ,再用(1)-(2)p
得到结果 y2 - py1 = (a - a
p) + b(x2 - px1) + c2-pc1
即得到转换方程:
y2’ = y2 - py1
x2’ = x2 - px1
此处指列举两个方程的计算形势,更多方程时可以用下标 t 和下标 t-1表示
在得到转换方程后,利用DW和自相关系数 p 的关系,可以得到 p = 1 - 0.5DW
将p代入到转换方程中,利用新的变量y和变量x即可得到回归方程,此时是没有自相关问题存在的(一阶自相关,多阶需要迭代多次)

差分法

与上述迭代法类似,都是上下互减的形式,只不过以各自变量的增量替代原有变量y和变量x,进行回归模拟。
一阶差分法一般适用于一阶高度自相关的情况,即自相关系数 p 接近1的情况

SPSS处理自相关示例

存在以下数据(部分)
在这里插入图片描述
【分析】【回归】【线性】,勾选【德宾沃森】和【残差】
在这里插入图片描述
得到残差图和DW值如下图:
在这里插入图片描述

在这里插入图片描述
可以看到残差图是表现出来回归模型存在正的序列相关的,且DW值为0.745,通过查询DW临界值表可知,DW上界du=1.63,下界dl=1.46,则也表明回归模型存在正的序列相关。

迭代法处理数据
首先可以得到自相关系数 p = 1 - 0.5DW = 0.6275
然后通过【转换】【计算变量】,输入公式:x1’ = x1 - 0.6275lag(x1) ; y和x2也是同理替换
在这里插入图片描述
【分析】【回归】【线性】,利用得到的新变量做回归方程模拟,得到新的德宾沃森值为
在这里插入图片描述
可以看到,经过迭代法之后,DW处于无自相关区域,即消除了自相关性。

差分法处理数据
前提步骤和迭代法一样
【转换】【计算变量】,输入公式 x’ = x - LAG(x) ;同样保存三个变量
利用得到的三个变量,继续进行回归模拟,得到的DW值如下图:
在这里插入图片描述
可以看到,经过差分法的数据的DW值也在无自相关区间内,同样消除了自相关性
但是通过二者之间的方差来看,迭代法明显要优于差分法。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐