方差分析

方差分析是一种假设检验,它把观测总变异的平方和与自由度分解为对应不同变异来源的平方和与自由度,将某种控制性因素所导致的系统性误差和其他随机性误差进行对比,从而推断各组样本之间是否存在显著性差异,以分析该因素是否对总体存在显著性影响。方差分析法采用离差平方和对变差进行度量,从总离差平方和分解出可追溯到指定来源的部分离差平方和。方差分析要求样本满足以下条件:

  1. 可比性:资料中各组均数本身必须具有可比性,这是方差分析的前提;
  2. 正态性:方差分析要求样本来源于正态分布总体,偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析;
  3. 方差齐性:方差分析要求各组间具有相同的方差,即满足方差齐性。

单因素方差分析用于分析单一控制变量影响下的多组样本的均值是否存在显著性差异。
单因素方差分析文章见链接:SPSS实战:单因素方差分析(ANOVA)

多因素方差分析

多因素方差分析用于分析两个或两个以上因素是否对不同水平下样本的均值产生显著的影响。

多因素方差分析的原理

多因素方差分析用于分析两个或两个以上控制变量影响下的多组样本的均值是否存在显著性差异。多因素方差分析不但可以分析单个因素对因变量的影响,也可以对因素之间的交互作用进行分析,还可以进行协方差分析。

多因素方差分析的SPSS操作

例:(随机区组设计) 为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取4窝不同种系的大白鼠,每窝3只,随机地分配到3个组内接受不同剂量雌激素的注射,然后测定其子宫重量,结果见表10.33。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响?

在这里插入图片描述
下面利用多因素方差分析方法分析不同剂量的雌激素对大白鼠子宫重量的影响

step1 建立数据文件

本实验的原始数据如下图所示:
在这里插入图片描述

在SPSS的变量视图中建立变量“大白鼠种系”“雌激素剂量”和“子宫重量”。其中,“大白鼠种系”变量中分别用“1、2、3、4”代表“种系A、种系B、种系C、种系D”,“雌激素剂量”变量中分别用“0、1、2”代表“0.25 μg/100g、0.50 μg/100g、0.75 μg/100g”,如下图所示:

在这里插入图片描述

在SPSS数据视图中,把相关数据输入到各个变量中,输入完毕后的部分数据如图所示:

在这里插入图片描述

step2 命令选项

在菜单栏中选择“分析”→“一般线性模型”→“单变量”命令,打开如图所示的“单变量”对话框。
在这里插入图片描述

step3 选择变量

因变量: 该列表框中的变量为要进行方差分析的目标变量。“因变量”列表框中只能选择唯一一个变量。

固定因子: 该列表框中的变量为固定控制变量,主要用来分组。固定控制变量的各个水平一般是可以人为控制的,如实验的温度、水分等。因子自变量为分类变量,其取值可以为数字,也可以为字符串。因子变量值应为整数,并且为有限个类别。

随机因子: 该列表框中的变量为随机控制变量,也用来分组。与固定控制变量不同的是,随机控制变量的各个水平一般是不可以人为控制的,如体重、身高等。

协变量: 该列表框中的变量是与因变量相关的定量变量,用来控制与因子变量有关且影响方差分析的目标变量的其他干扰因素,类似于回归分析中的控制变量。

WLS权重: 该列表框为加权最小二乘分析指定权重变量。如果加权变量的值为0、负数或缺失,则将该个案从分析中排除。已用在模型中的变量不能用作加权变量。

将本研究的变量选入上述列表框中,结果如图所示:

在这里插入图片描述

step4 进行相应的设置

(一)“模型”设置

单击“模型”按钮,弹出“单变量:模型”对话框。

在这里插入图片描述

  1. “指定模型” 选项组:
    在该选项组中为单因变量多因素分析指定方差分析的模型:
    (1)“全因子”,即全因子模型,包含所有因子主效应、所有协变量主效应及所有因子间交互,不包含协变量交互;
    (2)“构建项” or “构建定制项”,表示可以仅指定其中一部分的交互或指定因子协变量交互,必须指定要包含在模型中的所有项。
    (3)“构建项”的“类型” 下拉列表框中有5种模型形式可供选择:“交互”,表示模型中含有所选变量的交互项;“主效应”,表示模型中仅考虑各个控制变量的主效应而不考虑变量之间的交互项;“所有二阶”“所有三阶”“所有四阶”,表示模型中要考虑所有二维、三维、四维的交互效应。
    (4)“因子与协变量”列表框中列出了所有参与分析的因子与协变量。
  2. “平方和” 下拉列表框:
    该下拉列表框用于指定计算平方和的方法,主要有4种类型:
    (1)“ I类”,表示分层处理平方和,仅处理主效应项;
    (2)“II类”,表示处理所有其他效应;
    (3)“III类”,表示可以处理I类和II类中的所有效应;
    (4)“IV类”,表示对任何效应都处理,但对于没有缺失单元的平衡或非平衡模型
    III类平方和方法最常用,也是系统默认的。
  3. “在模型中包含截距” 复选框:
    该复选框用于决定是否在模型中包含截距,如果认为数据回归线可以经过坐标轴原点的话,就可以在模型中不含截距,但是一般系统默认含有截距项。
    在这里插入图片描述

本研究中选中“构建项”中的“主效应”按钮,其他为默认,然后单击“继续”按钮保存设置结果。

(二)“对比”设置

单击“对比”按钮,弹出“单变量:对比”对话框:

在这里插入图片描述

  1. “因子” 列表框:
    该列表框用于存放多因素方差分析中的因子变量,选择需要对比的因子就可以激活“更改对比”选项组,可对要进行对比的因子设置对比方式。
  2. “更改对比” 选项组:
    该选项组主要用于检验因子水平之间的差值,可以为模型中的每个因子指定对比,包括7种对比方法:
    (1)无,表示不进行因子各个水平间的任何对比;
    (2)偏差,表示对因子变量每个水平与总平均值进行对比;
    (3)简单,表示对因子变量各个水平与第一个水平和最后一个水平的均值进行对比;
    (4)差值,表示对因子变量的各个水平都与前一个水平进行做差比较,第一个水平除外;
    (5)Helmert,表示对因子变量的各个水平都与后面的水平进行做差比较,最后一个水平除外;
    (6)重复,表示重复比较,除第一类之外,因素变量的每个分类都与后面所有分类的平均效应进行比较;
    (7)多项式,表示对每个水平按因子顺序进行趋势分析。
    对于“偏差”和“简单”对比,可以选择参照水平是“最后一个”或“第一个”。
(三)“图”设置

单击“图”按钮,弹出“单变量:轮廓图”对话框:

在这里插入图片描述

  1. “因子” 列表框:该列表框中主要存放各个因子变量。
  2. “水平轴” 列表框:从“因子”列表框中选入,“水平轴”列表框中的变量是均数轮廓图中的横坐标。
  3. “单独的线条” 列表框:从“因子”列表框中选入,用来绘制分离线的。
  4. “单独的图” 列表框:从“因子”列表框中选入,用来创建分离图。

当“水平轴”“单独的线条”或“单独的图”列表框中有变量时,下方的“添加”“更改”“除去”按钮就会被激活,单击“添加”按钮即可将选择的变量加入“图”列表框。

(四)“事后比较”设置

单击“事后比较”按钮,弹出“单变量:实测平均值的事后多重比较”对话框:

在这里插入图片描述
“单变量:实测平均值的事后多重比较”对话框的作用在于:一旦确定均值间存在差值,两两范围检验和成对多重比较就可以确定哪些均值存在差值,同样包含假定等方差和不假定等方差两种,与单因素方差分析中的“假定等方差”和“不假定等方差”选项组相同,具体内容见SPSS实战:单因素方差分析(ANOVA)

本研究中勾选的方法:

在这里插入图片描述

(五)“保存”设置

单击“保存”按钮,弹出“单变量:保存”对话框:

在这里插入图片描述
“单变量:保存”对话框主要用于在数据编辑器中将模型预测的值、残差和相关测量另存为新变量,包括4个选项组:

  1. “预测值” 选项组:
    该选项组用于保存模型为每个个案预测的值,含有3个复选框:
    (1)“未标准化”,表示模型为因变量预测的值;
    (2)加权,表示加权未标准化预测值,仅在已经选择了WLS变量的情况下可用;
    (3)标准误差,表示对于自变量具有相同值的个案所对应的因变量均值标准差的估计。
  2. “残差” 选项组:
    该选项组用于保存模型的残差,含有5个复选框:
    (1)未标准化,表示因变量的实际值减去由模型预测的值;
    (2)加权,表示在选择了WLS变量时提供加权的未标准化残差;
    (3)标准化,表示对残差进行标准化的值;
    (4)学生化,表示Student化的残差;
    (5)删除后,表示剔除残差。
  3. “诊断” 选项组:
    该选项组用于标识自变量的值具有不寻常组合的个案和可能对模型产生很大影响的个案的测量,包括两个复选框:
    (1)库克距离,表示在特定个案从回归系数的计算中排除的情况下,所有个案残差变化幅度的测量,较大的库克距离表明从回归统计量的计算中排除个案之后,系数会发生根本变化;
    (2)杠杆值,表示未居中的杠杆值,每个观察值对模型拟合的相对影响。
  4. “系数统计” 选项组:
    该选项组用于保存模型中的参数估计值的协方差矩阵,一旦选中“创建系数统计”复选框,下面两个单选按钮就会被激活:
    (1)创建新数据集,表示将参数估计值的协方差矩阵写入当前会话中的新数据集;
    (2)写入新数据文件,表示将参数估计值的协方差矩阵写入外部SPSS Statistics数据文件。
    其中,对于每个因变量,都有一行参数估计值、一行与参数估计值对应的t统计量的显著性值及一行残差自由度。
(六)“选项”设置

单击“选项”按钮,弹出“单变量:选项”对话框:

在这里插入图片描述
该对话框提供一些基于固定效应模型计算的统计量,包括:

  1. “因子与因子交互” 列表框:
    该列表框中是所有因子变量和“OVERALL”变量,从中选择变量并单击箭头按钮就可以使之选入“显示下列各项的平均值”列表框中。

  2. “显示下列各项的平均值” 列表框:
    该列表框中的变量用来输出该变量的估算边际均值、标准误差等统计量。当该列表框中含有变量时,下方“比较主效应”复选框就会被激活,该复选框表示为模型中的任何主效应提供估计边际均值未修正的成对比较,但必须在“显示下列各项的平均值”列表框中含有主效应变量。

  3. “显示” 选项组:
    该选项组主要用于指定输出的统计量,有10个复选框,其功能如下表所示:
    在这里插入图片描述

  4. “显著性水平” 文本框:
    该文本框主要用于指定上述统计量的显著水平。

在这里插入图片描述

本研究是随机区组设计(无重复),无法进行莱文方差齐次检验,通过“残差图”选项来观察方差是否齐次,单击“继续”按钮。

step5 分析结果输出

单击“确定”按钮,输出分析结果。

下图给出了主要的因子列表,从中可以看出,两个因子变量的各个水平及每个水平上的观测值数目:

在这里插入图片描述

下图给出了因变量在各个因素下的一些描述性统计量,从中可以看出,不同种系的大白鼠和不同雌激素剂量下白鼠子宫重量的平均值、标准编差及个案数。
在这里插入图片描述

下图给出了主体间效应检验结果,从中可以看出,整个模型的F统计量为32.064,显著性是0.000,可见此方差分析模型是非常显著的

且R方为0.964,说明大白鼠子宫重量的变异能被“大白鼠种系”“雌激素剂量”及两者的交互效应解释的部分有96.4%。

其中,“大白鼠种系”“雌激素剂量”对子宫重量都有显著的影响(相应的显著性都小于0.05)。

在这里插入图片描述

由于随机区组设计无法进行莱文方差齐次检验,现通过残差图来判断其方差齐性:
在这里插入图片描述
残差图的分布总体来说很均匀、离散,没有明显的趋势,因此可以认为满足方差齐性。

到此为止,我们认为总体上雌激素剂量对白鼠子宫重量的影响有统计学意义。

下面是三种剂量下因变量称重的差异比较,我们发两两之间的差异不全有统计学意义(P<0.05),在此不做讨论。
在这里插入图片描述

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐