相关分析(SPSS)

相关分析通常用来分析客观事物之间的数量分析方法,是做回归分析的基础,下面主要从探究GDP地区生产总值与地区人均消费之间关系的案例进行介绍

一.散点图

判断两个变量是否有相关性,可以通过绘制散点图初步判断两者之间的关系,在SPSS中,可以按照步骤:图形–>旧对话框–>散点图–>简单散点图,点击定义,设置Y、X轴
在这里插入图片描述
在这里插入图片描述
点击确定可以得到两个变量之间的散点图
在这里插入图片描述
还可以在SPSS结果图中,双击图像,编辑图像,例如点击元素–>总计拟合线,可以画出总的拟合趋势,得到大致的拟合方程式
在这里插入图片描述
从图中可以观察到,人均消费与GDP之间关系大致呈正向(线性)相关关系。

二.相关系数

相关系数以数值的方式反映两变量间线性相关的强弱程度,相关分析主要应用包含两个方面:
第一方面是利用样本数据计算样本相关系数。我们用r来表示,其取值在-1~1之间,r>0表示两变量存在正的线性相关关系;r<0表示两变量存在负的线性相关关系;r=0表示两变量不存在线性相关关系(但可能存在非线性关系
第二个方面是对样本来自的两个总体是否存在显著的线性关系进行判断,其原假设H0为两个总体无显著线性关系

注意:对不同类型的变量做相关分析要用不同的检验统计量

下面,就来介绍相关系数的种类

  • Pearson简单相关系数
    用来度量两个数值型变量间的线性相关关系,pearson相关系数,就是我们所说的r
    Pearson相关系数检验统计量为t统计量,其中t统计量服从n-2自由度的t分布
    操作步骤:分析–>相关–>双变量
    在这里插入图片描述
    在这里插入图片描述
    选择要分析的两个变量,选择皮尔逊相关系数(其余两个会在后面说明),点击确定,得出分析结果
    在这里插入图片描述可以发现人均消费与GDP皮尔逊相关系数为0.387,通过5%的显著性检验,说明存在显著的正向线性相关性。
  • Spearman等级相关系数
    主要用来度量定序型变量间的线性相关关系,如不同年龄段与不同收入段关系,在上面案例相关系数选择项可以选择斯皮尔曼进行分析
  • Kendall t相关系数(注意这个t不是t,是个特殊字符,但不出来qaq)
    采用非参数检验方法度量定序型变量间的线性相关关系,在上面案例相关系数选择项可以选择肯德尔进行分析

三.偏相关分析

偏相关分析用于分析当两个变量都与第三个变量相关时,需将第三个变量的影响剔除,只分析另外两个变量之间的线性相关性
例如,研究GDP与消费水平的关系,GDP与消费水平都与收入有关系,所以我们就要剔除变量收入的影响,使用偏相关分析,在SPSS中可将收入作为控制变量,对GDP与消费水平作偏相关分析
具体操作为:分析–>相关–>偏相关
在这里插入图片描述
在这里插入图片描述
分析结果如下
在这里插入图片描述
排除收入的影响,GDP与人均消费水平的相关系数为0.501,存在正向的线性相关关系,且通过1%的显著性检验。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐