先了解什么是高/低聚类?

高/低聚类 (Getis-Ord General G) 统计是一种用于检测空间数据中是否存在高值或低值聚类的统计方法,这种方法可以帮助我们理解数据点在空间上是否呈现某种聚集模式。

白话版:一句话就是判断数据在空间上有没有聚集。

高/低聚类 (Getis-Ord General G) 和空间自相关 (Global Moran's I) 工具的零假设都具有完全空间随机性 (CSR);即在数据集的要素中值是随机分布的。

Getis-Ord General G统计的关键概念

  • p 值当p值较小(通常小于0.05或0.01),并且在统计学上显著时,可以拒绝零假设。这表明数据中的高值或低值并非随机分布,而是存在聚类现象。
  • z 得分如果z得分值为正数,这表明观测到的General G指数大于期望的General G指数,即高值在研究区域中聚类;如果z得分值为负数,这表明观测到的General G指数小于期望的General G指数,即低值在研究区域中聚类。即正的z得分表明高值聚类的存在,负的z得分表明低值聚类的存在。
  • General G 观测值:General G指数提供了一个关于数据集中高值或低值聚类强度的定量估计。

本篇文章着重介绍高/低聚类 (Getis-Ord General G),通过人口普查数据来看我们人口分布在空间上是否存在高值或低值聚类,我们这里用了2000-2020年这20年的三次人口普查数据,数据来源国家统计局:普查数据 - 国家统计局 (stats.gov.cn)

我们打开工具箱,在【空间统计工具】——>【分析模式】——>【高/低聚类】;

输入要分析的图层和需要判断空间相关性的要素字段,另外最好勾选生成报表,这样我们对空间自相会有直观的了解,标准化选:ROW,空间关系的概念化选:INVERSE_DISTANCE 意为:与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些,更多空间关系类型可以参考官方文档:高/低聚类(Getis-Ord General G) (空间统计)—ArcMap | 文档 (arcgis.com)

点击确定,生成结果会在下面这个文件夹路径生成,每个人的默认保存路径不同,可以自行查看;

打开这个General G结果.html 的文件,该文件将在默认的浏览器中打开,结果返回四个值:General G 观测值、General G 期望值、z 得分以及 p 值;

General G 观测值、General G 期望值、z 得分及 p 值四个值的关系到底怎么看,先看谁?

结合我们上篇Moran's I 指数的分析流程和官方文档可以发现,他们对于p 值、z 得分的观测原理是一致的,

  • p 值用于判断空间自相关性的显著性,帮助我们决定数据是否可以用;
  • z 值用于评估当z得分为正时表明高值聚类的存在,当z得分为负时表明低值聚类的存在;
  • General G指数用来衡量高值或低值的聚类程度。

那说了这么多,图上的4这个值合起来代表什么意思?

  1. General G 观测值: 这个数值表示实际计算得到的General G指数。它是一个介于0和1之间的值,用来衡量高值或低值的聚类程度。

  2. General G 期望值: 这个数值表示在零假设下(即不存在高值或低值聚类)预期得到的General G指数。

  3. z 得分: z得分是用来评估观测值与期望值之间差异的一个标准化指标。正值意味着观测值高于期望值且表明高值聚类的存在,负值则表示低于期望值且表明低值聚类的存在。

  4. p 值: p值是在给定零假设(即不存在高值或低值聚类)的前提下,观测到当前或更大差异的概率。如果p值很小(例如小于0.05或0.01),那么就可以认为观测到的数据与零假设不一致,从而拒绝零假设。在七普数据中,p值为0.149670,说明p值较大,不能拒绝零假设。

结论:七普的Getis-Ord General G统计结果显示,虽然z得分较高,但p值较大,因此无法拒绝零假设,即不能确定数据中存在显著的高值或低值聚类。

老规矩,再来看一下2010年六普的高/低聚类 (Getis-Ord General G);

2000年五普的高/低聚类 (Getis-Ord General G);

我们可以看出p值在20年前也就是2000年,p值为0.089845,小于0.1,因此我们可以在90%的置信水平上拒绝原假设,即认为数据中存在显著的高值或低值聚类,且z得分为1.696218,正值意味着观测值高于期望值,即高值在研究区域中聚类。

人口分布在高值聚类通常指的是人口密度较高的地区呈现出一定的集群特征,也就是说,在某些特定区域内,人口密度远高于周围其他区域。这些高值聚类区域拥有吸引人口的因素,如良好的就业机会、教育资源、医疗设施、交通便利等。高值聚类反映出城市化过程中的集聚效应,即人们倾向于居住在已经发展成熟的都市区或者中心地带。

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

更多推荐