前言

    GeoDa是一个免费的开源软件工具,用于空间数据分析。它旨在通过探索和建模空间模式来促进数据分析的新见解。
    GeoDa是由Luc Anselin博士和他的团队开发的。该项目为探索性空间数据分析(ESDA)方法提供了用户友好的图形界面,例如用于聚合数据(数千条记录)的空间自相关统计,以及用于点和多边形数据(数万条记录)的基本空间回归分析。要在GeoDa中使用大数据,首先应该将其聚合到区域单元。

GeoDa 1.12.1

    GeoDa现在支持各种不同格式的矢量数据:可以使用shapefile、地理数据库、GeoJSON、MapInfo、GML、KML和GDAL库支持的其他矢量数据格式。

    以上来源于 GeoDa GitHub

    2020年9月更新:GeoDa终于迎来重大更新-1.16版 [链接]

    2020年10月更新:Geoda出Python包了 [链接]

 

功能

    GeoDa提供了丰富的用于探索性空间数据分析(ESDA)的方法,比如:

  • 空间自相关统计(spatial autocorrelation statistics)
  • 空间回归分析(spatial regression analysis)
  • 单变量和多变量的局部Geary聚类分析
  • (非空间)聚类分析方法(PCA)等

 

    GeoDa的设计包含一个由地图和统计图表相联合的相互作用的环境,使用强大的连接窗口技术(与ArcGIS的关联表单同效果

    1. 打开一个shp文件

    2. 菜单栏选择 Table - Merge,填写弹出的表单(通过 ID 关联,添加文本数据中的count字段 

    3. 成功将一个shp文件与文本数据(如:csv)关联,可以点击菜单栏 查看属性表

 

操作案例

    找到的一些案例都大同小异,了解即可

    https://zhuanlan.zhihu.com/p/100455481 (参数介绍较为详细

    https://www.sohu.com/a/293616901_698752

    https://www.cnblogs.com/wicked-fly/p/6225002.html

    ⭐ 空间分析原理推荐 虾神daxialu 的 新版白话空间统计

 

与ArcGIS的区别

    我的理解:GeoDa致力于空间自相关分析等,在这方面其研究方法比 ArcGIS 更丰富(比如:空间滞后模型、空间残差模型等),至于同一方法的准确性差异不好评判优劣(个人理解,若有错,请指出

    虾神大佬如是说:

    ArcGIS的算法会使得误差比geoda的更大,所以一般做空间自相关都是采用geoda的[来源](个人感觉不绝对)

    GeoDa完全就是一款为统计而设计的软件;而ArcGIS更加全面,有更多分析模块,包括统计,功能更加强大 [来源]

 

案例学习

    数据

   

    研究内容

       结合考虑该区域每个人口普查区的经济、人口等情况,利用OLS探讨案发率与相关的社会经济的影响关系,验证是否具备空间依赖性或异质性

    

    实验

        前提说明:在实验前,通过“空间连接”工具进行计算字段 Join_Count,即为每个人口普查区中汽车盗窃案发生次数,将在该实验中作为因变量。对因变量进行空间自相关检验,结果表明各人口普查区中的盗窃案数目整体呈现正空间自相关。经过模型检验,剔除了一些变量,只留下PCI、Population 和 Unemployed三个变量(这部分省略不写了)。

        1. 创建权重矩阵,点击Weight Manger,再点击Create(GeoDa可以自定义空间权重矩阵和空间关系

        2. 工具栏点击 Regression - Regression

        3. 运行结果

        4. 在ArcGIS中,Arctoolbox“空间统计工具”工具箱中选择“空间关系建模”中的“普通最小二乘法”工具进行计算

        5. 运行结果

 

结语

    从两个软件的 OLS 结果来看,校正R^{2}两者一样但GeoDa的AIC值更小一些,所以在该数据、该模型下,GeoDa的效果更好。实验是上学时课程的作业,很多知识点都忘得差不多了。如有错误,请指出,谢谢。

 

其他    

    根据 R^{2} 的取值,来判断模型的好坏,其取值范围为[0,1]:如果结果是 0,说明模型拟合效果很差;如果结果是 1,说明模型无错误。一般来说,R^{2} 越大,表示模型拟合效果越好。

    校正R^{2} 抵消样本数量对 R^{2} 的影响,做到了真正的 0~1,越大越好。

    AIC信息准则是衡量统计模型拟合优良性的一种标准,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(对训练数据拟合的很好,而对测试数据拟合的很差)的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐