服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

ArcGIS空间统计——Moran's莫兰指数

日期: 来源:GIS前沿收集编辑:beatniu


概述:


根据要素位置和属性值使用 Global Moran's I 统计量测量空间自相关性。提出者为澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰(Patrick Alfred Pierce Moran)。


 

Moran PAP. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society B , 1948,(37):243-251.


详细概述:


空间自相关 (Global Moran's I)工具同时根据要素位置和要素值来度量空间自相关。在给定一组要素及相关属性的情况下,该工具评估所表达的模式是聚类模式、离散模式还是随机模式。该工具通过计算 Moran's I指数值、z得分和p值来对该指数的显著性进行评估。p值是根据已知分布的曲线得出的面积近似值(受检验统计量限制)。


公式:


 


说明:


1、空间自相关工具返回五个值:Moran's I 指数、预期指数、方差、z 得分及 p 值。您可通过结果窗口访问这些值,也可以将这些值作为派生输出值进行传递,以满足模型或脚本中的潜在使用需要。


在给定一组要素及相关属性的情况下,该工具评估所表达的模式是聚类模式、离散模式还是随机模式。使用 z 得分或 p 值指示统计显著性时,如果 Moran's I 指数值为正则指示聚类趋势,如果 Moran's I 指数值为负则指示离散趋势。


2、返回的z得分与P值解释:



常见的问题:


Q1:可以针对不同研究区域使用全局自相关生成的 z 得分或 p 值与分析结果进行比较吗?


不可以。但是,如果研究区域是固定的(例如,所有分析都针对加利福尼亚的县)、输入字段具有可比性(例如,所有分析都涉及某种类型的人口计数),并且工具参数均相同(例如,距离范围或距离阈值为 5,000 米的“固定距离”并且工具均使用“行标准化”参数),此时,便可对统计学上显著的 z 得分进行比较,以了解空间聚类或空间离散的程度或更好地了解趋势随时间推移的变化情况。还可以在不断增大距离范围或距离阈值的情况下运行分析,以了解在哪个距离/比例下促进空间聚类的过程最明显。


Q2:为何会得到大于 1.0 或小于 -1.0 的 Moran's I 指数?


通常,Global Moran's I 指数介于 -1.0 到 1.0 之间。只有对权重进行了行标准化时才会这样。如果未对权重进行行标准化处理,则指数值可能会落在 -1.0 到 1.0 的范围之外,这表示参数设置有问题。


Q3:何时采用全局莫兰指数(Global Moran's I),何时采用局部莫兰指数(Local Moran's I),以及,两者有何区别?


莫兰指数分为全局莫兰指数(Global Moran's I)和局部莫兰指数(Local Moran's I),前者是Patrick Alfred Pierce Moran于1950年提出,用来衡量空间自相关程度的度量;后者是美国亚利桑那州立大学地理与规划学院院长 Luc Anselin 教授在1995年提出的。


通常情况,先做一个地区的全局指数,全局指数只是告诉我们空间是否出现了集聚或异常值,但并没有告诉我们在哪里出现。换句话说全局Moran'I只回答Yes还是NO;如果全局有自相关出现,接着做局部自相关;局部Moran'I会告诉我们哪里出现了异常值或者哪里出现了集聚,是一个回答Where的工具。


莫兰指数是一个有理数,经过方差归一化之后,它的值会被归一化到-1.0与+1.0之间。


Moran's I大于0时,表示数据呈现空间正相关,其值越大空间相关性越明显;Moran's I小于0时,表示数据呈现空间负相关,其值越小空间差异越大;Moran's I为0时,空间呈随机性。


ArcGIS中运行莫兰指数的注意事项:


输入字段严重偏斜(创建数据值的直方图可了解此情况),空间关系的概念化或距离范围的设置使得某些要素的相邻要素非常少。Global Moran's I 统计量是渐进正态的,这意味着,对于偏斜数据,每个要素至少需要具有 8 个相邻要素。为距离范围或距离阈值参数计算的默认值可确保每个要素至少具有 1 个相邻要素,但这可能不够,尤其是在输入字段中的值严重偏斜时。


使用反距离空间关系的概念化,并且反距离非常小。


未选择行标准化。除非聚合方案与所分析的字段直接相关,否则,只要对数据进行了聚合处理,就应选择行标准化。


空间关系的概念化:


指定要素空间关系的定义方式。


 

INVERSE_DISTANCE—与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些。


INVERSE_DISTANCE_SQUARED—与 INVERSE_DISTANCE 类似,但它的坡度更明显,因此影响下降得更快,并且只有目标要素的最近邻域会对要素的计算产生重大影响。


反距离方法(INVERSE_DISTANCE、INVERSE_DISTANCE_SQUARED)最适合对连续数据,或最适合对符合此种情形的对象进行建模:两个要素在空间上越靠近,它们彼此交互/影响的可能性就越大。使用此空间概念化参数,每个要素都可能是其他各个要素的邻域,而对于大型数据集,这将涉及巨大的计算量。使用反距离法时,应尝试添加一个距离范围或距离阈值,特别是对于大型数据集十分重要。如果将距离范围或距离阈值参数留空,系统将计算距离阈值,但这可能不是分析所需的最适当距离;默认的距离阈值是能够确保每个要素至少具有一个相邻要素的最小距离。


可为0,可默认,可输入正值。


 

FIXED_DISTANCE_BAND—将对邻近要素环境中的每个要素进行分析。在指定临界距离(距离范围或距离阈值)内的邻近要素将分配有值为 1 的权重,并对目标要素的计算产生影响。在指定临界距离外的邻近要素将分配值为零的权重,并且不会对目标要素的计算产生任何影响。此方法适用于处理点数据。


ZONE_OF_INDIFFERENCE—在目标要素的指定临界距离(距离范围或距离阈值)内的要素将分配有值为1的权重,并且会影响目标要素的计算。一旦超出该临界距离,权重(以及邻近要素对目标要素计算的影响)就会随距离的增加而减小。


不可为0,可默认,可输入正值。


CONTIGUITY_EDGES_ONLY—只有共用边界或重叠的相邻面要素会影响目标面要素的计算。


CONTIGUITY_EDGES_CORNERS—共享边界、结点或重叠的面要素会影响目标面要素的计算。


国际象棋里面的Rook(车)和皇后(Queen)的走法,因此也叫做Rook's Case和Queen's Case。面要素计算进行计算的话,面邻接是最简单的一种空间关系概念化的模型。

GET_SPATIAL_WEIGHTS_FROM_FILE—将由指定空间权重文件定义空间关系。指向空间权重文件的路径由权重矩阵文件参数指定。


标准化:


行标准化的权重通常与固定距离相邻要素结合使用,并且几乎总是用于基于面邻接的相邻要素,这样可减少因为要素具有不同数量的相邻要素而产生的偏离。行标准化将换算所有权重,使它们在 0 和 1 之间,从而创建相对(而不是绝对)权重方案。每当要处理表示行政边界的面要素时,您都可能会希望选择“行标准化”选项。



实例:


这次,我们采用湖南省2018年的122个县的一些社会经济数据,如GDP、第二产业增加值、第二产业从业人员、第三产业增加值、学校、医院床位等等数据,来进行莫兰指数的实验:



之前的参数设置都已经讲过了,所以我们直接按照上方的提示设定参数,其实莫兰指数的参数蛮少,主要就一个:空间关系的概念化。


因为首先,空间关系的概念化选择决定了你要不要设置距离范围或距离阈值以及权重矩阵文件,如果你选择了反距离,那么距离范围可以不输入,也可以选择输入;如果选择了FIXED_DISTANCE_BAND或者ZONE_OF_INDIFFERENCE,那么最好输入距离范围,当然也可以不输入,选择默认;如果选择了CONTIGUITY_EDGES_ONLY或者CONTIGUITY_EDGES_CORNERS,则不需要输入距离范围,选择了GET_SPATIAL_WEIGHTS_FROM_FILE,那当然需要引入权重矩阵文件了!


其次,距离法一般我们也都是选择欧氏距离,标准化一般都是默认勾选ROW的。那么我们按照以下的进行选择,然后点击生成报表,运行。


 

最终会生成一张报表如下,而不是返回给我们一张花花绿绿的图(那是局部莫兰指数或者其他空间统计工具会生成的),因为上面已经讲到,其实莫兰指数就是告诉我们要素是否是随机分布的,也就是说只会给我们一个值,是或者否,仅此而已:


 


上图是莫兰指数返回给我们的这张图表,其实也就是全部的莫兰指数结果,首先在左上角是最重要的三个指数,莫兰指数、z得分以及p值。


首先我们要看的其实是z得分以及p值,莫兰指数放在最后看:


p值,p-value,,probability,表示概率。对于模式分析工具来说,p值表示所观测到的空间模式是由某一随机过程创建而成的概率。当p很小时,意味着所观测到的空间模式不太可能产生于随机过程(小概率事件),因此您可以拒绝零假设。您可能会问这样的问题:要小到什么程度才算足够小?这是一个非常好的问题。


z得分,z-score,表示标准差的倍数。例如,如果工具返回的z得分为+2.5,我们就会说,结果是2.5倍标准差。如下所示,z得分和p值都与标准正态分布相关联。


观察上图,其实也就是说,上图曲线下方是随机分布的正态分布概率图,如果P值小于0.01,可以发现也就是随机分布的可能性落在了最左边蓝色或者最右边红色的区域内,但是这个可能性是0.01,即1%,也就是说,我们观察的空间模式是随机分布的可能性为1%,也就是有99%的可能性为不是随机分布,有可能是聚类或者离散模式,但是这另说。在统计意义上来讲,也就是说在99%的置信度上拒绝原假设,即有99%的把握认为原假设(随机分布)是不可能的。若0.05,也就是说在95%的置信度上拒绝原假设,即有95%的把握认为原假设(随机分布)是不可能的。


Z值与P值有何用?


大多数统计检验在开始时都首先确定一个零假设。模式分析工具的零假设是完全空间随机性 (CSR),它或者是要素本身的完全空间随机性,或者是与这些要素关联的值的完全空间随机性。


模式分析工具所返回的 z 得分和 p 值可帮助您判断是否可以拒绝零假设。通常,您将运行其中一种模式分析工具,并希望 z 得分和 p 值表明可以拒绝零假设,这就意味着:您的要素(或与要素关联的值)表现出统计意义上的显著性聚类或离散模式,而不是随机模式。


如果您在景观分布(或空间数据)中发现了空间结构(如聚类),就证明某些基础空间过程在发挥作用,而这方面通常正是地理学者或 GIS 分析人员所最为关注的。


置信度


z 得分(标准差)

p 值(概率)

置信度

< -1.65 或 > +1.65

< 0.10

90%

< -1.96 或 > +1.96

< 0.05

95%

< -2.58 或 > +2.58

< 0.01

99%


置信度为 95% 时,z 得分的临界值为 -1.96 和 +1.96 倍标准差。如果此时,与其关联的未经校正的 p 值为 0.05,但z 值在 -1.96 和 +1.96 之间,则未经校正的 p 值将大于 0.05,因而不能拒绝零假设,因为所表现出的模式很可能是随机空间过程产生的结果。如果 z 得分在该范围之外(例如,-2.5 或 +5.4 倍标准差),则所观测到的空间模式可能过于罕见,不可能是随机过程产生的结果,而且 p 值很小也可以反映出这一点。在这种情况下,可以拒绝零假设,并着手找出是什么可能导致您的数据出现具有统计显著性的空间结构。


这里的一个关键概念是,正态分布中间位置的值(例如,类似 0.19 或 -1.2 的 z 得分)代表了预期的结果。但在 z 得分的绝对值很大而概率很小时(即出现在正态分布的两端),您就会查看其中存在的不寻常现象并且这也非常有趣。例如,对于热点分析工具,不寻常意味着出现了具有统计显著性的热点或冷点。


(z 得分越高(或越低),聚类程度就越高。如果 z 得分接近零,则表示研究区域内不存在明显的聚类。z 得分为正表示高值的聚类。z 得分为负表示低值的聚类。)


因此,其实上面这张图下面的那句话其实就是给我们的解释,“随机产生此聚类模式的可能性小于1%”,也就是说,我们的数据是聚类的,因为随机的可能性是1%,也就是99%的把握认为我们的数据是聚类的,也就是湖南省122个县的GDP在空间上是有关联的,并且是聚类分布的。


其实莫兰指数也就只能告诉我们这么多了,它并不会返回一张红蓝相间的图给我们,那是其他的工具如局部莫兰指数或者热点分析会返回的图,因此全局莫兰指数是作为一个检验数据的空间相关性的工具出现的,但是也是必不可少的,当然了,虽然不能出图,但是在我们的论文里,是可以将这个结果作为结论出现的!!



- END -

ArcGIS制图中边框的选择与制作
ArcGIS 各种坐标系文件下载
ArcGIS中定义坐标系并判断坐标系是否正确
国家标准、行业标准...实景三维建设相关标准规范汇总
香!好用图源!ArcGIS、QGIS、奥维、图新...都能免费调用的高清亚米级图源

相关阅读

  • 解码国家数据局组建逻辑

  • 2023年第6期《中国经济周刊》封面《中国经济周刊》 记者 孙冰 | 北京报道中共中央、国务院近日印发了《党和国家机构改革方案》,其中明确了组建国家数据局。根据该方案,国家数
  • 新龙江 新故事|曾德永:为太空水稻挥洒青春

  • 7年前,他怀揣太空育种梦在哈工大开启了空间环境诱变机制研究之路,开始了一名“稻田守望者”的生活。7年来,他往返于实验室和实验田,不仅在基础研究方面取得了系列成果,还培育出了
  • 我区收视乡村公共空间治理全市域推开动员大会

  • 乡村公共空间治理全市域推开动员大会召开全面推动乡村公共空间治理向更广领域拓展为推进乡村振兴建设农业强市注入强劲动能
    4月2日上午,乡村公共空间治理全市域推开动员大会
  • 哈工大博士生“种水稻”,种出了新天地!

  • 7年前他怀揣太空育种梦保送到哈工大攻读硕士研究生开启空间环境诱变机制研究之路也开始了一名“稻田守望者”的生活7年来他往返于实验室和实验田不仅在基础研究方面取得了一
  • 奋起反超,中国“太空拖船”的一路狂飙

  • 出品|网易新闻导语:3月10日消息,美国国家航空航天局(NASA)2024年科学探索预算为272亿美元,其中10亿美元计划开发新型太空拖船。而此前中国的“SJ-21”号卫星曾让外媒“如临大敌”
  • 逛大芬油画村,深圳人的一种生活方式

  • 0.4平方公里,1200余家画廊、艺术类相关产业聚集,8000油画从业者,年参观量300万人次,年总产值 42亿元人民币……这就是“中国油画第一村”大芬村的现状。全深圳约1700万人,除去部

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • ArcGIS空间统计——Moran's莫兰指数

  • 概述:根据要素位置和属性值使用 Global Moran's I 统计量测量空间自相关性。提出者为澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰(Patrick Alfred Pierce Moran)。 Mo