半方差函数详解_“半变异函数”-程序员宅基地

技术标签: 人工智能  统计学  概率论  

1 引言

托布勒的地理第一定律指出,“一切都与其他事物有关,但近处的事物比远处的事物更相关。

在半变异函数的情况下,更接近的事物更可预测,变异性更小,而遥远的事物则难以预测,相关性也较低

例如,当前位置的地形更可能与前方 1 米处的地形相似,而不是与 100 米外的地形相似。

半变异函数绘制了样本值(污染、海拔、噪声等)如何随距离变化

接下来以土壤水分样本作为案例进行说明。

案例包含 10 英亩田地中的 73 个土壤水分样本。在西北角,样品更湿润,含水量更高。但在东部象限,它们要干燥得多,如下图所示。

针对上图存在以下疑问

  • 不同地点的值的可预测性如何?
  • 距离较近的已知值是否距离较远的值更相似

可以用统计依赖性或自相关来描述这个想法。此外,空间自相关(距离较近的事物比距离较远的事物更相似)为预测提供了有价值的信息。

2 半变异函数原理

要了解空间依赖性,可以使用半变异函数进行估计。半变异函数取 2 个采样位置,并将两点之间的距离称为 h

x 轴上,它以滞后为单位绘制距离 (h),滞后只是分组距离。取每组 2 个样本位置,测量响应变量(土壤中的含水量)之间的方差,并将其绘制在 y 轴上

根据观察者的不同,半变异函数看起来像是一大堆点。例如,土壤水分图如下所示:

但是可以通过选择单个点来做一些侦探工作。当在半变异函数上取这个点时:

可以在地图上看到它们代表哪 2 个点。这是有道理的,因为它们彼此相距很远。因此,它在半变异函数中的极右位置。下面强调的正是这一点:

它们与该特定滞后距离的平均值也存在很大差异。如果半方差较高,则它在 y 轴上的位置较高。可以看到,半方差在滞后距离越近时越小,滞后距离越大,半方差就越大

我们正在研究 2 个样本之间的所有距离及其变异性。半变异函数考虑所有点及其与方差的距离。

这就是为什么半变异函数上有这么多点的原因。这是上面数据集的一个子集,可以看到我们可以在半变异函数中绘制的所有不同点集。

3 半变异函数计算

半方差函数是距离 h 的函数,也是方向 α 的函数。当一个变量分布于空间时,该变量叫区域化变量(regionalized variable),半方差函数就是区域化变量 Z ( x i ) Z(x_i) Z(xi) Z ( x i + h ) Z(x_i+h) Z(xi+h) 增量平方的数学期望即区域化变量增量的方差(variograms)。其计算公式:

r ( h ) = 1 2 N ( h ) ∑ i = 1 N ( h ) [ Z ( x i ) − Z ( x i + h ) ] 2 r(h)=\frac{1}{2N(h)}\sum_{i=1}^{N(h)}[Z(x_i)-Z(x_i+h)]^2 r(h)=2N(h)1i=1N(h)[Z(xi)Z(xi+h)]2

式中, r ( h ) r(h) r(h) 是相隔距离为 h h h 的半方差图的估计值 N ( h ) N(h) N(h)相隔距离为 h 的所有点的配对数 Z ( x i ) Z(x_i) Z(xi) 是样点 x i x_i xi 的平均密度, Z ( x i + h ) Z(x_i+h) Z(xi+h) 是样点 x i + h x_i+h xi+h 的平均密度。

半方差图是 r ( h ) r(h) r(h) 作为距离 h h h 的函数的图形,其值为某一特定方向的值,其中有4个最重要的参数:

  • 变程(RANGE):是当变异函数的值达到平衡时的间隔距离,反映了区域化变量影响范围的大小。
  • 块金值(NUGGET):指变异函数曲线延伸到间隔距离为零时的截距,反映区域化变量内部随机性的可能程度
  • 基台值 C 0 + C C_0+C C0+C(SILL):是指达到平衡时的变异函数值,反映变量变化幅度的大小
  • 空间变异比 C 0 / ( C 0 + C ) C_0/(C_0+C) C0/(C0+C):反映变量空间变异的程度,其值较高,说明随机部分引起的空间异质性程度较高较低则说明由空间自相关部分引起的空间变异较大;如果该比值接近1,则说明该变量在整个尺度上具有恒定的变异。从结构性因素看,其表示系统变量的空间相关程度,比值小于25%,说明变量具有强烈的空间相关;比值在25%-75%,变量是中等程度的空间相关;大于75%,变量空间相关性很弱。

r ( h ) r(h) r(h) 为纵轴, h h h 为横轴,绘制出 r ( h ) r(h) r(h) h h h 增加的变化曲线为半方差图。

从图中可以看出:

  • 在距离较近的采样点,点之间的值差异往往很小。换言之,半方差很小。
  • 随着远离采样点的距离增加,采样点之间不再存在关系。它们的方差开始趋于平缓,样本值彼此之间没有关联。
  • 当同一位置有两个采样点时,可以预期具有相同的值,因此块金值应为零。有时他们不会,这增加了随机性。但在图形开始调平之前,这些值在空间上是自相关的。
  • 当距离增加时,半方差会增加。相隔很远的点对较少,因此样本点之间的相关性较低。
  • 正如半变异函数所示,它开始达到其平坦的渐近水平。尝试拟合函数以对此行为进行建模。
4 半方差图拟合模型

计算取样范围内所有可能距离间隔的变异函数,绘制函数曲线图,进而建立变异函数理论模型

地统计学中常用来拟合实际变异曲线的理论模型有球状模型、指数模型、高斯模型、线状模型等。

  • 一般情况下,球状模型说明所研究的种群呈聚集分布,表示当样本点间隔距离达到变程之前,样点的空间依赖性随样点间距离增大而降低
  • 指数模型与球状模型相似,但其基台值是渐进线
  • 随机分布 r ( h ) r(h) r(h) 不随距离变化而规律性变化
  • 非水平线状模型表示种群为中等程度的聚集分布,其空间依赖范围超过研究尺度
  • 完全随机或均匀的数据,曲线表现为纯块金变异图, r ( h ) r(h) r(h) 呈水平直线或稍有斜率,表明在抽样尺度下无空间相关性

选择何种模型去拟合样本半方差图是一个复杂的过程,一般是根据样本方差图的形状或研究目的来确定。

自然界中许多生物和非生物因子的空间分布与方向有密切关系,因此,也产生了相应的各项异性模型。

有些区域化变量往往包含各种尺度或各种层次的变化,反映在半方差函数上其结构往往不是一种模型结构,而是多种模型结构相叠加在一起的套合结构。

python实现:

https://scikit-gstat.readthedocs.io/en/latest/userguide/variogram.html#the-variogram

参考:
https://gisgeography.com/semi-variogram-nugget-range-sill/

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/mengjizhiyou/article/details/134147915

智能推荐

python简易爬虫v1.0-程序员宅基地

文章浏览阅读1.8k次,点赞4次,收藏6次。python简易爬虫v1.0作者:William Ma (the_CoderWM)进阶python的首秀,大部分童鞋肯定是做个简单的爬虫吧,众所周知,爬虫需要各种各样的第三方库,例如scrapy, bs4, requests, urllib3等等。此处,我们先从最简单的爬虫开始。首先,我们需要安装两个第三方库:requests和bs4。在cmd中输入以下代码:pip install requestspip install bs4等安装成功后,就可以进入pycharm来写爬虫了。爬

安装flask后vim出现:error detected while processing /home/zww/.vim/ftplugin/python/pyflakes.vim:line 28_freetorn.vim-程序员宅基地

文章浏览阅读2.6k次。解决方法:解决方法可以去github重新下载一个pyflakes.vim。执行如下命令git clone --recursive git://github.com/kevinw/pyflakes-vim.git然后进入git克降目录,./pyflakes-vim/ftplugin,通过如下命令将python目录下的所有文件复制到~/.vim/ftplugin目录下即可。cp -R ...._freetorn.vim

HIT CSAPP大作业:程序人生—Hello‘s P2P-程序员宅基地

文章浏览阅读210次,点赞7次,收藏3次。本文简述了hello.c源程序的预处理、编译、汇编、链接和运行的主要过程,以及hello程序的进程管理、存储管理与I/O管理,通过hello.c这一程序周期的描述,对程序的编译、加载、运行有了初步的了解。_hit csapp

18个顶级人工智能平台-程序员宅基地

文章浏览阅读1w次,点赞2次,收藏27次。来源:机器人小妹  很多时候企业拥有重复,乏味且困难的工作流程,这些流程往往会减慢生产速度并增加运营成本。为了降低生产成本,企业别无选择,只能自动化某些功能以降低生产成本。  通过数字化..._人工智能平台

electron热加载_electron-reloader-程序员宅基地

文章浏览阅读2.2k次。热加载能够在每次保存修改的代码后自动刷新 electron 应用界面,而不必每次去手动操作重新运行,这极大的提升了开发效率。安装 electron 热加载插件热加载虽然很方便,但是不是每个 electron 项目必须的,所以想要舒服的开发 electron 就只能给 electron 项目单独的安装热加载插件[electron-reloader]:// 在项目的根目录下安装 electron-reloader,国内建议使用 cnpm 代替 npmnpm install electron-relo._electron-reloader

android 11.0 去掉recovery模式UI页面的选项_android recovery 删除 部分菜单-程序员宅基地

文章浏览阅读942次。在11.0 进行定制化开发,会根据需要去掉recovery模式的一些选项 就是在device.cpp去掉一些选项就可以了。_android recovery 删除 部分菜单

随便推点

echart省会流向图(物流运输、地图)_java+echart地图+物流跟踪-程序员宅基地

文章浏览阅读2.2k次,点赞2次,收藏6次。继续上次的echart博客,由于省会流向图是从echart画廊中直接取来的。所以直接上代码<!DOCTYPE html><html><head> <meta charset="utf-8" /> <meta name="viewport" content="width=device-width,initial-scale=1,minimum-scale=1,maximum-scale=1,user-scalable=no" /&_java+echart地图+物流跟踪

Ceph源码解析:读写流程_ceph 发送数据到其他副本的源码-程序员宅基地

文章浏览阅读1.4k次。一、OSD模块简介1.1 消息封装:在OSD上发送和接收信息。cluster_messenger -与其它OSDs和monitors沟通client_messenger -与客户端沟通1.2 消息调度:Dispatcher类,主要负责消息分类1.3 工作队列:1.3.1 OpWQ: 处理ops(从客户端)和sub ops(从其他的OSD)。运行在op_tp线程池。1...._ceph 发送数据到其他副本的源码

进程调度(一)——FIFO算法_进程调度fifo算法代码-程序员宅基地

文章浏览阅读7.9k次,点赞3次,收藏22次。一 定义这是最早出现的置换算法。该算法总是淘汰最先进入内存的页面,即选择在内存中驻留时间最久的页面予以淘汰。该算法实现简单,只需把一个进程已调入内存的页面,按先后次序链接成一个队列,并设置一个指针,称为替换指针,使它总是指向最老的页面。但该算法与进程实际运行的规律不相适应,因为在进程中,有些页面经常被访问,比如,含有全局变量、常用函数、例程等的页面,FIFO 算法并不能保证这些页面不被淘汰。这里,我_进程调度fifo算法代码

mysql rownum写法_mysql应用之类似oracle rownum写法-程序员宅基地

文章浏览阅读133次。rownum是oracle才有的写法,rownum在oracle中可以用于取第一条数据,或者批量写数据时限定批量写的数量等mysql取第一条数据写法SELECT * FROM t order by id LIMIT 1;oracle取第一条数据写法SELECT * FROM t where rownum =1 order by id;ok,上面是mysql和oracle取第一条数据的写法对比,不过..._mysql 替换@rownum的写法

eclipse安装教程_ecjelm-程序员宅基地

文章浏览阅读790次,点赞3次,收藏4次。官网下载下载链接:http://www.eclipse.org/downloads/点击Download下载完成后双击运行我选择第2个,看自己需要(我选择企业级应用,如果只是单纯学习java选第一个就行)进入下一步后选择jre和安装路径修改jvm/jre的时候也可以选择本地的(点后面的文件夹进去),但是我们没有11版本的,所以还是用他的吧选择接受安装中安装过程中如果有其他界面弹出就点accept就行..._ecjelm

Linux常用网络命令_ifconfig 删除vlan-程序员宅基地

文章浏览阅读245次。原文链接:https://linux.cn/article-7801-1.htmlifconfigping &lt;IP地址&gt;:发送ICMP echo消息到某个主机traceroute &lt;IP地址&gt;:用于跟踪IP包的路由路由:netstat -r: 打印路由表route add :添加静态路由路径routed:控制动态路由的BSD守护程序。运行RIP路由协议gat..._ifconfig 删除vlan