《地质统计学》ppt课件
地质统计学\n第一章绪论地质统计学的概念地质统计学的发展历程地质统计学的发展趋势地质统计学的研究内容\n一、地质统计学的概念地质统计学(Geostatistics)Geostatisticsisconcernedwiththestudyofphenomenathatfluctuateinspaceand/ortime(GeostatisticsGlossatyandMuktilingualDictionaryR.Olea.editor.OxfordUniversilyPressNewYork.1991)地质统计学是研究在空间(或时间)内变化的现象,它提供了一套理解和模拟空间变量的一套确定性和统计性的工具。地质统计学是数学地质的一个重要分支,而数学地质是地质科学中一门新的边缘学科。\n地质统计学是以区化变量理论作为基础,以变异函数为主要工具,对既有随机性又具有结构性的变量进行统计学研究的一门学科。(侯景儒,1998)田世丰在《数学地质浅析》(1998)一文中将地质统计学定义为:地质统计学是以矿石品位和矿床储量的精确估计为主要目的,以矿化的空间结构(空间相关)为基础,以区域化变量为核心,以变异函数为基本工具的一门新兴学科。地质统计学的定义地质学→数学地质→地质统计学地质统计学是地质学由定性向定量化发展的产物\n二、地质统计学的发展历程1、萌芽阶段(20世纪40年代—50年代末)为寻求合理、先进的矿床储量估算方法,有人提出了变异函数(variogram)的基本概念,随后南非金矿的矿山地工程师克里格(krig)及南非统计学家西舍尔(H.S.Sichel),提出了根据样品空间位置不同,相关程度不同来计算块段品位及储量而使其估计误差最小的储量计算方法。2、形成阶段(20世纪50年代末—60年代)50年代末,法国概率统计学家马特隆(GMatheron)在克里格及西舍尔研究的基础上,对十几个不同类型的矿床继续深入研究,于1962年首先提出了区域化变量(regionalizedvariable)的概念,为了更好地研究具有随机性和结构性的自然现象,他提出了地质统计学(Geostatistics)一词,发表了《应用地质统计学论》从而为地质统计学奠定了理论基础。3、发展阶段(20世纪70年代—)经过30多年的发展,地质统计学从理论研究到实践应用都有了一大批成果,其应用领域也不断地扩大和深入,在地质、矿山、环境保护、石油勘探、开发等10余个学科都不同程度地得到应用,越来越受到世界各国的重视。\n地质统计学在中国的发展历程1、起步阶段(1977~1989.11)地质统计学1977年传入我国,当时由美国福禄尔采矿金属有限公司)的H.M.Parker博士随美中贸易全国委员会矿业代表团来华访问,纯属偶然机缘。阶段特点:(1)以大专院校和有关工业部门的研究设计单位为活动主体,以出国学习深造、宣传、学术交流为主要形式。(2)在理论研究方面,以普通克里格法为主,泛克里格、对数正态克里格、因子克里格有所涉及。(3)零星的研究应用,随意性大,目的性不强。多应用于物探、化探、遥感数据处理及找矿预测等方面。\n地质统计学在中国的发展历程2、发展阶段(1989.11~1995.10)1989年11月召开全国第一届地质统计学学术讨论会阶段特点:(1)理论研究更加深入,涉及到的方法原理更加广泛,非平稳线性地质统计学、非参数地质统计学、多元地质统计学以及随机模拟等。(2)在应用方面有了实质性的突破。采用地质统计学方法提交地质勘探成果为生产部门所接受,开始成为地质勘探、油田和矿山开发的使用方法,与生产实践结合得越来越紧密。。(3)开发出了一系列软件系统。如西安石油学院的的KMS克里格绘图系统、北京科技大学的三维普通克里格法程序系统(3DOK),地矿部的KPx2.0软件系统等。\n地质统计学在中国的发展历程3、完善阶段(1995.10~)阶段特点:(1)与生产实践结合的更加紧密,注重解决实际问题,地质统计学的方法原理成功地应用到地质建模,成为今年来是由地质领域发展最快的技术之一。(2)地质统计学的软件系统进一步成熟。(3)无形资源评估将为地质统计学的应用提供更加广阔的市场。现在,地质统计学的应用已不仅仅限于地质领域,在环境科学、农田水利、土壤学、渔业、森林、海洋等方面也发挥这巨大的作用\n三、地质统计学的发展趋势1)从地质统计学的发展及应用看,它是一门新兴的交叉边缘学科,具有广阔的发展空间。2)由于研究对象的复杂性,地质统计学在许多多方面还存在着理论上的不足和不完善,要使地质统计学达到完全成熟和实用,还有许多工作待作。目前对于地质统计学的反对意见也很多,有人根本就不相信地质统计学的结果。3)地质统计学与其它学科的相互渗透,如贝叶斯理论,模糊数学及分维理论的结合,可能会产生新的突破。\n四、地质统计学的研究内容随机变量变差函数克里格条件模拟\n1、随机变量和随机函数按定义,地质统计学是“研究在空间(或时间)内变化的现象,”例如:岩石的物理性质包括Φ、Κ、金属或污染源的含量,地理性质(人口密度、海拔高度)这些连续性变化的变量,离散性的变量如岩石类型,昆虫或化石的属种,沉积微相类型等。把任何未知样本看作一个随机变量(RV)Z,这个随机变量的概率分布描述了有关Z的不确定性。随机变量:按照一定的概率分布能够取得不同数值的变量,随机变量的模型,即随机变量的空间分布,通常依赖于所处的空间位置,同时也随已有信息的变化而变化。\n连续型随机变量的随机函数连连续性随机变量Z(u)的累积概率分布函数(ccdf)可以表示为:随机函数离散型随机变量的随机函数在只能取得K个不同值的离散随机变量的情况下,使用类似的表示方法\n2、变差函数变差函数(Variogram)定义为两个相距h的随机变量的增量的方差变差函数是地质统计学研究的基本工具,其定义为两个相距h的随机变量增量协方差,表达式为:其中,C(h)是平稳协方差函数是平稳方差。变差函数研究内容包括变差函数的定义,性质与功能,变差函数的理论模型以及变差函数的结构分析\n3、克里格克里格插值(krigging)克里格是根据协方差函数或者变差函数的先验模型,使估计方差达到最小的线性回归方法的综合,即最优线性,无偏估计。克里格算法的实值是利用邻近的数值Z(μa),a=1.2.3…n,估计一个未取样值Z(μ)。主要研究各种克里格的数学基础,不同克里格方法的表达式及其应用条件,克里格在矿产估算中的应用。\n4、随机模拟随机模拟是从一个随机函数(RF)模型中提取多个等概率的所有随机变量(RV)的联合实现。在随机模拟中,研究的内容包括随机模拟的定义及其与插值的区别,随机模拟的基本原理,随机模拟的分类,典型的随机模拟方法及其计算机实现。本课程还将介绍地质统计学在储层建模中的应用包括资料的准备建模的步骤,成果的显示等。\n地质统计学与经典统计学经典统计学在地质研究中的缺陷1、经典统计方法在统计样品品位的频率及其分布时不考虑各样品的空间分布。但在地质研究中,很多地质变量的空间分布则是必须考虑的因素,经典统计学反映不了地质变量的空间变化性。2、经典概率统计学研究的对象必须是纯随机变量,而地质研究中的许多地质变量并不是随机变量,而是既有随机性又有结构性的变量。3、经典概率统计学所研究的变量原则上都是可以无限次重复试验或大量观察的,但地质变量则不行。因为一旦在矿体某处取一样品后,严格说来,就不可能在同一地方再次取到样品了。4、经典统计学一般要求每次抽取样品必须是独立进行的,但地质变量在两个相邻样品中的值就不见得一独立的,往往有某种成都的相关性。\n地质统计学的优点1、地质统计学不是简单地把现成的概率统计理论、方法直接搬到地质领域中,而是根据地质变量本身的特点来选择合适的数学概念、理论、模型、方法,并加以改造、创新,使之适应地质变量的特殊性的要求。其最鲜明的特点就是地质与数学相结合。2、最大限度地利用了地质研究中所能提供的各种信息。包括空间信息、所有已知样品信息等。3、不但可以进行样品的整体估计,最重要的是可以进行样品的局部估计4、应用地质统计学方法得到的地质变量的精度比传统方法要精确,可以避免系统误差。5、地质统计学方法可以直接给出估计精度来。其标准就是克里格方差。6、应用地质统计学方法的计算机实现,实现地质变量的科学化、精确化和自动化。7、地质统计学中的条件模拟可以很好再现变量的空间变化性,是研究储层非均质性的有力工具。\n第二章预备知识一、概率论基础二、随机变量及其概率分布三、随机变量的数字特征四、统计推断基础\n一、概率论基础1、随机事件概率论是研究自然界偶然现象的科学,在概率论中把偶然现象称为随机现象。在自然界,介于“必然事件”和“偶然事件”之间的即是“随机事件”。这类事件的特征是在一定条件下可能发生,也可能不发生,或者在一定条件下有多个可能发生的结果,而其结果事先不能预测。\n2、统计概率频率:设随机事件A,在次试验中发生m次,其比值m/n称为随机事件A的频率显然当重复试验的次数充分大时,随机事件A的频率(A)常常稳定在一个确定的数字附近,这就是概率。概率:在一定的相同条件下,重复作n次试验中发生了m次,当n充分大时,随机事件A的频率m/n稳定在某一数字P附近,称数值P为该随机事件的概率。记为P(A)=P性质(1)0≤P(A)≤1对于任意事件A,总有(2)P(V)=0V—不可能事件(3)P(U)=1U—必然事件概率虽然是用频率来刻划的,但概率与频率是两个不同范畴的概念。随机事件的频率与进行的试验次数有关,而随机事件的概率则是客观事物本身的属性。一般地说,当试验次数足够大时,频率可作为概率的近似值。\n3、古典型概率古典概率是一类简单的随机现象,它具有如下特征:1)在观测或试验中,它的全部可能结果为有限个,记作E1、E2、E3…En,即穷尽性2)在几个可能结果中,任何两个可能结果不可能同时发生,即这些事件是两两互不相容的,即互不相容性。3)事件E1、E2、E3…En发生的可能概率相等,即等概率性。4)在n个可能结果中,至少有一个结果发生,即必然性。具备上述四种性质的事件群,称作完备群,组成完备群的事件叫基本事件。若试验时某一基本事件的发生能导致随机事件A的发生,则称这个基本事件有利于随机事件A。若以N个互不相容且等可能性的事件构成的完备群代表试验得到的一切可能结果,其中M各事件有利于随机事件A,随机事件A的概率便等于有利的基本事件数M与基本事件的总数N的比值,即\n4、概率的基本运算1)加:P(A+B)=P(A)+P(B)A、B互不相容同理P(A1+A2+A3+…+An)=P(A1)+P(A2)+P(A3)+…+P(An)2)乘①事件A和事件B有连带关系,即在事件B已发生的条件下,事件A发生的概率(带有附加条件的概率),记作P(A|B)即或②不带有附加条件的概率,即事件B的发生不影响事件A出现的概率,故\n③全概率公式式中,PHi(i=1、2、3…n)为已知事件Hi的概率,P(A|Hi)为事件A在Hi已发生的条件下的条件概率;Hi事件两两互不相容,是样本空间的一个分割,甲、乙、丙三个钻井队施工,甲、乙、丙钻井队打钻的孔数分别是总孔数的20%、35%、45%,其见矿率分别是3%、2%、1%,问从总钻孔中任意指定一个钻孔的见矿概率是多少?解:设H1为{甲用钻井队打钻的孔数}P(H1)=0.20H2为{乙用钻井队打钻的孔数}P(H2)=0.35H3为{丙用钻井队打钻的孔数}P(H3)=0.45A为{钻孔见矿数}即P(A|H1)=0.03P(A|H2)=0.02P(A|H3)=0.01\n④逆概率公式(贝叶斯公式Bayes)假设事件A只能与两两互不相容的事件H1、H2、…Hn之一同时发生,且有:为样本空间)则该式称为逆概率公式,又可称作“后验概率”。它反映了实验之后对各种发生“原因”可能性的大小。地质上的储层分类评价等可应用该方法。同理\n二、随机变量及其概率分布随机变量是基本事件的函数,一般定义为:根据随机实验的结果而取得不同数值的变量称作随机变量。一般用希腊字母ξ、η,…表示。随机变量可分为离散型的和连续型的两种。若随机变量所可能取的值可以一一列举出来,即是有限的,则为离散型随机变量;若随机变量所可能取的值不能意义列举出来,则称连续型随机变量。随机变量的取值可以通过随机事件概率的方法来研究。从概率角度出发,可以给随机变量下一个更为科学的定义,即:若某一试验结果可用一变量ξ来表示,依着两种不同类型的随机变量,有两种情形:(1)若随机变量ξ是离散型的,则任一取值有确定的概率(2)若随机变量ξ是连续型的,则对任一实数,{ξ
0)则称ξ服从泊松分布式中,k为指定的发生次数;e为自然对数的底,λ为参数\n2、连续型随机变量的概率分布(1)正态分布若随机变量ξ的概率密度为:(-∞0,有:其中Sn=ξ1+ξ2+…+ξn,只要n充分大,算术平均值(Sn/n)接近于数学期望。通常把上式服从同一分布的随机变量数ξ1,ξ2,…ξn叫做服从大数定律(或称弱大数定律)。若不考虑D(ξk)是否存在,只要E(ξk)存在,上式亦存在,即这时把服从同一分布的随机变量数列ξ1,ξ2,…ξn称作服从强大数定律。大数定律揭示的规律是:只要n充分大,观测结果算术平均值接近于数学期望几乎是必然事件\n2、中心极限定理设ξ1,ξ2,…ξn是独立同分布的随机变量数列,且E(ξk)、D(ξk)(k=1,2,…)存在,同时D(ξk)不等于0,一切实数aa时,样品间就不存在相关性。a的大小反映了研究对象(如油藏)中某一区域化变量(如孔隙度)的变化程度,可以用在a范围以内的已知信息对待估区域进行预测。C=C0+C1,称为总基台值。C1:基台值,是先验方差与块金效应之差c=C-C0\n变差函数的性质在二阶平稳假设下:这是一个非常重要而且极为有用的共识,它表明了在二阶平稳的假设条件下,变差函数γ(h)、协方差函数C(h)与先验方差函数C(0)三者之间的重要关系。1、协方差函数C(h)的性质\n2、变差函数γ(h)的性质\n变差函数的理论模型如同经典统计学那样,理论变差函数仅仅是几个简单的模型,这些理论模型将直接参与克里格和随机模拟计算\n球状模型\n球状模型图示a是变程,一个主要特点是在原点附近的小范围内表现出线性行为,但在大距离时变得平缓当h为变程a时达到基台值。模型的另一个特点是原点的切线在2/3变程时便达基台值,这个事实在拟合实验变差函数时非常有用hCa0\n标准化后的球状模型均值为0,方差为1Var[Z(x)]=(∞)=1=C,球状模型可写成:\n高斯模型\n高斯模型图示式中a不是变程,由于当时即当时(h)≈C0+C所以该模型的变程为hC高斯模型\n标准化后的高斯模型高斯模型是一种连续性好但稳定性差的模型\n指数模型当h=3a时,即当h=3a时,γ(h)≈C0+C,所以该模型的变程约为3a\n三种变差函数的比较模型过原点切线与基台值交点的横坐标变程原点处的形状球状2a/3a直线指数a3a直线高斯无交点抛物线\n变差函数的功能变差函数在地质统计学中占有非常重要的地位,它不仅是许多地质统计学计算的基础,而且变差函数能够反映区域化变量的许多重要性质。1、通过编程反映变量的影响范围2、变差函数在原点处的形状可以反映变量的空间连续性。(1)抛物线型:反映变量具有高度的连续性。(2)直线型:反映区域化变量具有平均的连续性(3)间断型(有块金效应型):反映变量的连续性很差3、不同方向上的变差图可反映区域化变量的各向异性4、变差函数如果是跃迁型的(一个变程和一个基台值),其基台值的大小可反映变量在该方向上变化幅度的大小5、块金常数的大小可反映区域化变量的随机性大小\n结构分析(Structureanalysis)当作出实验变差函数图以后,最好是用一种合适的理论变差函数来拟合它,然后就可以对所研究的区域化变量进行分析。但是在实际工作中,区域化变量的变化性很复杂,它可能在不同的方向上有不同的变化性,或者在同一个方向上包含着不同尺度上的多层次的变化性,因而无法用一种理论模型来拟合它。为了全面了解区域化变量的变异性,就必须进行结构分析。\n结构分析的定义所谓结构分析,就是构造一个变差函数模型对于全部有效结构信息作定量化的概括,以表征区域化变量的主要特征。结构分析的主要方法是套合结构(neststructure)。所谓套合结构,是分别把出现在不同距离h上和(或)不同方向α上同时起作用的变异性组合起来。\n套合结构的表示方法套合结构可以表示为多个变差函数之和,每一个变差函数代表种特定尺度上的变异性。一套合结构的表达式为:\n套合结构的实现一个方向上的套合结构不同方向上的套合结构几何异向性及其套合结构带状异向性及其套合结构\n一个方向上的套合结构套合结构中每一个变差函数代表一种特定尺度上的变异性,可以是不同模型的变差函数。例如某区域化变量在某一方向上的变异性由γ0(h)、γ1(h)、γ2(h)组成。总的套合结构是:γ(h)=γ0(h)+γ1(h)+γ2(h)γ0(h)表示微观上的变化性,其变程a极小,可近似地看成纯块金效应:γ1(h)代表矿层及岩层的变化,可以用一个球状模型来表示,其变程a1=10\n一个方向上的套合结构γ2(h)可能表征矿化带的范围,也是一个球状模型,其变程a2=200m套合结构的具体表达式为总的套合结构是:γ(h)=γ0(h)+γ1(h)+γ2(h)其中a1>n时,原先模拟的数值的影响越来越重要,这时要特别注意原始数据的影响只利用邻域的条件数据使得(n+m)个随机变量的统计特征只能在邻域内的最大样品距离之内得到恢复。例如,搜寻半径至少要为所要恢复的变差函数的距离。当模拟过程从1增加到N时,这就要求越来越多的限制条件,这时可利用多级网格的概念,即在两步或更多步内模拟N个节点值:(1)利用大的数据邻域模拟较稀疏的网格,例如在每十个节点的位置处进行模拟,大的邻域保证恢复大规模的变差函数结构(2)在较小的邻域内模拟剩下的节点理论上并不规定要模拟的N个节点的顺序。但是最好是考虑一个随机的顺序。\n序贯模拟的步骤1.Assigndatavaluestoclosestgridnode2.Establisharandompaththroughallofthegridnodes3.Visiteachgridnode:(a)findnearbydataandpreviouslysimulatedgridnodes(b)constructtheconditionaldistributionbykriging(thisiswherethevariogramcomesin)(c)drawsimulatedvaluefromconditionaldistribution4.Checktheresults\n序贯高斯模拟由一个高斯型的平稳随机函数Z(u)所表征的一个连续变量z(u)的条件模拟过程是:1、确定反映整个研究地区而不只是已有的z取样数据的单变量cdfFZ(z),如果z-数据集中在某一局部范围,首先需要对数据进行解串,也可能需要对数据通过外推进行光滑2、利用cdfFZ(z),进行正态得分转换,把z-数据变为具有标准正态分布的y-数据3、确定y-数据分布是否符合多元高斯模型,如果不符合,可考虑使用其它模型\n4、如果能把多元的高斯随机函数模型用于y-数据的话,便可开始序贯模拟:a.定义一条随机路径,依次访问网格(不一定是规则的)上的各个节点,在每个节点u处,保留一定数目的邻域条件数据,包括原始的y-数据和已经模拟过的网格节点y-数据b.利用SK和正态得分的变差函数模型来确定在未知u处随机函数(RF)Y(u)的参数(均值和方差)c.从ccdf中随机地提取一个模拟值y(l)(u)d.把这个模拟的值y(l)(u)加进数据集中e.接着到下一个节点,并一直循环到所有的节点都被模拟了5、把模拟的正态数值{y(l)(u),u∈A}逆转带回原始变量的模拟值{z(l)(u)=φ-1(y(l)(u)),u∈A},常常需要进行组间内插和尾部外推\n有关序贯高斯模拟的说明1、多个实现如果需要得到多个实现{y(l)(u),u∈A}}l=1,2,…,L,可以利用下面两种方法对前面的算法重复L次:a.使用同样的随机路径放所有的节点,在这种情况下,从一个实现到另一个实现的数据构型不变,SK的方程组也不变,只需要解一次SK方程组。b.每次实现所使用的随机路径各不相同,每次的数据构型也不相同,因此需要建立不同的SK方程组求解。CPU时间增加\na.SimpleKriging(SK)b.OrdinaryKriging(OK)c.OtherTypes:UniversalKiriging(UK):AccountsforsimpletrendsExternalDrift:accountsformorecomplextrends2.TypeofKriging\n1.transformdatato"normalspace"2.establishgridnetworkandcoordinatesystem3.decidewhethertoassigndatatothenearestgridnodeorkeepseparate4.determinearandompaththroughallofthegridnodes(a)searchfornearbydataandpreviouslysimulatedgridnodes(b)constructtheconditionaldistributionbykriging(c)drawsimulatedvaluefromconditionaldistribution5.checkresults(a)honordata?(b)honorhistogram:N(0,1)?(c)honorvariogram?(d)honorconceptofgeology6.backtransformandcheckresultsDetailedStepsinSGSIM\n指示模拟(IndicatorSimulation)\n类型变量(离散变量的指示模拟)考虑K个互不相容的类型Sk,k=1,…,K的空间分布这些类型也是穷尽的,即任何位置u属于且仅属于这K个类型的一种假设i(u;Sk)是类型Sk的指示变量,如果u∈Sk,设i(u;Sk)=1,否则为0。类型的互不相容性和穷尽性保证了下面关系的成立对于指示变量i(u;Sk)直接应用于克里格算法就可得到位置u处类型Sk的概率估计值。例如利用简单克里格:其中Pk=E{i(u;Sk)}∈[0,1]是类型Sk的边缘频率,可以从类型为Sk的数据解串比率推导而来利用类型Sk的指示协方差函数的简单克里格方程组可得到权值λα\n离散变量的序贯指示模拟在沿随机路径的每一个节点u处,先进行指示克里格估计,然后作次序关系,就可得到K个估计量的概率值P*k(u)│(•)),k=1,2,…K。这个次序定义了条件信息(•)包括原始的数据和已经模拟过的类型Sk的指示数据接着确定K个类型的任意次序,如1,2,…K。这个次序定义了具有K个分割点的概率区间[0,1]间的cdf型标度:提取一个在[0,1]之间均匀分布的随机数p,p所落在的区间决定了在位置u处的模拟类型,利用这个新模拟的信息对所有的K个指示数据进行更新接着模拟下一个节点u’。由于p均匀分布,对于K个概率值P*k(•)的任意排序并不影响所模拟的类型和类型的空间分布\n连续变量的序贯指示模拟一个被离散成K个互不相容的类别Sk:(zk-1,zk],k=1,2,…K的连续变量z(u)的空间分布能够模拟为K个类别指示数据的空间分布。所丢失的组间分辨率可以利用一些组间分布模型得到部分恢复把连续变量z(u)看作K个类别的马赛克模型(方块模型)的优点在于它能利用不同的指示变差函数来灵活地模拟每种类型的空间分布特征,其另一个优点就是可以考虑软信息。而单一的高斯随机函数模型不具有这种灵活性,也就是说它没有足够的自由参数来处理混合总体或考虑软信息。\n累计类别指示数据与真实的没有排列次序的类别总体不同,连续变量z(u)的类别(zk-1,zk],k=1,2,…K需要依次排序.由于这个原因,最好用累计类别指示数据来描述所有的类别:除了第一个和最后一个类别,累计指示变差函数的推导比类别指示变差函数的推导要容易,尤其是类别具有小的边缘分布的情况.而且损失的信息少\n连续变量的序贯指示模拟在沿随机路径所要模拟的每个节点u处,指示克里格算法(SK或OK)通过估计K个概率值,提供了一个ccdf模型:组间内插使得对所有的门槛值z∈[zmin,zmax]都有连续的概率值通过随机地提取一个p(l)∈[0,1]间均匀分布的信息,然后转换为ccdfp(l)-分位数值,即可的蒙特卡罗模拟的一个实现z(l)(u):利用模拟的结果z(l)(u)对指示数据集(所有的截断值zk)进行更新,然后到随机路径的下一个位置u’一旦所有的位置u都被模拟之后,就得到一个随机模拟图像{z(l)(u),u∈A},为了得到另一个独立的实现{z(l’)(u),u∈A},l’≠l,只需沿一条新的随机路径重复整个序贯模拟的过程\nDetailedStepsinSISIM\nP-场模拟(P-FieldSimulation)通过把已经模拟过的数值看作模拟下一节点的条件数据,序贯模拟能够成功地恢复协方差函数模型,对于每一个新的实现,再要模拟的每一个节点处需要重新建立ccdf。如果从一个模拟到另一个模拟,这些ccdf可以保持不变的话,例如忠实于同样的原始数据,那么模拟速度可以加快许多。如果类似于序贯模拟方法,保证用于从ccdf中随机提取的概率值本身相互联系而不是独立的话,那么就能得到模拟数值之间的相关关系,这就是P-场模拟的出发点\nP-场模拟的实现令F(u;z|(n))和F(u’;z|(n))是在位置u和u’处只受限于原始的n个数据的ccdf,这n个原始数据值可以是原始变量或指示变量,也可以是类型变量。通过对z连续数据的正态得分转换进行多元高斯克里格估计或对指示数据进行指示克里格估计,可以得到ccdf,然后利用空间相关的概率值P(l)(u)和P(l)(u’),从这些ccdf中提取模拟的z值。上标(l)表明是第l个实现。概率值P(l)(u)和P(l)(u’)的空间相关性在于它们来源于“P-场”,或随机函数P(u)的同一实现。这种“P-场”具有在[0,1]之间的平稳均匀分布,其协方差函数模型是从数据的均匀转换的样品协方差函数推导而来的注意既然ccdf已经忠实与原始数据,P-场的实现{P(l)(u),u∈A}不必再受限于原始数据。在数据点uα处,ccdfF(uα;z|(n))的方差为0,中心位于数据值uα处。因此不论概率值P(l)(uα)是多少,那个ccdf一定返回数值:z(l)(uα)=z(uα)\nP-场模拟与序贯方法的差异及其优点P-场模拟与序贯方法的不同表现在:P-场方法把忠实与原始数据的任务和恢复协方差函数的任务分开来完成。前者通过ccdfF(u;z|(n))来完成,后者通过概率值P(l)(uα)来实现P-场模拟的主要优点在于它的快速简单(1)ccdfF(u;z|(n))只忠实于n个原始数据;它们只计算一次,然后就存下来(2)因为P-场的实现{P(l)(u),u∈A,l=1,2,…,L}是非条件模拟,可以用任何一种快速的模拟算法进行计算(3)然后利用每一个P的实现从预先存储的ccdf中提取z的条件实现\nSequentialsimulationsucceedsinreproducingthecovariancemodelsbytreatingeachsimulatedvalueasaconditioningdatumforsimulationatallsubsequentnodesTheccdf'sateachnodetobesimulatedmustbeconstructedforeachnewrealizationP-fieldsimulation\nMuchspeedwouldbegainediftheseccdf'scouldremainthesamefromonerealizationtoanother,e.g.,bybeingconditionedonthesoleoriginaldata.Thecorrelationbetweensimulatedvaluesisobtainedbyensuringthattheprobabilityvaluesusedtodrawfromtheccdf'sarethemselvescorrelatedinsteadofbeingindependentonefromanotherasinthesequentialapproach.TheideaofP-fieldsimulation\n1.LetF(u;z|(n))andF(u';z|(n))betheccdf'satlocationsuandu'conditionedononlytheoriginalndatavalues-eithercontinuousorindicatorsorcategories-ccdffrommultiGaussiankrigingperformedonnormalscorestransformsofthez-continuousdata,or-ccdffromindicatorkrigingperformedonindicatordata2.Thez-simulatedvaluesarethendrawnfromtheseccdf'susingspatiallycorrelatedprobabilityvaluesp(0(u)andp(0(u'),thesuperscript(l)denotingthel-threalization:z(l)(u)=F*-1(u;p(l)(u)|(n))suchthat:F'(u;z(l)(u)|(n))=p(l)(u)Theprobabilityvaluesp{0(u),p(0(u')arespatiallycorrelatedinthattheycomefromthesamerealization(l)ofa"p-field",orRFP(u),withstationaryuniformdistributionin[0,1]andcovariancemodeledfromthesamplecovarianceoftheuniformtransformsofthedataTheProcedureofP-FieldSimulation)\n3.Thep-fieldrealizations{p(l)(u),uA}neednotbeconditionalsincetheccdf'sarealreadyconditionedtotheoriginaldata4.TaskofconditioningisseparatedfromthetaskofreproducingthevariogramThemainadvantageofthep-fieldapproachisspeed:1.theccdf'sF(u;z|(n))areconditionedonlytothenoriginaldata;theyarecalculatedonlyonceandstored,2.becausethep-fieldrealizations{p(l)(u),uAl=1,...,L}arenon-conditional,anyfastsimulationalgorithmcanbeused,suchasspectraltechniques3.eachp-realizationisthenusedtodrawtheconditionalz-realizationfromtheprevisouslystoredccdf's\n模拟退火(SimulatedAnnealing)模拟退火的基本思想是对于一个最初的图像连续扰动(Perturb),直到他与预先定义的目标函数特征相匹配。接受或拒绝某次扰动的标准是看该次扰动能否使得图像更接近目标。利用数值方法产生连续或类型变量的条件模拟图像被称为“模拟退火”,这是一种较新的数值模拟方法。模拟退火最初只是一种优化方法,但已被用于产生随机图像,如产生与目标严格或近似吻合的多种实现。成功地应用模拟退火的关键是能很快地判断两次扰动产生的图像的质量,并决定是否保留这次扰动。模拟退火可用于修改(后处理)由较快的模拟算法如序贯高斯或P-场模拟得到的较为粗糙的随机模拟图像,使其更符合地质特征\n利用模拟退火进行随机模拟通过把条件数据重新定位到最靠近的网格节点处,然后从用户定义的直方图中随机地提取剩下的网格节点值,得到最初的图像,然后通过扰动或在一个随机选择的节点处(不是条件数据的位置处)重新提取数值,依次对这个最初的图像进行修改。如果目标函数(试验和模型变差函数的均方差平均值)降低的话,就接受这个扰动。但并不是所有使目标函数增加的扰动都被拒绝,这种方法是否成功在于模拟实现的缓慢冷却的程度,它受到随时间而降低的温度函数的控制。温度(或控制参数)越高,接受不理想的扰动的概率也越高。当模拟实现开始冻结时,即进一步的扰动并不使目标函数进一步降低或者达到预先定义的最小目标函数值时,就完成了一次模拟。通过把数据点重新定位到网格节点处能够恢复原始的数据值,这些网格节点处不允许任何扰动\n模拟退火实现步骤1、把从总体分布中随机提取的数值放在每一个节点处,产生最初的三维数值模型(类似于真实退火中的初次熔化)2、目标函数(类似于真实退火过程中的吉布斯自由能量)为希望得到的空间特性和每次实现的空间特性之间的差别(如模拟实现的变差函数和模型变差函数的差别)3、通过在一个随机选择的位置处随机提取一个新的数值,对图像进行扰动(类似于真实退火过程中的热振荡)4、如果目标函数降低的话,就接受该次扰动(热振荡),如果目标函数增加的话,以一定的概率接受。5、持续扰动过程,降低接受并不理想的扰动的概率,直到达到最低的目标函数的状态目标函数的状态越低,说明三维模拟实现的效果越好\n目标函数的类型在模拟退火模拟过程中,可以使用以下五种目标函数的任意组合1、直方图或单变量的分布是随机模拟实现必须忠实的统计参数,模拟实现的累积分布F*(z)应该和预先定义的某些z数值(选择那些把参考累计分布均匀的离散化的数值)的累计分布F(z)相匹配当一系列的条件分布确定了边缘直方图时,没有必要再次明显地把直方图作为限制条件\n2、变差函数反映了模拟实现中的两点空间变化性,模拟实现的变差函数γ*(h)应该和预先定义的变差函数γ(h)相匹配。目标函数记为在每一个滞后距离处除以模型变差函数的平方使得单位标准化,且给较低的数值分配较多的权值\n3、指示变差函数能够明确地定义在较低(高)的门槛值处的强或者弱连续型.指示变差函数的目标函数记为:式中nc是指示变差函数的个数4、要模拟的主变量和二级变量(具有同样的分辨率)之间的相关系数反映了线性相关性其中ρ*是在模拟实现的所有网格节点处的主变量和二级变量之间的相关性,ρ是目标相关系数。\n5、要模拟的主变量和二级变量之间的条件分布反映了比线性相关系数更为丰富的信息,这一目标函数记为:其中nS、nP分别是二级变量和主变量的类别的个数,符号fi(j)指的是如果同位的二级变量在类别i内对应的主变量(j=1,2,…,nP)的条件分布。其中\n一般地,目标函数O是由C个部分的加权值和组成的其中wc和Oc分别为权值和目标函数的组份,C的最大值可为5,目标函数的每一个组分Oc代表的度测量单位可各不相同权值wc便于在全局目标函数中平等地对待每个组分的贡献。根据目标函数的变化决定是接受还是拒绝某个扰动建立不同的权值wc,c=1,2,…,C,使得在平均意义上,每个组分对于目标函数变化O的贡献是均等的,也就是说,每个权值与这个组分的目标函数变化的绝对值之平均值O成反比\n除了确定目标函数之外,基于模拟退火的模拟算法的另一个关键是如何决定还是拒绝某一次扰动,接受扰动的概率分布是由波尔兹曼分布给出的所有理想的扰动(Onew≤Oold)都被接受,而以一个指数分布的概率接受并不理想的扰动。指数分布中的参数t类似于退火中的“温度”,温度越高,接受一次并不理想的扰动的概率越大温度t不能降低得太快,否则模拟实现会陷入局部优化状态,而且永远也不会收敛。但是如果降低得太慢的话,收敛速度就太慢。确定如何降低温度t被称为“退火步骤”,有一些数学原理保证退火步骤的收敛。\n迭代模拟迭代模拟方法的主要思想类似于模拟退火的基本思想,即通过对原始图像进行连续的扰动建立模拟的图像。二者的区别在于它并不是通过观察目标函数的变化决定接受或拒绝某一扰动,而是接受所有的扰动,希望每次修改都向好的方面发展。迭代方法的区别在于扰动过程和收敛标准\n迭代模拟的步骤1、从一个原始的图像开始,通常完全是随机噪音,但具有正确的直方图,涉及的变量可以是连续变量也可以是类型变量2、预先计算指示权值,用于在每个节点处建立ccdf,除了在边界上的节点以外,所有的色素单元都是满的(为数据点),那么只有一种数据构型,因此可以解一个大的复杂的克里格方程组,如考虑所有的指示互协方差函数的指示协同克里格方程组。3、沿着一条随机路径访问所有的结点,在每一个节点处,丢掉现有的数据,用新的从那个节点的ccdf中提取的模拟数值来代替,建立那个ccdf只与一套常数权值和领域指示数据(这些不是常数)有关的矩阵乘法。4、在访问了所有的结点之后,计算图像的区域统计参数(直方图和变差函数),如果这些参数被认为已经足够接近目标了,就停止迭代,否则回到第三步。利用吉布斯取样法进行迭代模拟的步骤如下通常需要许多次迭代,且没有任何理论保证迭代一定收敛,但是这种算法十分快速,因为它只要求进行一系列的矩阵乘法。