现代统计学预备知识讲义

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

现代统计学预备知识讲义

本资料来源1\n统计学预备知识:回顾1概率2概率分布(正态分布等)3两类错误4假设检验5置信区间、置信水平和显著性水平6统计检验的功效2\n事件的概率(probability)定义:事件A的概率是对事件A在试验中出现的可能性大小的一种度量表示事件A出现可能性大小的数值(介于0和1之间)事件A的概率表示为P(A)概率的定义有:古典定义、统计定义和主观概率3\n古典概率(先验概率)如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值,记为4\n古典概率特点样本空间的基本事件只有有限个;每个基本事件发生的可能性相等。例:一批产品共100件,其中有6件不合格品,随机抽取一件不合格品的概率是:5\n概率的统计定义在相同条件下重复进行n次随机试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为事件A的概率,记为优点:不受古典概率的两个特点的限制,容易理解。缺点:试验不能无限制的进行下去。6\n主观概率主观概率:是指对一些无法重复的试验,确定其结果的概率只能根据以往的经验,人为确定这个事件的概率。主观概率是一个决策者对某个事件是否发生,根据个人掌握的信息对该事件发生可能性的判断例如,企业投资新项目的成功和失败的概率。例如天下雨的可能性多大?一种新产品畅销的可能性多大?由于仅仅是经验的主观判断,因此可靠性就值得怀疑,不宜滥用。7\n概率的性质非负性对任意事件A,有0P(A)1规范性必然事件的概率为1;不可能事件的概率为0。即P()=1;P()=0可加性若A与B互斥,则P(A∪B)=P(A)+P(B)推广到多个两两互斥事件A1,A2,…,An,有P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)8\n参数估计的方法矩估计法最小二乘法最大似然法顺序统计量法估计方法点估计区间估计9\n点估计(pointestimate)用样本的估计量的某个取值直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计;无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量10\n点估计(pointestimate)点估计11\n区间估计的提出12\n区间估计(intervalestimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在75~85之间,置信水平是95%样本统计量 (点估计)置信区间置信下限置信上限13\n回顾:中心极限定理(centrallimittheorem)中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布14\n15\n进一步解释16\n置信区间 (confidenceinterval)17\n置信区间 (confidenceinterval)18\n19\n20\n置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平置信水平表示为(1-,为是总体参数未在区间内的比例,称为显著性水平。常用的置信水平值有99%,95%,90%相应的为0.01,0.05,0.10显著性水平越小越好置信水平21\n22\n置信区间与置信水平均值的抽样分布(1-)区间包含了的区间未包含1–aa/2a/223\n对置信区间的几点理解24\n总体均值的区间估计对总体均值进行区间估计时,需要考虑几种情形:1、总体是否为正态分布?2、总体方差是否已知?3、用于构造估计量的样本是大样本(n>30)?还是小样本(n<30)呢?25\n26\n27\n28\n29\n30\n总体均值的区间估计(大样本)1.假定条件总体服从正态分布,且方差(2)已知如果不是正态分布,可由正态分布来近似(n30)使用正态分布统计量z总体均值在1-置信水平下的置信区间为31\n32\n总体均值的区间估计(小样本)1.假定条件总体服从正态分布,但方差(2)未知小样本(n<30)使用t分布统计量总体均值在1-置信水平下的置信区间为33\nt分布t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z34\n35\n不同情形下总体均值的区间估计总体分布样本量正态分布非正态分布36\n待估参数:总体均值大样本小样本分布正态总体正态总体37\n假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程对总体参数(或分布形式)提出假设假设检验抽取样本,构造检验统计量决策过程:根据某种规则判断假设是否成立38\n假设检验和区间估计的区别区间估计:用给定的大概率推断出总体参数所在的范围。假设检验:是以小概率为标准,对总体的状况(总体参数或总体分布)所做出的假设进行判断。注:假设检验与区间估计结合起来,构成完整的统计推断内容。39\n区间估计与假设检验的转换区间估计问题:在一定的概率(置信水平)下,利用样本信息来估计总体的不合格率假设检验问题:以一定的概率水平(显著水平性),通过样本资料来判断该批产品是否合格或合格的程度注:对于同一个实例,用的是同一个样本,同一个样本统计量,同一个分布,因此区间估计与假设检验可以相互转换。40\n置信区间是在一定的概率(置信水平)保证程度下利用样本数据计算得到的关于总体参数可能所在的范围。而进行假设检验时,我们事先对总体参数的假设值有可能会落在这个置信区间外,这时我们判定为具有显著性差异,拒绝假设;假设值也可能会落在置信区间内,不能拒绝。假设检验:我们关心的是检验总体参数值有无变化(即是否存在显著性差异),而检验过程就是利用样本信息判断差异是否显著。区间估计:目的在于通过样本资料推断总体参数在一定的概率水平下可能的取值范围估计与检验的联系41\n提出假设构造适当的检验统计量,并利用样本信息计算检验统计量的值规定显著性水平,确定临界值作出统计决策:拒绝假设还是接受假设假设检验的步骤42\n原假设与备择假设原假设(nullhypothesis):研究者想收集证据予以反对的假设,待检验的假设。表示为H0H0:=,或某一数值备择假设(alternativehypothesis):与原假设对立,研究者想收集证据予以支持的假设。表示为H1H1:≠,或某一数值43\n原假设和备择假设是一个完备事件组,而且相互对立排斥在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立接受原假设,意味着拒绝备择假设;拒绝原假设,意味着接受备择假设;先确定备择假设,再确定原假设等号“=”一般都是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)(归纳与建议)提出原假设与备择假设44\n假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为真时我们拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2.第Ⅱ类错误(取伪错误)原假设为假时我们没有拒绝原假设第Ⅱ类错误的概率记为(Beta)45\n两类错误的进一步解释错误:错误46\n两类错误的进一步解释原假设没有拒绝H0拒绝H0H0为真1-(正确决策)H0为伪(取伪错误)1-(正确决策)47\n错误和错误的关系和的关系就像翘翘板,小就大,大就小你要同时减少两类错误的惟一办法是增加样本容量!48\n检验功效(testpower)拒绝一个错误的原假设的能力根据的定义,是指没有拒绝一个错误的原假设的概率。这也就是说,1-则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)可解释为正确地拒绝一个错误的原假设的概率49\n在犯第一类错误()概率得到控制的条件下,犯取伪错误的概率()也要尽可能地小,或者说,不取伪的概率1-应尽可能增大。1-越大,意味着当原假设不真实时,检验判断出原假设不真实的概率越大,检验的判别能力就越好;1-越小,意味着当原假设不真实时,检验结论判断出原假设不真实的概率越小,检验的判别能力就越差。可见1-是反映统计检验判别能力大小的重要标志,我们称之为检验功效或检验势。检验功效(poweroftest)50\n根据样本观测数据计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)标准化的检验统计量51\n选择检验统计量时需要考虑的要素检验的样本容量:大样本还是小样本?总体方差是否已知?原因:因为总体方差是否已知以及检验的样本大小决定了抽样分布,也就决定了检验统计量的选择与构造。52\n显著性水平和拒绝域(双侧检验示意图)抽样分布0临界值临界值a/2a/2样本统计量拒绝H0拒绝H01-置信水平53\n显著性水平(significantlevel)1.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域2.它是事先指定的犯第Ⅰ类错误概率的最大允许值3.常用的值有0.01,0.05,0.104.由研究者事先确定,也称名义显著性水平5.拒绝原假设,则表明检验的结果是显著的不拒绝原假设,表明检验的结果是不显著的54\n对显著性水平的几点说明提前选择一个显著性水平,可以根据分布表查出在该显著性水平下的临界值,进而将计算的检验统计值与临界值做一个比较,于是在给定的显著性水平下,原假设要么被拒绝,要么未被拒绝。不同的研究者根据特定的应用,会偏好不同的显著性水平,具有任意性。不存在一个“正确的”显著性水平。55\n假设检验的决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将由样本计算得出的检验统计量的值与水平下的临界值进行比较作出决策双侧检验:│统计量│>│临界值│,拒绝H0│统计量│<│临界值│,接受H0左侧检验:统计量<临界值,拒绝H0右侧检验:统计量>临界值,拒绝H056\n显著性水平和拒绝域(双侧检验)0临界值临界值a/2a/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平57\n显著性水平和拒绝域(双侧检验)0临界值临界值a/2a/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平58\n显著性水平和拒绝域(双侧检验)0临界值临界值a/2a/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平59\n利用P值进行决策60\n什么是P值?(P-value)P值是一个概率值,0”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验69\n双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧(下限)检验右侧(上限)检验原假设H0:m=m0H0:mm0H0:mm0备择假设H1:m≠m0H1:mm070\n双侧检验:假设的建立所关心的是检验样本均值与总体均值有没有明显差异,而不管差异的方向是正还是负,应该用双侧检验。71\n左侧检验:假设的建立所关心的是总体均值是否低于某个标准,则应该用左侧检验72\n右侧检验:假设的建立所关心的是总体均值是否高于或超过某个标准,则应该用右侧检验73\n单侧检验(原假设与备择假设的确定)将研究者想收集证据予以支持的假设作为备择假设H1一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H0先确立备择假设H174\n显著性水平和拒绝域(左侧检验H0:mm0H1:mm0)0临界值a样本统计量拒绝H0抽样分布1-置信水平计算检验统计量的值78\n显著性水平和拒绝域(右侧检验:拒绝原假设)0临界值a样本统计量抽样分布1-置信水平拒绝H0计算出的样本统计量79\n左侧检验的P值0临界值ca样本统计量拒绝H0抽样分布1-置信水平计算的检验统计量的值P值80
查看更多

相关文章

您可能关注的文档