统计学各种检验

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学各种检验

u检验、t检验、F检验、X2检验(转)来源:李冠炜。◕‿◕。的日志常用显著性检验  1.t检验  适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。  2.t'检验  应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。  3.U检验  应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验。  4.方差分析  用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q检验或LST检验等。\nu检验、t检验、F检验、X2检验(转)来源:李冠炜。◕‿◕。的日志常用显著性检验  1.t检验  适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。  2.t'检验  应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。  3.U检验  应用条件与t检验基本一致,只是当大样本时用U检验,而小样本时则用t检验,t检验可以代替U检验。  4.方差分析  用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较,方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用q检验或LST检验等。\n  5.X2检验  是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况:四格表资料、配对资料、多于2行*2列资料及组内分组X2检验。  6.零反应检验  用于计数资料。是当实验组或对照组中出现概率为0或100%时,X2检验的一种特殊形式。属于直接概率计算法。  7.符号检验、秩和检验和Ridit检验  三者均属非参数统计方法,共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息。所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。  8.Hotelling检验  用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。 计量经济学检验方法讨论\n计量经济学中的检验方法多种多样,而且在不同的假设前提之下,使用的检验统计量不同,在这里我论述几种比较常见的方法。在讨论不同的检验之前,我们必须知道为什么要检验,到底检验什么?如果这个问题都不知道,那么我觉得我们很荒谬或者说是很模式化。检验的含义是要确实因果关系,计量经济学的核心是要说因果关系是怎么样的。那么如果两个东西之间没有什么因果联系,那么我们寻找的原因就不对。那么这样的结果是没有什么意义的,或者说是意义不大的。那么检验对于我们确认结果非常的重要,也是评价我们的结果是否拥有价值的关键因素。所以要做统计检验。t检验,t检验主要是检验单个ols估计值或者说是参数估计值的显著性,什么是显著性?也就是给定一个容忍程度,一个我们可以犯错误的限度,错误分为两类:1、本来是错的但是我们认为是对的。2、本来是对的我们认为是错的。统计的检验主要是针对第一种错误而言的。一般的计量经济学中的这个容忍程度是5%,也就是说可以容忍我们范第一类错误的概率是5%。这样说不准确,但是比较好理解。t-stastic是类似标准正态化的正态分布两一样,也就是估计值减去假设值除以估计值得标准差,一般假设值是0,这一点不难理解,如果是0\n,那么也就意味着没有因果关系。这个t-static在经典假设之下服从t分布。t分布一般是和正态分布差不多,尤其是当样本的量足够大的时候,一般的经验认为在样本数量大于120的时候,就可以看成是正态分布的。F-statistc:F检验是属于联合检验比较重要的一种,主要的目的是用于对于一系列的原因的是否会产生结果这样一个命题做出的检验。F统计量主要的产生来源是SSR\SST\SSE三个量。但是这个检验有一个缺点是必须在经典假设之下才能有效。LM检验:这个检验的性质和F检验的性质是一样的,都是检验联合显著性的,不同的是F统计量符合F分布,但是LM统计量服从卡方分布。卡方分布是正态分布的变量的平方和,而F分布是卡方分布的商,并且分子和分布必须独立,这就是为什么F检验适用范围受限的原因。LM=n*SSR、或者是LM=n-SSR。至于其他的White检验、Brusch-pagan检验(异方差的检验方法)、还有序列相关的t检验、DW检验基本原来是相同的。关于异方差检验、序列相关的检验其中存在不同的地方,但是思想基本是相同的。\n关于异方差检验的讨论:1、Brusch-pagan检验:这个检验的思路比较简单,主要是要研究残查和X之间的关系,给定这样的一个方程:u=b0+b1*x1+……+bn*xn+u'的回归,其中进行F检验和LM检验。如果检验通过那么不存在异方差,如果不通过那么存在异方差。2、White检验:这个检验也是对异方差的检验,但是这个检验不同的是不仅对于X的一次方进行回归,而且考虑到残查和x的平方还有Xi*Xj之间的关系。给定如下方程:u=b0+b1*y+b2*y^2+u'。也是用F和LM联合检验来检验显著性。如果通过那么不存在异方差,否则存在。序列相关的检验方法的讨论:对于时间序列的问需要知道一个东西,也就是一介自回归过程,也就是一般在教科书中说到的:AR(1)过程,其中的道理主要是说在当期的变量主要是取决于过去一个时期的变量和一个随机误差项。表示如下:Ut=p*U(t-1)+et。在这里我要说到几个概念问题,I(1)(一阶积整)、I(0)(零阶积整)。\n其中的一介自回归过程AR(1)就属于零阶积整过程,而一阶积整过程实际上是随机游动和飘移的随机游动过程。随机游动过程:Ut=U(t-1)+et。也就是在AR(1)的过程之下,其中的P是等于1的。飘移的随机游动过程:Ut=a+U(t-1)+et。其中随机游动过程和AR(1)过程中的不同点在于一个弱相依性的强弱问题,实际上我们在时间序列问题中,我们可以认为任何一个过程是弱相依的,但是问题的关键是我们不知道到底有多弱?或者更加直观地说,我们想知道P到底是多大,如果P是0.9或者是一个比较接近于1得数,那么可能我们可以认为这个时间序列有高度持久性,这个概念表示当期的变量却绝于一个很早的时期的变量,比如一阶积整过程,实际上et是一个独立统分布的变量,而且条件数学期望等于0,没有异方差性。那么实际上这个序列的数学期望是和期数没有什么关系的。那么也就意味着从第0期开始,U的数学期望值就是和很久以后的U的数学期望值一样的。但是方差就不同了,方差随着时间的增加不断扩大。我们知道了,这种不同的概念就可以讨论在一阶自回归的条件之下的检验问题,但是我们说一介自回归的过程是参差序列的特征而已,其他的变量的特征问题我们不谈。在讨论检验的问题以前,我有必要交待一下时间序列在ols估计的时候我们应该注意什么。实际上解决序列自相关问题最主要的问题就是一个差分的方法。因为如果是长期持久的序列或者是不是长期持久的序列,那么一定的差分就可以解除这种问题。\n1、t检验。如果我们知道这个变量是一个一介自回归的过程,如果我们知道自回归过程是AR(1)的。那么我们就可以这样作,首先我们做OLS估计,得到的参差序列我们认为是一阶自相关的。那么为了验证这种情况,那么我们可以做Ut和U(t-1)的回归,当然这里可以包含一个截距项。那么我们验证其中的参数的估计是不是显著的,就用t检验。  t检验与F检验有什么区别 1.检验有单样本t检验,配对t检验和两样本t检验。单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。\n2.t检验和方差分析的前提条件及应用误区用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。  若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。  值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。  t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。  \nu检验和t检验区别与联系 u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。理论上要求样本来自正态分布总体。但在实用时,只要样本例数n较大,或n小但总体标准差σ已知时,就可应用u检验;n小且总体标准差σ未知时,可应用t检验,但要求样本来自正态分布总体。两样本均数比较时还要求两总体方差相等。一、样本均数与总体均数比较比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。通常把理论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t检验。(一)u检验用于σ已知或σ未知但n足够大[用样本标准差s作为σ的估计值,代入式(19.6)]时。以算得的统计量u,按表19-3所示关系作判断。表19-3u值、P值与统计结论\nα |t|值 P值 统计结论 0.05双侧单侧 <1.96<1.645 >0.05 不拒绝H0,差别无统计学意义 0.05双侧单侧 ≥1.96≥1.645 ≤0.05 拒绝H0,接受H1,差别有统计学意义 0.01双侧单侧 ≥2.58≥2.33 ≤0.01 拒绝H0,接受H1,差别有高度统计学意义 \n例19.3根据大量调查,已知健康成年男子脉搏均数为72次/分,标准差为6.0次/分。某医生在山区随机抽查25名健康成年男子,求得其脉搏均数为74.2次/分,能否据此认为山区成年男子的脉搏高于一般?据题意,可把大量调查所得的均数72次/分与标准差6.0次/分看作为总体均数μ0和总体标准差σ,样本均数x为74.2次/分,样本例数n为25.H0:μ=μ0H1:μ>μ0α=0.05(单侧检验)算得的统计量u=1.833>1.645,P<0.05,按α=0.05检验水准拒绝H0,可认为该山区健康成年男子的脉搏高于一般。(二)t检验用于σ未知且n较小时。以算得的统计量t,按表19-4所示关系作判断。表19-4|t|值、P值与统计结论\nα |t|值 P值 统计结论 0.05 <t0.05(v) <0.05 不拒绝H0,差别无统计学意义 0.05 ≥t0.05(v) ≤0.05 拒绝H0,接受H1,差别有统计学意义 0.01 ≥t0.01(v) ≤0.01 拒绝H0,接受H1,差别有高度统计学意义 例19.4若例19.3中总体标准差σ未知,但样本标准差已求出,s=6.5次/分,余数据同例19.3.据题意,与例19.3不同之处在于σ未知,可用t检验。H0:μ=μ0H1:μ>μ0α=0.05(单侧检验)\n本例自由度v=25-1=24,查t界值表(单侧)(附表19-1)得t0.05(24)=1.711.算得的统计量t=1.692<1.711,P>0.05,按α=0.05检验水准不拒绝H0,尚不能认为该山区成年男子的脉搏高于一般。二、配对资料的比较在医学研究中,常用配对设计。配对设计主要有四种情况:①同一受试对象处理前后的数据;②同一受试对象两个部位的数据;③同一样品用两种方法(仪器等)检验的结果;④配对的两个受试对象分别接受两种处理后的数据。情况①的目的是推断其处理有无作用;情况②、③、④的目的是推断两种处理(方法等)的结果有无差别。公式(19.8)式中,0为差数年总体均数,因为假设处理前后或两法无差别,则其差数的均数应为0,d为一组成对数据之差d(简称差数)的均数,其计算公式同式(18.1);Sd为差数均数的标准误,sd为差数年的标准差,计算公式同式(18.3);n为对子数。因计算的统计量是t,按表19-4所示关系作判断。例19.5应用某药治疗9例高血压病人,治疗前后舒张压如表19-5,试问用药前后舒张压有无变化?表19-5高血压病人用某药治疗前后的舒张压(kPa)\n病人编号 治疗前 治疗后 差数d D2 1 12.8 11.7 1.0 1.21 2 13.1 13.1 0.0 0.00 3 14.9 14.4 0.5 0.25 4 14.4 13.6 0.8 0.64 5 13.6 13.1 0.5 0.25 6 13.1 13.3 -0.2 0.04 7 13.3 12.8 0.5 0.25 8 14.1 13.6 0.5 0.25 9 13.3 12.3 1.0 1.00 合计     4.7 3.89 \nH0:该药治疗前后的舒张压无变化,即μd=0H1:该药治疗前后的舒张压有变化,即μd≠0α=0.05自由度v=n-1=8,查t界值表得t0.05(8)=2.306,t0.01(8)=3.355,本例t=3.714>t0.01(8),P<0.01,按α=0.05检验水准拒绝H0,接受H1,可认为治疗前后舒张压有变化,即该药有降压作用。三、完全随机设计的两样本均数的比较亦称成组比较。目的是推断两样本各自代表的总体均数μ1与μ2是否相等。根据样本含量n的大小,分u检验与t检验。(一)u检验可用于两样本含量n1、n2、均足够大时,如均大于50或100.公式(19.9)算得的统计量为u值,按表19-3所示关系作出判断。例19.6某地抽样调查了部分健康成人红细胞数,其中男性360人,均数为4.660×1012/L,标准差为0.575×1012/L;女性255人,均数为4.178×1012/L,标准差为0.291×1012/L,试问该地男、女红细胞数的均数有无差别?\nH0:μ=μ0H1:μ≠μ0α=0.05今x1=4.660×1012/L,s1=0.575×1012/L,n1=360;x2=4.1781012/L,s2=0.2911012/L,n2=255.算得的u=13.63>2.58,P<0.01,按α=0.05检验水准拒绝H0,接受H1,可认为该地男女红细胞数的均数不同,男性高于女性。(二)t检验可用于两样本含量n1、n2较小时,且要求两总体方差相等,即方差齐(homoscedasticity)。若被检验的两样本方差相差较大且差别有统计学意义则需用t检验。公式(19.10)公式(19.11)公式(19.12)式中sx1-x2,为两样本均数之差的标准误,s2c为合并估计方差(combinedestimatevariance)。算得的统计量为t,按表19-4所示关系作出判断。\n例19.7某医生统广西瑶族和侗族正常妇女骨盆X线测量资料各50例。骨盆入口前后径:瑶族的均数为12.002(cm),标准差0.948(cm),侗族相应的为11.456(cm)和1.215(cm)。问两族妇女的骨盆入口前后径是否有差别?H0:μ1=μ2H1:μ1≠μ2α=0.05已知n1=n2=50,x1=12.002(cm),s1=0.948(cm);x2=11.456(cm),s2=1.215(cm)。本例自由度v=n1+n2-2=98,查t界值表[表内自由度一栏无98,可用内插法(从略)或用v=100估计].T0.05(100)=1948,t0.01(100)=2.626,今t=2.505>t0.05(1000,P<0.05,按α=0.05检验水准拒绝H0,接受H1,可认为广西瑶族和侗族妇女骨盆入口前后径不同,前者大于后者。四、完全随机设计的两样本几何均数比较\n医学上有些资料为等比资料或正态分布资料,宜用几何均数表示其平均水平。比较两样本几何均数的目的是推断它们分别代表的总体几何均数是否相等。此种情况下,应先把原始数据X进行对数变换,用变换后的数据代入式(19.10)、(19.11)、(19.12)计算t值。例19.8将20名钩端螺旋体病人的血清随机分为两组,分别用标准株或水生株作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别?X1:标准株(11人)100,200,400,400,400,400,800,1600,1600,1600,3200X2:水生珠(9人)100,100,100,200,200,200,200,400,400H0:μ1=μ2H1:μ1≠μ2α=0.05将两组数据分别取对数,以对数作为新变量X1和X2.X1:2.000,2.301,2.602,2.602,2.602,2.602,2.903,3.204,3.204,3.204,3.505X2:2.000,2.000,2.000,2.301,2.301,2.301,2.301,2.602,2.602用变换后的数据计算x1,s12;x2,s22再代入式(19.10)、(19.11)、(19.12)计算t值。\nx1=2.794,s12=0.2043;x2=2.268,s22=0.0554自由度v=11+9-2=18,查t界值表得t0.01(18)=2.878,今t=3.150>2.878,P<0.01,按α=0.05检验水准拒绝H0,接受H1,可认为两组平均效价不同,标准株高于水生株。 http://hi.baidu.com/ʶ��/blog/item/54edcd02c2f4ea23b1351dda.html  方差分析与两样本T检验区别方差分析与两样本T检验。1。首先可以看到方差分析(ANOVA)包含两样本T检验,把两样本T检验作为自己的特例。因为ANOVA可以比较多个总体的均值,当然包含两个总体作为特例。实际上,T的平方就是F统计量(m个自由度的T分布之平方恰为自由度为(1,m)的F\n分布。因此,这时候二者检验效果完全相同。T检验和ANOVA检验对于所要求的条件也相同:1)各个组的样本数据内部要相互独立,2)各组皆要正态分布3)各总体的方差相等。上述这3个条件完全相同。2。如果说要指出差别,则区别仅在下列一点上:用ANOVA检验两总体均值相等性时,只限于这样的双侧检验问题,即:H0:mu1=MU2<->Ha:mu1not=mu2而两样本的T检验则可以比上述情况更广泛,对立假设可以是下面3种中的任何一种.Ha:mu1>mu2Ha:mu10.05差异非常显著差异显著差异不显著  5、根据是以上分析,结合具体情况,作出结论。T检验举例说明  例如,T检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别。理论上,即使样本量很小时,也可以进行T检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验,或进行更有效的Levene's检验。如果不满足这些条件,只好使用非参数检验代替T检验进行两组间均值的比较。\n  T检验中的P值是接受两均值存在差异这个假设可能犯错的概率。在统计学上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧T检验概率。  1、数据的排列  为了进行独立样本T检验,需要一个自(分组)变量(如性别:男女)与一个因变量(如测量值)。根据自变量的特定值,比较各组中因变量的均值。用T检验比较下列男、女儿童身高的均值。 性别身高对象1对象2对象3对象4对象5男性男性男性女性女性111110109102104 男性身高均数=110女性身高均数=103 \n  T统计量(T-statistic)和T检验(T-test)是一回事吗?如何不是,它们之间有什么关系?相关,但不是一件事。T-test是指用T-statistic来做假设检验(hypothesistesting),而T-statistic是根据model计算的,用来做检验的统计量。正常T-statistic应该在0假设(nullhypothesis)为真时,服从T分布(T-distribution)。T-test时根据T-statistic值的大小计算p-value,决定是接受还是拒绝假设。参数估计和假设估计的区别和联系参数估计:指的是用样本中的数据估计总体分布的某个或某几个参数,比如给定一定样本容量的样本,要求估计总体的均值、方差等。\n假设检验:通过样本分布,检验某个参数的属于某个区间范围的概率。参数估计分两种:一种是点估计,另一种是区间估计。其中,区间估计与假设检验可以看作同一个问题的不同表述方式。 统计学方法包括描述统计和推断统计两种方法,其中,推断统计又包括参数估计和假设检验。 1..参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。点估计是用估计量的某个取值直接作为总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。统计学家在某种程度上确信这个区间会包含真正的总体参数。在区间统计中置信度越高,置信区间越大。置信水平为1-a, a为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05, 0.1置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。\n一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等(1) 来自正态分布的样本均值,不论抽取的是大样本还是小样本,均服从正态分布(2) 总体不是正态分布,大样本的样本均值服从正态分布,小样本的服从t分布(3) 不论已判断是正态分布还是t分布,如果总体方差未知时,都按t分布来处理(4) t分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近(5) 样本均数服从的正态分布为N(u a^2/n)远远小于原变量离散程度N(u a^2) 2.假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。<1>检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设,而不是去证实它\n <2>统计学中假设检验的基本步骤:(1)建立假设,确定检验水准α假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1,根据备择假设不同,假设检验有单、双侧检验两种。检验水准用α表示,通常取0.05或0.10,检验水准说明了该检验犯第一类错误的概率。(2)根据研究目的和设计类型选择适合的检验方法这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。(3)确定P值并作出统计结论u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t界值,则P<0.05。相同自由度的情况下,单侧检验的t界值要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P<0.05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。\n 3 参数估计与假设检验之间的联系与区别:(1) 主要联系:a、都是根据样本信息推断总体参数;b、都以抽样分布为理论依据,建立在概率论基础之上的推断;c、二者可相互转换,形成对偶性。(2) 主要区别:a、参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;b、区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;c、区间估计立足于大概率,假设检验立足于小概率。 区间估计:1、单个正态总体均值的区间估计:法1:打开数据文件:DescriotiveStatistics→Explore:Dsplay中选Statistics,在DependentList中输入所求的变量名Statistics对话框中选择Descriptives,并在ConfidenceIntervalforMeans中输入数值,作为置信度.得统计量描述表中LowerBound为置信区间的下限,UpperBound为置信区间的上限法2:利用单个样本t检验过程求均值的置信区间CompareMeans→One_SampleTTest,在TestVariables中输入所求的变量名,在TestValue中输入所假设的均值,打开Option对话框中Confidenceinterval输入置信度.2、两个正态总体均值的区间估计:打开数据文件:CompareMeans→Independent_SampleTTest,在TestVariables中输入所求的变量名,在Grouping\nVariabli中输入两个正态总体变量名,打开DefineGroups对话框,在Group1中输入第一个正态总体变量名,Group2中输入第二个正态总体变量名,打开Option对话框中Confidenceinterval输入置信度.得两个独立样本在方差齐和方差不齐两种情况下均值差的置信区间三、假设检验:1、单个正态总体均值的假设检验打开数据文件:CompareMeans→One_SampleTTest,在TestVariables中输入所求的变量名,在TestValue中输入总体的均值,打开Option对话框中Confidenceinterval输入置信度(1-a)MissingValues中选择缺失值的处理方式:Excludecasesanalysisbyanalysis:在需要分析的数据中剔除含有缺失值的个案Excludecases:删除所有数据中含有缺失值的个案数据统计量表中列出:N变量的数据个数;Mean均值;Std.Deviation标准离差;Std.ErrorMean均值的标准误差;成果表中列出:TestVaule检验值;tt值;df自由度;Sig.(2_tailed)双尾显著性概率;MeanDifference均值差;ConfidenceintervalofMeanDifference均值差的置信区间;当显著性概率大于a,认为样本的均值与总体的均值没有明显差异  \n假设检验就是检验单个样本总体,或是两个样本总体的相关度和差异度。。。常用的假设检验方法有u—检验法、t—检验法、X2检验法、F—检验法等。假设检验的一般步骤    假设检验的一般步骤:    (一)根据所研究问题的要求,提出原假设  和备择假设  。    有三种类型的原假设和备择假设,以总体均值的假设检验为例加以说明。    1.  :  ;  :     2.  :  ;  :     3.  :  ;  :   其中,1.是双侧假设检验;2.是右侧假设检验;3.是左侧假设检验。因为假设检验是根据概率意义下的反证法来否定原假设,所以原假设必须包含等号。究竟采用哪一种检验要视具体问题而定,尤其是选择右侧检验还是左侧检验时,更要慎重。    (二)找出检验的统计量及其分布。    与参数估计一样,假设检验也要根据样本数据进行统计推断。用于判断是否接受原假设  的统计量称为检验统计量。在实际应用时,检验统计量的选择及其分布要根据检验的具体内容、抽样的方式、样本容量的大小和总体方差是否已知等多种因素来确定,常用的检验统计量有  统计量、  统计量、  统计量及  统计量等。    (三)规定显著性水平  ,就是选择发生第一类错误的最大允许概率。    显著性水平  的大小,取决于发生第一类错误和第二类错误产生的后果。如果  取的较小,那么  将会较大,虽然否定一个真实原假设(弃真)的风险小了,其代价是增加了接受一个不真实原假设(取伪)的概率;反之,如果  取的较大,那么  将会较小,虽然接受一个不真实原假设(取伪)的的风险小了,其代价是增加了否定一个真实原假设(弃真)的概率。因此,要根据研究问题的需要选择一个合适的  ,通常  选为  、  或  等。    (四)确定决策规则。    在选择好检验统计量和规定了显著性水平后,就可以根据        求出否定原假设和接受原假设的临界值,从而也就确定了否定域  。    (五)计算检验统计量的值,作出统计决策。    如果检验统计量的值落在否定域  里,则否定  ;否则,不否定  。    需要说明的是,显著性检验只对发生第一类错误的概率进行了控制,而不对发生第二类错误的概率加以限制。因此,当我们决定接受  时,并不意味着  一定为\n真,因为我们不能确定该决策有多大的可靠性。确切的说法是:在显著性水平为  时,根据这次试验得到的样本数据,不足以否定  。鉴于发生第二类错误的不确定性,通常在做决策时,统计学家建议我们采用“不否定  或不拒绝  ”的说法,而不采用“接受  ”的说法。但是,要否定  ,只要一个反例就足够了。否定了 ,也就避免了第二类错误,所以根据样本数据,作出否定  的决策就具有了可靠性 显著性检验中的第一类错误是指:原假设事实上正确,可是检验统计量的观测值却落入拒绝域,因而否定了本来正确的假设。这是弃真的错误。发生第一类错误的概率在双侧检验时是两个尾部的拒绝域面积之和;在单侧检验时是单侧拒绝域的面积。显著性检验中的第二类错误是指:原假设事实上不正确,而检验统计量的观测值却落入了不能拒绝域,因而没有否定本来不正确的原假设,这是取伪的错误。发生第二类错误的概率是把来自θ=θ1(θ1≠θ0)的总体的样本值代入检验统计量所得结果落入接受域的概率。根据不同的检验问题,对于和大小的选择有不同的考虑。在样本容量不变的条件下,犯两类错误的概率常常呈现反向的变化,要使和都同时减小,除非增加样本的容量。在控制犯第一类错误的概率情况下,尽量使犯第二类错误的概率小。在实际问题中,往往把要否定的陈述作为原假设,而把拟采纳的陈述本身作为备择假设,只对犯第一类错误的概率加以限制,而不考虑犯第二类错误的概率。这就是说,在假设检验中,相对而言,当原假设被拒绝时,能够以较大的把握肯定备择假设的成立。而当原假设未被拒绝时,并不能认为原假设确实成立。统计学中第一类错误与第二类错误统计学中第一类错误与第二类错误:  当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。\n  当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。  当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。    同一假设检验,我们构造了不同的统计量,形成了不同的检验方法,那么这些方法是完全等价的吗?问题的背景是,计量经济学中,参数线性约束有一个F检验统计量。F=(RSSR-RSSU)/m/(RSSU/(n-ku)),在原假设成立条件下服从F分布,然后====然而,在原假设成立条件下RSSR/(n-kr)还服从卡方分布(RSSR为约束条件下的残差平方和,kr为要估计的参数个数),我们为什么不用这个统计量进行检验呢?是这个检验效率低吗?我们假设,随机误差项的方差为1,进行上述讨论。势不同吧利用信息多的检验势一般更足\n呃,首先是大样本还是小样本吧?渐进的性质一般会好很多。然后,F和卡方这个可以推导一下,很可能在一定假设下是相互等价的。比如最简单的情况,只检验一个参数非零约束的时候,F等价于t,而t分布在大样本下等价于卡方…… 源地址:http://blog.renren.com/GetEntry.do?id=882188282&owner=257834888
查看更多

相关文章

您可能关注的文档