[农学]第6章 假设检验

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

[农学]第6章 假设检验

第6章假设检验\n假设检验在统计方法中的地位推断统计统计方法描述统计参数估计假设检验\n参数估计的主要任务是找参数值等于几。点估计:估计在一条生产线上平均每个包装箱的毛重。区间估计:基于数据找到一个区间[L,U],使之按给定的概率包含包装箱的毛重的均值。假设检验的兴趣主要是看参数的值是否等于某个特别感兴趣的值。参数估计和假设检验\n引例【例1】消费者协会接到消费者投诉,指控某粮食加工厂的每袋粮食的重量不足,有欺骗消费者之嫌。包装上标明的重量为16公斤。于是消费者协会从市场上随机抽取20袋作为样本,样本的平均重量为15.43公斤,显然小于16公斤。消费者协会能否根据样本数据判定该粮食加工厂欺骗了消费者呢?\n6.1假设检验的一般问题6.2假设检验的方法6.3总体均值的假设检验6.4总体比例的假设检验\n学习目标了解假设检验的含义和假设的形式。掌握假设检验的基本思想,区分假设检验中的两类错误。掌握假设检验的步骤和假设检验的方法。重点掌握一个总体均值的检验及一个总体成数的检验。\n6.1假设检验的一般问题6.1.1假设检验的基本思想6.1.2假设检验的步骤6.1.3假设检验的两类错误\n什么是假设?对总体参数的具体数值所作的陈述。总体参数包括总体均值、比例、方差等。分析之前必须陈述。我认为这种新药的疗效比原有的药物更有效!6.1.1假设检验的基本思想\n什么是假设检验?先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。有参数检验和非参数检验。逻辑上运用反证法,统计上依据小概率原理。\n小概率事件:发生概率很小的事件。小概率原理:小概率事件在一次试验中是几乎不可能发生的。小概率的标准由研究者事先确定,一般用α表示,称为显著性水平。常用的α值有0.01,0.05,0.10。\n总体基本思想抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设作出决策\n首先假定需要考察的假设是成立的,然后基于此进行推导,来计算从该假设所在的总体中进行抽样研究,得到当前样本的概率是多少。如果结果显示这是一个小概率事件,则意味着如果假设是成立的,则在一次抽样研究中竟然发生了小概率事件!这显然违反了小概率原理,因此可以按照反证法的思路推翻所给出的假设,认为原假设上是不成立的。\n基本思想总体(某种假设)抽样样本(观察结果)检验(不拒绝)(拒绝)小概率事件未发生小概率事件发生\n6.1.2假设检验的步骤\n假设检验步骤提出原假设和备择假设确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平根据显著性水平计算出临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝原假设,否则不拒绝原假设也可以直接利用P值作出决策\n检验步骤建立总体假设H0,H1抽样得到样本观察值12选择统计量确定H0为真时的抽样分布3根据具体决策要求确定α确定分布上的临界点C和检验规则计算检验统计量的数值比较并作出检验判断7456\n原假设原假设又称“0假设”,用H0表示,是关于总体参数的一种陈述,总是有符号,或,一般而言是被假定为正确的。例如,H0:16公斤之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等,即H0表示总体参数与样本统计量的差异或改变是由抽样误差引起的,而不是本质上的差异。\n备择假设,是在原假设不成立时而成立的关于总体参数一种假定。用H1表示,总是有符号,或,表示总体参数与样本统计量的差异或改变不是由抽样误差引起的,而是本质上的差异。例如,H1:<16公斤备择假设【例1】的原假设和备择假设为:H0:16公斤H1:<16公斤\n原假设和备择假设是一个完备事件组,且相互对立等号“=”总是放在原假设上先确定备择假设,再确定原假设。提出假设\n6.1.3两类错误与显著性水平\n假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为正确时拒绝原假设,认为其不正确第Ⅰ类错误的概率记为α。2.第Ⅱ类错误(取伪错误)原假设为错误时未拒绝原假设,而认为其正确第Ⅱ类错误的概率记为β\nH0:无罪假设检验中的两类错误陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程\n错误和错误的关系你要同时减少两类错误的惟一办法是增加样本容量!和的关系就像翘翘板,小就大,大就小\n两类错误的控制一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率,尽量避免犯弃真错误,若想同时减少α和β,唯一的办法就是增大样本容量。\n显著性水平(significantlevel)1.是一个概率值,它是:小概率事件的标准;帮助确定抽样分布的拒绝域;原假设为真时,拒绝原假设的概率(弃真错误的最大概率)2.表示为,由研究者事先确定常用的值有0.01,0.05,0.10\n6.2假设检验的方法\n6.2.1双侧检验和单侧检验对总体平均数的假设检验可分两类,即双侧(尾)检验和单侧(尾)检验。单侧检验又分为左侧检验和右侧检验,它们的原假设和备择假设的形式不同。\n双侧检验【例2】根据美国人口普查数据,1998年美国家庭平均拥有人口3.18人。一研究人员想检验1998年以后,这一均值是否发生了变化。如果自1998年以后,家庭平均人口增加或减少了,那么家庭人口规模就发生了变化。这是一个双尾检验的例子。则原假设和备择假设为:H0:3.18人H1:3.18人\n双侧检验\n双侧检验的拒绝区域a-1的面积拒绝区域拒绝区域0m2a的面积2a的面积\n左侧检验【例3】某健康俱乐部的管理层声称:“该组织会员在加入该组织后,在第一个月将减掉10磅或以上的体重”。一消费者组织想确认该说法是否属实,因而从该俱乐部随机选取了36名会员作为样本,发现所选取的会员在第一个月内平均减掉9.2磅,而该样本的标准差则为24磅。如果α=0.05,能否证明该俱乐部说法属实?\n左侧检验以μ表示会员第一个月能够减掉的体重H0:μ≥10磅(均值不小于10磅,0.8磅的差距为随机误差引起差异)H1:μ<10磅(均值小于10磅,0.8磅的差距为本质上的差异)当备择假设包含一小于符号(<)时,这一检验是左尾检验。\n左侧检验左侧检验a-1的面积拒绝区域0ma的面积\n右侧检验【例4】某储蓄银行的经理一直很注重为客户提供服务的质量。在旧计算机系统下,应答机每小时平均可服务22名客户。银行管理层注意到如果以这种效率提供服务,客户等待时间将会很长。最近银行管理层更换了计算机系统,期望以此缩短客户等待时间,从而提高顾客满意度。为检测新系统是否比旧系统更具效率,银行管理层随机地选取了18个小时作为一个样本,发现,这些时间内平均每小时每个应答机服务的顾客人数为28人,而标准差为2.5人.在1%的显著水平下,你能否得出新系统更为有效的结论?假定每小时服务的人数近似服从标准正态分布。\n右侧检验以μ表示应答机每小时服务的客户数H0:μ≤22人(其新系统服务的人数没有提高,不大于22人,6个人的差异是由抽样误差引起的)H1:μ>22人(其新系统服务的人数提高了,大于22人,6个人的差异不是由抽样误差引起的,而是本质差异)当备择假设中包含大于符号(>)时,检验是右尾检验。\n右侧检验a-1的面积拒绝区域0ma的面积右侧检验适用于原假设H0:0mm£,而备择假设H1:0mm>的情况,只要样本平均数显著地超过假设的总体参数,就拒绝原假设H0而接受备择假设H1。\n根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。对样本估计量的标准化结果。原假设H0为真点估计量的抽样分布6.2.2检验统计量\n总体是否近似正态?将样本容量增加到n≥30否是σ值是否已知?用统计量用样本标准差s估计σ否用统计量是是否为大样本(n>30)是σ值是否已知?用样本标准差s估计σ用统计量否用统计量是否\n6.2.3假设检验结论的表述1.当拒绝原假设时,我们称样本结果统计上是显著的拒绝原假设时结论是清楚的。并且,能给出犯错误的概率(α)。“统计显著”意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠随机因素能够得到的2.当不拒绝原假设时,称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的。\n假设检验结论的表述(“接受”与“不拒绝”)假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。\n6.3总体均值的检验\n一个总体参数的检验z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)2检验(单尾和双尾)均值总体参数比例方差\n6.3.1总体均值的检验(大样本)1.假定条件大样本(n30)2.使用z检验统计量2已知:2未知:\n总体均值的检验(2已知)【例5】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255\n总体均值的检验(2已知)(双侧检验)1、H0:=255H1:255=0.05n=40(大样本)2、确定检验统计量并计算z01.96-1.960.025拒绝H0拒绝H00.0254、决策:样本提供的证据不能证明该天生产的饮料不符合标准要求。结论:不拒绝H03、临界值(双侧检验):\n总体均值的检验(2未知)(例题分析)【例6】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86\n总体均值的检验(2未知)(左侧检验)1、H0:1.35H1:<1.35=0.01n=50(大样本)2、确定检验统计量并计算拒绝H04、决策:新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,这个结论错误的概率不超过1%。结论:-2.33z0拒绝H00.013、临界值(左侧检验):\n总体均值的检验(2未知)(例题分析)【例7】某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改良后的新品种产量是否有显著提高?(=0.05)右侧检验\n总体均值的检验(2未知)(右侧检验)1、H0:5200H1:>5200=0.05n=36(大样本)2、确定检验统计量并计算4、决策:拒绝H0改良后的新品种产量有显著提高,这个结论错误的可能性不超过5%。结论:z0拒绝H00.051.6453、临界值(右侧检验):\n总体均值的检验(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:mm0H0:mm0H1:mm0统计量已知未知拒绝域P值决策拒绝H0\n6.3.2总体均值的检验(小样本)1.假定条件总体服从正态分布,并且为小样本(n<30)2.检验统计量2已知:2未知:\n总体均值的检验(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:mm0H0:mm0H1:mm0统计量已知未知拒绝域P值决策拒绝H0注:已知时的拒绝域同大样本条件下\n总体均值的检验(例题分析)【例8】某邮递家具公司收到了许多客户关于不按期送货的投诉。该公司怀疑责任在于他们雇用的货物运输公司。货物运输公司保证说他们的平均运输时间不超过24天。于是家具公司随机抽选25次运输记录,得知样本均值为24.9天,样本标准差为1.5天。已知货物运输天数服从正态分布,试以0.01的显著性水平对货运公司的保证作出判断。\n总体均值的检验(例题分析)1、H0:≤24H1:>24=0.01n=25(小样本,且总体方差未知)2、确定检验统计量并计算拒绝H0结论:说明运输公司的保证是不可信的,平均运输时间应该超过了24天。这个结论正确的可能性至少为99%。4、决策:3、临界值(t分布右侧检验):\n总体均值的检验(例题分析)【例9】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3\n总体均值的检验(例题分析)1、H0:=12H1:12=0.05n=10(小样本)2、确定检验统计量并计算4、决策:不拒绝H0结论:样本提供的证据还不能证明该供货商提供的零件不符合要求。t02.262-2.2620.025拒绝H0拒绝H00.0253、临界值(t分布双侧检验):\n6.3.3利用P值进行决策\n什么是P值?(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设。它是对原假设H0的支持度。被称为观察到的(或实测的)显著性水平决策规则:若p值≤,拒绝H0,否则不决绝H0\n双侧检验的P值/2/2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值\n左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值\n右侧检验的P值0临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值\n总体均值的检验(2未知)(例题分析)【例7】某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改良后的新品种产量是否有显著提高?(=0.05)右侧检验\n总体均值的检验(2未知)(右侧检验)1、H0:5200H1:>5200=0.05n=36(大样本)2、确定检验统计量并计算4、决策:拒绝H0改良后的新品种产量有显著提高,这个结论错误的可能性不超过5%。结论:z0拒绝H00.051.6453、临界值(右侧检验):\n总体均值的检验(P值检验)1、H0:5200H1:>5200=0.05n=36(大样本)2、确定检验统计量并计算:4、决策:拒绝H0结论:改良后的新品种产量有显著提高,该结论错误的可能性为0.088%。3、查表得到P值:P值=0.000088<0.050z拒绝H03.750.00088\n总体均值的检验(z检验)(P值的图示)抽样分布P=0.00008801.645a=0.05拒绝H01-计算出的样本统计量=3.75P值\n用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少。与其大致知道犯第Ⅰ错误的概率,不如干脆知道一个确切的犯第Ⅰ类错误的概率(P值)P值决策与统计量的比较\n6.4总体比例的检验\n总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)2.检验的z统计量0为假设的总体比例\n总体比例的检验(例题分析)【例9】:工作正常时,制造计算器芯片的机器不会产生超过4%的瑕疵品。无论什么时候,如果机器生产的芯片有超过4%的不合格品,那么这台机器需要调试。为检测一台机器是否正常工作,公司质量部门需要抽取产品样本以检查产品是否为合格的。最近从生产线抽取的包含200芯片的随机样本有14片不合格。在5%的显著性水平下,这台机器是否需要进行调整?\n解:已知n=200,1、H0:p≤0.04(这台机器不需要调整)H1:p>0.04(这台机器需要调整)3、由α=0.05,查表得:\n01.645p=0.04z临界值α=0.05不拒绝H0拒绝H02.174、因此应拒绝原假设H0,即这台机器瑕疵品率超过4%,需要调整,这个结论正确的可能性至少达到95%。\n总体比例的检验(例题分析)【例10】:某公司市场部非常重视顾客对其品牌的满意情况,通过加强质量、提高服务等措施,一直使消费者对其品牌的满意程度保持在0.65的水平上。最近,市场部经理接到一些消费者的抱怨,也得到一些消费者的表扬,这使他对目前的顾客满意程度产生了怀疑,为了掌握市场情况,了解本品牌在市场中的位置,他委托一家市场调查公司在该地区抽取了315个有效样本,其中有214人对其品牌表示满意。以0.1为显著性水平,能否证明顾客的满意度没有变化?\n总体比例的检验(例题分析)1、H0:=65%H1:65%=0.1n=315(大样本)2、确定检验统计量并计算:4、决策:不拒绝H0尽管顾客存在不同的反映,但还不足以影响该公司品牌的整体顾客满意水平,顾客满意度没有发生变化。结论:z01.65-1.650.05拒绝H0拒绝H00.053、临界值(双侧检验):\n总体比例的检验(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0:0H1:<0H0:0H1:>0统计量拒绝域P值决策拒绝H0\n本章小结假设检验的基本思想(反证法和小概率原理)假设检验的步骤原假设和备择假设的建立检验统计量的选择假设检验的判断规则假设检验的两类错误1、等号“=”总是放在原假设上。2、先确定备择假设,再确定原假设。3、H0表示总体参数与样本统计量的差异或改变是由抽样误差引起的,而不是本质上的差异;H1样本均值与总体均值的差异是本质差异),\n检验步骤建立总体假设H0,H1抽样得到样本观察值12选择统计量确定H0为真时的抽样分布3根据具体决策要求确定α确定分布上的临界点C和检验规则计算检验统计量的数值比较并作出检验判断7456\n总体均值的检验统计量的选择总体是否近似正态?将样本容量增加到n≥30否是σ值是否已知?用统计量用样本标准差s估计σ否用统计量是是否为大样本(n>30)是σ值是否已知?用样本标准差s估计σ用统计量否用统计量是否比例的检验统计量\n假设检验的内容
查看更多

相关文章

您可能关注的文档