- 2022-08-18 发布 |
- 37.5 KB |
- 78页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
[农学]第6章 假设检验
第6章假设检验\n假设检验在统计方法中的地位推断统计统计方法描述统计参数估计假设检验\n参数估计的主要任务是找参数值等于几。点估计:估计在一条生产线上平均每个包装箱的毛重。区间估计:基于数据找到一个区间[L,U],使之按给定的概率包含包装箱的毛重的均值。假设检验的兴趣主要是看参数的值是否等于某个特别感兴趣的值。参数估计和假设检验\n引例【例1】消费者协会接到消费者投诉,指控某粮食加工厂的每袋粮食的重量不足,有欺骗消费者之嫌。包装上标明的重量为16公斤。于是消费者协会从市场上随机抽取20袋作为样本,样本的平均重量为15.43公斤,显然小于16公斤。消费者协会能否根据样本数据判定该粮食加工厂欺骗了消费者呢?\n6.1假设检验的一般问题6.2假设检验的方法6.3总体均值的假设检验6.4总体比例的假设检验\n学习目标了解假设检验的含义和假设的形式。掌握假设检验的基本思想,区分假设检验中的两类错误。掌握假设检验的步骤和假设检验的方法。重点掌握一个总体均值的检验及一个总体成数的检验。\n6.1假设检验的一般问题6.1.1假设检验的基本思想6.1.2假设检验的步骤6.1.3假设检验的两类错误\n什么是假设?对总体参数的具体数值所作的陈述。总体参数包括总体均值、比例、方差等。分析之前必须陈述。我认为这种新药的疗效比原有的药物更有效!6.1.1假设检验的基本思想\n什么是假设检验?先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。有参数检验和非参数检验。逻辑上运用反证法,统计上依据小概率原理。\n小概率事件:发生概率很小的事件。小概率原理:小概率事件在一次试验中是几乎不可能发生的。小概率的标准由研究者事先确定,一般用α表示,称为显著性水平。常用的α值有0.01,0.05,0.10。\n总体基本思想抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设作出决策\n首先假定需要考察的假设是成立的,然后基于此进行推导,来计算从该假设所在的总体中进行抽样研究,得到当前样本的概率是多少。如果结果显示这是一个小概率事件,则意味着如果假设是成立的,则在一次抽样研究中竟然发生了小概率事件!这显然违反了小概率原理,因此可以按照反证法的思路推翻所给出的假设,认为原假设上是不成立的。\n基本思想总体(某种假设)抽样样本(观察结果)检验(不拒绝)(拒绝)小概率事件未发生小概率事件发生\n6.1.2假设检验的步骤\n假设检验步骤提出原假设和备择假设确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平根据显著性水平计算出临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝原假设,否则不拒绝原假设也可以直接利用P值作出决策\n检验步骤建立总体假设H0,H1抽样得到样本观察值12选择统计量确定H0为真时的抽样分布3根据具体决策要求确定α确定分布上的临界点C和检验规则计算检验统计量的数值比较并作出检验判断7456\n原假设原假设又称“0假设”,用H0表示,是关于总体参数的一种陈述,总是有符号,或,一般而言是被假定为正确的。例如,H0:16公斤之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等,即H0表示总体参数与样本统计量的差异或改变是由抽样误差引起的,而不是本质上的差异。\n备择假设,是在原假设不成立时而成立的关于总体参数一种假定。用H1表示,总是有符号,或,表示总体参数与样本统计量的差异或改变不是由抽样误差引起的,而是本质上的差异。例如,H1:<16公斤备择假设【例1】的原假设和备择假设为:H0:16公斤H1:<16公斤\n原假设和备择假设是一个完备事件组,且相互对立等号“=”总是放在原假设上先确定备择假设,再确定原假设。提出假设\n6.1.3两类错误与显著性水平\n假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为正确时拒绝原假设,认为其不正确第Ⅰ类错误的概率记为α。2.第Ⅱ类错误(取伪错误)原假设为错误时未拒绝原假设,而认为其正确第Ⅱ类错误的概率记为β\nH0:无罪假设检验中的两类错误陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程\n错误和错误的关系你要同时减少两类错误的惟一办法是增加样本容量!和的关系就像翘翘板,小就大,大就小\n两类错误的控制一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率,尽量避免犯弃真错误,若想同时减少α和β,唯一的办法就是增大样本容量。\n显著性水平(significantlevel)1.是一个概率值,它是:小概率事件的标准;帮助确定抽样分布的拒绝域;原假设为真时,拒绝原假设的概率(弃真错误的最大概率)2.表示为,由研究者事先确定常用的值有0.01,0.05,0.10\n6.2假设检验的方法\n6.2.1双侧检验和单侧检验对总体平均数的假设检验可分两类,即双侧(尾)检验和单侧(尾)检验。单侧检验又分为左侧检验和右侧检验,它们的原假设和备择假设的形式不同。\n双侧检验【例2】根据美国人口普查数据,1998年美国家庭平均拥有人口3.18人。一研究人员想检验1998年以后,这一均值是否发生了变化。如果自1998年以后,家庭平均人口增加或减少了,那么家庭人口规模就发生了变化。这是一个双尾检验的例子。则原假设和备择假设为:H0:3.18人H1:3.18人\n双侧检验\n双侧检验的拒绝区域a-1的面积拒绝区域拒绝区域0m2a的面积2a的面积\n左侧检验【例3】某健康俱乐部的管理层声称:“该组织会员在加入该组织后,在第一个月将减掉10磅或以上的体重”。一消费者组织想确认该说法是否属实,因而从该俱乐部随机选取了36名会员作为样本,发现所选取的会员在第一个月内平均减掉9.2磅,而该样本的标准差则为24磅。如果α=0.05,能否证明该俱乐部说法属实?\n左侧检验以μ表示会员第一个月能够减掉的体重H0:μ≥10磅(均值不小于10磅,0.8磅的差距为随机误差引起差异)H1:μ<10磅(均值小于10磅,0.8磅的差距为本质上的差异)当备择假设包含一小于符号(<)时,这一检验是左尾检验。\n左侧检验左侧检验a-1的面积拒绝区域0ma的面积\n右侧检验【例4】某储蓄银行的经理一直很注重为客户提供服务的质量。在旧计算机系统下,应答机每小时平均可服务22名客户。银行管理层注意到如果以这种效率提供服务,客户等待时间将会很长。最近银行管理层更换了计算机系统,期望以此缩短客户等待时间,从而提高顾客满意度。为检测新系统是否比旧系统更具效率,银行管理层随机地选取了18个小时作为一个样本,发现,这些时间内平均每小时每个应答机服务的顾客人数为28人,而标准差为2.5人.在1%的显著水平下,你能否得出新系统更为有效的结论?假定每小时服务的人数近似服从标准正态分布。\n右侧检验以μ表示应答机每小时服务的客户数H0:μ≤22人(其新系统服务的人数没有提高,不大于22人,6个人的差异是由抽样误差引起的)H1:μ>22人(其新系统服务的人数提高了,大于22人,6个人的差异不是由抽样误差引起的,而是本质差异)当备择假设中包含大于符号(>)时,检验是右尾检验。\n右侧检验a-1的面积拒绝区域0ma的面积右侧检验适用于原假设H0:0mm£,而备择假设H1:0mm>的情况,只要样本平均数显著地超过假设的总体参数,就拒绝原假设H0而接受备择假设H1。\n根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。对样本估计量的标准化结果。原假设H0为真点估计量的抽样分布6.2.2检验统计量\n总体是否近似正态?将样本容量增加到n≥30否是σ值是否已知?用统计量用样本标准差s估计σ否用统计量是是否为大样本(n>30)是σ值是否已知?用样本标准差s估计σ用统计量否用统计量是否\n6.2.3假设检验结论的表述1.当拒绝原假设时,我们称样本结果统计上是显著的拒绝原假设时结论是清楚的。并且,能给出犯错误的概率(α)。“统计显著”意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠随机因素能够得到的2.当不拒绝原假设时,称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的。\n假设检验结论的表述(“接受”与“不拒绝”)假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。\n6.3总体均值的检验\n一个总体参数的检验z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)2检验(单尾和双尾)均值总体参数比例方差\n6.3.1总体均值的检验(大样本)1.假定条件大样本(n30)2.使用z检验统计量2已知:2未知:\n总体均值的检验(2已知)【例5】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255\n总体均值的检验(2已知)(双侧检验)1、H0:=255H1:255=0.05n=40(大样本)2、确定检验统计量并计算z01.96-1.960.025拒绝H0拒绝H00.0254、决策:样本提供的证据不能证明该天生产的饮料不符合标准要求。结论:不拒绝H03、临界值(双侧检验):\n总体均值的检验(2未知)(例题分析)【例6】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86\n总体均值的检验(2未知)(左侧检验)1、H0:1.35H1:<1.35=0.01n=50(大样本)2、确定检验统计量并计算拒绝H04、决策:新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,这个结论错误的概率不超过1%。结论:-2.33z0拒绝H00.013、临界值(左侧检验):\n总体均值的检验(2未知)(例题分析)【例7】某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改良后的新品种产量是否有显著提高?(=0.05)右侧检验\n总体均值的检验(2未知)(右侧检验)1、H0:5200H1:>5200=0.05n=36(大样本)2、确定检验统计量并计算4、决策:拒绝H0改良后的新品种产量有显著提高,这个结论错误的可能性不超过5%。结论:z0拒绝H00.051.6453、临界值(右侧检验):\n总体均值的检验(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:mm0H0:mm0H1:m查看更多