假设检验统计学课件
第8章假设检验作者:中国人民大学统计学院贾俊平PowerPoint统计学\n第8章假设检验8.1假设检验的基本问题8.2一个总体参数的检验8.3两个总体参数的检验8.4检验问题的进一步说明\n学习目标了解假设检验的基本思想掌握假设检验的步骤对实际问题作假设检验利用置信区间进行假设检验利用P-值进行假设检验\n8.1假设检验的基本问题8.1.1假设问题的提出8.1.2假设的表达式8.1.3两类错误8.1.4假设检验的流程8.1.5利用P值进行决策8.1.6单侧检验\n假设问题的提出\n什么是假设?(hypothesis)对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述\n什么是假设检验?(hypothesistesting)事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立有参数假设检验和非参数假设检验采用逻辑上的反证法,依据统计上的小概率原理\n提出原假设和备择假设什么是原假设?(nullhypothesis)待检验的假设,又称“0假设”研究者想收集证据予以反对的假设3.总是有等号,或4.表示为H0H0:某一数值指定为=号,即或例如,H0:3190(克)\n什么是备择假设?(alternativehypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号:,或表示为H1H1:<某一数值,或某一数值例如,H1:<3910(克),或3910(克)提出原假设和备择假设\n假设检验中的两类错误(决策风险)\n假设检验中的两类错误1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)\n假设检验的流程提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策\n什么是检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知检验统计量的基本形式为确定适当的检验统计量\n规定显著性水平(significantlevel)什么是显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定\n作出统计决策计算检验的统计量根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较得出拒绝或不拒绝原假设的结论\n利用P值进行决策\n什么是P值?(P-value)是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到的(或实测的)显著性水平H0能被拒绝的最小值\n双侧检验的P值/2/2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值\n左侧检验的P值H0值临界值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值\n右侧检验的P值H0值临界值a拒绝域抽样分布1-置信水平计算出的样本统计量P值\n利用P值进行检验(决策准则)单侧检验若p-值>,不拒绝H0若p-值<,拒绝H0双侧检验若p-值>/2,不拒绝H0若p-值</2,拒绝H0\n双侧检验和单侧检验\n双侧检验与单侧检验(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m=m0mm0mm0H1m≠m0m
m0\n双侧检验(原假设与备择假设的确定)属于决策中的假设检验不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为H0:=10H1:10\n双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域1-置信水平\n单侧检验(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域抽样分布1-置信水平\n8.2一个总体参数的检验8.2.1检验统计量的确定8.2.2总体均值的检验8.2.3总体比例的检验8.2.4总体方差的检验\n一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比例方差\n总体均值检验\n总体均值的检验(检验统计量)总体是否已知?用样本标准差S代替t检验小样本量n否是z检验z检验大\n总体均值的检验(2已知或2未知大样本)1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)使用Z-统计量2已知:2未知:\n2已知均值的检验(例题分析)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验\n2已知均值的检验(例题分析)H0:=0.081H1:0.081=0.05n=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:在=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异\n2已知均值的检验(P值的计算与应用)第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜单下选择字符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为0.997672537P值=2(1-0.997672537)=0.004654P值远远小于,故拒绝H0\n2已知均值的检验(小样本例题分析)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验\n2已知均值的检验(小样本例题分析)H0:1020H1:>1020=0.05n=16临界值(s):检验统计量:在=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:Z0拒绝域0.051.645\n2未知大样本均值的检验(例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验\n2未知大样本均值的检验(例题分析)H0:1200H1:>1200=0.05n=100临界值(s):检验统计量:在=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645\n总体均值的检验(2未知小样本)1.假定条件总体为正态分布2未知,且小样本2.使用t统计量\n2未知小样本均值的检验(例题分析)【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验\n2未知小样本均值的检验(例题分析)H0:=5H1:5=0.05df=10-1=9临界值(s):检验统计量:在=0.05的水平上拒绝H0说明该机器的性能不好决策:结论:t02.262-2.262.025拒绝H0拒绝H0.025\n2未知小样本均值的检验(P值的计算与应用)第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统计”,然后,在函数名的菜单中选择字符“TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16在自由度(Deg-freedom)栏中录入9在Tails栏中录入2,表明是双侧检验(单测检验则在该栏内录入1)P值的结果为0.01155<0.025,拒绝H0\n2未知小样本均值的检验(例题分析)【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单侧检验!\n均值的单尾t检验(计算结果)H0:40000H1:<40000=0.05df=20-1=19临界值(s):检验统计量:在=0.05的水平上不拒绝H0不能认为制造商的产品同他所说的标准不相符决策:结论:-1.7291t0拒绝域.05\n总体比例的检验(Z检验)\n一个总体比例检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的Z统计量0为假设的总体比例\n一个总体比例的检验(例题分析)【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验\n一个总体比例的检验(例题分析)H0:=14.7%H1:14.7%=0.05n=400临界值(s):检验统计量:在=0.05的水平上不拒绝H0该市老年人口比重为14.7%决策:结论:Z01.96-1.96.025拒绝H0拒绝H0.025\n总体方差的检验(2检验)\n方差的卡方(2)检验检验一个总体的方差或标准差假设总体近似服从正态分布检验统计量样本方差假设的总体方差\n方差的卡方(2)检验(例题分析)【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1绿色健康饮品绿色健康饮品双侧检验\n方差的卡方(2)检验(例题分析)H0:2=1H1:21=0.05df=25-1=24临界值(s):统计量:在=0.05的水平上不拒绝H0不能认为该机器的性能未达到设计要求2039.3612.40/2=.05决策:结论:\n8.3两个总体参数的检验8.3.1检验统计量的确定8.3.2两个总体均值之差的检验8.3.3两个总体比例之差的检验8.3.4两个总体方差比的检验8.3.5检验中的匹配样本\n两个正态总体参数的检验两个总体的检验Z检验(大样本)t检验(小样本)t检验(小样本)Z检验F检验独立样本配对样本均值比例方差\n独立样本总体均值之差的检验\n两个总体均值之差的检验(12、22已知)1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)检验统计量为\n两个总体均值之差的检验(假设的形式)假设研究的问题没有差异有差异均值1均值2均值1<均值2均值1均值2均值1>均值2H01–2=01–201–20H11–201–2<01–2>0\n两个总体均值之差的检验(例题分析)双侧检验!【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为n1=32,n2=40,测得x1=50公斤,x2=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05)\n两个总体均值之差的检验(例题分析)H0:1-2=0H1:1-20=0.05n1=32,n2=40临界值(s):检验统计量:决策:结论:在=0.05的水平上拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025\n两个总体均值之差的检验(12、22未知且不相等,小样本)检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且不相等12=22检验统计量其中:\n两个总体均值之差的检验(12、22未知但相等,小样本)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等1222检验统计量\n两个总体均值之差的检验(例题分析)单侧检验【例】“多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设(=0.05)\n两个总体均值之差的检验(例题分析—用统计量进行检验)H0:1-20H1:1-2<0=0.05n1=15,n2=20临界值(s):检验统计量:决策:结论:在=0.05的水平上拒绝H0没有证据表明多吃谷物将有助于减肥-1.694t0拒绝域.05\n两个总体均值之差的检验(例题分析—用Excel进行检验)第1步:选择“工具”下拉菜单,并选择“数据分析”选项第2步:选择“t检验,双样本异方差假设”第3步:当出现对话框后在“变量1的区域”方框内键入数据区域在“变量2的区域”方框内键入数据区域在“假设平均差”的方框内键入0在“α(A)”框内键入0.05在“输出选项”中选择输出区域选择“确定”\n两个匹配(或配对)样本的均值检验\n两个总体均值之差的检验(匹配样本的t检验)1.检验两个总体的均值配对或匹配重复测量(前/后)3.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n130,n230)\n匹配样本的t检验(假设的形式)假设研究的问题没有差异有差异总体1总体2总体1<总体2总体1总体2总体1>总体2H0mD=0mD0mD0H1mD0mD<0mD>0注:Di=X1i-X2i,对第i对观察值\n匹配样本的t检验(数据形式)观察序号样本1样本2差值1x11x21D1=x11-x212x12x22D1=x12-x22MMMMix1ix2iD1=x1i-x2iMMMMnx1nx2nD1=x1n-x2n\n匹配样本的t检验(检验统计量)样本差值均值样本差值标准差自由度df=nD-1统计量D0:假设的差值\n【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的t检验(例题分析)在=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102单侧检验\n样本差值计算表训练前训练后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计—98.5配对样本的t检验(例题分析)\n配对样本的t检验(例题分析)差值均值差值标准差\nH0:m1–m28.5H1:m1–m2<8.5a=0.05df=10-1=9临界值(s):检验统计量:决策:结论:在=0.05的水平上不拒绝H0不能认为该俱乐部的宣称不可信配对样本的t检验(例题分析)-1.833t0拒绝域.05\n配对样本的t检验(例题分析—用Excel进行检验)第1步:选择“工具”第2步:选择“数据分析”选项第3步:在分析工具中选择“t检验:平均值的成对二样本分析”第4步:当出现对话框后在“变量1的区域”方框内键入数据区域在“变量2的区域”方框内键入数据区域在“假设平均差”方框内键入8.5显著性水平保持默认值\n两个总体比例之差的检验\n1.假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似检验统计量两个总体比例之差的Z检验\n两个总体比例之差的检验(假设的形式)假设研究的问题没有差异有差异比例1≥比例2比例1<比例2总体1≤比例2总体1>比例2H0P1–P2=0P1–P20P1–P20H1P1–P20P1–P2<0P1–P2>0\n两个总体比例之差的Z检验(例题分析)单侧检验【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?(=0.05)\n两个总体比例之差的Z检验(例题分析)H0:1-20H1:1-2<0=0.05n1=60,n2=40临界值(s):检验统计量:决策:结论:在=0.05的水平上不拒绝H0没有证据表明乙厂工人参加技术培训的人数比例高于甲厂-1.645Z0拒绝域\n两个总体方差比的检验\n两个总体方差比的检验(F检验)假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本假定形式H0:s12=s22或H0:s12s22(或)H1:s12s22H1:s12)检验统计量F=S12/S22~F(n1–1,n2–1)\n两个总体方差的F检验(临界值)0不能拒绝H0F拒绝H0a/2a/2拒绝H0\n两个总体方差的F检验(例题分析)H0:12=22H1:1222=0.05n1=15,n2=20临界值(s):检验统计量:决策:结论:在=0.05的水平上不拒绝H0不能认为这两个总体的方差有显著差异0FF0.0975=0.352.025拒绝H0拒绝H0.025F0.025=2.62\n本章小节1.假设检验的概念和类型2.假设检验的过程基于一个样本的假设检验问题4.基于两个样本的假设检验问题5.利用p-值进行检验\n结束