- 2022-09-01 发布 |
- 37.5 KB |
- 72页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
医学统计学 卡方检验
第九章c2检验郑大公卫统计学教研室平智广1\n教学目的和要求了解c2分布的特征及c2检验的用途;了解多组资料c2检验后两两比较的方法;熟悉配对四格表的设计及其与一般四格表的区别;熟悉的c2检验基本思想;掌握不同设计类型c2检验的基本公式及各公式的适用条件;掌握四格表的确切概率法的适用条件。2\nc2分布是一种连续型随机变量的概率分布;如果Z服从标准正态分布,那么Z2服从自由度为1的χ2分布;设有k个相互独立的标准正态分布随机变量Z1,Z2,……Zm,Z12+Z22+……+Zm2服从自由度为n的c2分布。c2分布3\n3.847.8112.59P=0.05的临界值4\nc2分布的特点1.c2分布是非对称的分布2.c2分布的图形与其自由度有关5\nc2检验的用途c2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法第一节拟和优度检验第二节独立样本2×2列联表资料的c2检验第三节行×列(R×C)表资料的c2检验第四节配对设计资料的c2检验6\n概念:根据样本的频率分布检验其总体分布是否等于某给定的理论分布或检验一个因素多项分类的实际观察数与某理论频数是否有差别。公式理论频数实际频数第一节拟和优度检验7\n例1:如某人向上抛硬币,正面朝上的次数为46次,反面朝上的次数为54次,试问正面朝上的次数和反面朝上的次数是否相同?(1)建立假设,确定检验水准H0:A=TH1:A≠Ta=0.05(2)计算检验统计量T=(46+54)/2=50自由度的确定:df=分类项数-1=2-1=18\n(3)确定P值,得出统计结论表1c2界值表(部分)P>0.05,认为正面朝上的次数和反面朝上的次数相同9\n例2:随机抽取了某地12岁男孩120名,测其身高(cm)见表2,试以检验水准a=0.05,检验当地12岁男孩的身高是否服从正态分布。表2某地12岁男孩身高分布128.1144.4150.3146.2140.6139.7134.1124.3147.9143.0143.1142.7126.0125.6127.7154.4142.7141.2133.4131.0125.4130.3146.3146.8142.7137.6136.9122.7131.8147.7135.8134.8139.1139.0132.3134.7138.4136.6136.2141.6141138.4145.1141.4139.9140.6140.2131.0150.4142.7144.3136.4134.5132.3152.7148.1139.6138.9136.1135.9140.3137.3134.6145.2128.2135.9140.2136.6139.5135.7139.8129.1141.4139.7136.2138.4138.1132.9142.9144.7138.8138.3135.3140.6142.2152.1142.4142.7136.2135.0154.3147.9141.3143.8138.1139.7127.4146.0155.8141.2146.4139.4140.8127.7150.7157.3148.5147.5138.9123.1126.0150.0143.7156.9133.1142.8136.8133.1144.5142.410\n表3120名男生身高的频数分布及拟合优度检验统计量的计算组段观察频数AiPi理论频数Ti(1)(2)(3)(4)(5)=(4)-(3)(6)(7)122.0~50.008320.032400.024082.89001.54053126.0~80.032400.097040.064637.75570.00769130.0~100.097040.226420.1293915.52631.96698134.0~220.226420.419670.1932523.18980.06104138.0~330.419670.635030.2153625.84331.98188142.0~200.635030.814110.1790821.48980.10328146.0~110.814110.925220.1111113.33310.40827150.0~60.925220.976650.051436.17170.00477154.0~50.976650.994410.017762.13093.86289合计120——9.9373311\n(一)建立假设,确定检验水准H0:总体分布为正态分布H1:总体分布不是正态分布a=0.05(二)计算检验统计量自由度的确定:df=k-1-s=9-1-2=6组数估计理论值时用样本统计量代替总体参数的个数,本例为均数和标准差12\n(三)确定P值,得出统计结论n=6,查附表8,c2界值表得:P>0.05。按a=0.05水准不拒绝H0,可认为该资料服从正态分布。c2012.59a=0.059.93713\n处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.05第二节独立样本2×2列联表资料的c2检验例3:将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表4两种药物治疗消化道溃疡4周后疗效14\n一、c2检验的基本思想实际频数(actualfrequency)。两个样本率不相同的原因有两种可能:一种是抽样误差所致;另一种是总体率确有所不同。通过假设检验对两种原因进行判断:为了判别这两种情况,先作出“无效假设”,即假设这两个率相同,差别仅是抽样误差所致。15\n4.无效假设下频数的重新分配-理论频数:式中TRC表示R行(row)C列(column)的理论频数,nR为相应行的合计,nC为相应列的合计,n为总例数。处理愈合未愈合合计洛赛克642185雷尼替丁513384合计1155416916\n5.c2检验的基本思想:如果两个率不同只是抽样误差所致,那么,A与T之差就不会很大,则(式中A代表实际频数;T代表理论频数)的值不会太大。如实际频数与理论频数相差过大,即c2值大于所规定的检验水准的界值时,我们就拒绝这一假设,否则没有理由拒绝这一假设。17\n6.c2值的特点:⑴若各实际频数与理论频数完全相同,则c2值必为零。⑵c2永远是正值,且实际频数与理论频数的相对差异越大时c2值也越大。⑶格子越多,即自由度越大,c2值也会越大。7.自由度计算:ν=(行数-1)*(列数-1)18\nabcd64215133处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.05二、四格表资料的c2检验(一)什么是四格表资料例3:将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表4两种药物治疗消化道溃疡4周后疗效19\n(二)四格表资料的c2检验的基本步骤H0:p1=p2H1:p1≠p2a=0.05n=169>40,最小理论值为T11=(84×54)/169=26.84>520\n表5c2界值表(部分)α0.950.90.10.050.0250.010.005df10.0040.0162.7063.8415.0246.6357.87920.1030.2114.6055.9917.3789.21010.59730.3520.5846.2517.8159.34811.34512.83840.7111.0647.7799.48811.14313.27714.86051.1451.6109.23611.0712.83315.08616.75061.6352.20410.64512.59214.44916.81218.54872.1672.83312.01714.06716.01318.47520.27882.7333.4913.36215.50717.53520.0921.95593.3254.16814.68416.91919.02321.66623.589103.9404.86515.98718.30720.48323.20925.18821\nυ=1,查附表8,c2界值表得:P<0.05,按a=0.05水准拒绝H0,接受H1,可认为两药的愈合率不等,洛赛克(75.29%)高于雷尼替丁(60.71%)。a=0.05c203.841Reject4.3822\n为进一步描述两药效果的差别,可计算两药有效率之差:75.29%-60.71%=14.58%习惯上,常用“需处理数”(numberneededtotreat,NNT)作为指标比较两种药物的临床治疗效果NNT=(有效率之差)-1=14.58%-1=6.86=7说明两组每治疗7例,洛赛克就比雷尼替丁多治愈1人。23\n(三)本题还可用四格表的专用公式式中a、b、c、d分别为四格表的实际频数,n为总例数=a+b+c+d。应用条件:T≥5且n≥4024\n对例3用四格表专用公式计算。式中a、b、c和d分别为四格表的四个实际数,总例数n=a+b+c+d。表4两种药物治疗消化道溃疡4周后疗效处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.0525\n根据专用公式求c2值结果与基本公式计算结果基本相同。26\n(四)四格表c2检验的校正:(1)T≥5且n≥40时,直接计算c2值。27\n(2)1≤T<5且n≥40时,需计算校正值。(3)T<1或n<40时,需改用四格表资料的确切概率法。28\n例4:将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表5,问两疗法的总体缓解率是否不同?表5两种疗法缓解率的比较组别缓解未缓解合计缓解率(%)单纯化疗2(4.8)10(7.2)1216.7复合化疗14(11.2)14(16.8)2850.0合计16244040.029\nH0:p1=p2H1:p1≠p2a=0.05n=40,最小理论值为T11=(12×16)/40=4.8<530\n(五)2×2列联表c2检验注意事项c2校正公式仅用于n=1的四格表资料,对于n≥2时,一般不作校正;当n<40或T<1时,校正c2值也不恰当,此时应选用Fisher确切检验(Fisher’sexacttest);两组对象只有的同质的前提下才能进行比较。31\n第三节独立样本R×C列联表资料的c2检验行×列表资料概述:四格表只有2行(row)、2列(column),是行×列表的简单形式,当行和(或)列>2时,就叫行×列表,又称为R×C表。R×C表的c2检验可用于多个率或构成比的比较,其基本思想与四格表c2检验的思想一致。32\n式中n是总例数,A是每个格子的实际频数,nR、nC分别为某格子对应的行合计和列合计。33\n(一)多个独立样本率的比较例5:用三种不同治疗方法治疗慢性支气管炎的疗效见下表,试比较三种治疗方法治疗慢性支气管炎的疗效。表6三种不同治疗方法治疗慢性支气管炎的疗效组别有效无效合计有效率%A药3554087.50B药20103066.67C药7253221.88合计624010260.7834\n1.建立检验假设,确定检验水准H0:p1=p2=p3H1:p1,p2,p3不全相等a=0.052.计算统计量3.确定P值,做出推断查附表8可知,c2=32.74>c20.05,2=5.99,P<0.05。拒绝H0,接受H1,可以认为三种药物的治疗效果不全相同。35\n(二)多个独立样本频率分布的比较例6:试分析儿童急性白血病患者与成年人急性白血病的血型分布有无差别?表7儿童急性白血病患者与成年人急性白血病患者的血型分布组别A型B型O型AB型合计儿童30383212112成人193019977合计4968512118936\n1.建立检验假设,确定检验水准H0:儿童急性白血病患者与成年人急性白血病患者的血型分布相同H1:儿童急性白血病患者与成年人急性白血病患者的血型分布不相同a=0.052.计算统计量3.确定P值,做出推断查附表8可知,c2=0.695查看更多