医学统计学 卡方检验

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

医学统计学 卡方检验

第九章c2检验郑大公卫统计学教研室平智广1\n教学目的和要求了解c2分布的特征及c2检验的用途;了解多组资料c2检验后两两比较的方法;熟悉配对四格表的设计及其与一般四格表的区别;熟悉的c2检验基本思想;掌握不同设计类型c2检验的基本公式及各公式的适用条件;掌握四格表的确切概率法的适用条件。2\nc2分布是一种连续型随机变量的概率分布;如果Z服从标准正态分布,那么Z2服从自由度为1的χ2分布;设有k个相互独立的标准正态分布随机变量Z1,Z2,……Zm,Z12+Z22+……+Zm2服从自由度为n的c2分布。c2分布3\n3.847.8112.59P=0.05的临界值4\nc2分布的特点1.c2分布是非对称的分布2.c2分布的图形与其自由度有关5\nc2检验的用途c2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法第一节拟和优度检验第二节独立样本2×2列联表资料的c2检验第三节行×列(R×C)表资料的c2检验第四节配对设计资料的c2检验6\n概念:根据样本的频率分布检验其总体分布是否等于某给定的理论分布或检验一个因素多项分类的实际观察数与某理论频数是否有差别。公式理论频数实际频数第一节拟和优度检验7\n例1:如某人向上抛硬币,正面朝上的次数为46次,反面朝上的次数为54次,试问正面朝上的次数和反面朝上的次数是否相同?(1)建立假设,确定检验水准H0:A=TH1:A≠Ta=0.05(2)计算检验统计量T=(46+54)/2=50自由度的确定:df=分类项数-1=2-1=18\n(3)确定P值,得出统计结论表1c2界值表(部分)P>0.05,认为正面朝上的次数和反面朝上的次数相同9\n例2:随机抽取了某地12岁男孩120名,测其身高(cm)见表2,试以检验水准a=0.05,检验当地12岁男孩的身高是否服从正态分布。表2某地12岁男孩身高分布128.1144.4150.3146.2140.6139.7134.1124.3147.9143.0143.1142.7126.0125.6127.7154.4142.7141.2133.4131.0125.4130.3146.3146.8142.7137.6136.9122.7131.8147.7135.8134.8139.1139.0132.3134.7138.4136.6136.2141.6141138.4145.1141.4139.9140.6140.2131.0150.4142.7144.3136.4134.5132.3152.7148.1139.6138.9136.1135.9140.3137.3134.6145.2128.2135.9140.2136.6139.5135.7139.8129.1141.4139.7136.2138.4138.1132.9142.9144.7138.8138.3135.3140.6142.2152.1142.4142.7136.2135.0154.3147.9141.3143.8138.1139.7127.4146.0155.8141.2146.4139.4140.8127.7150.7157.3148.5147.5138.9123.1126.0150.0143.7156.9133.1142.8136.8133.1144.5142.410\n表3120名男生身高的频数分布及拟合优度检验统计量的计算组段观察频数AiPi理论频数Ti(1)(2)(3)(4)(5)=(4)-(3)(6)(7)122.0~50.008320.032400.024082.89001.54053126.0~80.032400.097040.064637.75570.00769130.0~100.097040.226420.1293915.52631.96698134.0~220.226420.419670.1932523.18980.06104138.0~330.419670.635030.2153625.84331.98188142.0~200.635030.814110.1790821.48980.10328146.0~110.814110.925220.1111113.33310.40827150.0~60.925220.976650.051436.17170.00477154.0~50.976650.994410.017762.13093.86289合计120——9.9373311\n(一)建立假设,确定检验水准H0:总体分布为正态分布H1:总体分布不是正态分布a=0.05(二)计算检验统计量自由度的确定:df=k-1-s=9-1-2=6组数估计理论值时用样本统计量代替总体参数的个数,本例为均数和标准差12\n(三)确定P值,得出统计结论n=6,查附表8,c2界值表得:P>0.05。按a=0.05水准不拒绝H0,可认为该资料服从正态分布。c2012.59a=0.059.93713\n处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.05第二节独立样本2×2列联表资料的c2检验例3:将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表4两种药物治疗消化道溃疡4周后疗效14\n一、c2检验的基本思想实际频数(actualfrequency)。两个样本率不相同的原因有两种可能:一种是抽样误差所致;另一种是总体率确有所不同。通过假设检验对两种原因进行判断:为了判别这两种情况,先作出“无效假设”,即假设这两个率相同,差别仅是抽样误差所致。15\n4.无效假设下频数的重新分配-理论频数:式中TRC表示R行(row)C列(column)的理论频数,nR为相应行的合计,nC为相应列的合计,n为总例数。处理愈合未愈合合计洛赛克642185雷尼替丁513384合计1155416916\n5.c2检验的基本思想:如果两个率不同只是抽样误差所致,那么,A与T之差就不会很大,则(式中A代表实际频数;T代表理论频数)的值不会太大。如实际频数与理论频数相差过大,即c2值大于所规定的检验水准的界值时,我们就拒绝这一假设,否则没有理由拒绝这一假设。17\n6.c2值的特点:⑴若各实际频数与理论频数完全相同,则c2值必为零。⑵c2永远是正值,且实际频数与理论频数的相对差异越大时c2值也越大。⑶格子越多,即自由度越大,c2值也会越大。7.自由度计算:ν=(行数-1)*(列数-1)18\nabcd64215133处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.05二、四格表资料的c2检验(一)什么是四格表资料例3:将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表4两种药物治疗消化道溃疡4周后疗效19\n(二)四格表资料的c2检验的基本步骤H0:p1=p2H1:p1≠p2a=0.05n=169>40,最小理论值为T11=(84×54)/169=26.84>520\n表5c2界值表(部分)α0.950.90.10.050.0250.010.005df10.0040.0162.7063.8415.0246.6357.87920.1030.2114.6055.9917.3789.21010.59730.3520.5846.2517.8159.34811.34512.83840.7111.0647.7799.48811.14313.27714.86051.1451.6109.23611.0712.83315.08616.75061.6352.20410.64512.59214.44916.81218.54872.1672.83312.01714.06716.01318.47520.27882.7333.4913.36215.50717.53520.0921.95593.3254.16814.68416.91919.02321.66623.589103.9404.86515.98718.30720.48323.20925.18821\nυ=1,查附表8,c2界值表得:P<0.05,按a=0.05水准拒绝H0,接受H1,可认为两药的愈合率不等,洛赛克(75.29%)高于雷尼替丁(60.71%)。a=0.05c203.841Reject4.3822\n为进一步描述两药效果的差别,可计算两药有效率之差:75.29%-60.71%=14.58%习惯上,常用“需处理数”(numberneededtotreat,NNT)作为指标比较两种药物的临床治疗效果NNT=(有效率之差)-1=14.58%-1=6.86=7说明两组每治疗7例,洛赛克就比雷尼替丁多治愈1人。23\n(三)本题还可用四格表的专用公式式中a、b、c、d分别为四格表的实际频数,n为总例数=a+b+c+d。应用条件:T≥5且n≥4024\n对例3用四格表专用公式计算。式中a、b、c和d分别为四格表的四个实际数,总例数n=a+b+c+d。表4两种药物治疗消化道溃疡4周后疗效处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.0525\n根据专用公式求c2值结果与基本公式计算结果基本相同。26\n(四)四格表c2检验的校正:(1)T≥5且n≥40时,直接计算c2值。27\n(2)1≤T<5且n≥40时,需计算校正值。(3)T<1或n<40时,需改用四格表资料的确切概率法。28\n例4:将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表5,问两疗法的总体缓解率是否不同?表5两种疗法缓解率的比较组别缓解未缓解合计缓解率(%)单纯化疗2(4.8)10(7.2)1216.7复合化疗14(11.2)14(16.8)2850.0合计16244040.029\nH0:p1=p2H1:p1≠p2a=0.05n=40,最小理论值为T11=(12×16)/40=4.8<530\n(五)2×2列联表c2检验注意事项c2校正公式仅用于n=1的四格表资料,对于n≥2时,一般不作校正;当n<40或T<1时,校正c2值也不恰当,此时应选用Fisher确切检验(Fisher’sexacttest);两组对象只有的同质的前提下才能进行比较。31\n第三节独立样本R×C列联表资料的c2检验行×列表资料概述:四格表只有2行(row)、2列(column),是行×列表的简单形式,当行和(或)列>2时,就叫行×列表,又称为R×C表。R×C表的c2检验可用于多个率或构成比的比较,其基本思想与四格表c2检验的思想一致。32\n式中n是总例数,A是每个格子的实际频数,nR、nC分别为某格子对应的行合计和列合计。33\n(一)多个独立样本率的比较例5:用三种不同治疗方法治疗慢性支气管炎的疗效见下表,试比较三种治疗方法治疗慢性支气管炎的疗效。表6三种不同治疗方法治疗慢性支气管炎的疗效组别有效无效合计有效率%A药3554087.50B药20103066.67C药7253221.88合计624010260.7834\n1.建立检验假设,确定检验水准H0:p1=p2=p3H1:p1,p2,p3不全相等a=0.052.计算统计量3.确定P值,做出推断查附表8可知,c2=32.74>c20.05,2=5.99,P<0.05。拒绝H0,接受H1,可以认为三种药物的治疗效果不全相同。35\n(二)多个独立样本频率分布的比较例6:试分析儿童急性白血病患者与成年人急性白血病的血型分布有无差别?表7儿童急性白血病患者与成年人急性白血病患者的血型分布组别A型B型O型AB型合计儿童30383212112成人193019977合计4968512118936\n1.建立检验假设,确定检验水准H0:儿童急性白血病患者与成年人急性白血病患者的血型分布相同H1:儿童急性白血病患者与成年人急性白血病患者的血型分布不相同a=0.052.计算统计量3.确定P值,做出推断查附表8可知,c2=0.6950.05。不拒绝H0,尚不能认为儿童急性白血病患者与成人急性白血病患者的血型分布不同。37\n(三)R×C列联表的分割对于多个率或多个频率分布比较的c2检验,结论为拒绝H0时,仅表示多组之间总得来说存在差别,即多组中至少有两组的率或频率不同,但不是任意两组之间有差别。若要明确是哪些组之间存在差异,需要进行多组间的两两比较,即卡方分割。对检验水准进行校正,用原来的a/n。38\n例7:为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的106名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果如下表。表8某药不同剂量的镇痛效果剂量镇痛效果合计有效率(%)有效无效1.0mg6(14.72)24(15.28)3020.002.5mg22(19.62)18(20.38)4055.005.0mg24(17.66)12(18.34)3666.67合计525410649.0639\n剂量镇痛效果合计有效无效1.0mg624302.5mg221840合计284270剂量镇痛效果合计有效无效1.0mg624305.0mg241236合计303666剂量镇痛效果合计有效无效2.5mg2218405.0mg241236合计463076表9不同剂量有效率之间的两两比较对比组四格表c2值P值检验结果1.0VS.2.58.750.0031拒绝H01.0VS.5.014.370.0002拒绝H02.5VS.5.01.0790.2988不拒绝H040\n(四)R×C表c2检验的注意事项对R×C表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)(4)采用R×C表的Fisher确切概率法。41\n多组比较时,若效应有强弱的等级,如+,++,+++,最好采用后面的非参数检验方法。χ2检验只能反映其构成比有无差异,不能比较效应的平均水平。表8观察组与对照组的疗效比较组别例数合计显效有效无效观察组584418120对照组564335134合计114875325442\n第四节配对设计资料的c2检验配对四格表资料:和计量资料一样,计数资料也可作配对设计,只是计量资料的配对其结果是数值变量,而计数资料的配对其结果是分类变量。对按一定条件配成对的n对研究对象分别使用两种不同的处理方法,或者对n个研究对象在同时或两个时间点上使用两种不同的处理方法所得到的观察数据。43\n配对数据:对按一定条件配成对的n对研究对象分别使用两种不同的处理方法,或者对n个研究对象在两个时间点上使用两种不同的处理方法所得到的观察数据。B+-A+ab-cd配对四格表IdAB1++2+-……j-+……n--原始数据例如,两个医生分别检查n个病人,检验的结果如下:问题:两个医生的检验结果一致吗?44\n例8:设有132份食品标本,把每份标本一分为二,分别用两种检验方法作沙门菌检验,检验结果如下表所示,试比较两种检验方法的阳性结果是否有差别?表9两种检验方法检验结果比较甲法乙法合计+-+80(a)10(b)90-31(c)11(d)42合计11121132(一)配对2×2列联表资料的c2检验45\n甲法阳性率:(80+10)/132=(a+b)/n乙法阳性率:(80+31)/132=(c+d)/n阳性率之差=甲法阳性率-乙法阳性率=(b-c)/n可见,要比较两种检验方法阳性率有无差别,只要对其中的频数b与c作c2检验即可。在假设两法阳性率相同的条件下,b与c两个格子理论频数都应该是(b+c)/2,当b+c≥40时,可有:46\n1.建立检验假设,确定检验水准H0:两种培养基上白喉杆菌生长的阳性概率相同H1:两种培养基上白喉杆菌生长的阳性概率不同a=0.052.计算统计量b+c=10+31=41>40,不需校正,计算c2得:3.确定P值,做出推断查附表8,得界值为c20.05,1=3.84c2=1.60,P>0.05。在a=0.05的检验水准不拒绝H0,所以尚不能认为两种方法测定的频率分布不同。50\n第五节2×2列联表的确切概率法例10:将23名精神抑郁症患者随机分到两组,分别用两种药物治疗,结果见下表,问两种药物的疗效有无差别?表11两种药物治疗精神抑郁症的效果分组治疗效果合计有效率有效无效甲药751258.3乙药381127.3合计10132313.551\n确切概率法的基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi;再按检验假设用单侧或双侧的累计概率P,依据所取的检验水准a做出推断。各组合的概率服从超几何分布,其和为1。52\n一、累计概率P的计算要想拒绝H0,必须使a值更大,c值更小;或者c值更大,a值更小。当前的率差为58.3%-27.3%=31.0%,只要计算率差大于或等于31.0%的所有四格表对应的确切概率之和便是H0不成立时的累积概率。当两组样本量相等,可计算1侧,然后乘2即可;若样本含量不等,则需分别计算。若要单侧的确切概率,根据两个率的关系仅计算其中的一种情况即可。分组治疗效果合计有效率有效无效甲药7(a)5(b)1258.3乙药3(c)8(d)1127.3合计10132313.553\ni四格表组合率差Piabcd10121010.90910.000009612111920.73490.000576893210830.56060.00951868439740.38640.06345788548650.21220.19989231657560.03780.31982770766470.13640.266523098*75380.31060.11422418*984290.48490.0237967010931100.65910.00211526111020110.83330.00005769表12Fisher确切概率法计算表54\n二、检验步骤本例n=23<40,宜用四格表资料的Fisher确切概率法直接计算累计概率。检验步骤为:H0:p1=p2,即两组新生儿HBV的总体感染率相等H1:p1≠p2,即两组新生儿HBV的总体感染率不等a=0.05当前率差为0.3106,计算所有率差≥0.3106的各组合下四格表的概率Pi。本例中P1、P2、P3、P4、P8、P9、P10和P11满足条件,累计概率为:P=P1+P2+P3+P4+P8+P9+P10+P11=0.2137568955\n补充:u检验与2检验的关系两样本率比较时,如为双侧检验,则u检验和四格表2检验是等价的,即自由度为1的2=u2;校正u检验和四格表校正2检验也是等价的,应用条件亦相同。若为单侧检验,则用u检验较为方便。56\n两样本率比较的u检验例11:某医师研究妊娠晚期患病毒性肝炎对早产的影响。发现186例病人中,有80例早产,早产率为43%;144例无肝炎孕妇,早产者36例,早产率为25%。问病毒性肝炎对早产是否有影响?早产非早产合计早产率(%)肝炎8010618643无肝炎3610814425合计1162143303557\n两样本率比较u检验的适用条件(1)两组样本含量n均大于5058\n式中X1和n1分别代表较大阳性率p1的阳性数及样本含量,X2和n2分别代表较小阳性率p2的阳性数及样本含量,pc为合并阳性率。计算公式:59\nH0:p1=p2H1:p1≠p2α=0.05本题n1=186,X1=80,P1=0.43;n2=144,X2=36,P2=0.25Pc=(X1+X2)/(n1+n2)=(80+36)/(186+144)=0.3515u=3.397>2.58,故P<0.01,按α水准拒绝H0,接受H1。可以认为肝炎孕妇的早产率高于无肝炎者。两样本率比较u检验的基本步骤60\n根据专用公式求c2值U检验结果为3.397,U2=11.5461\n练习62\n选择题1.用正态近似法进行总体率的区间估计时,应满足A.n足够大B.p或(1-p)不太小C.np或n(1-p)均大于5D.以上均要求63\n2.由两样本率的差别推断两总体率的差别,若P<0.05,则A.两样本率相差很大B.两总体率相差很大C.两样本率和两总体率差别有统计意义D.两总体率相差有统计意义64\n3.四格表资料中的实际数与理论数分别用A与T表示,其基本公式与专用公式求的条件为A.A≥5B.T≥5C.A≥5且T≥5D.A≥5且n≥40E.T≥5且n≥4065\n4.三个样本率比较得到,可认为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同66\n计算题用两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致的检出率为35%。试将上述资料整理成四格表,并比较两种方法何者为优?67\n表6甲乙两法检查乳腺癌患者结果比较乙法甲法合计+-+-423018306060合计724812068\n案例讨论某地对区级医院2001-2002年医疗质量进行总体评价与比较,按分层抽样方法抽取两年内某病患者1250例,患者年龄构成与病情两年间差别没有统计学意义,观察三项指标分别为疗效、住院日、费用。规定很好、好、一般、差的标准见表7-16,病人医疗质量各等级频数分布见表7-17。69\n70\n原检验方法不正确。该例结果变量为疗效、住院日、费用等,属于等级资料,等级资料平均效应的比较不能用卡方检验,因为卡方检验只能说明2001年和2002年的频数分布有无差别,不能说明平均效应有无不同。应该采用秩和检验。71\nThankyou!72
查看更多

相关文章

您可能关注的文档