医学统计学卡方检验
医学统计学好检验卫生部“十二五”规划牧村⑨E4星忆MUMMINGUWVERSITYX2检畛CX-tr/TRmtowU8SZJ9%)是现代统计学的创始人之一,英国统计学家KarlPearson于1900年提出的一种具有广泛用途的假设检验方法。常用于推断两个总体率(或构成比)之间有无差别。\nJ格表资料的X淞验口格表资料(fourfoldtabic)组别有效无效合计有效率A组aba+ba/(a+b)B组cdc+dc/(c+d)合计a+cb+dn(a+b+c+d)(a+c)/n实际频数(actualfrequency'A):a、b、c、d理论频数(theoteticalfrequency'T)假设Ho:KA=7tB=K,即A组与B组治疗的总体有效率相等A组:理论有效者=(a+b)X(a+c)/n;理论无效者=(a+b)X(b+d)/nB组:理论有效者=(c+d)X(a+c)/n;\n理论无效者=(c+d)X(b+d)/nT_"1RC~n丁乩为第R行第C列的理论频数,Hr为相应行的合计,Rz为相应列的合计。/=ZC4-~7)2-,r=(行数-1)(列数-1)心值反映了实际频数与理论频数的吻合程度。•若假设成立,实际频数与理论频数的差值较小,必值也较小;•若假设不成立,实际频数与理论频数的差值较大,x2值也较大。\n心值的大小取决于区严的个数多少,即自由度的大小。V愈大,心值也越大。自由度取决于可以自由取值的基本格子数,而不是样本含量。对于四格表资料(v=l),计算一个理论值Trc后,其他3个理论值可用周边合计数减去相应的理论值T得出。%2检畛的自由皮•X?检验,根据自由度v和检验水《准查表得必界值。•当v确定后,必分布曲线下右侧尾部的面积为)时,横轴上相应的W值记作O•当v确定后,值越大,p值越小。四格在资料X2检验的专用公式\n两样本率比较时,当总例数n>40且所有格子的T>5时,可用四格表资料的专用公式计算2_(ad-be)2n2(a+。)(c+d)(a+c)(〃+d)【例】某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗71例,有效52例,乙药治疗42例,有效39例。问两种药物的有效率是否有差别?药物有效无效合计有效率(%)甲药52(57.18)a19(13.82)b71(a+b)73.24乙药39(33.82)c3(8.18)d42(c+d)92.86A口计91(a+c)22(b+d)113(〃=a+5+c+d)80.53\n(1)设Ho:冗产吗,即两药有效率相同;Hi:九1r攻a=O.O5⑵n>40,Tmin>5z2=6.48(52-57.18)2(19-13.82)2(39-3X82)2(3-8.18)2HHH57.1813.8233.828.18或z2(52x3-19x39)233=6.4871x42x91x22⑶就oai=3.84
5,且n>40时,直接计算代值,用基本公式或专用公式;•l〈Tv5,且n>40时,用连续性校正公式(continuitycorrection),或四格表资料的Fisher确切概率法;•TV1或nV40,用四格表资料的Fisher确切概率法。【例】某医生研究比较A、B两种药物对急性细菌性肺炎的疗效,甲药治疗42例,有效40例,乙药治疗22例,有效16例。问两种药物的疗效差别有无统计学意义?处理有效无效合计有效率(%)A药40(36.75)2(5.25)4295.24B药16(19.25)6(2.75)2272.73合计5686487.50用校正公式,>2=4.79;错用基本公式,x2=6.69o\n四格妻进科的Fisher确切概率法当TV1或nv40,四格表资料必检验结果可能会有偏性,需采用Fisher确切检验进行分析。该法由R.A.Fishet提出,且直接计算概率,因此也叫Fisher确切概率检验(Fisher^exactprobabilitytest)oFisher确切概率法的■本思想在四格表周边合计数固定不变的条件下,利用超几何分布(hypergsmetricdistribution)公式直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准比较,作出是否拒绝H。的结论。(a+,)!(c+d)!(a+c)!(〃+")!r=a"!cld\〃!“!”为阶乘符号,n!=lX2X---Xn,01=1,£刊=1。\n【例】某医生用新旧两种药物治疗某病患者27人,治疗结果见表。问两种药物的疗效有无差别?组别治愈数未愈数合计治愈率(%)旧药2141612.5新药381127.3合计5222718.5(1)设Ho:冗尸吗,即两药疗效相同;H1:巧r冗2a=O.O5⑵计算各组合概率在四格表周边合计数不变的条件下,共有“周边合计数中最小数+1”中组合。组合i12345601611521431341251156473827110011Pi0.00572D.06540®.24526D.381519.24798t.054106⑶确定P值,作出结论原样本四格表对应的概率为P3=0.245262,小于或等于P3的四格表为i=123,6,故双侧检验P值为P=P1+P2+P3+p6=0.370>0.05,不拒绝Ho。左侧概率^P=P1+P2+P3=0.316,右侧概率为P=卓+P4+P5+P6=0.929,故单侧检验P值为0.316。\n配对四格表资料的代检验计数资料的配对设计常用于两种检脸方法、培养方法、诊断方法的比较。特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果,整理为髭对川格辰资料甲+乙■合计+abIa+b一Cd\c+d合计fl+cb+dn一致:a(+)和d(-);不一致:b(甲+,乙-)和C(甲乙+)O概坯\n配对四格表资料的X?检验,又称为McNemartest检验。(b+c)N40,/2=-,v=1b+c2{b—c—l)2(〃+c)V40,%-,v=1b+c由于该检验只考虑了不一致的情况(b与c),而未考虑样本含量口及一致结果(a与d)o因此,当n彳艮大且两法一致率较高(即a与d数值较大),b与c的数值相对较小时,即使检验结果有统计学意义,但实际意义并不大。【例】用两种血清学方法对100例肝癌患者进行检测,有关检测结果见表。问两种血清学方法检测结果有无差别?甲法-乙法-合计+,+503282,15318合计6535100(1)HO:b=c,两种方法检出率相同;Hi:brc;a=0.05z、,(32-15)2-(9)Z"==6.14⑷32+15⑶忘0"=3・84v/,则pvo.05,拒绝Ho,接受\nRxC列联表资料的(2检验行X列表资料的必检验,用于多个样本率的比较、两个或多个构成比的比较。基本数据为:⑴多个样本率比较时,有R行2列;⑵两个样本构成比比较时,有2行C列;⑶多个样本构成比比较时,有R行C列。J2Z2=/XV-1),r=(行数-1)(列数一1)nRnC\n【例】某研究者欲比较甲、乙、丙3家医院住院病人院内感染情况,随机抽查同一时期各医院住院病人院内感染情况结果见表。试比较三家医院院内感染率有无差别。医院感染未感染合计甲43188231乙19170189丙15151166合计77509586⑴设I%:三家医院院内感染率相同;H"感染率不同;a=O.O5.432/=586(---+231x7718619217tf152+H+231x509189x77189x509166x771512+1)=10.09166x509(3)Zo,o5,2=5.99Zo.01671»Z<腰>Zo.01671,7女-腰V状.01671,故可认为后溪穴与人中穴、后溪穴与腰痛穴治愈率之间有统计学意义,而人中穴与腰痛穴治愈率之间无统计学意义。若把人中穴针刺治疗急性腰扭伤设为对照组,另两组为试验组,则\n⑴设Ho:各试验组与对照组的总体治愈率相等;H"总体治愈率不等;a=0.05a,_0^05_00253-1⑵,机人=14.24,/攵_腰=1.26⑶Zo.0251=5・02Zg-A>Zo.0251,%攵-腰V/^o.0251>故可认为后溪穴与人中穴治愈率之间有统计学意义,而腰痛穴与人中穴治愈率之间无统计学意义。行X列表%2检验注愈*项a、若有1/5以上的格子出现1VTV5,则•增大样本含量,以达到增大理论频数的目的;•结合专业,删去理论频数太小的格子对应的行或列;•结合专业,将理论频数太小的行或列与性质相近的行或列合并;•用双向无序RXC表资料的Fisher确切概率法。\n行X列表X2检验注愈事项b、多个样本率比较,若统计推断为拒绝H。,接受H],只能认为各总体率或构成比之间总的来说有差别。若要进一步了解哪两者之间有差别,可用卡方分割法,或者调整检验水准。c、对于单向有序的RXC表资料,在比较各处理组的效应有无差别时,应该用秩和检验。