统计学公式汇总

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学公式汇总

.统计学公式汇总2(1)αβδμσνπρυtuFXsX1X2XnX(2)均数(mean):X式中X表示样本均数,X1,X2,nnXn为各观察值。(3)几何均数(geometricmean,G):1lgX1lgX2lgXn1lgXGnX?XXlg()lg()12n式中nnG表示几何均数,X1,X2,Xn为各观察值。(4)中位数(median,M)n为奇数时,MXn1()2n为偶数时,M[XnXn]/2()(1)22式中n为观察值的总个数。i(5)百分位数PxL(nx%fL)式中L为Px所在组段的下限,fx为其频fx数,i为其组距,fL为小于L各组段的累计频数。(6)四分位数(quartile,Q)第25百分位数P25,表示全部观察值中有25%(四分之一)的观察值比它小,为下四分位数,记作QL;第75百分位数P75,表示全部观察值中有25%(四分之一)的观察值比它大,为上四分位数,记作QU。(7)四分位数间距等于上、下四分位数之差。22(X)(8)总体方差N2(X)(9)总体标准差N222(XX)X(X)/n(10)样本标准差sn1n1s(11)变异系数(coefficientofvariation,CV)CV100%Xs(12)样本均数的标准误理论值估计值s式中σ为总体标准差,sXXnn'.\n.为样本标准差,n为样本含量。(1)p(1p)(13)样本率的标准误理论值p估计值sp式中π为总nn体率,p为样本率,n为样本含量。(14)总体率的估计:正态分布法,(pup(1p)/n,pup(1p)/n)式中p为样本均数,s为样本标准差,n为样本含量。ss(15)总体均数的估计t分布法:(Xt,,Xt,)式中X为样本均数,snn为样本标准差,n为样本含量,ν为自由度。(16)总体均数的估计u分布法:ss总体标准差σ未知但较大时,(Xu,Xu)式中X为样本均数,nns为样本标准差,n为样本含量。总体标准差σ已知时,(Xu,Xu)式中X为样本均数,σ为nn总体标准差,n为样本含量。X0(17)样本均数与总体均数比较的t检验:tn1式中X为样本均数,s/n0为欲比较的总体均数,s为样本标准差,n为样本含量,ν为自由度。X0(18)样本均数与总体均数比较的u检验:u式中X为样本均数,0为欲s/n比较的总体均数,s为样本标准差,n为样本含量。X0(19)样本均数与总体均数比较的u检验:u式中X为样本均数,0为欲比/n较的总体均数,σ为总体标准差,n为样本含量。(20)配对设计差值的符号秩和检验正态近似法公式:Tn(n1)/4u式中T为秩和,求秩和方法:差值d=(X-3n(n1)(2n1)(tjtj)2448μ0);依差值的绝对值从小到大编秩;差值为0者,舍去不计;如果差值相等,取平均秩次;分别求出正、负秩次之和T(+)、T(-);T为二者绝对值较小者;n为样本含量,但不包括差值等于0者;tj(=1,2,···)为第j个相同差值的个数。d0(21)配对设计两样本均数比较的t检验:tn1式中d为差值d的均数,sd/n'.\n.sd为差值d的标准差,n为样本含量(即样本对子数),差值d=各对子数据之差(含正负号!),ν为自由度。(22)成组设计两样本均数比较的t检验:X1X2X1X2ts2222X1X2X1(X1)/n1X2(X2)/n211()n1n22n1n2n1n22式中X1和X2分别为两个样本均数,n1和n2为两个样本含量,ν为自由度。Xn0(23)样本率与总体率的比较:未校正的正态近似法u或n0(10)p0u式中X为样本阳性数,π0为欲比较的总体率,p为样本率,n0(10)/n为样本含量。|Xn0|0.5(24)样本率与总体率的比较:校正的正态近似法u或n0(10)|p0|1/2nu式中X为样本阳性数,π0为欲比较的总体率,p为样本率,n0(10)/n为样本含量。(25)样本率与总体率的比较:直接计算概率法:首先按照二项分布的原理计算从0到nn!nXX各个X的概率值P(X)=(10)0。左单侧:PL表示从0到XsX!(nX)!的累计概率;右单侧:PR表示从Xs到n的累计概率;单侧概率P=MIN(PL,PR);双侧概率P的计算方法有三种:A,单侧概率乘2;B,当X大于nπ0时,双侧概率=P(≥X)+P(≤(2nπ0-X));当X小于nπ0时,双侧概率=P(≤X)+P(≥(2nπ0-X));C,将P(X)≤P(Xs)的各个概率值相加,即得双侧累计概率,即P=∑P(X),X满足条件P(X)≤P(Xs)。式中X为样本阳性数,π0为欲比较的总体率,Xs为样本阳性数,n为样本含量。p1p2p1p2(26)两个样本率的比较:正态近似法u式22sp1sp2p1(1p1)p2(1p2)n1n2中p1和p2分别为两个样本率,n1和n2为两个样本含量。p1p2n1p1n2p3(27)两个样本率的比较:正态近似法u,pc11n1n2pc(1pc)()n1n2式中p1和p2分别为两个样本率,n1和n2为两个样本含量。'.\n.222(AT)(28)四格表检验:ν=(行数-1)(列数-1)式中A为实际TnRnC频数(actualfrequency),T为理论频数(theoreticalfrequency),TRC式中nTRC表示R行(row)C列(column)的理论频数,nR为相应行的合计值,nC为相应列的合计值,n为总例数,ν为自由度。222(adbc)n(29)四格表检验专用公式:ν=(行数-1)(列(ab)(cd)(ac)(bd)数-1)式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。222(|adbc|n/2)n(30)四格表值的校正公式:ν=(行数-1)(列(ab)(cd)(ac)(bd)数-1)式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。222A(31)行×列表检验公式:n(1)ν=(R-1)(C-1)式中A为nRnC实际频数(actualfrequency),nR为相应行的合计值,nC为相应列的合计值,n为总例数,,R为行数,C为列数,ν为自由度。RCA22ij(32)行×列表检验公式:n(1)ν=(R-1)(C-1)式中Aiji1j1nimj为实际频数(actualfrequency),ni为相应行的合计值,mj为相应列的合计值,n为总例数,R为行数,C为列数,ν为自由度。(ab)!(cd)!(ac)!(bd)!(33)四格表的确切概率法:P式中a,b,c,d为a!b!c!d!n!四格表的四个实际频数,n为总例数。取表原则可分为“差数极端法”和“概率极端法”。多数情况下,二者所得结果一致,但个别情况下,所得结果不同。一般认为,“概率极端法”最准确。222(bc)(34)配对四格表的检验:,ν=1,式中b,c为结果不一致的对子数。bc2(bc1)22(35)配对四格表的检验校正公式:,ν=1,式中b,c为结果不一bc致的对子数。323nfX3fXfX2(fX)/n(36)矩法正态性检验g1223/2(n1)(n2){fX(fX)/n]/(n1)}4322422(n1)[nfX4fXfX6(fX)fX/n3(fX)/n]3(n1)g2222(n1)(n2)(n3){[fX(fX)/n]/(n1)}(n2)(n3)'.\n.26n(n1)24n(n1)g1g2(n2)(n1)(n3)(n3)(n2)(n3)(n5)ug1g1/g1ug2g2/g2式中X为变量值,f为相同X的个数,n为样本例数。(37)二项分布的概率A.恰有X例阳性的概率,记为P(X)nnXXP(X)(X)(1),X=0,1,2,⋯,nnn!(X)X!(nX)!式中X为阳性数,π为总体阳性率,n为样本例数,!为阶乘符号。B.最多有k例阳性的概率,记为P(X≤k)kP(X≤k)=P(X)X=0,1,2,⋯,n0C.最少有k例阳性的概率,记为P(X≥k)nP(X≥k)=P(X)X=0,1,2,⋯,nk(38)Poisson分布的概率A.恰有X例阳性的概率,记为P(X)XP(X)e(/X!),X=0,1,2,⋯,n式中μ=nπ,为Poisson分布的总体均数,X为单位时间(或面积、容积等)某事件发生数,e为自然对数的底。式中X为阳性数,π为总体阳性率,n为样本例数,!为阶乘符号。B.最多有k例阳性的概率,记为P(X≤k)kP(X≤k)=P(X)X=0,1,2,⋯,n0C.最少有k例阳性的概率,记为P(X≥k)nP(X≥k)=P(X)X=0,1,2,⋯,nkX(39)Poisson分布样本均数与总体均数比较u。式中X为样本阳性数,λ为总体均数。注意:样本的观察单位数应等于总体的观察单位数,否则,应根据二者观察单位数之比相应调整λ。'.\n.X1X2n1n2(40)Poisson分布两个样本均数比较u。式中∑X1为第一个样本阳X1X222n1n2性数之和,n1为第一个样本的观察单位数之和,∑X2为第二个样本阳性数之和,n2为第二个样本的观察单位数之和。(XiX)(YiY)lXY(41)Pearson相关系数计算公式:r22ll(XiX)(YiY)XXYY2(42)Pearson列联系数计算公式:P式中n为样本含量。2n2(43)关联系数:r式中n为样本含量。n(44)'.
查看更多

相关文章

您可能关注的文档