常用统计学方法
基本统计方法bystranger2012\n目录基•计数资料与计量资料•参数估计•假设检验的概念与步骤本•计量资料的统计描述•假设检验的两类错误统计描述•计数资料的统计描述统计推断统•双侧检验与单侧检验•常见概率分布•双尾检验与单尾检验计方•单样本均数的t检验•正态性检验两样本均法数比较•配对样本均数的t检验•两样本的方差齐性检验•两独立样本均数的t检验•两总体方差不等时的t`检验•方差分析的基本思想与步骤•多个样本的方差齐性检验(Bartlett检验多个样本均和Levene检验)数比较•不同设计资料的方差分析•常用的数据变换方法•多个样本均数间的多重比较•其他相关实验设计和统计方法\n1-1计数资料与计量资料统统计描述是指用统计指标和适当的统计图表来描述资料的分布规律及其数计量特征。医学统计资料按照性质一般分为计数资料与计量资料。描计数资料(Enumerationdata)计量资料(Numerationdata)述又称为定性资料或无序分类变量资料,又称定量资料或数值变量资料,为观是将观察单位按照某种属性或类别分测每个观察单位某项指标的大小而获组计数,分别汇总各组观察单位数后得的资料。表现为数值的大小,一般而得到的资料。有度量衡单位。如要对小鼠的基因型进行分析,先按如对小鼠的体重(g)进行测量后得照小鼠的基因型分为Np65+/+,Np65+/-,出的数据。如果对测出的体重按照不Np65-/-三组,再统计每种基因型小鼠同指标分为偏瘦、正常、肥胖等三组,的个数。如此便可得到相应的计数资再算出各组老鼠的个数。此时,计量料。资料便完成了向计数资料的转换。常用的统计方法包括卡方(χ2)检验等。常用的统计方法包括t检验等。\n1-2计量资料的统计描述Ⅰ-频数分布(Frequencydistribution)统连续变量(Continuousvariable)离散变量(Discretevariable)在一定区间内可以任意取值的变量。数值只能为自然数或整数。计频数分布为n个变量值在各个变量频数分布为n个变量值在各描值区间内的变量值个数的分配。(或各几个)变量值处的变述量值个数的分配。表1104只小鼠的体重(g)2534192226242431272725233624213429223021242526242622242533303023252415232521262626192927252831252720222619252223241933242728262829283124182525273228292426252022292830302328212730282633282331323032302216203027\n1-2计量资料的统计描述频数分布表与频数分布图统1求极差:极差即为最大值和最小值之差,记作R。计描2确定组段数与组距:组段数通常为10~15组。组距通过极差除以组段获得。述3根据组距写出组段:每组段下限为L,上限为U,变量X值归组为L≤U
?,假设检验结论接受H,验统计量不相等,?≤?,假0拒绝H,推断出两样本的总体设检验结论拒绝H,接受H,101推断出两样本均数存在差别。均数没有差别。犯此型错误的概率记为?。在犯此型错误的概率?,是在研假设检验中无设定值,因此在究设计师根据不同研究目的预下结论时,一般会说“尚不能先规定允许犯Ⅰ型错误概率的认为两总体均数不相同”。最大值。\n2-4双侧检验与单侧检验统双侧检验(Two-sidedtest)是只单侧检验(One-sidedtest)只关心计检验差别而不分差别方向的双向检验。差别单侧方向的单向检验。推断单侧检验通常是在试验设计时具有充分专业理由认为当前样本代表的总体均数(?1)必定大于(或小于)已知总体均数(?2)才会使用。设定备择假设时,单侧检验比双侧检验的专业要求更为严格。\n2-5双尾检验与单尾检验统检验水准?取自特定分布曲线下面积时,会出现双尾检验和单尾检验。计推双尾检验(Double-tailtest)检验单尾检验(One-tailtest)的检验水时,检验水准为曲线下双侧尾部面积之准为曲线下单侧尾部面积,且只有一个断和,具有两个检验界值。检验界值。检验统计量在某些情况时,如多均•单尾检验或是双尾检验主要针对检验数比较的方差分析等,呈不对称分布,统计量而言左右两侧界值不同。此时虽为单尾检验,由于界值表中的?是右侧尾部面积,对•单侧检验或是双侧检验则针对备择假应一个检验戒指,但对於多个均数差别设而言的假设检验来说?仍是双侧检验的检验水准,对应备择假设也为双侧检验的H。1\n3-1单样本均数的?检验两单样本均数的?检验(Onesample/groupt-test)适用于样本均数?与已知总体均数?0的比较。样本均目的是检验样本均数?所代表的未知总体均数?是否与总体均数?0有差别。数比较应用条件是资料服从正态分布。的假设检验统计量计算公式为:检验?−??−?0?==,?=?−1??/??当样本含量较大时,可以近似地采用?检验\n3-1SPSS实现过程统计描述One-SampleStatisticsStd.Std.ErrorNMeanDeviationMean血红蛋白20104.400019.481164.35612One-SampleTestTestValue=140.495%ConfidenceMeanIntervalofthetdfSig.(2-tailed)DifferenceDifferenceLowerUpper血红蛋白-8.26419.000-36.00000-45.1175-26.8825\n3-2配对样本均数的?检验配对设计的概念与步骤两样配对设计(Paireddesign):根据试验中各组间均衡性的要求,首先将实验对象按研究对象的某些特征或条件组成相同或相近原则配对,再将每对中的两个研究对象随机分配到实验本组和对照组(或两个不同的处理组),给予不同处理,一个实验由若干对子组成,这种试均验设计称为配对设计。数配对设计有两种情况:同源配对(即同一受试对象分别接受两种不同处理。)和异源配对。比较的配对条件是指上述的实验对象配对的条件或特征。动物试验中,常将品系、窝别、性别相假同或年龄、体重相近等配对;临床试验可将年龄、职业相近或病情相近或相同的病人配对。设检设计步骤包括:(1)确定研究因素和水平。配对设计只能考察一个因素且该因素只能为两个水平。验(2)确定研究对象和配对条件,并进行配对。配对原则为“对内一致,对间可不一致”。(3)随机化分组。将每对中的两个对象随机分配到实验组与对照组中。(4)对研究对象按试验要求进行实验。(5)数据统计分析。\n3-2配对样本均数的?检验两配对样本均数的?检验(Paired/matchedt-test),又称配对?检验。适用于配对设计的计量资样料两相样本均数的比较。本均目的是检验两相关样本均数所代表的未知总体均数是否有差别。数比较应用条件是差值?服从正态分布。的假设计算检验统计量前需求出各对数据的差值?,将其作为变量值计算均数。若两处理因素效检应无差别,则差值?的总体均数??应为0。检验统计量计算公式为:验?−???−0??===,?=?−1??/??/????\n3-2SPSS实现过程统计描述PairedSamplesTestPairedDifferences95%ConfidenceIntervalofthetdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMeanDifferenceLowerUpperPair1A-B.272400.108681.034368.194654.3501467.9269.000\n3-2实例(Two-tailedpairedttest)统计描述Figure5.J.Neurosci.,May13,2015•35(19):7600–7615\n3-3两独立样本均数的?检验完全随机设计两样完全随机设计(Completelyrandomdesign),又称单因素设计或成组设计。设计时在一个本实验中安排一个研究因素,可以是两水平也可以是多水平,将同质的受试对象随机分配到均各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。各组的样本含量可相等也可不相等。数比较的设计步骤如下:假(1)确定研究因素和水平。根据研究目的确定研究的因素以及水平数。设(2)确定研究对象和实验效应指标。研究对象要有较好的同质性。实验效应指标应具有检客观性、有效性和准确性。(3)随机化分组。应用随机数字表或软件产生随机数等方法将选取的研究对象分配到各验处理组中。随机数的编号可对其进行从小到大编秩,之后按照秩次分别归组。(4)将各组实验对象进行试验。(5)数据统计分析。\n3-3两独立样本均数的?检验两两独立样本均数的?检验又称成组?检验(Two-sample/groupt-testforindependentsamples)样适用于完全随机设计两独立样本均数的比较。本均目的是检验两独立样本均数所代表的未知总体均数是否有差别。数比较应用条件是两组数据均服从正态分布,且两样本对应的两总体方差相等。的假当两总体方差相等,即?2=?2时,两样本?检验的检验统计量在?=?=?−?=0条设12012件下,计算公式如下:检(?1−?2)−(?1−?2)?1−?2?==,?=?1+?2−1验??1−?2??1−?211(?−1)?2+(?−1)?2?=?2(+),?2=1122?1−?2?????+?−21212\n3-3SPSS实现过程统计描述IndependentSamplesTestLevene'sTestfort-testforEqualityofMeansEqualityofVariances95%ConfidenceStd.ErrorIntervaloftheFSig.tdfSig.(2-tailed)MeanDifferenceDifferenceDifferenceLowerUpperEqualvariances.440.514-1.80723.084-1.15032.63675-2.46755.16690assumedxEqualvariances-1.76719.472.093-1.15032.65111-2.51088.21023notassumed\n3-3实例(Unpairedt-test)统计描述Figure7ImpairmentoffearmemoryconsolidationbyMnRphotostimulationNATURENEUROSCIENCEVOLUME18|NUMBER5|MAY2015\n3-3实例(Two-tailedStudent’sttest)统计描述Figure4.Applicationof30?MLSP4-2022decreasesGABAergicinterneuron-specificopticallyinducedIPSCs.PairedoIPSCsweredeliveredbystimulatingusing473nmbluelight.J.Neurosci.,May13,2015•35(19):7600–7615\n3-3实例(Two-tailedStudent’sttest)统计描述Figure5.NATURENEUROSCIENCEVOLUME18|NUMBER5|MAY2015\n3-4正态性检验-图示法两正态性(Normality)即样品取自正态分布总体。某些医学指标如身高、体重、血压等已样知服从正态分布,不必作正态性检验;正态性检验多用于采用正态分布法制定参考值范围。正态性检验(Normalitytest)的方法有图示法和计算法等两种。本均图示法是一种较为简单的方法。通过图示中的散点分布情况,若基本成直线则可粗略估计数观察资料是否服从正态分布。通常有以下两种表示方法。比较(1)频率-频率图(Proportion-proportion(2)分位数-分位数(Quantile-quantile的plot,P-Pplot),以实际观察值的累计频率plot,Q-Qplot),以实际观察值的分位数假(?)对被检验分布的理论或期望累计频率(?)(?)对被检验分布的理论或期望分位数(?)作图。作图。设检验\n3-4SPSS实现过程统计描述\n3-4正态性检验–计算法两样计算法是一通过计算反映正态分布特征的指标来了解观察资料是否服从正态分布。正态分布具有对称和正态峰等两个主要特征。本均数分布不对称即为偏态。右偏态或正偏峰态有正峰态和负峰态之分,分别较比态的峰偏左,长尾向右侧;左偏态或正态峰尖峭或平阔。见图(b)负偏态则相反。见图(a)较的假设检验\n3-4正态性检验–矩法两样(1)矩法(Methodofmoment);对偏度(Skewness)和峰度(Kurtosis)各用一个指标评定。本均偏度指分布不对称的程度和方向,峰度指分布与正态分布曲线相比的尖用偏度系数(Coefficientofskewness)来峭或平阔程度,用相应的(Coefficientof数衡量。样本偏度用?1表示,总体偏度系kurtosis)衡量,样本峰度系数用?2表示,比数用?1表示。总体峰度系数用?2表示。较的假?1、?2及其标准误??1、??2计算后,可使用?检验对其进行检验推论分布的正态性。计算公设式为:?1?2检??1=???2=??1?2验当同时满足对称和正态峰两个条件时,才认为该资料服从正态分布\n3-4正态性检验–?检验与?检验两(2)仅使用一个指标来综合评定,常用S.S.Shaprio与M.B.Wilk提出的?检验法(Shaprio-Wilk样检验)和Ralaph.B.D.Agostino提出的?检验法(D`Agostino检验)。?检验法使用条件为3≤?≤本50;?检验法使用条件为50≤1000。均?检验法的一般步骤:?检验法的步骤:数(1)检验水准为?=0.10。假设检验为(1)检验水准为?=0.10。假设检验为比?0:总体服从正态分布?0:总体服从正态分布较?1:总体服从正态分布?1:总体服从正态分布(2)检验统计量?的计算公式为:(2)检验统计量?的计算公式为:的假?/2?(?∗−?∗)2??+1∗?=1??+1−???=1(?−2)??设?=?2?=?=1(??−?)检?3/2(??−?)2∗验其中??为将?个观测值??重新按照升序排列后的第?个观察值;??为系数,可通过?其中?∗为按照升序排列后的第?个数据。?检验专用系数??表查得。(3)查阅临界值表(?界值表)确定?值,得出结论。\n3-4SPSS实现过程统计描述TestsofNormalityaKolmogorov-SmirnovShapiro-Wilk组别StatisticdfSig.StatisticdfSig.*血红蛋白含注射组.08220.200.97520.863量(g/L)口服组.10220.200*.96020.550*.Thisisalowerboundofthetruesignificance.a.LillieforsSignificanceCorrection\n3-5两样本方差齐性检验两两样本方差齐性检验的常用方法是?检验。其检验统计量的公式为:样?2(较大)本1?=2,?1=?1−1,?2=?2−1均?2(较小)数求出?值后,可根据?界值表得到?值,然后根据所选取得?水准给出推断结论。?界值表比?界值表中给出不对称的?分布的右侧界值,实际上对应的是双侧概率?。较的假表4方差齐性检验方法的比较设检验方法应用检验?检验资料服从正态分布;只用于两样本方差齐性检验Bartlett检验资料服从正态分布;可用于两样本或多样本方差齐性检验。Levene检验不依赖总体分布形式;可用于两样本或多样本方差齐性检验。\n3-5SPSS实现过程统计描述TestofHomogeneityofVarianceLevenedf1df2Sig.StatisticBasedonMean.138138.712BasedonMedian.139138.711血红蛋白含量(g/L)BasedonMedianandwith37.33.1391.711adjusteddf5Basedontrimmedmean.139138.711\n3-6两总体方差不等时的t`检验两两总体方差不等时,可采取以下不同方法:样本•数据转换:将原始数据经过对数变换、平方根变换、平方根反正弦变换等方法使得数据满均足方差齐性和正态分布要求,再进行假设检验。•t`检验:有时函数转换值仍不能满足方差齐性和正态分布要求,可选用t`检验。数•使用基于秩次的非参数检验方法。比较t`检验也称近似?检验(Separatevarianceestimationt-test)。?`统计量的公式为:的假?1−?2设?`=?2?2检1+2?1?2验通常使用的方法包括对临界值校正的Cochran&Cox法;对自由度进行校正的Satterth-waite法和Welch法。其中Satterth-waite法为统计学软件中较为常用的方法。\n4-1方差分析的概念多个方差分析(Analysisofvariance,ANOVA)的基本思想是分析变异,或称分解变异,即将数据样总的变异分解为处理因素引起的变异和随机误差引起的变异,再通过对两者进行比较做出处理因素是否起作用的统计推断。方差分析多用于处理三个及其以上处理组的分析比较。以下为方本差分析中的常见概念。均数表5?个处理组的研究结果比较处理组结果数据统计量的1水平??...?...??11121?1?11?1假......2水平?21?22?2??1?2?2?2设...........................检......验g水平??1??2????1?????????????????各处理组的均数为??=?=1??,总均数为?=?=1?=1?\n4-1方差分析的基本思想多方差分析的思想可进一步归纳为:根据研究设计的类型,将全部测量值的总的离均差平方个和与其自由度分解为两个或多个部分,每部分的变异都有某个因素(或几个因素相互)作用引起。样通过比较不同变异来源的均方,借助?分布做出统计推断,从而推论各种处理因素对研究结果本是否有影响。均数表6完全随机设计资料的方差分析表比变异来源???????较?????的2处理处理处理间?−1??(??−?)???假?=1处理误差设??误差检误差?−???总−??处理?误差验??(?−?)2??总变异?−1?=1?=1\n4-1方差分析的步骤多1变异的分解:根据不同性质可分为以下三种变异:个(1)总变异(Totalvariation)是指?个组中?个数据大小不等产生的变异,用??样总表示。其大小为所有观察值???与均数?(Overallmean)的离均差平方和,本??均??=(?−?)2总??数?=1?=1比(2)组间变异(Variationbetweengroups)指各组的样本均数间的差异,用??表示。其大小为各组均数与总均数的离均差平方和,较组间?的2??组间=??(??−?)假?=1设反映了处理作用的大小,也包括随机误差成分,如个体变异和测量误差。检(3)组内变异(Variationwithingroups)是由每组内数据大小不等造成,主要产生原因是随机误差的存在,用??表示。计算方式为个组内所有数据与改组均数验组内的离均差平方和:????=??−??=(?−?)2组内总组间????=1?=1\n4-1方差分析的步骤多2自由度的分解:上述三种变异的自由度同样存在可加性,即:个?=?−1=?+?=(?−1)+(?−?)样总组间组内本均3估计方差:均方差,简称均方(Meansquare,MS)是各部分离均差平方和与对应自由数度的比值。均方反应了平均变异的大小,用于相互比较。组内均方由个体变异和测量误差引起,为随机误差;组间方差反映了处理的效应。比较4?统计量的计算:组间均方与组内均方的比值即为?统计量。?值接近于1时,组间变的异由于随机误差引起;?值大于1时,处理因素有影响,且其越大,则各组总体均假数相等的可能性越小。设检5?分布与?值的确定:服从自由度?1=?1−1,?2=?2−1的?分布记为??1−1,?2−1。验在检验水准(0.05)分布的?界值表??(?1,?2)的值可用于判断统计量?的大小。自由度?1=?组间,?2=?组内•当?≥??(?1,?2)时,?≤0.05,此时拒绝?0接受?1,即认为各样本来自不同总体。•当??(?1,?2)时,?>0.05,此时拒绝?1接受?0,还不能认为各样本均数不等。\n4-2完全随机设计资料的方差分析多完全随机设计多组间均数比较的方差分析又称单因素方差分析。按照一个处理个因素随机分组后统计分析处理因素各个水平组间均数差别。样本方差分析的应用条件:均(1)各样本组内观察值相互独立且服从正太分布;数(2)各样本组内观察值总体方差相等,即方差齐性(Homogeneityofvariance)。比较的方差分析的结果分析:假(1)方差分析结果拒绝?0接受?1时,不能得出各组总体均数两两之间存在差别。设如要确定两组间差别,需要进行多重比较;(2)当?=2时,方差分析结果理论上与?检验结果等价,即?2=?。检验\n4-2SPSS实现过程统计描述ANOVAldl_cSumofMeandfFSig.SquaresSquareBetween32.156310.71924.884.000GroupsWithinGroups49.967116.431Total82.123119\n4-2随机区组设计资料的方差分析多随机区组设计(Randomizedblockdesign)资料的方差分析是针对随机区组设计进行的。随个机区组设计的方法为:样区组设计:按照对试验结果有影响的非研究因素将受试对象分为若干区组(Block)本分组:将各区组的受试对象随机分配到处理水平不同的各个组中。均试验:进行试验得出试验结果,如下表:数比表7随机区组设计的实验结果较处理因素(?个水平)的区组编号12...?...?假1?11?12...?1?...?1?设检2?21?22...?2?...?1?.....................验???????.....................??n1??2...???...???\n4-2随机区组设计资料的方差分析表多表7随机区组设计资料的方差分析表个变异来源???????样?????本?(?−?)2处理处理处理间?−1????均?=1处理误差数?2??区组??区组比区组间?−1?(??−?)???较?=1区组误差??的(?−1)(?−1)??−??−??误差误差总处理区组?假误差设??(?−?)2检??总变异?−1验?=1?=1随机区组设计的优点是:从组内变异中分离出区组变异,从而使得误差变异减小,因此容易发现处理组间的差别并提高统计效率。\n4-3多个样本均数间的多重比较多均数多重比较的方法包括多重比较(Multiplecomparisons)、线性对比(Linearconstrasts)、个正交对比(Orthogonalconstrasts)等。多重比较的方法结果具有一致性,但并不等价,结果会样表现出些许差别,应根据需要选取合适结果。常用的多重比较方法有:本均研究设计中未考虑多重比较,但方差分析结论有统计学意义后决定的对对多个均数进行两两数事后比较(Posthoccomparisons/unplannedcomparisons),通常采用SNK-q检验法(Students-比Newman-Keuls)。较的Dunnett-t检验是一种根据研究目的或专业知识,已经计划好各均数间进行两两比较(Planned假contrast/comparisons)的多重比较方法。设检从研究目的或专业知识层面考虑,在设计阶段决定不做全面多重比较时可以采用LSD-t检验验(Fisher`sleastsignificanttest)。进行多个样本率比较时,在得出多个率间差异有统计学意义后,需要进一步获取两个率之间的两两比较,可采用Bonferroni法。\n4-3多重比较的SNK-q检验法多SNK法是多重极差检验(Multiplerangetest),又称为q检验,其假设检验统计量q的计算个公式为:样本??−????−???==,?=?均?误差??−????11误差数(+)2????比较的检验步骤:假(1)建立假设检验、确定检验水准设(2)计算检验统计量。包括差值标准误的计算,样本均数按从小到大编秩次,根据秩次计算检三次两两对比的q统计量等。验(3)确定概率值,并得出结论。\n4-3多重比较的Dunnett-t检验多Dunnett-t检验适用于多个实验组均数逐一与对照组进行比较。其假设检验统计量t的计算个公式为:样本??−????−???==,?=?均??11误差?−????(+)数误差????比较检验步骤:的(1)建立假设检验、确定检验水准假?0:??=??(处理组与对照组的总体均数相等)?1:??≠??(处理组与对照组的总体均数不等)设检(2)计算检验统计量。验(3)确定概率值,并得出结论。\n4-3多重比较的LSD-t检验多LSD-t检验又称最小有意义差异(Leastsignificantdifference)t检验,多用于组中某一对或个几对在专业上有特殊意义的均数进行比较。一般在设计阶段便要确定哪些均数进行多重比较。样其假设检验统计量q的计算公式为:本均??−????−???==,?=?数??11误差?−????(+)比误差????较的检验步骤:假(1)建立假设检验、确定检验水准设(2)计算检验统计量LSD-t值。检验(3)确定概率值,并得出结论。\n4-3实例统计描述Figure5&3ANOVAwascarriedoutinallstudies.AnyoverallstatisticaldifferenceswereanalyzedfurtherusingFisher’sposthoctests.THEJOURNALOFPHARMACOLOGYANDEXPERIMENTALTHERAPEUTICSVol.295No.3\n4-3Bonferroni法多检验步骤:(1)对需要进行比较的行×列表资料进行?2分割,变为多个四格表;个(2)对每个四格表进行?2检验;样′?′?(3)采用?=(多组间进行任意两组的两两比较)或?=(实验组与同一个对照组比?(?−1)?−1本2较)计算调整的水准;均(4)以调整后?′的作为检验水准,得出有无统计学意义的结论。数比?2检验(Chi-squaretest)主要用于检验两个或两个以上率(或构成比)是否有差异,或两变较量之间是否有关联。当每一格子期望频数?≥?,总例数?≥??,采用Pearson?2检验,其检验的步骤包括:假(1)建立假设检验,确定检验水准(2)计算期望频数(Theoreticalexpectedfrequency)和检验统计量,公式为:设2(?−?)检?2=?验(3)确定?值,得出结论。当任一格子期望数小于1或总例数小于40时,或检验的?值接近于检验水平,采用Fisher确切概率检验。\n4-3SPSS实现过程统计描述\n4-3SPSS输出结果统计ANOVAMultipleComparisonsldl_cDependentVariable:ldl_c描SumofMeanSquaresdfSquareFSig.MeanDifference95%ConfidenceInterval(I)groupStd.ErrorSig.Between32.156310.71924.884.000(I-J)GroupsLowerBoundUpperBound*述Within49.967116.4312.4g.71500.16946.000.37941.0506Groupsplacebo4.8g.73233*.16946.000.39671.0680Total82.1231197.2g1.46400*.16946.0001.12841.7996*placebo-.71500.16946.000-1.0506-.37942.4g4.8g.01733.16946.919-.3183.3530*7.2g.74900.16946.000.41341.0846LSD*placebo-.73233.16946.000-1.0680-.3967ldl_c4.8g2.4g-.01733.16946.919-.3530.3183*7.2g.73167.16946.000.39601.0673Subsetforalpha=0.05groupNplacebo-1.46400*.16946.000-1.7996-1.1284123*7.2g2.4g-.74900.16946.000-1.0846-.41347.2g301.9663*Student-4.8g302.69804.8g-.73167.16946.000-1.0673-.3960*Newman-2.4g302.7153placebo7.2g1.46400.16946.0001.06071.8673aDunnettt(2-*Keulsplacebo303.4303b2.4g7.2g.74900.16946.000.34571.1523sided)*Sig.1.000.9191.0004.8g7.2g.73167.16946.000.32831.1350Meansforgroupsinhomogeneoussubsetsaredisplayed.*.Themeandifferenceissignificantatthe0.05level.a.UsesHarmonicMeanSampleSize=30.000.b.Dunnettt-teststreatonegroupasacontrol,andcompareallothergroupsagainstit.\n4-3实例(One-wayANOVAwithBonferonni’spost-test)统计描述Figure8.Threedifferenthigh-frequencystimulationparadigmswereusedtoinducevaryinglevelsofLTP.Onetrainof100HzstimulationinducedasubmaximallevelofLTP,whereas2or3trainsof100HzstimulationbothinducedsaturatedLTP.J.Neurosci.,May13,2015•35(19):7600–7615\n4-3实例(Two-wayANOVAwithBonferonni’spost-test)统计描述Figure6.J.Neurosci.,May13,2015•35(19):7600–7615\n4-4Bartlett检验与Levene检验2多从?各正态总体中,分别独立随机抽取?个样本,各样本均数为??,样本方差为??(?=1,2,…,?)。个Bartlett检验的步骤如下:样(1)检验水准取?=0.10,假设检验为:本?:?2=?2=···=?2011?均?1:各总体方差不全相等数(2)Bartlett法建立的统计量为:?2比?(?−1)−1ln??=1??2需要时可对χ2进行校正,即较χ2=?,?=?−1χ21?11?−1−1χ2?=,?=1+(−?)的?=1(??−1)−(?−?)?3?−1?=1??−1?=1(??−1)1+3(?−1)假合并方差?2(设计为完全随机设计时等于??)计算方式为:?组内设??检?2=?−1?2/?−1????验?=1?=1(3)根据χ2统计量查得?值。获得值较小,拒绝?;反之,认为方差齐性。0与Bartlett检验法比较,Levene检验法分析的资料可不具有正态性,适用于任意分布(Distribution-free)的两组或多组资料。\n4-5常用的数据变换方法多数据转换(Datatransformations)可改善资料的正态性和方差齐性。常用的数据变换法如下:个样平方根反正弦变换(Arcsinesquareroottransformation),也称为角度变换(Angular本transformation)。适用于观察值服从二项分布的比例资料。如原观察值为?,变换后的新值均为?`,变换公式为:数?`=sin−1?比较平方根变换(Squareroottransformation)。适用于观察值服从泊松分布的比例资料。此类资的料方差等于平均值,平均值变大使得方差变大,可采用此变换使靠近平均值的个体变异相假对变小。变换公式为:设?`=?检验对数变换(Logarithmtransformation)。适用于一些服从对数正态分布的资料。变换公式为:?`=???或?`=log10(?+?)(a为任意常数)\n4-5SPSS实现过程统计描述\n4-6多因素实验设计多单因素与多因素是指”处理”的多少。处理因素不止一个时,称为多因素实验。个样析因设计(Factorialdesign)是一种多因正交设计(Factorialdesign)是利用已经本素交叉分组设计方法。适用于试验中需设计好的正交表对对因素进行设计。根均要安排多个因素,且因素是相互联系相据各因素关系,选择必不可少的各因素数互制约,即存在交互作用(Interaction)。各水平搭配进行实验。采用一部分因素比此时析因分析不仅可以作每因素各水平水平搭配进行试验,忽略高阶交互作用间比较,也可以进行交互作用分析。其考察与分析,在不降低实验效率的情况较因素数下达到试验目的。的处理组数=水平数。假设优点:可分析各因素的主效应及其相互优点:可考察多个因素及因素间的交互间的交互作用,比较各因素作用大小。作用。检适用于水平和因素不太多的情况。验缺点:不能考察因素间的高阶交互作用。即分析结果提供的为各因素不同对平对缺点:因素过多和水平划分较细时,会试验结果的影响是否显著及各因素间的使操作过程和解释时较为复杂。交互作用是否存在(一级交互作用)。\n4-6重复测量设计资料多重复测量设计(Repeatedmeasurementdesign)是指给予一种或多种处理后,在多个时间点个上从同一受试对象重复获得指标的观察值。目的是探究同一研究对象在不同时点上的某指标变样化。本均前后测量设计(Premeasure-postmeasuredesign)是重复测量数据比较简单的情况。与配对设数计相比前后测量设计不能同期观察试验结果,本质上比较的是前后差别。此外前后测量设计比除分析平均差值外,还可进行相关回归分析。较的设计对照的前后测量数据是在前后测量的基础上分为了试验组和对照组进行前后测量试验。假设检验重复测量设计或重复测量数据是指前后测量数据的重复测量次数在三次及其以上的设计。可与随机区组设计相似的计算出方差分析表。但其区组内各时间点固定不能随机分配,区组内的实验单位彼此也并不独立。\n4-6重复测量资料的??????????2检验多HotellingT2检验是多变量资料组间差别比较的一种方法。单组、两组和多组比较的个HotellingT2统计量都可转换为检验统计量F,进行结果分析。使用此法分析重复测量资料时是样将每个观察对象的?次重复结果看作一个向量进行检验。本HotellingT2统计量的计算公式为:均数?2=?1?2?−???−1(?−?)12?12比?1+?2较其中协方差矩阵??的计算公式为:的假1??=?1−1?1+?2−1?2设?1+?2−2检在?0:?1=?2成立条件下,?与?2关系为:验(?1+?2−?−1)2?=?(?1+?2−2)?其中?1=?,?2=?1+?2−?−1\n4-6重复测量设计资料的方差分析多表8重复测量实验数据的方差分析表个方差来源????????样12本处理?−1??1=????−???1?1=??1/??4均12数测量时间?−1??2=????−???2?2=??2/??5比1较处理×测量时(?−1)(?−1)??=?2−?−??−??3??12??3?3=??3/??5的间?假1观察对象间?2−?−???(?−1)??4=?1??4设误差?检观察对象内验?(?−1)(?−1)??5=???−??1−??2−??3−??4??5误差??=?2−??合计???−1?(?)2?=??\n4-6两因素两水平(或)多水平分析多个重复测量数据的两因素两水平分析。某试验干预因素为A因素,共实验组和对照组两个水平,分别记为1水平和2水平;前后两次测量时间作为B因素,分为前后两水平,即1水平和2水样平。其方差分析步骤概括为:本(1)离均差平方和的分解,将数据资料使用合计表列出后分别计算出表8对应的各值;均(2)将计算结果带入方差分析表;数(3)分析结论,说明测量时间与处理是否存在交互作用等最终结果。比较的重复测量数据的两因素多水平中的两因素指只有干预和测量时间,多水平值干预因素和测量时间都具有两个及其以上的水平。假设检验注意事项:•各处理组例数不等时,不能使用重复测量数据的方差分析•重复测量数据方差分析需要满足“球对称”检验•不考虑单组重复测量数据是否满足“球对称”检验时,可采用??????????2检验。\n4-6“球对称”检验及其校正多个重复测量数据使用随机区组方差分析比较组间差异的前提条件是满足“球对样称”(Sphericity)假设,即重复测量误差的协方差矩阵经正交对比变换后,与单位矩阵?4×4成正比。本均数检验结果?≥0.05,接受“球对称”假设;?<0.05,拒绝“球对称”假设,则继续使比用方差分析并不妥当,至少处理组内效应?界值需要校正。较的假校正方法是使用“球对称”系数?乘以处理组内效应?界值的自由度,即设检?1=?1?,?2=?2?验“球对称”系数?常用的估计方法有Greenhouse-Geisser、Huynh-Feldt和Lower-bound等方法。经过校正后,使用??,(?1,?2)作为检验界值。此外样本含量较小时,也应进行校正。\n4-5SPSS实现过程统计描述\n4-6秩和检验多非参数统计是指对总体的分布不作假设或仅作非常一般性假设条件下的统计推断方法。个非参数统计方法不依赖于总体分布类型。当样本所代表总体分布不易确定、分布呈非正态或样方差不齐且无适当数据转换法以及观察指标不能或未精确测量,均可使用非参数统计方法。本秩和检验(Ranksumtest)便属于非参数统计学(Nonparametricstatistics)的范畴,主要包括以均下几种:数比配对设计资料的Wilcoxon符号秩和检验单样本资料的Wilcoxon符号秩和检验较的假设完全随机设计两独立样本的Wilcoxon秩完全随机设计多个样本的Kruskal-Wallis和检验秩和检验(两两比较使用Nemenyitest)检验随机化区组设计资料的Friedman秩和检验(两两比较使用q检验)\n4-6Wilcoxon秩和检验Wilcoxon符号秩和检验(Wilcoxonsignedranktest),又称Wilcoxon配对法(Wilcoxon多matchedpairstest),适用于样本资料不满足正态分布等情况。个样配对设计资料的Wilcoxon符号秩和检验本研究目的是推断配对资料的差值是否来自中位数为零的总体。均基本思想是假定两种处理效应相同,则差值的总体分布式对称的,总体中位数为0。作出结数论时当5≤50,可查?界值表;当?>50时,应使用近似服从正态分布法。比较单样本资料的Wilcoxon符号秩和检验的目的是推断某随机样本所代表的总体位置是否与已知总体位置相等。假原理与配对设计资料相似,不同的是差值是各观察值与已知总体中位数之差(?=??−?0)设检完全随机化设计两独立样本的秩和检验(Wilcoxonranktestfortwoindependentsamples)验适用于t检验时条件不满足或R为等级资料儿比较两个处理组间的等级是否不同。研究目的是推断两样本分别代表的总体分布是否不同。为比较两样本中位数分别所代表的总体中位数是否不等,假设检验为?0:?1=?2\n4-6SPSS实现过程统计描述RanksNMeanRankSumofRanksastrandard-NegativeRanks22.254.50血红蛋白bPositiveRanks1811.42205.50cTies0Total20a.strandard<血红蛋白b.strandard>血红蛋白aTestStatisticsc.strandard=血红蛋白bZ-3.757Asymp..000Sig.(2-tailed)a.WilcoxonSignedRanksTestb.Basedonnegativeranks.\n4-6SPSS实现过程统计描述\n4-6实例(Wilcoxonpairedsigned-ranktest)统计描述Figure8.Neuron86,768–782,May6,2015\n4-6Kruskal-Wallis秩和检验多完全随机设计多个独立样本的秩和检验通常使用K-W检验(Kruskal-Wallistestfor个independentsamples),也称为H检验。其目的是推断多个样本中位数分别所代表的总体中位数样是否不等。通常检验步骤为:本均(1)建立假设检验,选取检验水准;数(2)编秩:各组数据混合后,由小到大排序并编秩,相等数值取平均秩次;比较(3)求秩和,分别将各组秩次相加等到秩和?1,?2,…,??。的假(4)计算统计量,公式为2设12???=−3?+1,?=?−1检?(?+1)??(5)确定?值,得出结论。k=3,?≤5时查?界值表;k>3,或?>5,使用近似?2分布法验??秩和检验推断多个总体得出总体分布不同或不全相同时,可使用Bonferroni法进行组间的多重比较。\n4-6SPSS实现过程统计描述\n4-6Friedman秩和检验多随机化区组设计资料的秩和检验采用的是Friedman秩和检验(Friedman`stest)。若观察的指个标为计数资料,采用Cochran检验。Friedman秩和检验又称?检验,目的是推断各处理组样本代样表的总体分布是否不同。本均数数据特点:连续型变量,各处理组数据不满足方差分析的条件,或变换后仍不能满足条件。比较的主要步骤:注意事项:假•先将各区组由大到小编秩•编秩时相同的数据取平均秩次设•计算统计检验量:?=(?−?)2•相同秩次较多时,使用校正公式?检•确定?值。?≤15,?≤15时查?界值表;验否则,使用近似?2分布法•有统计学意义可进行各处理组间的多重比较。\n4-6SPSS实现过程统计描述\n4-6其他统计软件-OriginPro9.0统计描述\n4-6其他统计软件-Excel统计描述描述统计t-检验:成对双样本均值分析列1列2变量1变量2平均平均0.7952平均0.52280.79520.5228标准误差0.058300334方差标准误差0.058812470.0339892890.034589067中位数0.74中位数0.5075观测值1010众数#N/A众数#N/A标准差0.184361842泊松相关系数标准差0.1859813610.827796559方差0.033989289假设平均差方差0.0345890670峰度1.484402106df峰度5.4421193999偏度1.256066031偏度1.969338422tStat7.925975721区域0.609区域0.681最小值P(T<=t)0.591最小值单尾0.3161.19198E-05最大值t单尾临界1.2最大值0.9971.833112933求和P(T<=t)7.952求和双尾5.2282.38395E-05观测数10观测数10t双尾临界2.262157163\n参考资料(1)医学统计学第三版,孙振球,人民卫生出版社。(2)医学统计学,颜虹,人民卫生出版社。(3)Mesopontinemedianrapheregulateshippocampalrippleoscillationandmemoryconsolidation,Wangetal.,NatureNeuroscienceVolume18Number5May2015.(4)Activationofmetabotropicglutamatereceptor7isrequiredforinductionoflong-termpotentiationatSC-CA1synapsesintheHippocampus,Klaretal.,TheJournalofNeuroscienceMay132015·35(19):7600-7615.(5)Acorticothalamicswitch:controllingtheThalamuswithdynamicsynapses,Crandalletal.,Neuron86768-782May62015.(6)Slowlydividingneuralprogenitorsareanembryonicoriginofadultneuralstemcells,Furutachietal.,NatureNeuroscienceVolume18Number5May2015.(7)Antidepressant-likebehavioraleffectsmediatedby5-Hydroxytryptaminereceptors1,2CCryanetal.,TheJournalofPharmacologyandExperimentalTherapeuticsVol.295No.3:1120-1126.