医学统计学课后答案

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

医学统计学课后答案

第四章定量资料的统计描述1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用范围广,可适用于任何类型资料参数检验Ø优点:资料信息利用充分;检验效能较高Ø缺点:对资料的要求高;适用范围有限2.非参数检验Ø优点:适用范围广,可适用于任何类型的资料Ø缺点:检验效能低,易犯Ⅱ型错误凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。2.简述误差的概念。误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。3.举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。4.简述小概率事件原理。当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①4-85\n第四章定量资料的统计描述研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。2.简述调查设计的基本内容。①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。3.试比较常用的四种概率抽样方法的优缺点。(1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。(2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。(3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。(4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。4.常用的非概率抽样方法有哪些?有偶遇抽样、立意抽样、定额抽样、雪球抽样等。5.简述调查问题的顺序安排。调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题在前,难答题在后④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题⑤敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。二、最佳选择题1.实验性研究与观察性研究的根本区别在于A.抽样方法不同B.研究对象不同C.是否设立对照组D.假设检验方法不同E.是否人为施加干预措施2.以下抽样方法中不属于概率抽样的是A.单纯随机抽样B.系统抽样C.整群抽样D.分层抽样E.雪球抽样3.条件相同时,下列抽样方法中抽样误差最大的是A.单纯随机抽样B.系统抽样C.分层抽样D.整群抽样E.无法直接比较4.下列关于调查设计的叙述,正确的是4-85\n第四章定量资料的统计描述A.明确调查目的是调查研究最核心的问题B.采用抽样调查还是普查是由该地区的经济水平决定的C.调查设计出现缺陷时,可以通过相应的统计分析方法弥补D.一旦制定了调查研究计划,在实际操作过程中,就不可改变E.调查的质量控制主要在调查问卷设计阶段5.为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于A.单纯随机抽样B.分层抽样C.系统抽样D.整群抽样E.多阶段抽样6.某县有30万人口,其中农村人口占80%,现欲对农村妇女的计划生育措施情况进行调查,调查对象应为A.该县所有的已婚夫妻B.该县所有的农村妇女C.该县所有的育龄期妇女D.该县所有的已婚妇女E.该县所有已婚育龄期农村妇女7.欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为A.单纯随机抽样B.整群抽样C.分层抽样D.典型调查E.普查8.普查是一种全面调查的方法,与抽样调查相比,叙述正确的是A.确定普查观察单位非常简单B.普查适于发病频率较低疾病的调查C.普查不易获得反映平均水平的统计指标D.因涉及面广普查可产生较大的抽样误差E.普查更易统一调查技术,提高调查质量9.以下五个问题中,最符合调查问卷设计要求的是A.你一个月工资多少?B.你一个月吃多少克盐?C.你是否有婚外恋:①有②无D.你和你的妈妈认为女孩几岁结婚比较好?E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可1.E2.E3.D4.A5.B6.E7.D8.A9.E第三章实验研究设计【思考与练习】一、思考题1.实验设计根据对象的不同可分为哪几类?2.实验研究中,随机化的目的是什么?3.什么是配对设计?它有何优缺点?4.什么是交叉设计?它有何优缺点?5.临床试验中使用安慰剂的目的是什么?4-85\n第四章定量资料的统计描述二、案例辨析题“三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。三、最佳选择题1.实验设计的三个基本要素是A.处理因素、实验效应、实验场所B.处理因素、实验效应、受试对象C.受试对象、研究人员、处理因素D.受试对象、干扰因素、处理因素E.处理因素、实验效应、研究人员2.实验设计的三个基本原则是A.随机化、对照、重复B.随机化、对照、盲法C.随机化、重复、盲法D.均衡、对照、重复E.盲法、对照、重复3.实验组与对照组主要不同之处在于A.处理因素B.观察指标C.抽样误差D.观察时间E.纳入、排除受试对象的标准4.为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是A.空白对照B.安慰剂对照C.实验对照D.标准对照E.自身对照5.观察指标应具有4-85\n第四章定量资料的统计描述A.灵敏性、特异性、准确度、精密度、客观性B.灵敏性、变异性、准确度、精密度、客观性C.灵敏性、特异性、变异性、均衡性、稳定性D.特异性、准确度、稳定性、均衡性、客观性E.灵敏性、变异性、准确度、精密度、均衡性6.比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成A.选择性偏倚B.测量性偏倚C.混杂性偏倚D.信息偏倚E.失访性偏倚7.将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是A.随机区组设计B.完全随机设计C.析因设计D.配对设计E.交叉设计8.在某临床试验中,将180例患者随机分为两组,实验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用的控制偏倚的方法有A.单盲、多中心B.随机化、多中心C.随机化、单盲D.随机化、双盲双模拟E.双盲双模拟、多中心9.临床试验的统计分析应主要包括A.可比性分析、疗效评价、安全性评价B.可比性分析、优效性分析、劣效性分析C.可比性分析、安全性评价、可行性分析D.优效性分析、等效性分析、安全性评价E.疗效评价、安全性评价、可行性分析10.药品上市后应用阶段进行的临床试验属于A.I期临床试验4-85\n第四章定量资料的统计描述B.II期临床试验C.III期临床试验D.IV临床试验E.现场试验四、综合分析题1.欲将16只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组,剩下8只作为对照组。该分组方法是否正确?若不正确,请说明理由。2.某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?3.某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠血管紧张素的影响,并欲分析两药联合应用是否更为有效。(1)你认为该研究最好采用何种实验设计方案?并说明理由。(2)请帮该研究者实现32只大鼠的随机分组。【习题解析】一、思考题1.根据受试对象不同,实验可以分为动物实验、临床试验和现场试验三类。动物实验的受试对象为动物,也可以是器官、细胞或血清等生物材料;临床试验的受试对象通常为患者,持续时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是未患某种疾病的人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。2.实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。3.配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。用以配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、实验效率较高;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低效率。在临床试验中,配对的过程还可能延长实验时间。4.交叉设计是一种特殊的自身对照设计。其中2´2交叉设计首先是将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段结束后,两组交换处理措施进行第二阶段的实验,这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适于具有自愈倾向或病程较短的疾病研究。4-85\n第四章定量资料的统计描述交叉设计的优点有:①节约样本含量;②能够控制个体差异和时间对处理因素的影响;③在临床试验中同等地考虑了每个患者的利益。其缺点有:①处理时间不能太长;②当受试对象的状态发生根本变化时,后一阶段的处理将无法进行;③受试对象一旦在某一阶段退出试验,就会造成数据缺失。5.临床试验中使用安慰剂,目的在于消除由于受试对象和试验观察者的心理因素引起的偏倚,还可控制疾病自然进程的影响,显示试验药物的效应。二、案例辨析题该结论不正确。研究某治疗方案对某病患者的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有设立了对照才能较好地控制非处理因素对实验结果的影响,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入38例消化性溃疡患者,并未设立相应的对照组。而且这38例患者接受治疗的时间为2000年至2006年,时间跨度太大,可能对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。三、最佳选择题1.B2.A3A.4.A5.A6.C7.C8.D9.A10.D四、综合分析题1.解:该分组方法不正确。随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,因此破坏了随机化原则。2.解:先将6对小鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第18行最左端开始横向连续取12个两位数字。事先规定,每一对中,随机数较小者序号为1,对应于A组,随机数较大者序号为2,对应于B组。分配结果见表3-1。表3-1配对设计的12只小鼠随机分组的结果对子数123456动物编号1.11.22.12.23.13.24.14.25.15.26.16.2随机数129688173165196902836075序号122112121212组别ABBAABABABAB4-85\n第四章定量资料的统计描述SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量number和pair,再点击DataView标签,录入数据(见图3-1,图3-2)。图3-1VariableView窗口内定义要输入的变量number和pair图3-2DataView窗口内录入数据分析:Transform→RandomNumberGenerators…ActiveGeneratorInitializationSetStartingPointFixedValueValue:键入20071222设定随机种子为20071222OKTransform→Compute…TargetValuable:键入randomNumericExpression:RV.Uniform(0,1)产生范围在0~1之间的伪随机数4-85\n第四章定量资料的统计描述OKTransform→RankCases…Variables(s):randomBy:pair对每个对子中的两个伪随机数进行排序OK注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。File→New→Syntax,打开Syntax窗口,键入如下程序:inputprogram.开始数据录入程序段numerickbnnumberpair(F8.0)/random(F8.6).stringtreat(A1).computek=2.处理组为2computeb=6.对子数为6computen=b*k.loopnumber=1ton.computepair=rnd((number-1)/k+0.5).endcase.computek=lag(k).endloop.endfile.endinputprogram.结束数据录入程序段setseed20071222.设定随机种子为20071222computerandom=uniform(1).产生范围在0~1之间的伪随机数rankvariables=randombypair.对伪随机数排序formatsrrandom(F3.0).computetreat=substr("ABCDEFGHIJKLMN",rrandom,1).根据伪随机数的序号进行分组listnumberpairtreat.结果中显示受试对象编号及被分到的处理组在Syntax窗口中选择Run→All提交运行。注:程序中的b(即对子数)可根据实际情况赋予不同的值。随机区组设计受试对象的分配也可以用此程序来实现,仅需将k值设为处理组数,b值设为相应的区组数。结果及解释4-85\n第四章定量资料的统计描述DataView窗口图3-3SPSS编程实现受试对象随机分配结果Output窗口Listnumberpairtreat11A21B32A42B53B63A74A84B95B105A116B126A编程实现随机分配的结果见dataview窗口(图3-3)或output窗口。可以看出12只小鼠被随机分配到A组和B组。在用此程序进行随机分组前,规定A组表示实验组,B组表示对照组。则1,3,6,7,10,12号小鼠被分到实验组,2,4,5,8,9,11号小鼠被分到对照组。4-85\n第四章定量资料的统计描述3.解:(1)该研究最好采用2×2析因设计的实验方案,如表3-2所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。因此既可分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。表3-2MEL和TXL对32只大鼠血管紧张素影响的析因设计MELTXL(用)b1(不用)b2(用)a1a1b1a1b2(不用)a2a2b1a2b2(2)先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第2列最上端开始纵向连续取32个两位数字。对随机数字排序,事先规定,序号为1~8的豚鼠分为A组,序号为9~16的大鼠分为B组,序号为17~24的大鼠分为C组,序号为25~32的大鼠分为D组,分配结果见表3-3。表3-332只大鼠随机分组的结果编号12345678910111213141516随机数17367743282276683971355096938756序号18251154221992071430282715分组AADBAACCBCABDDDB编号17181920212223242526272829303132随机数72969464447617177629804056654396序号21312917132323246261016181232分组CDDCBCAACADBBCBDSPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量number,见图3-4。再点击DataView标签,录入变量number的值,即从1~32。图3-4VariableView窗口内定义要输入的变量number4-85\n第四章定量资料的统计描述分析:Transform→RandomNumberGenerators…ActiveGeneratorInitializationSetStartingPointFixedValueValue:键入20071222设定随机种子为20071212OKTransform→Compute…TargetValuable:键入randomNumericExpression:RV.Uniform(0,1)产生范围在0~1之间的伪随机数OKTransform→RankCases…Variables(s):random对伪随机数排序OKTransform→Recode→IntoDifferentVariables…InputVariableOutputVariable:Rrandom原变量名为伪随机数的序号RrandomOutputVariableName:键入treat新变量名为treat点击Change点击OldAndNewValues…OldValueRange:键入1through8OutputvariablesarestringsNewValueValue:键入ARrandom值为1~8时,treat值为AOldNew:点击AddOldValueRange:键入9through16NewValueValue:键入BRrandom值为9~16时,treat值为BOldNew:点击AddOldValueRange:键入17through24NewValue4-85\n第四章定量资料的统计描述Value:键入CRrandom值为17~24时,treat值为COldNew:点击AddOldValueRange:键入25through32NewValueValue:键入DRrandom值为25~32时,treat值为DOldNew:点击AddContinueOK注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为SPSS的Syntax窗口中用编程来完成本题。File→New→Syntax,打开Syntax窗口,键入如下程序:inputprogram.开始数据录入程序段numericnknumbergroup(F8.0)/random(F8.6).stringtreat(A1).computen=32.受试对象总数为32computek=4.4个处理组loopnumber=1ton.endcase.computen=lag(n).computek=lag(k).endloop.endfile.endinputprogram.结束数据录入程序段computerandom=uniform(1).产生范围在0~1之间的伪随机数setseed20071222.设定随机种子为20071222rankvariables=random.对伪随机数排序computegroup=trunc((rrandom-1)*k/n).formatsgroup(F3.0).computetreat=substr("ABCDEFGHIJKLMN",group+1,1).根据伪随机数的序号进行分组listnumbertreat.结果中显示受试对象编号及被分到的处理组注:程序中的n(受试对象总数)、k(即处理组数)可根据实际情况赋予不同的值。4-85\n第四章定量资料的统计描述输出结果DataView窗口(由于篇幅限制,仅列出前16例受试对象的分组情况)图3-5SPSS编程实现受试对象随机分配结果Output窗口ListnumbertreatnumberTreat1D17C2D18C3B19B4C20C5D21B6D22A7B23C8C24D9D25C10A26A11D27B12B28A13C29A14B30A4-85\n第四章定量资料的统计描述15A31B16A32D编程实现随机分配的结果见dataview窗口(图3-5)或output窗口。可以看出32只大鼠被随机分配到A、B、C、D组。在用此程序进行随机分组前,事先规定A、B、C、D分别对应于对照组、MEL组、TXL组和MEL+TXL组。从分配结果中可以看出:10,15,16,22,26,28,29,30号大鼠被分到对照组;3,7,12,14,19,21,27,31号大鼠被分到MEL组;4,8,13,17,18,20,23,25号大鼠被分到TXL组;1,2,5,6,9,11,24,32号大鼠被分到MEL+TXL组。第四章定量资料的统计描述【习题解析】一、思考题1.均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势,。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。2.同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。3.极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。4.正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数和形态参数;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于1。曲线下区间内的面积为95.00%;区间内的面积为99.00%。5.①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。二、案例辨析题统计描述时,常见错误是对定量资料的描述均采用均数、标准差,。4-85\n第四章定量资料的统计描述正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离散程度指标。本资料的血清总胆固醇的频数分布图如下:频数图4-1血清甘油三酯(TG)的频数分布可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:集中趋势指标(mmol/L)离散程度指标四分位数间距=(mmol/L)三、最佳选择题1.B2.E3.B4.C5.D6.E7.A8.D9.D四、综合分析题1.解:输出结果频数图4-4尿总砷的频数分布图4-85\n第四章定量资料的统计描述由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。频数输出结果图4-5尿总砷对数的频数分布图由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。(2)燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。输出结果结果中的Mean表示尿总砷对数值的均数为1.1831,求其反对数,得到几何均数。2.解:(1)已知健康人的血清TC服从正态分布,故采用正态分布法制定95%的参考值范围。下限:(mmol/L)上限:(mmol/L)该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为2.96mmol/L~6.72mmol/L。(2)45~55岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。查标准正态分布曲线下的面积表(附表2)得:4-85\n第四章定量资料的统计描述该市45~55岁健康男性居民中,血清总胆固醇在3.25mmol/L~5.25mmol/L范围内的比例为61.79%。(3)作标准化变换查标准正态分布曲线下的面积表(附表2)得:该市45~55岁健康男性居民中,血清总胆固醇低于3.80mmol/L所占的比例为14.01%。3.解:输出结果5060708090100110120130140150频数跟骨硬度指数图4-8跟骨硬度指数的频数分布图由图4-8可见资料呈负偏态分布,因为跟骨硬度指数过高或过低均为异常,故应使用百分位数法,制定双侧95%参考值范围。输出结果StatisticsSINValid120Missing0Percentiles2.558.016797.5143.6618即该地区30~35岁健康女性的SI的95%参考值范围为(58.02,143.66)。第五章定性资料的统计描述【习题解析】一、思考题4-85\n第四章定量资料的统计描述1.①计算相对数应时有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。2.率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。3.如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。4.常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。5.①标准化法的目的是通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择的标准不同,计算出的标准化率也不相同。因此,标准化率仅用于相互间的比较,实际水平应采用未标化率来反映。②样本的标准化率是样本指标,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。③注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。二、案例辨析题该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。三、最佳选择题1.B2.A3.D4.E5.D6.D7.C8.C9.B四、综合分析题1.解:表5-3经常吸烟与慢性阻塞性肺病(COPD)的关系分组调查人数经常吸烟经常吸烟率(%)是否COPD患者35623112564.89非COPD患者47918329638.20COPD患者的经常吸烟率:231/356×100%=64.89%非COPD患者经常吸烟率:183/479×100%=38.20%COPD患者的经常吸烟率比非COPD患者高26.69%4-85\n第四章定量资料的统计描述还需进一步对作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。输出结果2.解:表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化年份符号死亡率绝对增长量发展速度增长速度累计逐年定基比环比定基比环比1998~a0160.5——————1999~a1144.2-16.3-16.30.900.90-0.10-0.102000~a2130.0-30.5-14.20.810.90-0.19-0.102001~a3120.2-40.3-9.80.750.92-0.25-0.082002~a485.6-74.9-34.60.530.71-0.47-0.292003~a569.5-91.0-16.10.430.81-0.57-0.192004~a638.5-122.0-31.00.240.55-0.76-0.45该病死亡率的平均发展速度该病死亡率的平均增长速度3.解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。表5-5直接法计算某地不同年龄、性别人群的HBsAg标准化阳性率(%)年龄组标准人口数男性女性4-85\n第四章定量资料的统计描述原阳性率预期阳性数原阳性率预期阳性数0~10812.3024.902.3225.0920~14732.7139.972.7240.0240~15466.0693.636.4699.8660~14087.52105.858.60121.04合计5508(N)5.11264()4.86286()男性HBsAg标准化阳性率:女性HBsAg标准化阳性率:可见,经标准化后女性HBsAg阳性率高于男性。输出结果注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2的和除以sp的和,得女性HBsAg标准化阳性率。第六章总体均数的估计【习题解析】一、思考题1.抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。2.样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。3.标准差与标准误的区别在于:①计算公式:标准差为,标准误为;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。标准差与标准误的联系:当样本量一定时,标准误随标准差的增加而增加,公式为:4-85\n第四章定量资料的统计描述。4.数理统计的中心极限定理:从均数为,标准差为的正态总体中进行独立随机抽样,其样本均数服从均数为,标准差为的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时,其样本均数的分布逐渐逼近于均数为,标准差为的正态分布。越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。计算总体均数置信区间的通式为:;当样本含量较大时,例如,分布近似标准正态分布,可用值代替值,作为置信区间的近似计算,相应的置信度为时,总体均数的置信区间为:。5.置信区间与医学参考值范围的区别见表6-1。表6-1均数的置信区间与医学参考值范围的区别区别均数的置信区间医学参考值范围意义按一定的置信度()估计的总体均数所在的区间范围大多数“正常人”的某项解剖、生理、生化指标的波动范围计算公式①未知:()②未知而n较大:()③已知:()①正态分布法:双侧95%的参考值范围为()②偏态分布法:单侧下限95%的参考值范围为单侧上限95%的参考值范围为用途用于总体均数的估计或假设检验判断观察对象的某项指标正常与否,为临床诊断提供参考二、案例辨析题该学生误用医学参考值范围的公式来计算总体均数的95%置信区间,正确计算公式为:,二者的主要区别在于,计算医学参考值范围时应该用“标准差”,计算置信区间时应该用标准误。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.01,122.99)。三、最佳选择题1.C2.E3.E4.A5.E6.A7.E8.B四、综合分析题1.解:由于该样本为小样本,故用公式估计总体均数95%置信区间为(8.27,10.03)mm/h;用公式估计总体均数99%置信区间为(7.96,10.34)mm/h。输出结果DescriptivesStatisticStd.Error红细胞沉降率Mean9.1481.4256395%ConfidenceIntervalforMeanLowerBound8.2697UpperBound10.02664-85\n第四章定量资料的统计描述5%TrimmedMean9.1795Median9.4288Variance4.529Std.Deviation2.12816Minimum5.01Maximum12.68Range7.67InterquartileRange2.73Skewness-.250.464Kurtosis-.429.902DescriptivesStatisticStd.Error红细胞沉降率Mean9.1481.4256399%ConfidenceIntervalforMeanLowerBound7.9576UpperBound10.33865%TrimmedMean9.1795Median9.4288Variance4.529Std.Deviation2.12816Minimum5.01Maximum12.68Range7.67InterquartileRange2.73Skewness-.250.464Kurtosis-.429.9022.解:①抽样误差为1.82;②由于该样本为大样本,故用公式估计正常人ET含量的95%置信区间为(77.43,84.57)ng/L。输出结果DescriptivesStatisticStd.Error血浆内皮素Mean80.98911.8203395%ConfidenceIntervalforMeanLowerBound77.3771UpperBound84.60105%TrimmedMean80.8639Median79.5837Variance331.362Std.Deviation18.20334Minimum34.02Maximum129.20Range95.17InterquartileRange21.754-85\n第四章定量资料的统计描述Skewness.182.241Kurtosis.140.4783.解:①由于两样本均为小样本,故用公式估计总体均数95%置信区间,肺心病组血液二氧化碳分压的95%置信区间为(7.86,13.10)kpa;慢性支气管炎合并肺气肿组血液二氧化碳分压的95%置信区间为(5.41,6.83)kpa。②由于方差不齐,应当选择方差不齐时的结果。两组患者的血液二氧化碳分压差值的95%置信区间为(1.66,7.05)kpa,该区间不包含0,可以认为肺心病患者与慢性支气管合并肺气肿患者的均数不同,肺心病患者较高。输出结果Descriptives组别StatisticStd.Error二氧化碳压肺心病组Mean10.47821.2656495%ConfidenceIntervalforMeanLowerBound7.8600UpperBound13.09645%TrimmedMean10.2266Median10.3473Variance38.444Std.Deviation6.20035Minimum1.59Maximum24.30Range22.71InterquartileRange7.13Skewness.615.472Kurtosis-.030.918慢性支气管炎合并肺气肿组Mean6.1228.3380995%ConfidenceIntervalforMeanLowerBound5.4151UpperBound6.83045%TrimmedMean6.1266Median6.0160Variance2.286Std.Deviation1.51198Minimum2.93Maximum9.25Range6.32InterquartileRange1.784-85\n第四章定量资料的统计描述Skewness-.081.512Kurtosis.192.992GroupStatistics组别NMeanStd.DeviationStd.ErrorMean二氧化碳压·肺心病组2410.47826.200351.26564慢性支气管炎合并肺气肿组206.12281.51198.33809IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpper二氧化碳压Equalvariancesassumed17.431.0003.06142.0044.355471.422901.483947.22700Equalvariancesnotassumed3.32526.238.0034.355471.310021.663877.04706第七章假设检验1、解释零假设与备择假设的含义。零假设又称无效假设或无差异假设,记为H0,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示目前的差异是因为比较的对象之间存在本质不同造成的。2、简述假设检验的基本步骤。假设检验的基本步骤如下:(1)建立检验假设,确定检验水准。(2)计算检验统计量。(3)确定P值,作出统计推断。3、比较单侧检验与双侧检验的区别。选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。例如,在临床试验中,比较甲、乙两种治疗方法的疗效有无差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。若从专业角度无法确定的情况下,一般应采用双侧检验。4、解释I型错误、II型错误和检验效能,并说明它们之间的关系。拒绝实际成立的H0所犯的错误称为I型错误,记为α。不拒绝实际不成立的H0所犯的错误称为II型错误,记为β。如果两个总体参数间确实存在差异,即H1:μ≠μ4-85\n第四章定量资料的统计描述0成立,按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为(1-β)。三者的关系为:当样本量确定时,α与β成反比,与(1-β)成正比。如果把α设置得很小,势必增加犯II型错误的概率,从而降低检验效能;反之,如果把重点放在减少β上,势必增加犯I型错误的概率,从而降低了置信度。要同时减小α和β,只有通过增加样本含量来实现。5、简述假设检验与置信区间估计的联系。假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,且统计推断结论是等价的。此外,置信区间在回答差别有无统计学意义的同时,还能提供一些假设检验不能提供的信息,并可以提示差别是否具有实际意义。因此,置信区间与假设检验的作用是相辅相成的,将两者结合起来,可以提供更为全面的统计推断信息。二、案例辨析题为了比较非洛地平与常规药物治疗高血压的疗效差异,现已知常规药能使高血压患者的血压平均下降20mmHg,某医生随机抽取100名原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其mmHg,mmHg。该医生进行了t检验,零假设是,备择假设是,检验水准。计算得,按查界值表,得,故接受,认为非洛地平与常规药物治疗高血压的疗效无差别。你认为该结论正确吗?请说明理由。答:该结论是错误的。因为在进行两均数比较的假设检验时,当时,说明两总体均数无差别是一个小概率事件,我们认为在一次试验中几乎不会发生,于是得出拒绝,接受的结论,即使犯错误,概率也小于5%;但是当时,对两总体均数无差别即接受这一结论无任何概率保证,得出错误结论的概率可能很大。故本例正确的结论应该是:按水准,不能拒绝,差异无统计学意义,尚不能认为非洛地平与常规药物治疗高血压的疗效有差异。三、最佳选择题1.C2.E3.E4.E5.E6.E7.D8.E9.E四、综合分析题1.解:本题是单样本均数与已知总体均数的比较,用单样本资料的t检验,具体步骤如下:(1)建立检验假设,确定检验水准:=52:=52单侧(2)计算检验统计量4-85\n第四章定量资料的统计描述,=,(3)确定P值,作出统计推断查界值表,得。按水准,拒绝,差别有统计学意义,故可认为该营养素新产品比旧产品的效果好。2.解:本题是样本均数与总体均数的比较,用单样本资料的检验,具体步骤如下:(1)建立检验假设,确定检验水准::单侧(2)计算检验统计量=10.1392,=0.2595==0.523,(3)确定P值,作出统计推断查界值表,得。按水准,不拒绝,差别无统计学意义,尚不能认为该地区正常成年男性无名指长度大于一般汉族成年男性。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,x表示该地区正常成年男性中指长度(cm);再点击DataView标签,录入数据(见图7-1,图7-2)。图7-1VariableView窗口内定义要输入的变量x4-85\n第四章定量资料的统计描述图7-2DataView窗口内录入数据分析:Analyze→CompareMeans→OneSampleTTestTestVariable(s)框:xTestValue框:10.10OK输出结果One-SampleStatisticsNMeanStd.DeviationStd.ErrorMean该地区正常成年男性中指长度1210.1392.25946.07490One-SampleTestTestValue=10.10tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpper该地区正常成年男性中指长度.52311.611.03917-.1257.20403.解:A药、B药两组均为配对设计资料,故用配对t检验进行分析。(1)A药:设治疗前后血色素的差值为d1)建立检验假设,确定检验水准:,即A药治疗前后患者血色素的差值的总体均数为0:,即A药治疗前后患者血色素的差值的总体均数不为04-85\n第四章定量资料的统计描述2)计算检验统计量,,,3)确定P值,作出统计推断查界值表,得,,。按水准,拒绝,接受,差别有统计学意义,可认为A药治疗前后患者血色素不同,即A药有效。B药:同理,对B药可得到治疗前后该指标差值的样本均数为18.8889,标准差为13.4856,标准误为4.4952,,,,拒绝,接受,差别有统计学意义,可认为B药治疗前后患者血色素不同,即B药有效。(2)首先进行方差齐性检验,得,,可认为两总体方差齐,两组差值可用两独立样本均数比较的检验。1)建立检验假设,确定检验水准:,即两种药物治疗前后血色素差值的总体均数相等:,即两种药物治疗前后血色素差值的总体均数不等2)计算检验统计量,,,==,3)确定P值,作出统计推断查界值表,得,,,按水准,不拒绝,差别无统计学意义,尚不能认为两种药物的疗效有差别。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,a表示血色素治疗前的测量值,b表示血色素治疗后的测量值,g表示分组变量(1为A药组,2为B药组);再点击DataView标签,录入数据(见图7-3,图7-4)。4-85\n第四章定量资料的统计描述图7-3VariableView窗口内定义要输入的变量a,b和g图7-4DataView窗口内录入数据第一问分析:Transform→Compute…TargetVariable框:dNumeric→Expression框:b-aOKData→SplitFile…:Organizeoutputbygroups:GroupsBasedon框:分组(group)OKAnalyze→CompareMeans→OneSampleTTest…TestVariable(s)框:dTestValue框:0OK输出结果One-SampleStatistics(a)4-85\n第四章定量资料的统计描述NMeanStd.DeviationStd.ErrorMeand915.55569.761033.25368a分组=A药组One-SampleTest(a)TestValue=0tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperd4.7818.00115.555568.052623.0586a分组=A药组One-SampleStatistics(a)NMeanStd.DeviationStd.ErrorMeand918.888913.485594.49520a分组=B药组One-SampleTest(a)TestValue=0tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperd4.2028.00318.888898.522929.2548a分组=B药组第二问分析:Data→SplitFile…:Analyzeallcases,donotcreategroups:OKAnalyze→CompareMeans→Independent-SamplesTTest…TestVariable(s)框:dGroupingVariable框:分组Definegroups…Group1框:1Group2框:2ContiniueOK4-85\n第四章定量资料的统计描述输出结果GroupStatistics分组NMeanStd.DeviationStd.ErrorMeandA药组915.55569.761033.25368B药组918.888913.485594.49520IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpperdEqualvariancesassumed3.021.101-.60116.556-3.333335.54916-15.097038.43037Equalvariancesnotassumed-.60114.577.557-3.333335.54916-15.191048.52438第八章t检验【习题解析】一、思考题1.理论根据是小概率事件和小概率反证法。值表示成立时,出现等于及大于(或等于及小于)现有样本统计量的概率。则表示在成立的前提下,得到现有样本统计量的概率为小概率事件,所以拒绝。2.检验中是选择单侧检验还是双侧检验,需要根据专业知识来确定。例如,根据专业知识能确定未知总体均数不会大(小)于标准值(单样本检验),则可用单侧检验,否则,采用双侧检验。3.配对检验的应用条件是资料为配对设计,且数据差值服从正态分布。4.理论上讲应取得大一些,如0.10或0.20,目的是减少犯II型错误的概率;在实际应用中,常取。5.变量变换的目的在于使变换后的资料满足正态分别或方差齐性等条件,便于进一步的统计分析。6.可以,大样本两组均数的Z检验是两组均数比较检验的近似。二、案例辨析题该医生的分析结果是错误的。正确作法应是分别将甲、乙两药各自治疗前后的血沉值作差值,比较两组差值的均值是否有差别,具体步骤如下:(1)正态性检验分别对甲、乙两种药物治疗前后的血沉差值进行正态性检验。4-85\n第四章定量资料的统计描述甲药:乙药:故,甲药、乙药两组资料的差值均服从正态分布。(2)方差齐性检验1)建立检验假设,确定检验水准,两差值总体方差相等,两差值总体方差不等2)计算检验统计量3)确定值,作出统计推断查界值表(附表4),得,按的水准,不拒绝,差异不具有统计学意义,尚不能认为两差值总体方差相等。(3)以差值为资料,作两组均值检验1)建立检验假设,确定检验水准:,即甲、乙两种药物的疗效无差别:,即甲、乙两种药物的疗效有差别2)计算检验统计量3)确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝,接受,差异具有统计学意义,可认为甲、乙两种药物的疗效有差别。由于乙种药物治疗前后血沉值的差值较大(均数为5.8),故乙药物治疗效果要好于甲药。输出结果4-85\n第四章定量资料的统计描述三、最佳选择题1.E2.C3.C4.B5.E6.E7.C四、综合分析题1.解:本题应进行单样本检验,可按如下步骤完成:(1)资料的正态性检验,故资料服从正态分布。(2)单样本检验1)建立检验假设,确定检验水准,即该山区成年男子的脉搏与一般成年男子脉搏无差别,即该山区成年男子的脉搏与一般成年男子脉搏有差别2)计算检验统计量由原始资料计算得:,于是3)确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝,接受,差异有统计学意义,可以认为该山区成年男子脉搏与一般成年男子脉搏有差别。输出结果4-85\n第四章定量资料的统计描述2.解:本题应采用配对检验,完成步骤如下:(1)分别作甲、乙两药治疗前后差值的正态性检验由案例辨析题中的结论可知,资料均服从正态分布。(2)对甲、乙两药分别作配对检验甲药:1)建立检验假设,确定检验水准,即甲药治疗前后血沉值无差别,即甲药治疗前后血沉值有差别2)计算检验统计量3)确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝,差异有统计学意义,即甲药降低血沉有效。乙药:1)建立检验假设,确定检验水准,即乙药治疗前后血沉值无差别,即乙药治疗前后血沉值有差别2)计算检验统计量4-85\n第四章定量资料的统计描述3)确定P值,作出统计推断查界值表(附表3),得,按水准,拒绝,差异有统计学意义,即乙药降低血沉有效。输出结果3.解:本题资料为抗体滴度数据,一般服从对数正态分布,宜采用成组设计的两小样本几何均数比较的检验。(1)将原始数据取常用对数值后分别记为、(2)正态性检验用SPSS统计软件算得变量、的正态性检验结果。::故,,两组资料均服从正态分布。(3)方差齐性检验1)建立检验假设,确定检验水准,两总体方差相等,两总体方差不等2)计算检验统计量,于是3)确定值,作出统计推断查界值表(附表4),得。按水准,拒绝,差异有统计学意义,故可认为两总体方差不相等。(4)两样本均数()的检验1)建立检验假设,确定检验水准4-85\n第四章定量资料的统计描述两总体几何均数的对数值相等两总体几何均数的对数值不等2)计算检验统计量3)确定值,作出统计推断查界值表(附表3),得。按水准,拒绝,接受,差异有统计学意义,可认为两组的平均效价有差别。输出结果第九章方差分析1、方差分析的基本思想及其应用条件是什么?4-85\n第四章定量资料的统计描述方差分析的基本思想是把全部观察值的总变异按设计类型分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。应用条件:各样本是相互独立的随机样本,且服从正态分布,各样本的总体方差齐性。2、在完全随机设计方差分析中SS总、SS组间、SS组内各表示什么含义?SS总是各观察值与总均值之差的平方和,即总离均差平方和,表示总变异的大小;SS组间表示组间变异,指各处理组均值大小的不同,是由处理因素和随机误差造成的;SS组内表示组内变异,指同一处理组内部各观察值之间的变异,是由随机误差造成的。3、什么是交互效应?请举例说明。交互效应是指某一因素的效应随另一因素不同水平的变化而变化,称这两个因素之间存在交互效应。例如:某实验研究A、B两种药物在不同剂量情况下对某病的治疗效果,药物A在不同剂量时,B药的效应不同,或者药物B在不同剂量时,A药的效应不同,则A、B两药间存在交互效应。4、重复测量资料具有何种特点?重复测量资料中的处理因素在受试者间是随机分配的,受试者内的因素即时间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响,而且时间点离的越近的数据相关性越高。5、为什么总的方差分析的结果为拒绝零假设时,若想进一步了解两两之间的差别需要进行多重比较?方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。因此,若希望进一步了解两两的差别,需进行多重比较。二、最佳选择题1.C2.C3.A4.E5.D6.E7.D8.E9.C三、综合分析题1.解:本题采用完全随机设计的方差分析。表9-6三种方案治疗一个月后缺铁性贫血患者红细胞的升高数(102/L)一般疗法一般疗法+A1一般疗法+A2合计0.811.322.350.751.412.500.741.352.430.861.382.360.821.402.440.871.332.460.751.432.400.741.382.430.721.402.210.821.402.450.801.342.380.751.462.404-85\n第四章定量资料的统计描述12121236()9.4316.6028.8154.84()0.78581.38332.40087.438522.982869.228199.6494()(1)方差分析1)建立检验假设,确定检验水准:,即三种方案治疗后缺铁性贫血患者红细胞升高数相同:不全相同,即三种方案治疗后缺铁性贫血患者红细胞升高数不全相同=0.052)计算检验统计量方差分析结果见表9-7。表9-7完全随机资料的方差分析表变异来源总变异16.109835组间变异16.002228.00112452.7216<0.014-85\n第四章定量资料的统计描述组内变异0.1076330.00333)确定值,作出统计推断查界值表(附表4)得P<0.01,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为三种不同方案治疗后患者红细胞升高数的总体均数不全相同。(2)用Dunnett-法进行多重比较。1)建立检验假设,确定检验水准:任一实验组与对照组的总体均数相同:任一实验组与对照组的总体均数不同2)计算检验统计量表9-8多个样本均数的Dunnett-检验计算表对比组(1)均数差值(2)标准误(3)(4)Dunnett-界值一般疗法与一般疗法+A10.600.02302.32<0.05一般疗法与一般疗法+A21.620.02812.32<0.053)确定值,作出统计推断将表9-8中取绝对值,并以计算时的自由度和实验组数a=k−1=2(不含对照组)查Dunnett-界值表得值,列于表中。按=0.05水准,一般疗法+A1与一般疗法相比,疗效差别有统计学意义,可以认为一般疗法+A1与一般疗法治疗缺铁性贫血疗效不同。同理,可以认为一般疗法+A2与一般疗法治疗缺铁性贫血疗效不同SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,group表示组别(1为一般疗法,2为一般疗法+药物A低剂量,3为一般疗法+药物A高剂量),x表示患者红细胞的升高数(102/L);再点击DataView标签,录入数据(见图9-1,图9-2)。4-85\n第四章定量资料的统计描述图9-1VariableView窗口内定义要输入的变量group和x图9-2DataView窗口内录入数据分析:Analyze→CompareMeans→one-WayANOVADependentList框:xFactor框:groupPostHoc…→EqualVariancesAssumed:Dunnett:ControlCategory:firstContinueOption...→Statistics:HomogeneityofVariancestestContinueOK输出结果TestofHomogeneityofVariances红细胞升高数(102/L)LeveneStatisticdf1df2Sig..774233.469ANOVA4-85\n第四章定量资料的统计描述红细胞升高数(102/L)SumofSquaresdfMeanSquareFSig.BetweenGroups16.00228.0012452.722.000WithinGroups.10833.003Total16.11035MultipleComparisonsDependentVariable:红细胞升高数(102/L)Dunnettt(2-sided)a(I)G(J)GMeanDifference(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBound21.59750(*).02332.000.5436.6514311.61500(*).02332.0001.56111.6689*Themeandifferenceissignificantatthe.05level.aDunnettt-teststreatonegroupasacontrol,andcompareallothergroupsagainstit.2.解:本题采用析因设计的方差分析。表9-9九种不同处理情况下抑菌环的直径(mm)纸片弥散法挖洞弥散法钢圈弥散法黄芪大黄青霉素黄芪大黄青霉素黄芪大黄青霉素合计27.520.927.424.324.622.020.019.129.627.621.227.624.624.721.721.019.330.226.920.526.925.023.921.820.618.729.527.321.326.727.724.822.320.818.530.444444444436109.383.9108.6101.698.087.882.475.6119.7866.9121212121212301.8287.4277.7293.3257.5316.1(1)建立检验假设,确定检验水准因素A:三种弥散方法抑菌环直径的总体均数相等:三种弥散方法抑菌环直径的总体均数不全相等4-85\n第四章定量资料的统计描述因素B:三种药物抑菌环直径的总体均数相等:三种药物抑菌环直径的总体均数不全相等AB交互作用:不同药物对三种弥散方法的抑菌效果无影响:不同药物对三种弥散方法的抑菌效果有影响=0.05(2)计算检验统计量4-85\n第四章定量资料的统计描述方差分析结果见表9-10表9-10析因设计资料的方差分析表变异来源总变异447.396435处理436.63398A24.5072212.253630.7416<0.05B145.4289272.7145182.4247<0.05AB266.6978466.6745167.2717<0.05误差10.7625270.3986(3)确定P值,作出统计推断根据,查界值表(附表4)得相应值。交互作用的F=167.2717,P<0.05,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为弥散方法和药物抑菌效果两者之间存在交互作用。这时,如要分析A因素或B因素的单独效应,应固定在A因素的基线水平来分析B因素的作用,或者固定在B因素的基线水平来分析A因素的作用。SPSS操作4-85\n第四章定量资料的统计描述数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,g1表示三种弥散方法(1为纸片,2为挖洞,3为钢圈),g2表示三种药物(1为黄芪,2为大黄,3为青霉素),x表示抑菌效果(mm);点击DataView标签,录入数据(见图9-3,图9-4)。图9-3VariableView窗口内定义要输入的变量g1、g2和x图9-4DataView窗口内录入数据分析:Analyze→GeneralLinearModel→UnivariateDependentList框:xFixedFactor框:g1、g2OK输出结果4-85\n第四章定量资料的统计描述3.解:本题可采用t检验分析,但最好采用重复测量资料的方差分析。因重复测量资料的方差分析计算量较大,故本题不给出笔算结果,仅提供SPSS软件分析结果。(1)建立检验假设,确定检验水准处理因素K:饮食疗法和药物疗法降低胆固醇值的总体均数相同:饮食疗法和药物疗法降低胆固醇值的总体均数不相同时间因素I:试验前后患者胆固醇值的总体均数相同:试验前后患者胆固醇值的总体均数不相同交互作用KI:时间对两种方法降低胆固醇的效果无影响:时间对两种方法降低胆固醇的效果有影响=0.05(2)计算检验统计量本例是最简单的重复测量设计,时间因素只有两个水平,可以用重复测量的方差分析进行计算,由于时间点只有两个水平,可以不考虑球形对称问题。列出方差分析表见表9-11:表9-11重复测量资料的方差分析表变异来源P总变异14.19727处理0.16810.1680.1530.703个体间误差13.196121.1004-85\n第四章定量资料的统计描述时间0.44510.44513.9210.003处理×时间0.00410.0040.1220.733个体内误差0.384120.032(3)确定P值,作出统计推断时间因素和治疗方法之间的交互作用,F值为0.122,P值为0.733,按=0.05水准,不拒绝,差异无统计学意义,尚不能认为时间和疗法之间存在交互作用;对于时间因素,F值为13.921,P值为0.003,P<0.001,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为试验前后患者胆固醇的值不同;两种治疗方法的F值为0.153,P值为0.703,P>0.05,按=0.05水准,不拒绝,差异无统计学意义,尚不能认为饮食疗法和药物疗法之间具有差别。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,no表示编号,g表示分组(1为饮食疗法,2为药物疗法),t1表示实验前患者胆固醇的值(mmol/L),t2表示实验后患者胆固醇的值(mmol/L);击DataView标签,录入数据(见图9-5,图9-6)。图9-5VariableView窗口内定义要输入的变量no、g、t1和t24-85\n第四章定量资料的统计描述图9-6DataView窗口内录入数据分析:Analyze→GeneralLinearModel→RepeatedMeasuresWithin-SubjectFactorname:改为tNumberofLevels:键入2→AddDefine:Within-SubjectsVariables[t]:t1~t2Between-SubjectsFactor[s]:gModel:→Custom→Within-SubjectsModel:t→Between-SubjectsModel:gContinueOK输出结果Mauchly'sTestofSphericity(b)Measure:MEASURE_1WithinSubjectsEffectMauchly'sWApprox.Chi-SquaredfSig.Epsilon(a)Greenhouse-GeisserHuynh-FeldtLower-boundtime1.000.0000.1.0001.0001.0004-85\n第四章定量资料的统计描述4.(1)该资料采用的是两独立样本t检验作两两比较。(2)所使用的统计分析方法错误。欲比较三组均数是否两两不同,用两独立样本t检验作多次比较,会增大犯I型错误的概率。(3)应当先采用完全随机设计方差分析,若分析结果拒绝H0,则进一步采用SNK法作三组间的两两比较。完全随机设计方差分析1)建立检验假设,确定检验水准:三个年级锻炼时间的总体均数相等:三个年级锻炼时间的总体均数不全相等,即至少有两个总体均数不等=0.052)计算检验统计量4-85\n第四章定量资料的统计描述方差分析结果见表9-12。表9-12方差分析表变异来源总变异9988.516459组间2431.723121215.86159.17<0.01组内7556.793357132.5753多个样本均数间比较见表9-13。表9-13SNK检验计算表对比组与(1)两均数之差(2)两均数之差标准误(3)对比组内包含组数(5)界值(8)0.05(6)0.01(7)1与314.95192.57465.807533.444.37<0.011与211.31142.57464.393522.863.82<0.012与33.64052.57461.414022.863.82>0.053)确定P值,作出统计推断方差分析结果P<0.01,按=0.05水准,拒绝,接受,差别有统计学意义,可以认为三个年级锻炼时间的总体均数不全相等;多个均数间的两两比较的SNK检验结果提示:可以认为一年级和二年级、一年级和三年级的锻炼时间不同;尚不能认为二年级和三年级的锻炼时间不同。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,group表示组别(1为一年级,2为二年级,3为三年级),x表示锻炼时间(分);再点击Data4-85\n第四章定量资料的统计描述View标签,录入数据(见图9-7,图9-8)。图9-7VariableView窗口内定义要输入的变量x、g图9-6DataView窗口内录入数据分析:Analyze→CompareMeans→ONEWAY-ANOVADependentList框:锻炼时间(x)Factor框:gPostHoc…→EqualVariancesAssumed:S-N-KContinueOption...→Statistics:HomogeneityofVariancestestContinueOK输出结果4-85\n第四章定量资料的统计描述第十章二项分布和Poisson分布及其应用【习题解析】一、思考题1.Bernoulli试验的适用条件如下:①每次试验只会发生两种互斥结果之一,即两种互斥结果的概率之和恒等于1;②在相同的试验条件下,每次试验产生某种结果(如“阳性”)的概率固定不变;③重复试验是互相独立的,即任何一次试验结果的出现不会影响其它试验结果出现的概率。2.Poisson分布的性质如下:①总体均数与总体方差相等;②当n很大,而很小,且为常数时,Poisson分布可看作是二项分布的极限分布;③当增大时,Poisson分布渐近正态分布,一般而言,时,Poisson分布资料可作为正态分布处理;④Poisson分布具备可加性,即对于服从Poisson分布的m个互相独立的随机变量,它们之和也服从Poisson分布,且其均数为这m个随机变量的均数之和;⑤的大小决定了Poisson分布的图形特征。3.随机变量X服从二项分布,是指在n重Bernoulli试验中,发生某种结果(如“阳性”)的次数的一种概率分布,其恰好发生X个阳性的概率为(),且总有。而随机变量X服从Poisson分布,是指X满足:①取值范围为;②相应的概率为,且总有。在总体率很小,而样本含量(试验次数)n趋向于无穷大时,二项分布近似于Poisson分布。因此,Poisson分布可看作是二项分布的一种极限情况,可用来描述小概率事件的发生规律。4.二项分布、Poisson分布和正态分布间的联系为:①在n很大,而很小,且为常数时,二项分布的极限分布为Poisson分布;②在n较大、不接近0也不接近1时,二项分布近似正态分布,而相应的样本率p的分布也近似正态分布。③当增大时,Poisson分布渐近正态分布,一般而言,≥20时,Poisson分布资料可作为正态分布处理。二、案例辨析题4-85\n第四章定量资料的统计描述不正确。溶液中的细菌数可以认为服从Poisson分布,当其“单位容积”所含细菌数时,可采用正态近似法估计总体均数的()置信区间。但本例溶液的“单位容积”为10ml,应先用正态近似法估计出该溶液每10ml所含细菌数的95%置信区间,再除以10即得到每1ml所含细菌数的95%置信区间。由式(10.16)可得,每10ml该溶液所含细菌数的95%置信区间为,故每1ml该溶液所含细菌数的95%置信区间为。三、最佳选择题1.A2.C3.B4.E5.C6.E7.E8.C四、综合分析题1.解:本例可认为治疗有效人数X服从二项分布,根据研究目的,选用单侧检验。其假设检验步骤为:(1)建立检验假设,确定检验水准H0:,该药新剂型的疗效等于常规剂型H1:,该药新剂型的疗效优于常规剂型单侧(2)计算概率本例,,,,(3)作出统计推断由结果可见,按水准,不拒绝H0,差异无统计学意义,尚不能认为该药新剂型能增加疗效。2.解:本例中,乳腺癌患病人数可认为服从Poisson分布,两个样本的观察单位数不相等,以10000人为一个单位,则,。设甲、乙两地妇女乳腺癌的患病率分别为和,其假设检验步骤为:(1)建立检验假设,确定检验水准H0:,两地妇女乳腺癌患病率相等H1:,甲地妇女乳腺癌患病率高于乙地单侧(2)计算检验统计量(3)作出统计推断查t界值表(附表3),得,按水准,不拒绝H0,差异无统计学意义,尚不能认为甲地妇女乳腺癌的患病率高于乙地。第十一章检验【习题解析】4-85\n第四章定量资料的统计描述一、思考题1.检验的基本思想:在成立的条件下,推算出各个格子的理论频数T,然后利用理论频数T和实际频数A构造统计量,,反映实际频数与理论频数的吻合程度。若无效假设成立,则各个格子的A与T相差不应该很大,即统计量不应该很大。A与T相差越大,值越大,相对应的P值越小,当,则越有理由认为无效假设不成立,继而拒绝,作出统计推断。由于格子越多,值也会越大,因而考虑值大小的意义时,应同时考虑格子数的多少(严格地说是自由度的大小),这样值才能更准确地反映A与T的吻合程度。检验可用于:独立样本两个或多个率或构成比的比较,配对设计两样本率的比较,频数分布的拟合优度检验,线性趋势检验等。2.对不同设计类型的资料,检验的应用条件不同:(1)独立样本四格表的检验1)当,且时,用非连续性校正的检验。或2)当,且有时,用连续性校正的检验或用四格表的确切概率法。或3)当或时,用四格表的确切概率法。(2)独立样本列联表检验的专用公式为:1)不宜有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1。2)结果为有序多分类变量的R×C列联表,在比较各处理组的平均效应有无差别时,应该用秩和检验或Ridit检验。(3)配对四格表的检验1)当时,。2)当时,需作连续性校正,。3.四格表的Z检验和检验的联系,体现在:能用四格表Z检验进行两样本率比较的资料,都可以用检验。四格表的双侧Z检验与检验是完全等价的,两个统计量的关系为,相对应的界值的关系为。4.拟合优度检验是根据样本的频数分布检验其总体是否服从某特定的理论分布。按照该理论分布计算的频数称为理论频数;从样本观察到的频数称为实际频数。利用检验,推断实际频数与理论频数的吻合程度。5.检验的理论是基于分布,但是只有在大样本时检验统计量才近似服从分布,才能使用检验公式。如四格表资料,若,且有时,尚可以校正检验统计量使其近似服从分布;当时,这种近似性就很差,4-85\n第四章定量资料的统计描述检验就不适用了,只能用确切概率法。二、案例辨析题该研究的试验设计和统计分析方法均存在不合理的地方。试验设计方面:样本含量偏小。该研究者在临床试验设计之初,就应该严格按照临床试验设计要求,进行样本含量的估计,以保证足够的检验效能。此外,由于急性细菌性下呼吸道感染,某些症状疗效的判断可能易受主观因素的影响,因此应采用盲法。统计分析方面:由于样本含量小于40,不能采用检验,应采用四格表的确切概率法。具体步骤为:1.建立检验假设,确定检验水准:,即两种抗生素治疗急性细菌性下呼吸道感染的有效率相同:,即两种抗生素治疗急性细菌性下呼吸道感染的有效率不同2.计算概率:在周边合计不变的条件下,以最小行、列合计所对应的格子为基础,其取值的变动范围为从0到最小周边合计。本例中,将甲药治疗无效对应的格子的取值从0增至10,可得到11个四格表,并按第1个格子的值由小到大排列,结果见下表。表11-4Fisher确切概率法计算用表序号i有效无效14100.000031602590.001071513680.011991424770.063971335860.181911246950.2910511571040.2668010681130.13860979*1220.0389888101310.0053379111400.00027610*表11-1数据按下式计算各四格表的概率,结果见表11-4最后一列。3.确定P值,作出统计推断将小于等于原四格表概率的所有四格表对应的概率相加,得到双侧概率4-85\n第四章定量资料的统计描述按水准,不拒绝,差异无统计学意义,尚不能认为两种抗生素治疗急性细菌性下呼吸道感染的疗效有差别。该结果与该研究者的结论相反。因此,在统计分析时应注意所选方法的应用条件。三、最佳选择题1.A2.E3.D4.E5.D6.A7.E8.B9.B10.C四、综合分析题1.解:(1)资料整理后的表格为表11-5A、B两种抗生素治疗单纯性尿路感染的疗效组别有效无效合计有效率(%)抗生素A3754288.10抗生素B29134269.05合计66188478.57(2)该研究属于完全随机设计,所得资料为二分类资料。(3)由于该资料为分类资料,欲比较A、B两药的有效率,宜选用独立样本四格表的检验。具体步骤为:1)建立检验假设,确定检验水准:,即两种抗生素治疗单纯性尿路感染的有效率相同:,即两种抗生素治疗单纯性尿路感染的有效率不同2)计算检验统计量本题中最小行、列合计对应的格子为采用抗生素A治疗无效者或抗生素B治疗无效者,其理论频数,故采用四格表专用公式:3)确定P值,作出统计推断查界值表(附表9),得,按水准,拒绝,接受,差异有统计学意义,可以认为两种抗生素治疗单纯性尿路感染的疗效不同,A药的有效率高于B药。输出结果4-85\n第四章定量资料的统计描述2.解:(1)资料整理后的表格为表11-6两种CT对煤工尘肺肺气肿的检查结果螺旋CTHRCT合计有无有73275无71421合计801696(2)该研究属于配对设计,所得数据为分类资料。(3)该资料为分类资料,欲比较螺旋CT和HRCT在煤工尘肺肺气肿检出方面有无差异,宜选用配对四格表的检验。具体步骤为:1)建立检验假设,确定检验水准:,即两种CT检出煤工尘肺肺气肿的结果无差异:,即两种CT检出煤工尘肺肺气肿的结果有差异2)计算检验统计量本题,应采用配对四格表检验的校正公式:3)确定P值,作出统计推断查界值表(附表9),得,按水准,不拒绝,差异无统计学意义,尚不能认为两种CT煤工尘肺肺气肿的检出率有差异。4-85\n第四章定量资料的统计描述输出结果3.解:本题资料为分类资料,欲比较3种方案治疗单纯性肥胖的有效率有无差异,宜选用独立样本列联表的检验。具体步骤为:1)建立检验假设,确定检验水准:,即3种方案治疗单纯性肥胖的有效率相同:3种方案治疗单纯性肥胖的有效率不全相同2)计算检验统计量最小理论频数,故直接将数据带入独立样本列联表检验的公式:3)确定P值,作出统计推断查界值表(附表9),得,按水准,不拒绝,差异无统计学意义,尚不能认为3种方案治疗单纯性肥胖的有效率不同。输出结果4-85\n第四章定量资料的统计描述4.解:(1)该资料为分类资料,欲比较两药治疗胃溃疡的疗效构成比有无差异,宜选用独立样本列联表的检验。先将资料整理成下表形式:表11-7两种药物治疗治疗胃溃疡的疗效组别痊愈显效进步无效合计试验组20(58.82)6(17.65)4(11.76)4(11.76)34(100)对照组16(47.06)4(11.76)8(23.53)6(17.65)34(100)合计3610121068假设检验的具体步骤为:1)建立检验假设,确定检验水准:两药治疗胃溃疡的疗效构成比相同:两药治疗胃溃疡的疗效构成比不同2)计算检验统计量最小理论频数,故直接将数据带入独立样本列联表检验的公式:3)确定P值,作出统计推断4-85\n第四章定量资料的统计描述查界值表(附表9),得,按水准,不拒绝,差异无统计学意义,尚不能认为两药治疗胃溃疡的疗效构成比不同。(2)若比较两药有效率有无差异,宜选用独立样本四格表的检验。按题意将资料整理成下表形式:表11-8两种药物治疗治疗胃溃疡的疗效组别有效无效合计试验组26834对照组201434合计462268(3)若比较两药治疗胃溃疡的疗效大小,宜选用秩和检验。因为本题中治疗效果呈等级变化,由于检验未考虑“疗效”的等级顺序,因此经检验只能说明各处理效应的构成比是否有差别。而秩和检验考虑了“疗效”的等级顺序,用于比较疗效大小比检验更合理。输出结果以上是问题(1)的SPSS分析过程。问题(2)的SPSS分析过程请参见本章综合分析题的第1题,问题(3)的SPSS分析过程请参见第十二章相关内容。第十二章、秩和检验1.参数检验和非参数检验的区别答:参数检验是以特定的总体分布为前提,对未知总体参数做推断的假设检验方法;非参数检验不以特定的总体分布为前提,也不针对决定总体分布的参数做推断,又称任意分布检验。非参数检验不要求总体的分布类型,适用性广泛;在非参数检验中,一般不直接用样本观测值做分析,统计量的计算基于原数据在样本中的秩次,因此对于符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;对不满足参数检验条件的资料,应选用非参数检验。2.非参数检验的适用范围答:①总体分布不明或未知的资料;②一端或两端有不确实数值的资料;③等级资料;④极度偏态分布的资料。4-85\n第四章定量资料的统计描述3.同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时,以何者为准?理由答:应以资料满足的条件为准。若资料满足参数检验的条件,应以参数检验的结果为准,此时非参数检验的检验效能低于参数检验。若资料不服从正态分布,或者分布情况未知,不能用参数法进行推断,宜采用非参数法对总体分布位置进行假设检验。二、案例辨析题某儿科医生比较甲、乙、丙三种药物治疗小儿腹泻的疗效,将379名小儿腹泻患者随机分为三组,分别采用甲、乙、丙三种药物治疗,结果见表12-1。表12-1三种药物治疗小儿腹泻的疗效比较疗效甲药乙药丙药合计痊愈17551181显效95555155进步64630100无效4535686合计37910142522对于上述资料,该医生采用行×列表检验,得,,故认为三种药物的疗效有差别。该结论是否正确,为什么?二、案例辨析题该结论不正确。本题为单向有序资料,采用检验只能说明各组的效应在分布上有无不同而不能说明各组效应的平均水平有无差别,比较三种药物的疗效应采用Kruskal-WallisH秩和检验。三、最佳选择题1.A2.E3.E4.E5.C6.A7.A8.E9.B四、综合分析题1.解:该资料为定量资料,属于单一样本与总体中位数比较,可采用符号秩和检验。假设检验步骤如下:(1)建立检验假设,确定检验水准:该厂工人的尿氟含量中位数等于2.15:该厂工人的尿氟含量中位数大于2.15(单侧)(2)计算检验统计量计算检验统计量值,见表12-1:表12-1检验统计量值计算结果4-85\n第四章定量资料的统计描述尿氟含量(mmol/L)差值正差值秩次负差值秩次2.150--2.10-0.052.52.200.052.52.12-0.0312.420.2742.520.3752.620.4762.720.5773.000.8583.181.0393.871.72105.673.5211合计-62.5()3.5()(3)确定值,作出推断由,或,查配对比较的符号秩和检验用T界值表(附表10),得单侧。按照=0.05水准,拒绝,接受,差异有统计学意义,可认为该厂工人尿氟含量高于当地正常人。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,workers表示工人尿氟含量,median表示中位数;再点击DataView标签,录入数据(见图12-1,图12-2)。图12-1VariableView窗口内定义要输入的变量4-85\n第四章定量资料的统计描述图12-2DataView窗口内录入数据分析:Analyze→NonparametricTests→2RelatedSamplesTestpairslist框:workermedianTestType:WilcoxonOK输出结果2.解:该资料为等级资料,配对设计,可采用配对设计符号秩和检验。假设检验步骤如下:(1)建立检验假设,确定检验水准:两种方法治疗效果差值的总体中位数为零:两种方法治疗效果差值的总体中位数不为零4-85\n第四章定量资料的统计描述(2)计算检验统计量首先对疗效赋值:好=1,中=0,差=-1,计算检验统计量结果见下表:表12-2检验统计量值计算结果病例号甲法(1)乙法(2)差值(1)-(2)秩次11-12102110-31-121041014.55-10-1-4.560-114.571014.581-12109000-10-1-10-11110-12-1-10-131014.5140-114.5151014.5160-114.5(3)确定值,作出统计推断本例n=11,T=61.5或T=4.5,查配对比较的符号秩和检验用T界值表(附表10)得P<0.01,按=0.05检验水准,拒绝H0,接受H1,差别有统计学意义,可以认为两种方法治疗效果有差异,甲法治疗扁平足的效果优于乙法。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,x1和x2;再点击DataView标签,录入数据(见图12-3,图12-4)。4-85\n第四章定量资料的统计描述图12-3VariableView窗口内定义要输入的变量图12-4DataView窗口内录入数据分析:Analyze→NonparametricTests→2RelatedSamplesTestpairslist框:x1x2TestType:WilcoxonOK输出结果4-85\n第四章定量资料的统计描述3.解:本题采用成组设计两样本比较的Wilcoxon秩和检验。假设检验步骤如下:(1)建立检验假设,确定检验水准:铅作业与非铅作业工人的血铅值的总体分布相同:铅作业与非铅作业工人的血铅值的总体分布不同单侧(2)计算检验统计量表12-3检验统计量值计算结果铅作业工人非铅作业工人血铅含量(1)秩次(2)血铅含量(3)秩次(4)0.8290.241.50.8710.50.241.50.97120.2931.21140.3341.64150.4452.08160.5862.13170.6370.7280.8710.51.0113(3)确定值,作出统计推断由,,,查两样本比较秩和检验用T界值表(附表11),得。按=0.05水准拒绝H0,接受H1,差别有统计学意义,可以认为铅作业工人的血铅值高于非铅作业工人。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,分组(1=铅作业工人,2=非铅作业工人)和血铅含量;再点击DataView标签,录入数据(见图12-5,图4-85\n第四章定量资料的统计描述12-6)。图12-5VariableView窗口内定义要输入的变量图12-6DataView窗口内录入数据分析:Analyze→NonparametricTests→2IndependentSamplesTestVariablelist框:血铅值GroupingVariable框:分组(1,2)TypeTest:Mann-WhitneyUOK输出结果4-85\n第四章定量资料的统计描述4.解:该资料为定量资料,随机区组设计,故采用随机区组设计的秩和检验。假设检验步骤如下:(1)建立检验假设,确定检验水准:治疗前后不同周次的SGPT含量的总体分布相同:治疗前后不同周次的SGPT含量的总体分布不全相同(2)计算检验统计量表12-4治疗前后不同周数SGPT含量的变化患者号治疗前治疗后1周2周3周163(1.5)188(4)138(3)63(1.5)290(1)238(4)220(3)144(2)354(1)300(4)83(2)92(3)445(1)140(3)213(4)100(2)554(2)175(4)150(3)36(1)672(1)300(4)163(3)90(2)764(1)207(4)185(3)87(2)8.5272113.5编秩结果见表12-4,计算检验统计量值:(3)确定值,作出统计推断以配伍组数b=7和处理组数k=4,查M界值表(附表13),=92,本例4-85\n第四章定量资料的统计描述M=199.5>92,P<0.05。按=0.05水准拒绝H0,接受H1,差别有统计学意义,故可以认为治疗前后不同周次的SGPT含量不全相同。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,再点击DataView标签,录入数据(见图12-7,图12-8)。图12-7VariableView窗口内定义要输入的变量图12-8DataView窗口内录入数据分析:Analyze→NonparametricTests→kRelatedSamplesTestVariables框:治疗前、治疗后一周、治疗后两周、治疗后三周TestType:FriedmanOK输出结果4-85\n第四章定量资料的统计描述5.解:该资料为等级资料,属于成组设计,可采用成组设计两样本比较的秩和检验。假设检验步骤如下:(1)建立检验假设,确定检验水准:两种药物治疗心绞痛的疗效总体分布相同:两种药物治疗心绞痛的疗效总体分布不同(2)计算检验统计量表12-5两种药物疗效秩和计算结果疗效人数合计秩次范围平均秩次秩和缓释片组普通片组缓释片组普通片组显效6235971~974930381715有效18314998~14612221963782无效51419147~1651567802184加重347166~172169507676合计88(n2)84(n1)172--6521(T2)8357(T1),,检验统计量。利用正态近似法,计算值。因资料中相同秩次较多,需作校正。4-85\n第四章定量资料的统计描述(3)确定值,作出统计s推断查界值表(附表3)中行,得,按水准,拒绝,接受,差异有统计学意义,可认为缓释片与普通片治疗心绞痛的疗效不同,缓释片的治疗效果好于普通片。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,疗效(1=显效,2=有效,3=无效,4=加重)、分组(1=缓释片,2=普通片)和f(频数);再点击DataView标签,录入数据(见图12-9,图12-10)。图12-9VariableView窗口内定义要输入的变量图12-10DataView窗口内录入数据分析:Data→WeightcasesWeightcasesbyFrequencyVariable框:fOKAnalyze→NonparametricTests→2IndependentSamples4-85\n第四章定量资料的统计描述TestVariablelist框:疗效GroupingVariable框:分组(1,2)TypeTest:Mann-WhitneyUOK输出结果6.解:该资料为等级资料,属于成组设计,可采用成组设计多个样本比较的秩和检验(检验)。假设检验步骤如下:(1)建立检验假设,确定检验水准:三种疗法治疗慢性喉炎疗效的总体分布相同:三种疗法治疗慢性喉炎疗效的总体分布不同(2)计算检验统计量表12-6不同治疗方法的秩和检验计算结果疗效人数合计秩次范围平均秩次秩和A法B法C法A法B法C法治愈18632222401~240120.52241338562651显效722414110241~350295.52127670924137好转26162264351~414382.5994561208415无效24202064415~478446.51071689308930合计3089278478--643502599824133备注:A=综合治疗,B=电子治疗仪,C=消音丸三种不同治疗方法的秩和计算结果见表12-6,计算检验统计量4-85\n第四章定量资料的统计描述值,因相同秩次较多,须校正统计量。(3)确定值,作出统计推断查界值表(附表9),,,得,按水准,拒绝,接受,差异有统计学意义,可认为三种疗法治疗慢性喉炎疗效有差别,综合治疗疗效较好。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,疗效(1=治愈,2=显效,3=好转,4=无效)、分组(1=综合治疗,2=电子治疗仪,3=消音丸)和f(频数);再点击DataView标签,录入数据(见图12-11,图12-12)。图12-11VariableView窗口内定义要输入的变量4-85\n第四章定量资料的统计描述图12-12DataView窗口内录入数据分析:Data→WeightcasesWeightcasesbyFrequencyVariable框:fOKAnalyze→NonparametricTests→kIndependentSamplesTestVariablelist框:疗效GroupingVariable框:分组(1,3)TypeTest:Kruskal-WallisHOK输出结果第十三章双变量关联性分析【习题解析】一、思考题1.双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个变量间是否存在关联性,以及这种关联性的密切程度如何。关联性只反映变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。2.22列联表的关联性分析与两样本率比较的检验的数据形式非常相似,检验的公式以及应用条件也完全相同。但区别在于:两样本率比较的检验是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两总体的率是否相同;而22列联表的关联性分析是从同一个总体中进行随机抽样,对样本中的每个个体考察其两个变量的关系,检验两个分类变量之间是否存在关联性或者说是否独立。3.P值越小,说明越有理由拒绝,犯I型错误的概率越小。相关系数r经假设检验有统计学意义且得到非常小的P值,表示有足够的理由认为两变量总体相关系数4-85\n第四章定量资料的统计描述,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数的置信区间来说明。4.区别:①Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用于不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。②Pearson积矩相关是基于原始数据进行统计分析,而Spearman秩相关是将原始数据进行秩变换后进行统计分析。③Pearson积矩相关是参数检验方法,而Spearman秩相关不以特定的总体分布为前提,为非参数检验的方法。联系:①两种相关系数的取值都介于-1和1之间,无单位,小于0为负相关,大于0为正相关。②用原始数据的秩次来计算Pearson相关系数,得到的即为Spearman秩相关系数。二、案例辨析题该案例是对同一样本的两个分类变量之间的关联性进行分析,检验的计算方式不变,结果仍为84.533,但下结论时最好不要从“不同年龄的AKP酶反应活性不同”演绎到“两变量有关系”,而应为“按=0.05水准,拒绝,可认为年龄与AKP酶反应活性之间有关”。此外,可结合列联系数说明其关联强度,。由于年龄与AKP酶反应活性都是有序分类变量,可考虑进行Spearman秩相关分析,得,单侧,可认为随着年龄的增加,AKP酶反应活也降低。三、最佳选择题1.B  2.C  3.C  4.D  5.A  6.B  7.B  8.C9.D四、综合分析题1.解:(1)由散点图(略)结合两个变量的正态性检验,可进行直线相关分析。由式(13.1)分别算出但需进行假设检验以推断总体上这种相关是否存在。(2)检验相关是否具有统计学意义1)建立检验假设,确定检验水准:,即血浆清蛋白含量及血红蛋白含量之间无直线相关关系:,即血浆清蛋白含量及血红蛋白含量之间有直线相关关系2)计算检验统计量由式(13.4)和式(13.5)得3)确定P值,作出统计推断查t界值表(附表3),得,按=0.05水准,拒绝,接受4-85\n第四章定量资料的统计描述,可以认为该病成年男性患者血浆清蛋白含量与血红蛋白含量呈正相关关系。输出结果血红蛋白含量血浆清蛋白含量(3)结果解释通过对血浆清蛋白和血红蛋白两变量的正态性检验可以看出:两者的P值分别为0.200,0.200,可以认为两变量都服从正态分布,故进行Pearson积矩相关分析。两者相关系数为0.916,,按水准拒绝,可以认为该病成年男性患者血浆清蛋白和血红蛋白两变量呈正相关关系。2.解:此问题属于配对设计列联表的关联性分析。(1)建立检验假设,确定检验水准:甲法和乙法之间互相独立:甲法和乙法之间互相关联(2)计算检验统计量将表13-3中数据代入式(11.5)得:4-85\n第四章定量资料的统计描述(3)确定P值,作出统计推断查界值表(附表9),得,按水准,拒绝,接受,可以认为甲法和乙法之间互相关联。进一步计算Pearson列联系数,输出结果3.解:(1)本题为等级资料,应采用Spearman秩相关分析,并用单侧检验。表13-5404例流行性出血热患者的病情转化情况早期分度x最后定型y合计秩次范围平均秩次pi轻型中型重型轻度982011191~119604-85\n第四章定量资料的统计描述中度513621162120~281200.5重度12120123282~404343合计104158142404秩次范围1~104105~262263~404平均秩次qi52.5183.5333.5将n对实测值与(=1,2,3,…,)分别从小到大编秩(相同秩次取平均值),以表示的秩次,表示的秩次,将、直接替换式(13.1)中的x和y,即用秩次作为分析变量值,直接计算Pearson积矩相关系数。但需进行假设检验以推断总体上这种相关是否存在。(2)对总体秩相关系数作假设检验,本例中=0.891,,采用式(13.4)和式(13.5)作t检验。1)建立检验假设,确定检验水准:,即流行性出血热的早期分度和最后定型无相关关系:,即流行性出血热的早期分度和最后定型有正相关关系单侧2)计算检验统计量由式(13.4)和式(13.5)得3)确定P值,作出统计推断查t界值表(附表3),得,按水准,拒绝,接受,可以认为流行性出血热的早期分度和最后定型存在正相关关系,随着早期分度的增高其最后定型加重。输出结果(3)结果解释:Spearman秩相关系数,,按水准,拒绝,接受,可以认为流行性出血热的早期分度和最后定型存在正相关关系,随着早期分度的增高其最后定型加重。4-85\n第四章定量资料的统计描述第十四章直线回归分析【习题解析】一、思考题1.建立直线回归方程的步骤:①绘制自变量与应变量的散点图,观察是否有可疑的离群值及两变量是否有直线趋势;②利用最小二乘法计算回归系数b及截距a,得到样本回归方程;③对回归系数进行假设检验。在此过程中应当注意考察资料是否满足模型假设条件,即应变量与自变量关系是否为线性、误差是否服从正态分布且方差相等、各观测值是否独立等。通过散点图可以初步考察两变量间是否有直线关系及识别可能的离群值。2.方差分析的基本思想是将总的变异按照设计和需要分解成2个或2个以上的部分,在对回归系数的假设检验中,将应变量y的变异分解为可以用y与x的直线关系解释的部分和不能用y与x的线性关系解释的部分,如果两变量间直线关系确实存在,回归的均方应大于误差的均方,大到何种程度时可以认为具有统计学意义,可根据与的关系构造检验统计量,。在成立的假设下,服从自由度为、的分布,可根据分布曲线下面积确定P值,作出统计推断结论。3.区别:①资料要求上:直线相关要求、服从双变量正态分布;而直线回归要求在给定某个值时服从正态分布,须为可精确测量和严格控制的值。②应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明应变量和自变量在数量上的依存关系则用直线回归分析。③意义上:相关系数说明两变量直线相关的方向与密切程度;回归系数表示每改变一个单位时,的平均改变量。④计算:,。⑤取值范围:,。⑥没有单位,有单位。联系:①对于服从双变量正态分布的同一组数据,既可作直线相关分析又可作直线回归分析,计算出的与符号一致。②对于同一样本,相关系数与回归系数的假设检验等价。③对于服从双变量正态分布的同一组资料,其相关系数r和回归系数b可以相互换算:。④用回归可以解释相关,决定系数。4.有以下方法:方差分析、总体回归系数的t检验、计算总体回归系数的置信区间。若资料服从双变量正态分布,除上述方法外,因为相关系数与回归系数的假设检验等价,还可采用总体相关系数的t检验、计算总体相关系数的置信区间等方法来推断总体回归关系是否成立。二、案例辨析题要进行直线回归分析,首先应绘制自变量与应变量的散点图,观察两变量是否有直线趋势。如图14-1所示,两变量散点呈曲线趋势,不宜进行直线回归分析。4-85\n第四章定量资料的统计描述IgA浓度(μg/ml)火箭电泳高度(mm)图14-1火箭电泳高度与IgA浓度的关系因此直接用原始数据建立直线回归方程得到不正确。对自变量进行对数变换,令,再观察与的散点图,如图14-2所示,可见对数转换后其直线趋势较为明显。IgA浓度的对数值火箭电泳高度(mm)图14-2火箭电泳高度与IgA浓度对数值的关系建立与的直线回归方程得到,对回归系数进行假设检验,得,回归方程有统计学意义。进一步检查两次回归的决定系数,直接以IgA浓度为自变量时=0.911,而以IgA浓度的对数值为自变量时=0.989,拟合效果更好。此案例强调了直线回归分析之前绘制散点图的重要性。三、最佳选择题1.A2.C3.B4.B5.D6.B7.B8.D四、综合分析题1.解:(1)建立肺活量y与胸围x的回归方程1)作两变量的散点图,以胸围为横坐标,肺活量为纵坐标绘制散点图(见SPSS结果),散点呈直线趋势,故可进行直线回归分析。2)由样本数据计算如下统计量,4-85\n第四章定量资料的统计描述3)计算回归系数b及截距a,4)得直线回归方程为:(2)对回归系数进行假设检验方法一:采用方差分析对回归系数进行假设检验1)建立检验假设,确定检验水准:,即胸围与肺活量之间无直线回归关系:,即胸围与肺活量之间有直线回归关系2)计算检验统计量3)确定值,作出统计推断,,查F界值表(附表4),,得,按水准拒绝,回归方程有统计学意义,可以认为女大学生的胸围与肺活量之间有直线回归关系。方法二:采用t检验对回归系数进行假设检验1)建立检验假设,确定检验水准:,即胸围与肺活量之间无直线回归关系:,即胸围与肺活量之间有直线回归关系2)计算检验统计量3)确定P值,作出统计推断,查t界值表(附表3),得,按水准拒绝,回归方程有统计学意义,可认为女大学生的胸围与肺活量之间有直线回归关系。(3)计算总体回归系数的95%置信区间由以上计算结果可知,,,查t界值表得。回归系数的95%置信区间为:4-85\n第四章定量资料的统计描述。2.解:(1)以每日吸烟量为横坐标,DNA加合物含量为纵坐标绘制散点图(见SPSS结果),散点呈直线趋势,不存在离群点,故可进行直线回归分析。(2)建立DNA加合物含量y与每日吸烟量x的回归方程由样本数据计算如下统计量,计算回归系数b及截距a,得直线回归方程为:采用方差分析对回归系数进行假设检验1)建立检验假设,确定检验水准:,即DNA加合物含量与每日吸烟量之间无直线回归关系:,即DNA加合物含量与每日吸烟量之间有直线回归关系2)计算检验统计量3)确定值,作出统计推断,,查F界值表(附表4),得,按水准拒绝,回归方程有统计学意义,可以认为肺癌患者肺组织中DNA加合物含量与每日吸烟量之间有直线回归关系。输出结果DNA加合物含量每日吸烟量4-85\n第四章定量资料的统计描述第十五章生存分析1.简述生存分析中截尾数据的常见原因。①失访:指失去联系。②退出:指死于非研究因素或非处理因素而退出研究。③终止:指设计时规定的研究时限已到而终止观察,但研究对象依然存活。2.简述生存率和生存概率的区别与联系。生存概率表示某单位时段开始时存活个体到该时段结束时仍存活的可能性大小;生存率是指观察对象活过某时刻的概率,实质上是累积生存概率。生存概率是单位时段的概率,生存率是多个时段的累计结果。3.简述死亡率和死亡概率的区别与联系。死亡概率是指在某个单位时段开始时存活的个体在该时段内死亡的可能性大小;死亡率表示所有观察对象在某时刻的平均死亡水平。二者分母不同,死亡率的分母常用其中人口数,而死亡概率则用期初人数。4.生存时间资料能计算均数和标准差吗?如果资料所包含的数据都是完全数据,可以计算均数和标准差;若资料中包含截尾数据,则不可以计算。5.简述两样本比较的生存时间资料不宜采用t检验或x方检验进行分析的理由。因为随访资料具有特殊性,观察对象既有随访时间又有随访结果,随访期间可能出现失访等,生存时间数据不完整,分布类型复杂,因而不能简单的应用t检验或x方检验。第二十章检测手段的效度和信度评价1.简述效度、信度的概念和目的。效度用以反映测量结果与“真值”的接近程度。信度用以反映相同条件下重发测定结果的一致程度。评价效度、信度的目的是评价量表对真实情况反映的准确性、可靠性。2.简述评价效度和信度的常用方法及其特点。评价效度的常用方法有:标准效度分析、内容效度分析、结构效度分析、区分效度分析。评价信度的常用方法有:重复测量法、分半信度法、Cronbach’sa系数法。特点:标准效度分析需要一个“金标准”作为参考;内容效度分析对概念的定义有依赖性;结构效度分析需借助因子分析来完成;区分效度分析通过t4-85\n第四章定量资料的统计描述检验或方差分析可比较不同群组间的差别有无统计学意义。重复测量法需要重复两次或两次以上测量;分半信度法将调查的问题条目分成两半;Cronbach’sa系数法适用于奇偶两半条目方差不等的情况。3.简述分半信度法的优点和不足。优点:分半信度法只在一个时间点上进行;不受记忆效应的影响;在重复测量法中容易出现的误差项之间的相关在分半信度法中不易出现;分半信度法比较经济和简便。不足:将所有的问题条目分为两半的方法有些武断,不同的半分法可能会得到不同的结果。4.简述如何考察测量手段和反应度。①使用测量手段分别在治疗前后或施加干预措施前后对研究对象进行测量,记录治疗前后或施加干预措施前后的测量结果。②使用效应尺度统计量评价测量的反应度。效应尺度=(治疗后得分—治疗前得分)/治疗前后得分的标准差第二十一章医学人口与疾病统计常用指标1.疾病统计中的观察单位“病例”和“病人”有何区别?疾病统计的观察单位可以是病人,也可以是病例。一个人每发生一次疾病就算是一个病例,一个病人可以先后数次患同一种疾病,也可以同时患数种不同的疾病。2.发病率、时点患病率、期间患病率有何区别?发病率表示在一定时期内,可能发生某病的一定人群中新病例出现的频率,其分子是一定期间内的新发病例数。患病率指在某特定时间内总人口中某病新旧病例所占比例,适用于病程较长的疾病或发病时间不易轻易明确的疾病的统计研究,按观察时间的不同可分为时点患病率和期间患病率。时点患病率用于反映在调查或检查时点一定人群中某病的现患情况(包含该病的新、旧病例);期间患病率可用于反映在观察期间内一定人群存在或流行某病的频度,包括观察期间内的新病例数和现患病例数,但资料收集较为困难。3.年龄别死亡概率与年龄别死亡率有何区别?两者间有什么关系?年龄别死亡概率(nqx)是表示一批人在x到x+n岁之间的死亡概率,即同时出生的人群中,刚满x岁的尚存者在今后n年内死亡的可能性。因此,死亡概率的公式定义为:nqx=(x岁到x+n岁之间死亡人数)/活满x岁的人口数而年龄别死亡率(nmx)是表示某年龄别人口在n年内的平均死亡水平,其公式定义为:nmx=(x岁到x+n岁之间死亡人数)/(x岁到x+n岁之间的平均人口数)可见,两者分母不同,当年龄分组为1岁时,即n=1时,qx比mx略小,当年龄分组大于1岁时,即n〉1时,则nqx约比nmx大n倍。死亡率与死亡概率之间可以互相换算,现有许多种由nmx推算nqx的方法,目前常用的计算死亡概率的公式为:nqx=2*n*nmx/(2+n*nmx)4.平均寿命与平均死亡年龄有何区别?平均寿命实际上是同时出生的一批人,以各年龄组死亡人数作为权数计算出来的平均岁数,其大小取决于各年龄组死亡人数的相对水平。用寿命表方法计算的平均寿命的大小,仅取决于年龄别死亡率的高低,两地的平均寿命可以直接比较。但平均死亡年龄的大小,不仅取决于年龄别死亡率的高低,也取决于年龄别人口构成。如用甲、乙两地的平均死亡年龄作比较,即使两地的年龄组死亡率完全相同,若甲地人口中青壮年比重较大,而老年人比重较小,可导致甲地平均死亡年龄较低。显然,这种平均死亡年龄的差别,是由于人口年龄构成不同所致,并不反映两地人口的平均寿命不同。因此,一般情况下,两地的平均死亡年龄不能直接比较,不能把平均死亡年龄当作平均寿命应用。5.某地的平均寿命高,则老年人口占总人口数的比例一定很高,这种说法对吗?这种说法不正确。用寿命表法计算的平均寿命,其大小仅取决于年龄别死亡率的高低,某地的平均寿命高,并不表明老年人口所占的比例高。如果人群的年龄别死亡率降低,尤其是婴幼儿组死亡率降低,该地人群的平均寿命就会增高。4-85\n第四章定量资料的统计描述                     4-85
查看更多

相关文章

您可能关注的文档