- 2022-08-24 发布 |
- 37.5 KB |
- 108页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
卫生统计学题库-
|简答题1.欲研究广东省6岁儿童的身高情况,在广东省随机抽取了200名6岁儿童进行调查,以此为例说明同质、变异、总体与样本这几个概念。答:同质体现在同为广东省、同为6岁儿童,变异体现在200名儿童的身高不同。总体是指所有广东省6岁儿童,样本为200名6岁儿童。2.卫生统计工作中的统计资料主要的来源有哪些?答:①统计报表。②经常性工作记录。③专题调查或实验。3.简述统计工作全过程的四个步骤。答:研究设计、收集资料、整理资料、统计分析。4.试举例说明常见的三种资料类型。答:(1).计量或测量或数值资料,如身高、体重等。(2).计数或分类资料,如性别、血型等。(3).等级资料,如尿蛋白含量-、+、++、+++、…。5.统计学上的变异、变量、变量值是指什么?答:变异:每个观察个体之间的测量指标的差异称为变异。变量:表示个体某种变异特征的量为变量。变量值:对变量的测得值为变量值。6.简述编制频数表的步骤与要点。答:(1)找出最大和最小值,计算极差。(2)确定组距和列出分组计划:第一组应包括最小值;最末组应包括最大值,并闭口。(3)将原始数据整理后,得到各组频数。7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?答:常用描述平均水平的平均数有算术均数、几何均数和中位数。算术均数适合:对称资料,最好是近似正态分布资料。几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。中位数适合:数据非对称分布、分布不清楚或开口资料的情形。8.描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。极差适合:数据分布非对称的情形。四分位数差距适合:数据分布非对称的情形。方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。9.统计描述的基本方法有哪些,各自有何特点?答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。表:详细、精确。图:直观。指标:综合性好。10.简述变异系数的实用时机。答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。11.怎样正确描述一组计量资料?答:(1).根据分布类型选择指标。(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。12.正态分布的主要特征有哪些?\n|答:(1)正态曲线在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。(4)正态曲线下的面积分布有一定规律。13.参考值范围是指什么?答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。“正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。14.简述估计参考值范围的步骤与要点。答:设计:①样本:“正常人”,大样本n≥100。②单侧或双侧。③指标分布类型。计算:①若直方图看来像正态分布,用正态分布法。②若直方图看来不像正态分布,用百分位数法。15.简述正态分布的用途。答:(1)估计频数分布。(2)制定参考值范围。(3)质量控制。(4)统计检验的理论基础。16.简述可信区间在假设检验问题中的作用。答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。故将二者结合起来,才是对假设检验问题的完整分析。17.假设检验时,当P≤0.05,则拒绝H0,理论依据是什么?答:P值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于0.05,也就是说,有了概率保证。18.假设检验中与P的区别何在?答:以t检验为例,与P都可用t分布尾部面积大小表示,所不同的是:值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。P值是由实际样本获得的,是指在H0成立的前提下,出现大于或等于现有检验统计量的概率。19.什么叫两型错误?作统计学假设检验为什么要加以考虑?答:如果H0正确,检验结果却拒绝H0,而接受H1,则犯I型错误,记为α;如果H0错误,检验结果却不拒绝H0,未能接受H1,则犯II型错误,记为β。一般情况下,α越大,β越小;α越小,β越大。如果要同时减少两类错误,则需最大样本含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论时,都要考虑到两型错误。20.配对比较是不是就比成组比较好?什么情况下用配对比较比较好?答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不是说凡是配对试验就一定比成组比较好。实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的个体间相似程度更高。21.t检验有几种?各适用于哪些情况?答:t检验以t分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种:一是样本均数与总体均数比较的t检验。即将一个样本均数X与一已知的总体均数作比较;二是配对资料的t检验。例如治疗前后的比较,或配成对子的实验动物之间的比较。三是两个样本均数比较的t检验;两组的样本量可以不相同。此外尚有相关系数、回归系数的t检验。22.什么叫假设检验?医学研究中常用的假设检验有哪些?\n|答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤是:①提出检验假设0H,确定单双侧与检验水准α;②计算检验统计量;③确定概率P值;④判断结果。在医学研究中常用的显著性检验有u检验、t检验、F检验、2c检验及非参数秩和检验等多种,不论那种检验均以假设成立时得到的统计量的概率来判断。23.通过实例说明为什么假设检验的结论不能绝对化?答:统计的结论为概率性的结论。拒绝H0时,可能犯Ⅰ型错误。不拒绝H0时,可能犯Ⅱ型错误。24.方差分析的检验假设(H0)是什么?答:各总体均数相等25.方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解?答:总的离均差平方和等于各部分离均差平方和之和.总的自由度等于各部分自由度之和.完全随机设计:SS总=SS组内+SS组间V总=V组内+V组间随机区组设计:SS总=SS组内+SS处理组间+SS区组间V总=V组内+V处理组间+V区组间26.三组均数比较时,为什么不能直接作一般的两两均数比较的t检验?答:增大犯第一类错误的可能性.27.两组均数差别的假设检验能否作方差分析,为什么?答:可以.方差分析与t检验关系:k=2时,F=t2,P值相等,即两检验等价。28.方差分析中,组间变异是来源于那些方面的变异?答:该变异除随机原因的影响外,有可能存在处理因素的作用。29.对多组均数作方差分析的主要步骤和结果有那些?答:(1)建立检验假设和检验水准(2)计算统计量F值(列出方差分析表)(3)确定P值和作出推断结论(4)作两两均数之间的比较(若P>0.05则可省略此步骤)30.方差分析的基本思想是什么?答:方差分析的基本思想:就是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。31.为什么不能以构成比代率?答:二者说明的问题不同。构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。32.简述相对数标准化的基本思想。答:基本思想:采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的标准化死亡率具有可比性。33解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?答:率的直接标化法:已知各组的年龄别死亡率pi。间接标化法:已知各组的死亡总数和各年龄组人口数.34.率的直接标化法,与间接标化法有何不同?答:(1)适用条件不同(见第上题);(2)“标准”不同:前者选定一个“标准人口”或“标准人口构成”。后者选定一套“标准年龄别死亡率”。35.应用相对数时应注意哪些问题?答:应用相对数指标的时候要注意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较时应做假设检验。\n|36.常用相对数指标有哪些?它们的意义上有何不同?答:常用相对数指标:率、构成比、比。率又称频率指标或强度相对数。说明某现象发生的频率或强度。常用来表示某一事物发展的趋势或水平及特征。构成比又称构成指标或结构相对数。部分与全部之比,说明某事物内部各组成部分在全体中所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。37.统计学上资料是否“具有可比性”指的是什么?你能举出一些不可比的例子吗?答:除研究因素外,其余重要影响因素应相同或相近。一般观察单位同质,研究方法相同,观察时间相等,以及地区、民族等客观条件一致。例如内科和外科的治愈率就无可比性。38.二项分布、Poisson分布各有哪些特征?答:二项分布和Poisson分布都是离散型分布。二项分布的形状取决于与n的大小:=0.5时,不论n大小,分布对称。≠0.5时,图形呈偏态,随n的增大,逐渐对称。当n足够大,或1-不太小,二项分布B(n,)近似于正态分布N(n,n(1-))。Poisson分布:值愈小分布愈偏,愈大分布趋于对称,当足够大时,分布接近正态分布N(,)。39.简述二项分布、Poisson分布、正态分布的关系。答:当n足够大,或1-不太小时,二项分布近似于正态分布。当n足够大,或1-很小时,二项分布近似于Poisson分布。较大时,Poisson分布近似于正态分布。40.二项分布的应用条件是什么?答:⑴每次试验有且仅有两个互相排斥的结果(A或非A)。⑵每次试验中,发生A的概率相同,均为π。⑶各次试验独立,即n次观察结果相互独立。41.检验的用途有哪些?答:主要适用于计数资料,(1)两个及两个以上的率或构成比的比较(2)交叉分类资料两属性间的关联性检验(3)频数分布的拟合优度。42.以下表资料说明χ2检验的基本思想。(不用计算)答:基本思想:假设观察值来自理论分布,则观察值与理论值就不会差别太大,如果差距太大,则怀疑H0是否成立。完全符合则为0或特别小,x2值越小,越支持H0。43.四格表资料检验的条件有哪些?答:T<1或n<40确切概率法n≥40但有1£T<5要校正n≥40并且T>5不必校正44.某病的发病率对全国人口来说是8.72%,现在某县回顾一年,抽样调查了120人,有16人发病,如果要考察该县的发病率是否高于全国,请问可不可以对该份资料作检验,你认为应该用什么方法?答:不能,用单样本率比较的u检验。45.请指出非参数检验与参数检验相比的优、缺点。答:非参数检验适用范围广,收集资料、统计分析也比较方便。但检验效率没有参数检验高,犯第二类错误的概率较大。46.简述参数检验与非参数检验的定义及两者的区别。\n|答:参数统计是总体的分布类型是已知的,对其中某些未知的参数进行估计和检验的统计方法。特点:依赖于特定的分布类型,比较的是参数。非参数统计是不依赖于总体分布具体形式的统计方法。特点:不受总体参数的影响,比较的是分布或分布位置,而不是参数。47.简述配对比较秩和检验的编秩方法。答:求差值,差值编秩;差值0删去,相同值取平均秩48.配对设计差值的符号秩和检验步骤。答:(1)H0:差值的总体中位数Md=0;H1:Md≠0;=0.05(2)求差值(3)编秩:依差值的绝对值从小到大秩次。绝对值相等者,若符号不同取平均秩次;零差值不参与编秩,同时样本数-1;将差值的正负标在秩次之前。(4)求秩和确定检验统计量:分别求正、负秩次之和,任取T+或T—作检验统计量T,(5)确定P值,作推断结论。49.两组比较的秩和检验的编秩方法。答:将两样本混合编秩次。若有“相同数据”,处于不同组,便取平均秩次;处于同一组,不必取平均秩次。50.对同一资料,又出自同一研究目的,用参数检验和非参检验结果不一致时,宜以何为准?答:当资料满足参数检验方法的条件时,应使用参数检验方法;当资料不满足参数检验方法的条件时,必须采用非参数检验方法。51.非参数检验的适用范围。答:①各种资料的初步分析;②等级资料:某种标志不便准确测定,只能以严重程度、优劣等级、成效大小、名次先后或综合判断等方式定出次序;③资料分布类型不能确定或偏态分布;④综合分析同质性较差的资料,如不同地点、不同年份的某种实验结果;⑤组内个别数据偏离过大,或各组内相差悬殊。52.两个变量之间的相关系数等于0,是否说明这两个变量之间没有关系?答:0相关不等于无关,因为可能无直线关系但有曲线关系53.直线回归及其回归方程有何用途?答:(一)描述Y对X的依存关系。(二)预测(forecast):由自变量X估算应变量Y。Y波动范围可按求个体Y值容许区间方法计算。(三)统计控制:控制Y估算X,逆估计。通过控制自变量X的取值,满足应变量Y在一定范围内波动。54.简述作直线相关与回归分析时应注意的事项。答:(1)回归方程要有实际意义。(2).分析前绘制散点图,考察是否有直线趋势或异常点。(3).直线回归的适用范围一般以自变量的取值范围为限。没有充分理由X的取值不要外延。55.简述直线回归与直线相关的区别与联系。答:(一)、区别(1)资料要求不同:回归可以有两种情况:①Y正态随机,X为选定变量----Ⅰ型回归;②X、Y服从双变量正态分布----Ⅱ型回归。相关:X、Y服从双变量正态分布。(2)应用不同:回归是由一个变量值推算另一个变量的数值,说明依存变化的数量关系。相关是只说明两个变量间是否有关联。\n|(3)意义不同:b表示X每增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间关系的密切程度和方向。(4)取值范围不同:-∞<b<+∞;-1<a<+1。(5)回归系数有单位,相关系数无单位。(二)、关系(1)方向一致:对一组数据若同时计算r与b,其正负号一致。(2)假设检验等价:对同一样本,tr=tb,P值相等。(3)用回归解释相关:决定系数反映Y的总变异中有多大可能可由X来解释。越接近1,回归的效果越好。56.简述直线相关系数意义。答:相关系数描述线性相关的密切程度与方向。相关系数没有单位,-1≤r≤1。r>0表示正相关;r<0表示负相关;|r|=1表示完全相关;r=0表示零相关。57.经检验认为回归方程有意义,表明两变量间存在因果关系,对否?答:不一定。应联系专业知识考察变量间关系。58.用什么方法考察回归直线图示是否正确?答:直线经过(X,Y)点。直线与纵轴交点的纵坐标为截距a。直线应在自变量X的实测范围内。59.依次写出箱式图中涉及到的各个取值。由大到小的次序为:极大值、75P、中位数、25P和极小值。60.直方图中各矩形的高度等于频数(或频率),对吗?答:对于各组距相等的情形,该说法是对的。若某些组段的组距与多数组段所取组距不同时,例如前者是后者的k倍,则该不等距组段的高度为频数(或频率)除以k。确切地说,组段对应的面积等于频数(或频率)。61.统计表的列表原则是什么?答:一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。62.线图和半对数线图的主要区别是什么?答:线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋势;半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增长或减少速度。63.某医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三个基本要素是什么?答:降压药物为处理因素,高血压患者为受试对象,血压(如舒张压)的改变量为实验效应。64.样本含量估计的要素有哪些?答:(1)根据研究目的,建立检验假设(2)定出检验水准,常取0.05=(3)提出所期望的检验效能(4)必须知道由样本推断总体的一些信息,例如,对于两总体均数的比较,需知道两均数间的差值和总体标准差65.什么是盲法?举例说明盲法在临床试验中的重要性。答:为了有效减少实验观察过程中的偏倚,使患者(甚至包括研究者及其他参与者)不知道处理措施的内容,称为盲法。可有单盲法、双盲法和三盲法。例如研究某抗神经衰弱药物的疗效,当患者知晓自己所接受的处理措施时,对疗效的评价往往会受心理因素作用而不够客观。采用盲法,则可以避免疗效测量中可能产生的偏倚。66.实验设计应当遵循哪些基本的原则?随机化原则、对照的原则及重复的原则。67.各举一个配对设计和成组设计的例子。在评价某降压药物的降压作用时,可以采用以下两种方案。\n|配对设计:按体重和舒张压相近、性别和窝别相同将40只大鼠分为20对,每对中随机地取其一接受A药,另一只接受B药。服用一个疗程后,比较两组血压改变量的区别,从而考察药物A和B的疗效。成组设计:将体重和舒张压相近、性别相同的40只大鼠随机地分为两组,取其中一组接受A药,另一组接受B药。服用一个疗程后,比较两组血压改变量的平均水平的区别,从而考察药物A和B的疗效。68.按实验设计的要求和原则,对下列设计加以分析:某医师研究一种新药对慢性支气管炎的近期疗效,以门诊30名病人作为观察对象,以30名住院病人服用传统药物作为对照,经过3周治疗后,统计结果发现新药症状近控率高于传统药物近控率。答:门诊病人和住院病人的病情轻重不均衡。假设门诊病人的病情较轻,则近控率较高可能是由于此原因,从而夸大了新药的作用。建议门诊病人中随机抽取一半接受新药,另一半接受传统药物。住院病人也随机分为两组接受这两种处理。然后分别考察两种药物对不同组别的疗效。69.某研究者欲将15只大白鼠随机分配到甲、乙、丙三组,每组5例。试由查出的随机数字写出分组结果,并简述分组方法。答:动物号:123456789101112131415随机数字:40910145162123111378随机数字对应为0~4,5~9,10~14的个体分别分入甲、乙、丙三组,结果动物号1、2、7、9、11者分入甲组;动物号3、6、8、14、15者分入乙组;动物号4、5、10、12、13者分入丙组70.调查研究的基本抽样方法有那些?按抽样误差由大到小的顺序写出。答:整群抽样、单纯随机抽样、系统抽样和分层抽样。71.举例说明开放式问题和封闭式问题的特点。答:开放式问题未加任何限制,封闭式问题则提供了若干备选项。例如在调查首次妊娠年龄时,可以采用开放式问题:请填写您首次妊娠的具体年龄;也可以采用封闭式问题:您首次妊娠的年龄是:①<20岁②<25岁③<30岁④30及以上。72.常用的获得原始资料的调查方式有哪些?应答率最低和所得资料最为可靠的方式分别是哪种?答:直接观察法、直接采访法和间接采访法。应答率最低的方法是间接采访法,而直接观察法所得资料最为可靠。73.由无限总体抽样和有限总体抽样时所需的样本含量有何不同?答:由无限总体抽样时所需的样本含量大于从有限总体抽样。74.根据调查范围可以将调查方法分为哪些?答:普查(全面调查)、抽样调查和典型调查(案例调查)。75.简述常用的四种随机抽样方法。答:(1)完全随机抽样,即总体中每一个体有同等的机会被抽中或分配到某一组,如抽签或随机数字表法;(2)系统抽样或等距抽样或机械抽样,首先将总体中的个体按某种顺序编码并分为n个组段,间隔为k,接着用完全随机方法在第一组段中抽出一个号码,往后各组依次递加k个号码的个体被抽中;(3)整群抽样,首先将总体分为K群,而后从中抽取k个群体作为样本;(4)分层随机抽样,首先将总体按个体特征分为K层,而后分别从每一层中随机抽样。76.某市卫生防疫站为验证复方制剂A(桉叶、板兰根、防风、白芷和葛根等)预防流感的效果,取城区第一幼儿园的儿童作研究对象,小班儿童为实验组服用制剂A,大班儿童为空白对照组,不服用任何制剂,结果认为制剂A无预防流感的作用。试评述该结果。答:该实验结果是不可靠的,理由是:(1)流感对全体人群都敏感,仅选择儿童作研究对象是不够的,对成人也应进行研究。\n|(2)实验组和对照组缺乏可比性,事实上,大班儿童的免疫力及身体素质状况比小班好,即两组的非处理因素不均衡;(3)如用该幼儿园作研究对象,应分别将大班和小班分为两半放到实验组和对照组。77.何谓人口老龄化?请简述其影响因素。答1:人口老龄化是指老年人口(65岁及以上)在人口中所占的比重升高的现象。在没有迁移的情况下,人口老龄化的进程主要受生育率和死亡率两种因素的影响。生育率下降,使低年龄人口的比重降低,高年龄人口的比重相应增加;死亡率(主要是中老年人口的死亡率)降低,使寿命延长,老年人口比重增加。一般来说,人口老龄化的速度和程度主要取决于生育率的下降速度。当生育率水平下降达到很低的水平且很难再有较大程度的降低时,中老年人口死亡率的降低对人口老龄化的影响才比较明显。78.发病率、时点患病率、时期患病率的区别。答:(1)发病率是指观察期内,可能发生某病的人群中新发病例的频率,其观察期多为年、月、日等,急性常见病多计算发病率。(2)时点患病率反映在检查或调查时点一定人群中某病的现患情况(包括该病的新旧病例数)。观察时点在理论上是无长度的,但实际上观察时间不宜过长,一般不超过个月。(3)时期患病率反映在观察期间一定人群中存在或流行某病的频度,包括观察期间的新发病例和现患病例数,为慢性病的统计指标。79.疾病统计的观察单位“病人”和“病例”的区别。答:(1)一个人每次患病都可作为一个病例。以病例为单位的疾病统计,可研究居民各种疾病的频度、疾病的种类及疾病的变动,以获得居民患病的基本规律。(2)病人是指一个有病的人。在观察期间内,观察对象患有疾病即算作一个病人,不管其患病的种类及患病次数的多少。以病人为单位的疾病统计,在一定程度上反映居民的患病频度,可找出具体的患病人群,便于开展对病人个人的防治工作。80.病死率和死亡率的区别。答:(1)某病病死率表示在规定的观察期内,某病患者中因该病而死亡的频率。它是反映疾病的严重程度的指标。在用病死率进行比较时应注意病情轻重等内部构成不同的影响。计算公式为:观察期内因某病死亡的人数某病病死率=同期该病患者数×1000‰(2)某病死亡率表示在规定的观察期内,人群中因某病而死亡的频率。它可以反映不同地区或年代某种疾病的死亡水平。计算公式为:观察期内因某病死亡的人数某病死亡率=同期平均人口数×1000‰81.简述婴儿死亡率指标的实际意义答:婴儿死亡率指某地某年不满一周岁婴儿的死亡数与同期活产总数的比值。婴儿死亡率=某年不满周岁婴儿死亡数×1000‰/同期活产数婴儿死亡率的高低对平均寿命有重要的影响,它是反映社会卫生状况和婴儿保健工作的重要指标,也是死亡统计指标中较为敏感的指标。婴儿死亡率不受年龄的影响,不同国家或地区之间可以相互比较。82.平均寿命与平均死亡年龄的区别?答:平均寿命是指0岁组预期寿命,仅取决于年龄组死亡率的高低,两地的平均寿命可直接进行比较。平均死亡年龄是指死者死亡时年龄的算术均数,不仅取决于年龄组死亡率的高低,也取决于年龄别人口构成,两地的平均死亡年龄不能直接进行比较。83.简略去死因寿命表的作用。答:研究某种死因对居民死亡的影响,可编制去死因寿命表。其基本思想是,假使消除了某种死因,则原死于该原因的人不死于该原因,寿命就会有所延长。显然,如果消除了对生命威胁大的死因,寿命就会延长更多。去死因寿命表的优点是:①\n|以某死因耗损的预期寿命和尚存人数合理地说明了该死因对人群生命的影响程度。②去死因寿命表的指标既能综合说明某死因对全人口的作用,又能分别说明某死因对各年龄组人口的作用。③去死因寿命表的指标同样不受人口年龄构成的影响,便于相互比较。84.简述寿命表中的几个主要指标。答:寿命的各项指标Xl、Xnd、Xnq、Xe,都用来评价居民的健康水平。其中最主要的指标是平均预期寿命。寿命表尚存人数:反映在一定年龄组死亡率基础上,一代人口的生存过程,一般用线图表示。尚存人数随年龄增加而减少。寿命表死亡人数:反映在一定年龄组死亡基础上,一代人口的死亡过程。一般用直方图表示。横坐标为年龄,纵坐标为死亡人数。寿命表死亡概率:取决于各年龄组死亡率,一般用半对数线图表示。预期寿命:预期寿命是评价居民健康状况的主要指标。一般用线图表示。85.简述寿命表的用途。答:寿命表主要应用于:(1)评价国家或地区居民健康水平。(2)利用寿命表研究人口再生产情况。(3)利用寿命表指标进行人口预测。(4)利用寿命表方法研究人群的生育、发育及疾病的发展规律。86.全死因寿命表可分为哪几类,哪类更常用。答:寿命表是根据某地特定人群的年龄组死亡率编制而成的。一般可分为定群寿命表和现时寿命表。由于人的生命周期很长,用定群寿命表的方法去研究人群的生命过程,不仅随访人数要很多,而且随访时间要数十年。因此,在编制寿命表时,一般不使用定群寿命表,而是使用现时寿命表。现时寿命表是假定同时出生的一代人(一般为10万),按照某年(或某一时期内)特定人群的年龄组死亡率先后死去,直至死完为止,用寿命表方法计算出这一代人在不同年龄组的“死亡概率”、“死亡人数”、刚满某年龄时的“尚存人数”及其“预期寿命”等指标。这些指标不受人群年龄构成的影响,不同的地区可以相互比较。根据年龄分组方法的不同,现时寿命表可分为完全寿命表及简略寿命表两种。完全寿命表年龄分组的组距是1岁,而简略寿命表习惯上将年龄组距定为5岁。因为婴儿死亡率对寿命表的影响相当大,所以简略寿命表也将第1个5岁年龄组拆分为组距为1岁的“0~”岁组和组距为4岁的“1~”岁组,从5岁开始年龄组距才为5岁。87.在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理?答:当作截尾数据处理。88.生存分析可用于发病资料的分析吗?请举例说明。答:可用于慢性病的发病资料分析。89.生存时间能计算平均数、标准差吗?答:.因为这类资料常包含截尾数据,并且常为非正态分布,所以一般不可以计算均数和标准差,应计算半数生存时间。90.Cox回归可估计参数,故属于参数方法?答.属于半参数模型91.简述生存资料的基本要求。答:生存资料的基本要求为:①样本由随机抽样方法获得,并有足够数量;②死亡例数不能太少;③截尾比例不能太大;④生存时间尽可能精确到天数;⑤缺项要尽量补齐。医学统计学第一章绪论一、名词解释:1.同质与变异2.总体和样本3.参数和统计量4.抽样误差5.概率6.计量资料7.计数资料8.等级资料\n|二、是非题:1.用定性的方法得到的资料称作数值变量资料,亦称作计数资料。()2.观察某人群的血型,以人为观察单位,结果分为A型、B型、AB型和O型,是有序分类资料。()3.分类变量或称定量变量,其变量值是定量的,表现为数值大小,一般有度量衡单位,亦称计量资料。()4.调查某地10岁女孩的身体发育状况,以人为观察单位,测得每个人的身高(cm)、体重(kg)、血压(mmHg),此资料称为多项分类变量资料。()5.用定量的方法测定观察单位某个量的大小的资料,称数值变量资料。()7.等级分组资料兼有计数与计量资料的性质。()8.将观察单位按某一属性的不同程度分组计数,所得各组的观察单位称为计数资料。()三、单选题:1.计量资料﹑计数资料和等级分组资料的关系有A.计量资料兼有计数资料和等级分组资料的一些性质B.计数资料兼有计量资料和等级分组资料的一些性质C.等级分组资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.等级分组资料又可叫半计数资料2.为了由样本推断总体,样本应该是A.总体中任意一部分B.总体中的典型部分C总体中有意义的一部分D.总体中有价值的一部分E.总体中有代表性的一部分3.统计学上所说的系统误差﹑测量误差和抽样误差三种误差,在实际工作中有A.三种误差都不可避免B.系统误差和测量误差不可避免C.系统误差和抽样误差不可避免D.测量误差和抽样误差不可避免E.三种误差都可避免4.抽样误差指的是A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.总体参数值和总体参数值之差5.医学统计工作的基本步骤是A.调查资料﹑校对资料﹑整理资料B.调查资料﹑归纳资料﹑整理资料C.收集资料﹑校对资料﹑整理资料D.收集资料﹑整理资料﹑分析资料E.收集资料﹑校对资料﹑归纳资料6.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体答案名词解释:(1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。(2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。\n|(1)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。(2)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。(3)概率:是描述随机事件发生的可能性大小的数值,用p表示(4)计量资料:由一群个体的变量值构成的资料称为计量资料。(5)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。(6)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。是非题:1.×2.×3.×4.×5.√6.√7.×单选题:1.C2.E3.D4.C5.D6.B第二章计量资料统计描述及正态分布一、名词解释:平均数标准差标准正态分布参考值范围二、填空题:1、医学统计资料按研究指标的性质分为________、________和_________三类。2、统计工作的全过程按顺序可分为四个步骤,即_________、_________、________和__________。3、正态分布用N(μ,2)表示,为了应用方便,常对变量X作___________变换,使μ=0,=1,则正态分布转变为___________分布,用___________表示。4、正态曲线下面积的分布有一定规律,理论上___________、___________和___________,区间的面积(观察单位数)各占总面积(总观察单位数)的___________、___________和___________可用于估计医学参考值范围和质量控制方面。5、标准正态曲线下,区间(-1.96,0)的面积占总面积的___________%。6、用___________和___________可全面描述正态分布资料的特征。7、为了说明离散程度应选用变异指标,常用的变异指标有___________、___________、___________和___________。8、___________范围内的面积占正态曲线下总面积的95%。9、样本值中最大值与最小值之差,称为这个样本的___________记___________。10、通常把α称为___________或___________而将u>u1-(α/2)的区域称作拒绝域,α一般取___________有时___________或___________。11、正常值范围的意义是指绝大多数正常人的变量均在此范围中,这个绝大多数习惯上包括正常人的_______、_______、_______、_______而最常用的是_______。12、对于正态分布的资料,在μ±1.96,μ±2.58区间内的变量值,其出现的概率分别为___________和___________。13、频数分布的两个重要特征是指___________和___________,可全面地分析所研究的事物。14、偏态分布资料宜计算___________以表示其平均水平。15、平均数的计算和应用必须具备___________、___________,否则平均数是没有意义。\n|1、正态分布有以下的特征①正态曲线在横轴上方,且_________所处在最高。②正态分布以_________为中心左右对称。③正态分布有两个参数即_________和_________。④正态分布的面积有一定的__________。17.描述一组正态分布资料的变异度,以__________指标为好。18.变异系数CV常用于比较_________或_________的两组或多组资料的变异程度一、是非题:1.平均数是一类用于推断数值变量及资料平均水平(或集中趋势)的指标。()2.反映频数分布的两个重要特征是集中趋势与散离趋势。()3.标准差是最常用的变异指标,它既可以用于正态资料亦可用于非正态资料。()4.计算中位数时要求组距相等。()5.计量单位相同,均数相差不大时,可使用变异系数反应两组变量值的离散程度。()6.变量值之间呈倍数或等比关系的数据,宜用几何均数表示其平均水平。()7.百分位数应用中提到,分布中部的百分位数相当稳定具有较好的代表性,但靠近两端的百分位数只在样本例数足够多时才比较稳定。()8.为了解数值变量分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征以及分布类型。()9.如果少数几个数据比大部分数据大几百倍一般就不宜计算均数()10.原始数据有零,就不能直接计算几何均数()11.正态分布是以均数为中心的钟型分布()12.高峰位于中央,两侧逐渐下降并完全对称的频数分布即为正态分布()13.理论上,对于正态分布资料的P5-P95和±1.96S范围内都包含有95%的变量值。()14.制定正常值范围应选足够数量正常人作为调查对象,所谓正常人就是排影响被研究指标的各种疾病的人()15.描述频数分布离散程度的最常用的指标是变异系数和标准差()16.正态分布用N(0,1)表示,为了应用方便,常对变量X作u=(x-µ)/变换,使μ=0=1则将正态分布转换为标准正态分布用N(μ,2)表示()17.只要单位相同,用标准差和用变异系数来比较两组变量值的离散度结论是完全一致的()18.四分位数间距Q=P75~P25,常用于描述近似正态分布资料的离散程度()19.频数表和频数分布图用以推断变量值的分布特征和揭示变量值的分布规律()20.制定正常值范围,如取95%界限,是指95%的正常人本项指标在此范围()21.指标无论过高或过低均属异常,可用来计算正常值范围()二、单选题:1.以年龄(岁)为例,最常用的组段表示法是A.0─5,5─10,10─15,15─20……;B.0─ ,5─ ,10─ ,15─ ……;C.0─4,5─9,10─14,15─19……;D.─5,─10,─15,─20……;E.以上都不是;2.以下指标中____可用来描述计量资料离散程度。\n| A.算术平均数 B.几何均数 C.中位数 D.标准差 E.第50百分位数3.偏态分布资料宜用___描述其分布的集中趋势。 A.算术平均数 B.标准差 C.中位数 D.四分位数间距 E.方差4.用均数和标准差可全面描述___资料的分布特征。 A.正态分布 B.正偏态分布 C.负偏态分布 D.对称分布 E.任何计量资料分布5.____可用于比较身高与体重的变异度 A.方差 B.标准差 C.变异系数 D.全距 E.四分位数间距6.各观察值均加(或减)同一个数后,_______。A.均数不变,标准差不一定变B.均数不变,标准差变C.均数不变,标准差也不变D.均数变,标准差不变E.均数变,标准差也变7.各观察值同乘以一个不等于0的常数后,______不变。A.均数B.标准差C.几何均数D.中位数E.变异系数8.____的资料,均数等于中位数。A.对称B.正偏态C.负偏态D.对数正态9.最小组段无下限或最大组段无上限的频数分布表资料,可用____描述其集中趋势。A.均数B.标准差 C.中位数D.四分位数间距 E.几何均数10.描述一组偏态分布资料的变异度,以______指标较好.A.全距(R)B.标准差(s)C.变异系数(CV)D.四分位数间距(Qu-QL)11.计算某抗体滴度的平均水平,一般选择A.算术均数 B.几何均数C.中位数 D.标准差E.标准误12.计算某病的平均潜伏期,一般选择A.算术均数 B.几何均数C.中位数 D.标准差E.变异系数13.表示正态分布资料个体变量值的变异程度的常用指标是A.均数B.全距C.标准差 D.标准误E.变异系数14.平均数是表示A.性质相同的变量值的相对水平B.性质相同的变量值的实际水平C.性质相同的变量值的平均水平D.性质不同的变量值的平均水平E.性质相同的变量值的变异程度15.用变异系数比较变异程度,适于\n|A两组观察值单位不同,或两均数相差较大B两组观察值单位相同,标准误相差较大C两均数相差较大,标准误相差较大D以上都不是16.正偏态资料计算平均水平,首选A.算术均数B.几何均数C.中位数D.加权均数E.百分位数17.均数与标准差的关系是A.均数越大,标准差越大B.均数越大,标准差越小C.标准差越大,均数代表性越好D.标准差越小,均数代表性越差E.标准差越小,均数代表性越好18.有8名某传染病患者,潜伏期分别为:2,1,21,7,12,1,4,13天。其平均潜伏期为天。A.4B.5.5C.7D.12E.9.519.五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种指标比较两组数据变异大小为宜A.SB.SC.全距D.CVE.自由度20.调查50例链球菌咽峡炎患者潜伏期如下,为计算均数平均数,应首选潜伏期12—24—36—48—60—72—84—96—108—120合计病例数1711117542250A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以21.102名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用抗体滴度1﹕1001﹕2001﹕4001﹕8001﹕1600合计人数719342913102A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以22.对于均数μ﹑标准差为σ的正态分布,95%的变量值分布范围为A.μ-σ~μ+σB.μ-1.96σ~μ+1.96σC.0~μ+1.96σD.-∞~μ+1.96σE.μ-2.58σ~μ+2.58σ23.若u服从均数为0,标准差为1的正态分布,则A.u≥2.58的P=0.01B.u≥2.58的P=0.005C.-2.58<u<2.58的P=0.01D.u≥2.58的P=0.05E.u≥2.58的P=0.02524.正态分布有两个参数μ与σ,______曲线的形状越扁平。A.μ越大B.μ越小C.σ越大D.σ越小E.μ与σ越接近025.对数正态分布是一种_____分布A.正态B.近似正态C.左偏态D.右偏态E.对称26.正态分布曲线下,横轴上,从均数μ到+∞的面积占总面积的比例为______\n|A.97.5%B.95%C.50%D.5%E.不能确定(与标准差的大小有关)27.标准正态分布的均数与标准差分别为_____A.0与1B.1与0C.0与0D.1与1E.1.96与2.5828.若X服从以μ,σ²为均数和方差的正态分布,则X的第95百分位数即___A.μ-1.64σB.μ-1.96σC.μ+σD.μ+1.64σE.μ+1.96σ29.若正常成人的血铅含量X服从近似对数正态分布,则可用公式______制定95%正常值范围。(其中:Y=logX)A.<+1.96SB.<+1.64SC.<+1.64SYD.<log-1(+1.64SY)E.<log-1(+1.96SY)30.正态分布曲线下,横轴上,从均数μ到μ+1.96倍标准差的面积为____A.95%B.45%C.97.5%D.47.5%31.标准正态分布曲线下中间90%的面积所对应的横轴尺度u的范围是___A.–1.645到+1.645B.-∞到+1.645C.∞到+1.282D.–1.282到+1.28232.设X符合均数为μ﹑标准差为σ的正态分布,作u=的变量变换则A.符合正态分布,且均数不变B.符合正态分布,且标准差不变C.u符合正态分布,且均数和标准差都不变D.u不符合正态分布E.u符合正态分布,但均数和标准差都改变33.正态分布是以A.标准差为中心的频数分布B.t值为中心的频数分布C.组距为中心的频数分布D.均数为中心的频数分布E.观察例数为中心的频数分布34.用变异系数比较变异程度,适于A两组观察值单位不同,或两均数相差较大B两组观察值单位相同,标准误相差较大C两均数相差较大,标准误相差较大D以上都不是35.决定个体值正态分布的参数是A.变异系数B.全距C.标准误D.标准差E.以上都不是36.正态分布是以A.标准差为中心的频数分布B.t值为中心的频数分布C.组距为中心的频数分布D.均数为中心的频数分布E.观察例数为中心的频数分布37.正偏态资料计算平均水平,首选A.算术均数B.几何均数C.中位数D.加权均数E.百分位数38.均数与标准差的关系是A.均数越大,标准差越大B.均数越大,标准差越小C.标准差越大,均数代表性越好D.标准差越小,均数代表性越差E.标准差越小,均数代表性越好\n|39.计量资料的标准差A.不会比均数大B.不会比均数小C.要比标准误小D.不决定于均数E.以上都不对40.有9名某传染病人,潜伏期分别为(天):2,1,21,7,12,1,4,13,24其平均潜伏期为A.4B.5.5C.7D.12E.9.541.表示变异程度的指标中A.标准差越大,变异程度越小B.标准差越小,变异程度越大C.变异系数越大,变异程度越大D.变异系数越大,变异程度越小E.全距越大,变异程度越小42.正态资料的变异系数应A.一定>1B.一定<1C.可能>1,也可能<1D.一定<标准差E.一定>标准差43.五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种方式说明两组数据变异大小A.SB.SC.全距D.CVE.自由度44.调查50例链球菌咽峡炎患者潜伏期如下潜伏期12—24—36—48—60—72—84—96—108—120合计病例数1711117542250求平均潜伏期,应首选A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以45.102名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用─────────────────────────────────────抗体滴度1﹕1001﹕2001﹕4001﹕8001﹕1600合计人数719342913102A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以一、问答题:1.均数﹑几何均数和中位数的适用范围有何异同?2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?3.同一资料的标准差是否一定小于均数?4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?6.医学中参考值范围的含义是什么?确定的原则和方法是什么?7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?二、计算题1.某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.704.073.504.694.384.896.255.324.504.633.614.444.43\n|4.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05(1)编制频数分布表并绘制直方图,简述其分布特征。(2)计算均数、标准s、变异系数CV。(3)计算中位数M,并与均数比较,(4)计算P2.5及P97.5并与±1.96s的范围比较。(5)分别考察1S、1.9S6、2.58S范围内的实际频数与理论分布是否基本一致?(6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,还有百分之几的人血清总胆固醇值比他高?2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑制抗体滴度资料如表。表2-1:平均滴度计算表抗体滴度人数f1:821:1661:3251:64101:12841:25621:5121合计30(1)试计算其平均滴度。(2)有人发现本例用抗体滴度稀释倍数和直接用滴度倒数算得几何标准差的对数值相同,为什么?3.50例链球菌咽峡炎患者的潜伏期如表,说明用均数、中位数或几何均数,何者\n|的代表性较好?并作计算。表2-2:50例链球菌咽峡炎患者的潜伏期潜伏期(小时)病例数f12~124~736~1148~1160~772~584~496~2108~1202合计504.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量如表:表2-3:238人发汞含量频数计算表发汞值人数f(μmol/kg)1.5~203.5~665.5~607.5~489.5~1811.5~1613.5~615.5~117.5~019.5~21.53合计238(1).说明此频数分布的特征,(2).计算均数和中位数,何者较大?为什么?何者用于说明本资料的集中位置较合适?(3).选用何种指标描述其离散程度较好?(4).估计该地居民发汞值的95%参考值范围\n|答案名词解释:1.平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2.标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3.标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。4.参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题:1.计量,计数,等级2.设计,收集资料,分析资料,整理资料。3.(变量变换)标准正态分布、0、14.68.27%95%99%5.47.5%6.均数、标准差7.全距、方差、标准差、变异系数8.9.全距R10.检验水准、显著性水准、0.05、0.01(0.1)11.80%90%95%99%95%12.95%99%13.集中趋势、离散趋势14.中位数15.同质基础,合理分组16.均数,均数,μ,σ,规律性17.标准差18.单位不同,均数相差较大是非题:1.×2.√3.×4.×5.×6.√7.√8.√9.√10.√11.√12.√13.×14.√15.√16.×17.×18.×19.√20.√21.√单选题:1.B2.D3.C4.A5.C6.D7.E8.A9.C10.D11.B12.C13.C14.C15.A16.C17.E18.C19.D20.C21.B22.B23.E24.C25.A26.C27.B28.D29.D30.D31.A32.E33.D34.A35.D36.D37.C38.E39.D40.B41.C42.B43.D44.C45.B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。不同点:表2-5.表2-5均数,几何均数和中位数的相异点\n|平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两察值水平端出现不确定值2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?答:1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。(2)计算:中位数和百分位数均可用同一公式计算,即Px=L+(i/fx)(n·x%-ΣfL)可根据研究目的选择不同的百分位数代入公式进行计算分析。(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。3.同一资料的标准差是否一定小于均数?答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。变异大,标准差就大,有时比均数大;变异小,标准差小。4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?(1)样本含量的大小,样本含量越大,标准差越稳定。(2)分组的多少(3)分布形状的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)研究总体中观察值之间变异程度大小5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?(1)概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正态分布用N(µ,σ2)表示,标准正态分布用N(0,1)表示,对数正态分布N(μlgX,σ2lgX)表示。(2)应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。6.医学中参考值范围的含义是什么?确定的原则和方法是什么?含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。(2)原则:①抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。②对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。③判定是否要分组(如男女、年龄、地区等)确定正常值范围。④决定取双侧范围值还是单侧范围值。\n|⑤选择适当的百分范围⑥确定可疑范围⑦估计界值(3)方法:①百分位数法:Px=L+(i/fx)(n·x%-ΣfL)②正态分布法(对数正态分布):百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。计算题:1.某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.7040743.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05(1)编制频数分布表,简述其分布特征。①找出最大值、最小值求全距(R):全距=最大值-最小值=7.22-2.70=4.50(mmol/L)②求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L)③分组段,划记(表1-1)表2-6某地101例30~49岁健康男子血清总胆固醇值划记表组段(mmol/L)划记频数2.5~13.0~83.5~9\n|4.0~234.5~255.0~175.5~96.0~66.5~27.0~7.51合计101由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。表2-7某地101例30~49岁健康男子血清总胆固醇值(mmol/L)、s计算表血清总胆组中值频数fXfX2累计累计频数固醇值Xf频数(实际)2.5~2.7512.757.56310.00993.0~3.25826.0084.50090.08913.5~3.75933.75126.563180.17824.0~4.252397.75415.438410.40594.5~4.7525118.75564.063660.65355.0~5.251789.25468.563830.82185.5~5.75951.75297.563920.91096.0~6.25637.50234.375980.97036.5~6.75213.5091.1251000.99017.0~7.57.2517.2552.5631011.0000478.252242.315注:Xu为组段上限值(2)计算均数、标准s、变异系数CV。由上计算表1-2可见:478.25/101=4.735(mmol/L)\n|=0.882(mmol/L)CV=100%=0.882/4.735100%=18.627%(3)计算中位数M,并与均数X比较,利用前表计算中位数MM=L+(i/f50)(n50%-ΣfL)=4.5+(0.5/25)(10150%-41)=4.69(mmol/L)本题算术均数为4.735(mmol/L),与中位数4.69(mmol/L)很接近,这也是资料服从正态分布的特征之一。(4)计算P2.5及P97.5并与±1.96s的范围比较。P2。5=3.0+(0.5/8)(1012.5%-1)=3.095(mmol/L)P97.5=6.5+(0.5/2)(10197.5%-98)=6.619(mmol/L)1.96S=4.735±1.960.882=3.01~6.46(mmol/L)用百分位数法求得101例30~49岁健康男子血清总胆固醇值95%分布范围3.095~6.619(mmol/L),与正态分布法求得的95%分布范围3.01~6.46(mmol/L)基本一致。(5)分别考察1S、1.96S、2.58S范围内的实际频数与理论分布是否基本一致(表1-3)表2-8某地101例30~49岁健康男子血清总胆固醇值理论分布与实际分布比较血清总胆固醇实际分布理论分布人数%%3.85~5.627271.2968.273.01~6.469796.0495.002.46~7.0110099.0199.00由上表,范围内,实际分布与理论分布略有不同,而、范围内,实际分布与理论分布基本一致。(6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,还有百分之几的人血清总胆固醇值比他高?前计算得95%正常值为3.01~6.46(mmol/L)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),在95%范围以外,故属于异常u=(X-μ)/σ=(6.993-4.735)/0.882=2.56因ф(2.56)=ф(-2.56),查表1得ф(-2.56)=0.0052估计该地30~49健康男子中约有0.52%的人血清总胆固醇值比他高。2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑制抗体滴度资料如表2-9第(1)(2)栏。\n|表2-9平均滴度计算表抗体滴度人数f滴度倒数X1lgX1flgX1(1)(2)(3)(4)(5)=(2)×(4)1:8280.90311.80621:166161.20417.22471:325321.50517.52571:6410641.806218.06181:12841282.10728.42881:25622562.40824.81651:51215122.70932.7093合计3050.5730(1)试计算其平均滴度。由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5该站30名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为1:48.50表2-10平均滴度计算表抗体滴度人数f滴度倒数X1lgX1flgX1(1)(2)(3)(4)(5)=(2)(4)1﹕8280.90311.80621﹕166161.20417.22471﹕325321.50517.52571﹕6410641.806218.06181﹕12841282.10728.42881﹕25622562.40824.81651﹕51215122.70932.7093合计3050.5730(2)有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对数值的标准差相同,为什么?表2-11滴度对数值计算表抗体滴度X2人数flgX2flgX21﹕82-0.9031-1.80621﹕166-1.2041-7.22471﹕325-1.5051-7.52571﹕6410-1.8062-18.06181﹕1284-2.1072-8.42881﹕2562-2.4082-4.81651﹕5121-2.7093-2.7093合计30-50.57301)由表1-4中数据计算标准差为:slgx1=lg-10.4444=2.78232)由表1-5中数据计算标准差为:slgx2=lg-10.4444=2.7823\n|直接用抗体滴度的对数lgx2与稀释倍数的对数lgx1计算标准差是相等的,因为由上表可见lgx2=lg1-lgX1=-lgx1,而lgx1与-lgx1的离散程度是相同的,所以用抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。3.50例链球菌咽峡炎患者的潜伏期如表2-12,说明用均数、中位数或几何均数,何者的代表性较好?并作计算。表2-1250例链球菌咽峡炎患者的潜伏期的中位数计算表潜伏期(小时)病例数f累计频数12~1124~7836~111948~113060~772~584~496~2108~1202合计50本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几何均数表示其平均水平。如上表,经计算中位数,几何均数、算术均数分别为:M=54.55(小时),G=54.08(小时),=58.56(小时)显然,算术均数受长潜伏期的影响使其偏大,中位数M与几何均数G接近,故描述链球菌咽峡炎患者潜伏期的集中趋势指标使用中位数M或几何均数G均可。4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量如表2-13:表2-13238人发汞含量频数计算表发汞值人数f组中值XfXfX²累计频数累计频率(μmol/kg)1.5~202.550.0125.00208.403.5~664.5297.01336.508636.105.5~606.5390.02535.0014661.347.5~488.5408.03468.0019481.509.5~1810.5189.01984.5021289.0811.5~1612.5200.02500.0022895.8013.5~614.587.01261.5023498.3215.5~116.516.5272.2523598.7417.5~018.50.00.0023598.7419.5~21.5320.561.51260.75238100.00合计2381699.014743.50(1).说明此频数分布的特征:可见发汞值的频数分布高峰位于第2个组段。前4个组段的频数占总频数的81.5%,长尾拖向右侧,呈极度正偏态。\n|(2).计算均数和中位数M,何者较大?为什么?何者用语说明本资料的集中位置较合适?=1699/238=7.139(μmol/kg)M=L+(i/f50)(n50%-ΣfL)=5.5+2/60(23850%-86)=6.6(μmol/kg)由计算结果得知,其原因因为本例呈正态分布,均数计算结果受到少数较大发汞值的影响,使得偏向大发汞值一边.本例用中位数描述偏态资料的集中趋势较好,它不受两端较大值和极小值的影响.(3).选用何种指标描述其离散程度较好?选用四分位数间距描述其离散程度较好.(4).估计该地居民发汞值的95%参考值范围本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大,n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范围较为合适.P95=L+(i/f95)(n95%-ΣfL)=11.5+(2/16)(23895%-212)=13.2625(μmol/kg)第三章均数的抽样误差与t检验一、名词解释:1.标准误2.总体均数可信区间3.假设检验4.检验水准5.检验统计量6.P值7.第I类错误8.第II类错误二、填空题:1.用样本均数估计总体均数的可靠程度宜选用__________。2.一般将概率小于_________和_________的随机事件称为小概率事件。3.对总体所作的假设进行统计推断,作出拒绝或接受假设的结论的方法,称___________。4.样本均数比较,经t检验差别有显著性时,P越小,说明___________。5.t分布的图型形状与___________有关。6.可信区间的两个要素是___________,______。7.准误愈小,表示_________愈小,_________对_________估计愈可靠。8.统计推断包括___________和___________两方面。9.设检验中,不拒绝Ho时,可发生_________错误,其概率用_________表示。三、是非题:1.区间估计以预先给定的概率(可信度)估计总体参数在哪个范围内的方法,称区间估计。()2.样本标准误反映了抽样误差大小,显然n越大抽样误差越大,用样本推断总体的精度越高。()3.抽样误差的大小可以用标准差来表示。()4.参数估计有⑴点(值)估计——用样本统计量值估计相应的总体参数。⑵区间估计——估计总体参数在哪个范围,它不涉及抽样误差,所以比点(值)估计更为重要。\n|()5.从正态总体N(μ,σ)中,随机抽取例数为n的样本,则样本均数也服从N(μσ)的正态分布。()6.抽样研究时,可通过增加样本含量来减少抽样误差。()7.成组比较的t检验要求两组样本例数一定相等。()8.可信区间比假设检验还可以提供更多信息,不但能回答差别有无统计意义,还能提出差别有无实际意义。()9.t检验结果t>1.96,可以认为两样本均数不同。()10.样本含量相同时,配对设计与成组设计相比,前者统计效率较高()11.在配对t检验中,用药前数据减去用药后数据,与用药后数据减去用药前数据作t检验后的结论是相同的()12.t分布曲线的形状与标准差有关()13.拒绝了实际上是成立的Ho,这类“弃真”的错误称为第一类错误或Ⅰ型错误()14.抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征()15.变量变换是各组观察值经变量转换后达到方差齐性()16.样本均数的99%可信区间可用2.58表示()17.计算总体均数可信区间的通式为(,)缩写为()18.当P≤α时,结论为按所取α检验水准拒绝Ho,接受H1;如P>α时,即样本信息支持Ho,就无理由拒绝它,此时只好接受它()19.当t0.01v>t>t0.05v时,则0.01>P>0.05()20.两个均数比较只能用t检验或u检验()21.t检验可用于同一批对象的身高和体重均数差别的假设检验()22.β为第二类错误的概率(1-β)越小,所需的样本例数越多()一、单选题:1.从一个计量资料的总体中抽样,产生的抽样误差的原因是:()A.总体中的个体值存在差异B.总体均数不等于零C.样本中的个体值存在差异D.样本均数不等于零E.样本只包含总体的一部分个体2.σ是指:()A.所有个体值对总体均数的离散程度B.某一个样本均数对总体均数的离散程度C.所有样本均数对总体均数的离散程度D.一些样本均数对总体均数的离散程度E.所有某个含量相同的样本均数对总体均数的离散程度3.在同一正态总体中随机抽样,有99%的样本均数在下述范围内:()A.B.C.D.E.以上都不是4.在同一总体中随机抽取多个样本,用样本来估计总体均数的95%可信区间,则估计精密的是:()\n|A.均数大的样本B.均数小的样本C.标准差小的样本D.标准误大的样本E.标准误小的样本1.表示:()A.总体的95%个体值在该区间内B.样本的95%个体值在该区间内C.平均每100个总体均数,有95个总体均数在该区间内D.平均每100个样本(含量相同)均数,有95个样本均数在该区间内E.平均每100个样本(含量相同)有95个样本所得出的该区间包括总体均数2.总体均数的99%可信区间为:()A.B.C.D.E.以上都不是3.在由两样本均数的差别推断两总体均数的差别的t检验中,检验假设的无效假设是:()A.两样本均数差别无统计意义B.两总体均数差别无统计意义C.两样本均数相等D.两总体均数相等E.两总体均数不等4.由两样本均数的差别推断两总体均数的差别,所谓差别有显著性是指:()A.两样本均数差别有显著性B.两总体均数差别有显著性C.两样本均数和两总体均数的差别都有显著性D.其中一个样本均数和总体均数的差别有显著性E.以上都不是5.在样本均数和总体均数差别的显著性检验中,H0(无效假设):μ=μ0;H1(备择假设):μ≠μ0;结果因为P<0.05而拒绝H0接受H1,是由于:()A.无效假设成立的可能性小于5%B.备择假设成立的可能性大于5%C.无效假设成立的可能性小于5%和备择假设成立的可能性大于95%D.该样本来自该总体(μ=μ0)的可能性小于5%E.该样本来自另一个总体(μ≠μ0)的可能性大于95%6.与标准正态分布(u分布)比较,t分布的:()A.中心位置左移B.中心位置右移C.分布曲线峻峭一些D.分布曲线平坦一些E.以上都不是7.与标准正态分布(u分布)比较,t分布的:()A.均数要小些B.均数要大些C.标准差要小些D.标准差要大些E.以上都不是8.若总例数相同,则两组计量资料的t检验与配对计量资料的t检验相比较,一般为:()A.两组计量资料的t检验的效率要高些B.配对计量资料的t检验的效率要高些C.两者效率相等D.两者效率相差不大E.两者效率不可比9.在两个均数比较的t检验中,计算合并方差的公式为:()A.B.\n|C.D.E.1.推断样本率为16.8%与14.5%所代表的总体有无差别,选用的方法是:()A.样本均数与总体均数比较的t检验B.配对t检验C.成组t检验D.以上都不是2.在比较两个小样本的均数时,需改用校正t检验的情况是:()A.两总体均数相等B.两总体均数不等C.两总体方差相等D.两总体方差不等E.两样本方差不等3.在两组资料比较的t检验中,结果为P<0.05,差别有显著性。P愈小则:()A.说明两样本均数差别愈大B.说明两总体均数差别愈大C.说明两样本均数有差别的可能性愈大D.愈有理由认为两样本均数不同E.愈有理由认为两总体均数不同4.t检验中,不同类型资料的t检验的区别是:()A.检验步骤不同B.统计量t的计算公式不同B.确定P值时查的表不同D.根据P值判断结果的方法不同E.以上都不对5.两组同质资料中,_____小的那个样本均数更有代表性()A.SB.CVC.D.19._________小,表示用该样本均数估计总体均数的可靠性大。A.CVB.SC.SD.R20.统计推断的内容__________。A.是用样本指标估计相应的总体指标B.是检验统计上的“假设”C.A、B均不是D.A、B均是21.两样本均数比较,经t检验,差别有显著性时,P越小,说明。A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同一、问答题:1.标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3.假设检验和区间估计有何联系?4.假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么?5.t检验和方差分析的应用条件有何异同?6.怎样正确使用单侧检验和双侧检验?7.验假设中α和P的区别何在?二、计算题1.某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:\n|表:3-1健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算性别例数均数标准差标准值红细胞数男3604.660.584.84(×1012/L)女2254.180.294.33血红蛋白男360134.57.1140.2(g/L)女255117.610.2124.7(1)说明女性的红细胞数与血红蛋白量的变异程度何者为大?(2)分别计算男﹑女两项指标的抽样误差。(3)试估计该地健康成年男﹑女红细胞数的均数。(4)该地健康成年男﹑女间血红蛋白含量有无差别?1.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月的血沉(mm/小时)如下表,问:(1)甲,乙两药是否均有效?(2)甲,乙两药的疗效有无差别?表3-2甲,乙两药治疗前后的血沉━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前10136111078859治疗后693101042533━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前9109138610111010治疗后6353358274━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━(1)甲,乙两药是否均有效?(2)甲,乙两药的疗效有无差别?2.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别?标准株(11人)1002004004004004008001600160016003200水生株(9人)1001001002002002002004004003.表3-3为抽样调查资料,可做那些统计分析?表3-3某地健康成人的第一秒肺通气量(FEV1)(L)FEV1人数男女2.0~142.5~383.0~1123\n|3.5~27334.0~36204.5~26105.0~1025.5~306.0~6.510合计1181005.某医师就表3-4资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,后(接种后两月)血清抗体(黄疸出血型)的变化。表3-4328例血清抗体滴度及统计量抗体滴度的倒数02040801603206401280s免疫前人数2112719242519376.1111.76.17免疫后人数216577675542523411.9470.525.90t=(411.91-76.1)/=12.6>3,查t界值故P<0.01,说明接种后血清抗体有增长。试问:(1)本例属于何种类型设计?(2)统计处理上是否妥当?6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计和95%区间估计。滴度倒数12481632641282565121024合计人数00171031334224311527.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:得表如下:表3-59例慢性苯中毒患者治疗前后的白细胞总数(×109/L)病人号治疗前治疗后16.04.224.85.435.06.343.43.857.04.463.84.076.05.983.58.094.35.0(1)问该药是否对患者的白细胞总数有影响?(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得t=4.1,问该药是否对患者的血小板有影响?(3)综合上述结果能否提出进一步研究意见.答案填空题:1.标准误2.0.05,0.013.假设检验,(显著性检验)\n|4.两总体均数不同(越有理由说明有统计学意义)5.自由度大小6.一是准确度、二是精度7.抽样误差、样本均数、总体均数8.总体均数估计、假设检验9.第二类错误(Ⅱ型错误)β是非题:1.√2.×3.×4.×5.√6.√7.×8.√9.×10.√11.√12.×13.√14.√15.√16.√17.√18.√19.×20.×21.×22.×单选题:1.A2.E3.D4.E5.E6.E7.D8.A9.D10.D11.D12.B13.E14.D15.D16.E17.B18.C19.C20.D21.C问答题:1.标准差和标准误有何区别和联系?表3-6标准差与标准误的区别标准差(α或s)标准误()意义上描述一组变量值之间的离散趋势描述样本均数间的离散趋势应用上①s越小,表示变量值围绕①越小,表示样本均数与均值分布越密集,说明均数总体均数越接近,说明样本的代表性越好。均数推断总体均数可靠性越大。②可用估计变量值分②可用估计总体布范围均数可信区间与n的关系n越大,s越趋于稳定n越大,越小(2)联系①二者均是表示变异度大小的统计指标。②标准误与标准差大小成正比,与抽样例数n的平方根成反比。③当n一定时,同一份资料,标准差越大,标准误也越大。2.可信区间和参考值范围有何不同?参考值范围是指同质总体中个体变量值的分布范围,如X±1.96s说明有95%的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大,该范围越宽,分布也就越散。而可信区间是指在可信度为(1-α)时,估计总体参数可能存在的范围。即从同一总体中随机抽样,当n一定时,每抽一次即可得一个样本均值,以\n|计算可信区间,如95%可信区间,类似的随机抽样进行一百次,平均有95次,即有95个可信区间包括了总体均数,有5次没有包括括总体均数,5%是小概率事件,实际发生的可能性很小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方法犯错误的可能性最大不超过5%。可信区间与标准误大小有关,标准误越大,可信区间则越大。3.假设检验和区间估计有何联系?假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因此,只有将二者有机地结合起来,相互补充,才是完整的分析。4.假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么?假设检验时,当P<0.05,则拒绝Ho,其理论依据是在Ho成立的条件下,出现大于等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见,假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。5.t检验和方差分析的应用条件有何异同?(1)相同点:在均数比较中,t检验和方差分析均要求各样本来自正态总体;各处理组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。(1)不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。6.怎样正确使用单侧检验和双侧检验?根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率高,但应慎用。7.第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义?(1)假设检验中Ⅰ、Ⅱ型错误的区别。Ⅰ型错误是拒绝了实际上成立的Ho,也称为“弃真”错误,用α表示。统计推断时,根据研究者的要求来确定。Ⅱ型错误是不拒绝实际上不成立的Ho,也称为“存伪”错误,用β表示。它只能与特定的H1结合起来才有意义,一般难以确切估计。(2)Ⅰ、Ⅱ型错误的联系。①当抽样例数一定时,α越大,β越小;反之,α越小,β越大。②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,可适当增加样本含量。③根据研究者要求,n一定时,可通过确定α水平来控制β大小。(3)了解两类错误的实际意义。①可用于样本含量的估计。②可用来计算可信度(1-α),表明统计推断可靠性的大小。③可用于计算把握度(1-β),来评价检验方法的效能等。\n|④有助于研究者选择适当的检验水准。⑤可以说明统计结论的概率保证。计算题:1.某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:表3-7:健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算性别例数均数标准差标准值变异系数(%)标准误红细胞数男3604.660.584.8412.450.0306(×1012/L)女2254.180.294.336.940.0182血红蛋白男360134.57.1140.25.280.3742(g/L)女255117.610.2124.78.670.6387(1)说明女性的红细胞数与血红蛋白量的变异程度何者为大?女性CVRBC=S/×100%=0.29/4.18×100%=6.49%CVHB=S/×100%=10.2/117.6×100%=8.67%由上计算可知该地女性血红蛋白量比红细胞数变异度大(2)分别计算男﹑女两项指标的抽样误差。见上表最后一栏,标准误计算公式。(3)试估计该地健康成年男﹑女红细胞数的均数。健康成年男子红细胞数总体均数95%可信区间为:±1.96Sx=4.66±1.96×0.0306=4.60~4.72(1012/L)其中n=360故近似按υ=∞。同理健康成年女子红细胞数总体均数95%可信区间为4.14~4.22(1012/L)(4)该地健康成年男﹑女间血红蛋白含量有无差别?Ho:µ男=µ女H1:µ男≠µ女α=0.05u==22.83按υ=∞,查附表2,得P<0.0005,按α=0.05水准,拒绝Ho,接受H1,可以认为男女间血红蛋白含量不同,男高于女。2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月的血沉(mm/小时)如下表,问:(1)甲,乙两药是否均有效?(2)甲,乙两药的疗效有无差别?表3-8甲,乙两药治疗前后的血沉━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前10136111078859治疗后693101042533差值4431036326\n|━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前9109138610111010治疗后6353358274差值37410512936━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━(1)甲,乙两药是否均有效?经计算得:甲药=3.2000(mm/h)乙药=5.0000(mm/h)Sd=1.9322(mm/h)Sd=2.9810(mm/h)S=0.6110(mm/h)S=0.9428(mm/h)n=10n=10Ho:μd=0Ho:μd=0H1:μd≠0H1:μd≠0α=0.05α=0.05t(甲药)=/S=3.2000/0.6110=5.237t(乙药)=/S=5.0000/0.9428=5.303=9,查t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,故可认为甲、乙两药均有效。(2)甲,乙两药的疗效有无差别?由表中资料分别求得治疗前后差值(见表3-8),再作两组比较。H0:甲乙两药疗效相同H1:甲乙两药疗效不同α=0.05=18,查t界值表,得0.20>P>0.10,按α=0.05水准,不拒绝Ho,尚不能认为甲乙两药疗效有差别。1.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别?标准株(11人)1002004004004004008001600160016003200水生株(9人)100100100200200200200400400由题知:该资料服从对数正态分布,故得:标准株水生株n=11n=9\n|=2.7936=2.2676=0.4520=0.2355(1)两组方差齐性检验:H0:H1:=0.05F=V1=10V2=8F0.05(10,8)=4.30查附表3,得P>0.05,按α=0.05水准,不拒绝Ho,可以认为两总体方差齐。(2)两组均数比较;H0两总体几何均数相等H1两总体几何均数不等α=0.05查t界值表,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H1,故可认为钩端螺旋体病人的血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者1.表3-9为抽样调查资料,可做那些统计分析?表3-9某地健康成人的第一秒肺通气量(FEV1)(L)FEV1人数男女2.0~142.5~383.0~11233.5~27334.0~36204.5~26105.0~1025.5~30\n|6.0~6.510合计118100(1)统计描述。由上表可见,男性调查118人,第1秒肺通气量分布为2.0~6.5,高峰位于4.0~4.5组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可见上表和下图。女性调查100人,第1秒肺通气量分布为2.0~2.5,高峰位于3.5~4.0组段内,以中间频数分布最多,两侧逐渐减少,且左右大体对称,频数分布可见表3-9和图3-1。102.02.53.03.54.04.55.05.56.06.540300女男20图3-1某地健康成人第一秒肺通气量(FEV1)(L)分布由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰位置高于女性,向右推移一个组段。(2)计算集中与离散趋势指标,并对两组进行比较。Ho:男女间第1秒肺通气量总体均数相同H1:男女间第1秒肺通气量总体均数不同α=0.05男性:n=118=4.2373s1=0.6902女性:n=100=3.7250s2=0.6258u==(4.2373-3.7250)/=5.624查t界值表,v=∞,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,故可认为男女间第1秒肺通气量均数不同,男高于女。(3)根据上述分析结果,分别确定95%参考值范围。男性第1秒肺通气量单侧95%参考范围下限为:\n|=4.2373-1.6450.6902=3.16(L)即可认为有95%的男性第1秒肺通气量不低于3.16(L)女性第1秒肺通气量单侧95%参考范围下限为:=3.7250-1.6450.6258=2.69(L)即可认为有95%的女性第1秒肺通气量不低于2.69(L)1.某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,后(接种后两月)血清抗体(黄疸出血型)的变化。表3-10328例血清抗体滴度及统计量抗体滴度的倒数02040801603206401280s免疫前人数2112719242519376.1111.76.17免疫后人数216577675542523411.9470.525.90t=(411.91-76.1)/=12.6>3,查t界值故P<0.01,说明接种后血清抗体有增长。试问:(1)本例属于何种类型设计?本例属于自身配对设计。(3)统计处理上是否妥当?统计处理上不妥当,因为:①在整理资料过程中,未按配对设计整理,而是拆开对子按成组设计整理,失去原设计的意义。②统计描述指标使用不当,血清浓度是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。对现已整理好的资料,可计算中位数表示平均水平,用四分位数间距表示离散趋势。③假设检验因本资料不宜计算均数,故对均数进行t检验当然是不妥当的。6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计和95%区间估计。滴度倒数12481632641282565121024合计人数0017103133422431152以滴度倒数X的对数值求得X1gx=1.85965,Slgx=0.44245,n=152,则点值估计G=lg-11.85965=72.39患儿病后血清抗体滴度倒数总体均数95%可信区间为lg-1(Xlgx+1.96Slgx/√n)=lg-1(1.85965+1.96×0.44245/√152)=lg-1(1.78931276~1.92999206)=61.5~85.117.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:(1)得表白细胞总数(×109/L),问该药是否对患者的白细胞总数有影响?\n|表3-119例慢性苯中毒患者治疗前后的白细胞总数病人号治疗前治疗后d116.04.21.824.85.4-0.635.06.3-1.343.43.8-0.457.04.42.663.84.0-0.276.05.90.183.58.0-4.594.35.0-0.7H0该药对患者的白细胞总数无影响,即μd=0H1该药对患者的白细胞总数有影响,即μd≠0α=0.05求得(前—后)差值di经计算得:=0.3556Sd=1.9951n=9t==8查附表2,t界值表,得P>0.5,按α=0.05水准,不拒绝Ho,尚不能认为该药对患者的白细胞总数有影响。(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得t=4.1,问该药是否对患者的血小板有影响?H0该药对患者的血小板无影响,即μd=0H1该药对患者的血小板有影响,即μd≠0α=0.05=37.8t=4.1=8查附表2,t界值表,得0.005>P>0.002,按α=0.05水准,拒绝Ho,接受H1,故可认为该药对患者的血小板有影响,可增加患者血小板。(3)综合上述结果能否提出进一步研究意见/综合上述结果,提出以下建议:①在此项研究中,从t检验结果来看,血小板治疗前后变化有意义,而白细胞则无意义,可补充计算两项指标的95%可信区间,结合专业知识,分析治疗前后指标差数有无实际意义。②如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效第四章方差分析\n|一、填空题:1、方差分析的应用条件是___________、___________和___________。2、方差分析的基本思想把变量值看成三种不同的变异,即___________,___________和___________三种变异关系___________。3、多个样本均数间每两个均数的比较常用的统计方法是___________。4、在单因素方差分析中,其各自由度之间的关系是__________。二、是非题:1.四个样本均数的比较,不可以两个两个抽出来作t检验()2.两样本均数的检验,可使用两样本t检验,亦可以用方差分析()3.方差不齐的两个小样本均数检验可采用两样本均数的t检验()4.多个样本均数的两两比较有两种方法可供选择,一是用t检验对每两个对比组作比较,二是先作方差分析然后作多重比较()5.与单因素方差分析相比,两因素方差分析由于从总变异中多分离出配伍组变异,使计算值的分母缩小了,因而提高了研究的效率。()三、单选题:1.在相同自由度()及α水准时,方差分析的界值比方差齐性检验的界值___A.大B.小C.相等D.不一定2.成组设计的方差分析中,必然有_______A.<B.<C.=+D.=+3.在单因素方差分析中:()A.只要求资料是计量的B.只要求资料呈正态分布C.只要求方差齐性D.要求资料是计量的,且呈正态分布E.要求资料正态,且方差齐性4.单因素方差分析的无效假设是:()A.各对比组样本均数相等B.各对比组总体均数相等C.至少有两个对比组总体均数相等D.各对比组总体均数差别无显著性E.各对比组总体均数不等5.在K组每组n例的单因素方差分析中,组间变异的离均差平方和为:()A.B.C.D.E.6.在单因素方差分析中若处理因素无作用,理论上应有:A.F=OB.F=1C.F<1.96D.F<E.以上都不是7.对成对的两组资料作均数差别的假设检验:A.只能用随机区组F检验B.只能用配对t检验\n|C.用随机区组F检验或配对t检验都可D.只能用成组t检验8.在多组均数的两两比较中,若不用q检验而用t检验,则:A.结果更合理B.结果会一样C.会把一些无差别的总体判断为有差别D.会把一些有差别的总体判断为无差别E.以上都不对一、计算题:1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差别?表4-1:某湖水不同季节氯化物含量(mg/L)春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.216.921.520.116.716.221.221.219.614.81.试就下表资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是否会影响生存日数?表4-2:各组大鼠接种后生存日数伤寒百日咳对照5687698710981010911109121110121110141211163.研究酵解作用对血糖浓度的影响,从8名健康人中抽取血液并制备了血滤液,每一个受试者的血滤液又分成4份,再随机地把4份血滤液分别放置0,45,90,135分钟,然后测定其中血糖浓度(mmol/L):结果如下表\n|表4-3放置不同时间血滤液所含血糖浓度(mmol/L)受试者编号放置时间小计0459013515.275.274.494.6119.6425.275.224.884.6620.0335.885.835.385.0022.0945.445.385.275.0021.0955.665.445.384.8821.3666.226.225.615.2223.2775.835.725.384.8821.8185.275.115.004.4419.82试比较0分钟与其他3个放置时间的血糖浓度间是否存在差别?.4.某医师为研究人体肾上腺皮质(羟基类固醇脱氢酶)活性在四个季节中是否有差别,采用分光光度计随机测定了部分研究对象,数据见表,请做统计分析.表4-4:四个季节的人体肾上腺皮质活性季节nS春季420.780.13夏季400.690.20秋季320.680.14冬季360.580.20答案填空题1.各样本是相互独立的随机样本,各样本来自正态总体,处理组总体方差相等(方差齐性)2.总变异、组内变异、组间变异SS总=SS组间+SS组内3.q检验(又称Newman-Keuls法)4.V总=SS组间+SS组内是非题:1.×2.√3.×4.√5.×单选题:1.B2.D3.E4.B5.C6.A7.C8.C计算题:1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差别?\n|表4-1:某湖水不同季节氯化物含量(mg/L)春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.216.921.520.116.716.221.221.219.614.8∑∑Хij167.9159.3131.9129.3588.4ni888832X20.9919.9116.4916.168.39∑Х²ij3548.513231.952206.272114.1111100.84S²i.52988.55554.50983.47125.0166(1)多组均数间比较:表1:方差分析表变异来源SSvMSF总变异281.63531组间变异141.170347.0579.380组内变异140.465285.017查F界值表,得P<0.01,按0.05水准,拒绝H0,接受H1,故可认为不同季节湖水中氯化物含量不同或不全相同。(2)各组均数间两两比较H0:μA=μBH1:μA≠μBα=0.05表2四个样本均数顺序排例组别春夏秋冬X20.9919.9116.491位次1234\n|表3四组均数两两比较q检验对比组两均数之差组数q值P值1与44.8346.099<0.011与34.5035.682<0.011与21.0821.364>0.052与43.7534.735<0.012与33.4224.319<0.013与40.3320.417>0.05春与夏、秋与冬湖水中氯化物含量P>0.05,按α=0.05水准不拒绝Ho,即尚不能认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外,其它4组均P<0.01,按α=0.05水准,拒绝Ho,接受H1,即可认为春夏两季湖水中氯化物含量高于秋冬两季。2.试就表4-2资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是否会影响生存日数?表4-2各组大鼠接种后生存日数伤寒百日咳对照568769871098101091110912111012111014121116∑∑Хij9284112288ni101010309.28.411.29.6∑886732130629244.4002.9335.7334.3553\n|解Ⅰ:假定生存日数服从正态分布(1)方差齐性检验:Ho:三总体方差齐即H1:三总体方差不等或不全相等。α=0.059(4.4+2.933+5.733)/(30-3)=4.3553=0.9461v=2,查附表9,X²界值表,得0.75>P>0.50,按α=0.05水准,不拒绝Ho,故可认为三组资料总体方差齐。(2)三组均数比较(表4-5)Ho:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。H1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等α=0.05C=(∑∑Χij)2/n=288²/30=2764.8SS总=∑∑Χij2-C=2924-2764.8=159.2SS组间=∑(∑Χij)2/ni-C=[92²+84²+112²]/10-2764.8=41.6SS组内=SS总-SS组间=159.2-41.6=117.6表4-5方差分析表变异来源SSvMSF总变异159.229组间变异41.6220.84.776组内变异117.6274.3556查附表4,得0.05>P>0.01,在α=0.05水准上,拒绝Ho,接受H1,故可以认为大白鼠感染脊髓灰质炎病毒后,在接种伤寒或百日咳菌苗对生存日数有影响。(3)均数间多重比较:Ho:任一组与对照组总体均数相同H1:任一组与对照组总体均数不同α=0.05伤寒与对照组比较\n|=(11.2-9.2)/=2/0.933338=2.1428v=27,得0.05>P>0.02,按α=0.05水准,拒绝Ho,接受H1,故可认为接种伤寒菌苗组较对照组生存日数减少。百日咳与对照组比较v=27,查附表2,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H1,可以认为接种百日咳菌苗组较对照组生存日数减少。3.研究酵解作用对血糖浓度的影响,从8名健康人中抽取血液并制备了血滤液,没一个受试者的血滤液又分成4份,再随机地把4份血滤液分别放置0,45,90,135分钟,然后测定其中血糖浓度(mmol/L)(1)4组血滤液方差齐性检验:Ho:不同放置时间血滤液所含血糖浓度总体方差相等,即H1:不同放置时间血滤液所含血糖浓度总体方差不等或不全相等α=0.05方差齐性检验方法同本例X²=1.16847v=k-1=4-1=3,查附表9,X²界值表,得0.90>P>0.75,按α=0.05水准,不拒绝Ho,可以认为放置不同时间血滤液所含血糖浓度总体方差齐。表4-3放置不同时间血滤液所含血糖浓度(mmol/L)受试者编号放置时间受试者小计0459013515.275.274.494.6119.6425.275.224.884.6620.0335.885.835.385.0022.0945.445.385.275.0021.0955.665.445.384.8821.3666.226.225.615.2223.2775.835.725.384.8821.8185.275.115.004.4419.82ΣΧij44.8444.1941.3938.69169.11ni888885.60505.52385.17384.83635.2847∑252.1996245.0671215.0527187.5585899.87790.12450.13890.13020.06340.1143(2)配伍组设计方差分析:处理:Ho:不同放置时间血滤液所含血糖浓度相同\n|H1:不同放置时间血滤液所含血糖浓度不同或不全相同相同α=0.05配伍:Ho:8位受试者血液所含血糖浓度相同H1:8位受试者血液所含血糖浓度不同或不全相同α=0.05С=(ΣΣⅩij)2/n=169.112/32=893.6935SS总=ΣΣⅩij2-С=899.8779-893.6935=6.1844SS放置时间==(44.842+44.192+41.392+38.692)/8-893.6935=2.98524SS受试者==1/4(19.642+20.032+22.092+21.092+21.362+23.272+21.812+19.82)-893.6935=2.79093SS误差=SS总-SS放置时间-SS受试者=6.1844-2.98524-2.79093=0.40832方差分析表变异来源SSvMSF总变异6.184431放置时间2.9852430.9950851.189受试者2.7909370.3987020.510误差0.40823210.01944查F界值表F0.05(3,21)=3.07F0.01(3,21)=4.87F0.05(7,21)=2.49F0.01(7,21)=3.64放置时间受试者间均P<0.01,按α=0.05水准,均拒绝Ho,接受H1,故可认为不同放置时间、不同受试者间血滤液所含血糖浓度不同或不全相同。(3)不同放置时间血滤液所含血糖浓度均数间多重比较,采用多个实验组与一个对照组均数间两两比较。①Ho:放置45分钟与0分钟血滤液所含血糖浓度相同H1:放置45分钟与0分钟血滤液所含血糖浓度不同α=0.05=0.0812/0.06971=1.16476v=n-k=32-4=28,查附表2,t界值表,得0.40>P>0.20,按α=0.05水准,不拒绝Ho,尚不能认为放置45分钟与0分钟血滤液血糖浓度总均数有差别。②Ho:放置90分钟与0分钟血滤液所含血糖浓度相同H1:放置90分钟与0分钟血滤液所含血糖浓度不同α=0.05\n|=0.4312/0.0697=6.1853v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,可认为放置90分钟较0分钟血滤液所含血糖浓度减少。③Ho:放置135分钟与0分钟血滤液所含血糖浓度相同H1:放置135分钟与0分钟血滤液所含血糖浓度不同α=0.05=0.7687/0.0697=11.0265v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,故可认为放置135分钟较0分钟血滤液所含血糖浓度减少。4.某医师为研究人体肾上腺皮质(羟基类固醇脱氢酶)活性在四个季节中是否有差别,采用分光光度计随机测定了部分研究对象,数据见表2.8,请做统计分析.表4-4四个季节的人体肾上腺皮质活性季节nS春季420.780.13夏季400.690.22秋季320.680.14冬季360.580.20解:本题仅给出分析思路及主要结果1.采用完全随机设计资料的方差分析:(1)由公式可推得由方差公式可推得(2)计算SS总SS组间SS组内SS总=5.365,SS组间=0.777SS组内=4.588列出方差分析表方差分析表变异来源SSMSF总变异5.365149组间变异0.77730.25908.248组内变异4.5881460.0314(4)确定P值,判断结果查方差分析表,得P<0.01,在=0.05水准上,拒绝Ho,接受H1,可以认为四个季节人体肾上腺皮质(羟基类固醇脱氢酶)活性不同或不全相同.\n|2.进一步作均数间的多重比较分析(略)第五章相对数一、名词解释:1.相对数2.率3.构成比4.相对比5.标准化率法二、填空题:1、分析时不能以构成比代替率,构成比只能说明事物各组成部分的__________不能说明某现象发生的___________。2、反映某现象实际发生频数与可能发生频数的比值可选用___________。3、率的标准化目的是______________________。4、常用的相对数有___________、___________和___________。5、从同一个总体中随机抽出观察相等的多个样本,样本率与总体率,各样本率之间往往有差异,这种差异被称作___________用___________表示。三、是非题:1.标准化就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法()2.构成比的计算公式是:构成比=甲指标/乙指标×100%()3.某年某地出生男婴数除以出生女婴数是相对比()4.计数资料的假设检验样本要满足np与n(1-p)≥5的条件()5.计算相对数时分母不宜过小()6.比较两地胃癌死亡率,若两地胃癌死亡率相等就不必进行率的标准化()7.某现象实际发生数与可能发生数之比称为构成比()8.标准化后的率已消除了内部构成不同对总率产生的影响故可直接比较其大小()9.三个医院的门诊构成作比较时不可作χ²检验()10.由于标准化率有利于数据间比较,故绝大多数统计指标需先进行标准化,而无需考虑是否存在内部构成间的不同()11.率又称频率指标,它说明某现象发生的比重或分布,常以百分率(%)、千分率()、万分率(1/万)等表示()四、单选题:1.在实际工作中,发生误把构成比作率分析的主要原因是由于:A.构成比和率的计算方法一样B.构成比较率容易计算C.构成比较率难于计算D.计算构成比的原始资料较计算率的原始资料容易得到E.计算构成比的原始资料较计算率的原始资料难于得到2.要比较甲乙两厂某工种工人患某职业病的患病率的高低,采取标准化法的原理是:A.假设甲乙两厂的工人数相同B.假设甲乙两厂某工种的工人数相同C.假设甲乙两厂患某职业病的工人数相同D.假设甲乙两厂工人的工龄构成比相同E.假设甲乙两厂某工种工人的工龄构成比相同3.经调查得甲乙两地的冠心病粗死亡率都为40/万,按年龄构成标化后,甲地冠心病标化死亡率为45/万,乙地为31/万,因此可以认为:A.甲地年龄别人口构成较乙地年轻B.乙地年龄别人口构成较甲地年轻C.甲地冠心病的诊断较乙地准确D.乙地冠心病的诊断较甲地准确\n|E.甲地年轻人患冠心病较乙地多4.在医学科研中,率的标化,经常采用全国人口的性别年龄构成,其理由是:A.这样算得的标准化率比较合理B.这样算得的标准化率比较准确C.计算标准化率比较容易D.便于进行比较E.以上都不是5.比较甲乙两县的食管癌死亡率,以甲乙两县合计的人口构成为标准,设以各年龄组人口数为标准算得标化率为P1,以各年龄人口构成比为标准算得的标化率为P2,则:A.P2=P1B.P2>P1C.P2<P1D.P2比P1要准确E.P2比P1要合理6.计算某年某地死亡率的分母是:A.该地该年年初人口数B.该地该年年中人口数C.该地该年年末人口数D.该地该年任意时刻人口数E.以上都不是7.óp是描述A.一个样本率对总体率的离散程度B.一些样本率之间的离散程度C.所有样本率之间的离散程度D.所有含量相同的样本率之间的离散程度E.所有总体率之间的离散程度8.某医生用两种药物治疗两组同病患者,若治愈率相等,但甲组收治的病人数是乙组的10倍,试比较两总体治愈率的95%可信区间:A.甲组的较乙组的精密B.乙组的较甲组的精密C.甲组的较乙组的准确D.乙组的较甲组的准确E.以上都不是9.由样本估计总体率的95%可信区间的计算公式A.π±1.96SpB.P±1.96ópC.π±1.96D.P±1.96SpE.P±t0.05()Sp10.用某药治疗某病患者,5例中有4例治愈,宜写作4/5,而不计算治愈率为4/5×100%=80%,这是由于:A.计算治愈率的方法不正确B.样本治愈率的可信区间太宽C.样本治愈率的可信区间太窄D.总体治愈率的可信区间太宽E.总体治愈率的可信区间太窄11.计算相对数的目的是:A为了表示实际水平B为了便于比较C为了表明绝对水平D为了说明数据大小E为了进行显著性检验12.相对数是表示:A计量资料相对大小的指标B表示平均水平的指标C表示事物关联程度的指标D表示排列等级的指标E计数资料相对水平的指标13.对两个地区恶性肿瘤发病率进行标准化率的比较时,应该:A排除两地人口年龄构成不同的影响B排除两地总人口数不同的影响C排除各年龄组死亡人数不同的影响D排除抽样误差\n|E以上都不是14.两地某病总死亡率比较时,进行标准化可以:A消除总人数不同的影响B消除各年龄组死亡率不同的影响C消除两比较组人口年龄构成不同的影响D消除两组调查时的抽样误差E.消除以上各因素的影响15.相对数中:A发病率即为患病率B死亡率即为病死率C构成比即为相对比D总率即为标化率E相对比即为对比指标16.300例宫颈癌发病与年龄的关系:年龄例数百分比30岁以下3311.0031~9531.6641~13143.6751~604113.67合计300100.00结论如下:A41~以前随年龄增加发病率增加B宫颈癌发病率以41~最高C41~以后随年龄增加而发病率下降D宫颈癌30岁以下最少见E以上全不对17.下表为“锑剂短疗程治疗血吸虫病51例死亡病例临床分析”性别<10岁10~20~30~40~50~计女311451529男37632122合计6181083651可认为:A女性死亡率高于男性B10~死亡率最高C10~以后随年龄增加死亡率下降D例数过少,不能说明死亡率E是构成比,不能下率的结论18.某医院的资料,计算了各种疾病所占的比例,该指标为:A发病率B构成比C相对比D标化发病率E标化发病比19.男性吸烟率是女性的10倍,该指标为:A相对比B流行率C构成比D定基比E标化流行率20.N足够大,样本率不接近于1或0,估计总体率95%的可信区间用:AP±1.96SpBP±2.58SpCP±1.96SDP±2.58SEP±2.33Sp21.相对比是A.B两个有关指标之比,两个指标要求:A性质必须相同B性质必须不同C性质可以相同也可以不同D性质最好相同E以上都不是22.若仅知道样本率,估计率的抽样误差用________指标表示。A.SB.C.D.SpE.σp一、问答题:1.常用的相对数指标有那些?它们的意义和计算上有何不同?为什么不能以比代率?请联系实际加以说明。\n|2、应用相对数时应注意哪些问题?3、什么情况下需要进行率的标准化?标准化的方法有那些一、计算题1.表5-1(1)~(4)栏资料宜计算那些相对数指标?试对围产儿在围产期死亡的主要因素作初步分析。表5-1不同体重,孕周,产次的围产儿死亡情况分析因素分组出生数死亡数(1)(2)(3)(4)体重(g)1000~1029112342500~19326111294000~537348合计2089252411孕周(周)<3818178206038~189937177142~14013244合计2221284075产次(次)11332901940251596739372562594178682≥595469合计19488230892.表5-2为一抽样研究资料(1)填补空白数据,见下表()内。表5-2某地各年龄组恶性肿瘤死亡情况年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)(1)(2)(3)(4)(5)=(4)/(3)6)=(4)/(2)(7)0~82920()42.90()()20~()63()19.0525.73()40~2816117242()()()60~()()32()()()合计1670907159012.59()()(2)根据最后(5)(6)(7)三栏结果作简要分析(3)试估计“0~”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。(4)试比较“20~”与“40~”岁组恶性肿瘤死亡率有无差别。2.试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率。表5-3甲乙两医院乳腺癌病人手术后五年生存率腋下淋巴甲医院乙医院结转移病例数生存数生存率%病例数生存数生存率%无453577.7730021571.67\n|有71045063.38834250.60合计75548564.2438325767.101.为了解某乡钩虫感染情况,随机抽查男200人,感染40人,女150人,感染20人。(1)该乡男性感染率是否高于女性?(2)若对该乡居民作驱钩虫治疗,需要按多少人准备药物(全乡人口男7253人,女7109人)?2.抽样调查某企业2839名职工高血压病,结果见表.据此,某医生认为:①该企业高血压发病率为8%,并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为100%。②高血压发病与性别有关,男性为10.2%,女性为4.5%,男性明显高于女性(P<0.01)。以上分析是否妥当,试加评述。表5-4男、女年龄组高血压病例分布男性女性年龄组——————————————————————————————受检人数病例数发病率(%)受检人数病例数发病率(%)20~33351.571240.630~30141.314296.340~5176412.41852714.650~5769316.061914.860~1212100.0合计173917810.21100494.53.某产院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,畸形儿116例,得以下资料。据此得出结论:“母亲年龄在24~29岁时,畸形儿最多,占总数的92.2%,符合一般规律”。母亲年龄(岁)212324252627282930313233合计畸形儿例数121419241819133111116%0.861.712.116.420.715.516.411.22.60.860.860.86100.00(1)以上结论是否合理?为什么?(2)若要达到作者之目的,应计算什么相对数指标较好?如何计算?7.某市1971~1981年乙型脑炎发病率如下表,试作动态分析。表5-5:某市1971~1981年乙型脑炎发病率动态分析年份发病率绝对增长量发展速度(%)增长速度(%)(1/10万)累计逐年定基比环比定基比环比197120.5219726.3119731.8719743.0719751.0819761.3819772.29\n|19782.3119792.4719802.7619812.948.从下表资料,判断某工厂肺癌发生率是否比一般人群高?表5-6:某工厂肺癌发生率分组某厂一般人群人数肺癌人数肺癌发生率(1/万)吸烟70054.5不吸烟30011.59.就下表资料如何比较甲乙两厂某工种某病患病率表5-7:甲,乙两厂某工种某病患病率工龄甲厂乙厂(岁)工人数患者患病率(%)工人数患者患病率(%)<3400123.0010011.00≥31001010.004007218.00合计500224.405007314.6010.设某病患者的自然康复率为30%,分别求10个患者中自然康复1人及以下,8人以上的概率?11.用某型麻疹疫苗接种一批麻疹易感儿,把接种后已阳转者96名作为观察对象,三年后复查,96名中仍为阳性者为85名,试求该疫苗接种阳转者3年后仍保持阳性的百分率的95%可信区间12.用一种新药治疗某种寄生虫病,受试者50人中在服药后1人发生严重反应,这种反应在此病患者中也曾有发生,但过去普查结果为每5000人仅有一人出现。问此新药是否提高了这种反应生率?13.同一水样中,每次抽取1ml置培养皿中,共作10个平板培养,共数得菌落146个,试估计该检样菌落数的95%可信区间。14.某疫苗预防接种后,进行有关的非传染性疾病流行病学效果考核,结果如下:接种组与对照组各调查10万人,接种组发病22人,对照组发病36人。试问两组发病率有无差别?15.甲乙两市分别用抽样调查了解已婚妇女宫颈癌的患病情况,甲市调查1万人,患者82例,乙市调查2万人,患者102例。问甲、乙两市已婚妇女子宫颈癌患病率有无差别?16.观察某种防治细菌性痢疾(菌痢)措施的效果,结果如表。问能否据此认为该措施有效?表5-8:两组人群菌痢发病率的比较(1979年)分组人数菌痢例数(无菌痢数)发病率(‰)试验组41182140975.1对照组521772514513.8合计93359392429.9617.把某肿瘤新发病例按住址点在一张地图上,又将地图划分成许多面积相等的小方格,再分别统计发病数0,1,2,……及相应的方格数,对此资料作Possion分布拟合优度的χ²检验,若P<0.05,就可认为此病在人群中的分布不随机,可能有聚’\n|集性。你认为如何?18.某乡有人口5000人,已知血吸虫粪检阳性率下降至5%左右。血防站准备进行一次血吸虫感染的普查,拟先将每10人粪便作为一个初筛的混合样本,混合样本血吸虫卵阴性,则该10人均作阴性;混合样本阳性,再对该混合样本的10人粪便逐人复查。问此法比一般的逐人粪便检查会减少多大的工作量?19.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如下表,试估计该县百白破疫苗接种率的95%可信区间。表5-9:某县三类乡百白破疫苗接种率调查结果类别人数抽样人数接种率好73717230.8174较好1489914780.6969差93089300.3022合计31578313120.为了解某县某病感染率,现从全县125个村民组(共3万人)中随机抽出10个村民组,对该10个村民组的全部人口进行了调查,结果如下,试据此估计此县农村居民感染率村民组12345678910合计人数1381561761841942152743293503702386感染人数41485670758690101109121797答案填空题1.比重和分布,频率与强度2.率3.消除混杂因素对结果影响4.率,构成比,相对比5.率的抽样误差δ是非题:1.√2.×3.√4.×5.√6×.7.×8.×9.×10.×11.×单选题:1.D2.E3.A4.D5.A6.B7.D8.A9.D10.D11.B12.E13.A14.C15.E16E.17.E18.B19.A20.A21.C22.D计算题:1.表5-1(1)~(4)栏资料宜计算那些相对数指标?试对围产儿在围产期死亡的主要因素作初步分析。表5-1不同体重,孕周,产次的围产儿死亡情况分析因素分组出生数死亡数死亡构成比(%)死亡率(%)(1)(2)(3)(4)(5)(6)体重(g)1000~10291123451.18119.912500~193261112946.835.84\n|4000~5373481.998.93合计2089252411100.0011.54孕周(周)<3818178206050.55113.3238~189937177143.469.3242~140132445.9917.41合计2221284075100.0018.35产次(次)1133290194062.8014.5525159673923.9214.32372562598.3835.6941786822.6545.91≥5954692.2372.33合计1948823089100.0015.85先就上述资料计算了上表(5)~(6)栏两类指标。由表中死亡率可知;体重低于2500g组围产儿死亡率约为2500g组的20倍;孕周<38周组围产儿死亡率约为38周组的12倍;随着产妇的产次增加,围产儿死亡率也逐渐升高。由表中死亡构成比可知:半数以上的围产儿死亡率集中在体重1000~2500g组和孕周<38周组。为降低围产儿死亡率,对体重偏低,不足月妊儿及多产次产妇应加强产前保护。2.表5-2为一抽样研究资料(1)填补空白数据,见下表()内。表5-2某地各年龄组恶性肿瘤死亡情况年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)(1)(2)(3)(4)(5)=(4)/(3)6)=(4)/(2)(7)0~82920(138)42.90(4.82)(1.644)20~(46638)63(12)19.0525.73(1.351)40~2816117242(24.42)(149.142)(6.108)60~(9371)(342)32(9.63)(341.479)(36.496)合计1670907159012.59(53.863)(4.279)(2)根据最后(5)(6)(7)三栏结果作简要分析由表中第(5)栏可知:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4;20~岁组次之,占19.5%;60~岁组恶性肿瘤死亡人数最多,但仅占9.36%;0~岁组恶性肿瘤死亡占总死亡比重最底,仅占2.90%由表中第(6)栏可知:恶性肿瘤的年龄别死亡随年龄的增大而增加,以60~岁组为最高,为341.479/10万。故可认为恶性肿瘤对老年人危害最大,应引起足够的重视。由表中第(7)栏可知:年龄别死亡率以40岁以下最低,以后随年龄的增加而增加,60岁以后高达36.496‰。\n|(3)试估计“0~”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。0~岁组恶性肿瘤死亡率的可信区间:死亡数为4,查poisson分布u的可信区间,可信区间为1.0~10.2。所以恶性肿瘤死亡率的95%可信区间为:(1.0/82920~10.2/82920)=(1.206~12.301)/10万0~岁组年龄别死亡率的可信区间,按式:(4)试比较“20~”与“40~”岁组恶性肿瘤死亡率有无差别。Ho:20~与40~岁组恶性肿瘤死亡率相等,即π1=π2H1:20~与40~岁组恶性肿瘤死亡率不相等,即π1≠π2α=0.05本例:n1=28161x1=42n1-x1=28119n2=46638x2=12n2-x2=46626合计:747995474745X²=37.07查X²界值表,得P<0.005在α=0.05的水准上,拒绝Ho,接受H1,故可认为20~岁组与40~岁组恶性肿瘤死亡率有差别。3.试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率。表5-3甲乙两医院乳腺癌病人手术后五年生存率标化(甲+乙医院合计为标准)腋下淋巴标准病甲医院乙医院结转移例数原生存率(%)预期生存人数原生存率(%)预期生存人数NiPiNiPiPiNiPi(1)(2)(3)(4)=(2)(3)(5)(6)=(2)(5)无34577.77268.3171.67247.26有79363.38502.6050.60401.26合计1138(∑Ni)64.24770.91(∑NiPi)67.10648.52甲医院乳腺癌手术后五年标化生存率×100%=×100%=67.74%乙医院乳腺癌手术后五年标化生存率×100%=×100%=56.99%因为甲乙两医院有无腋下淋巴结转移的病型构成不同,故标化后,甲医院乳腺癌\n|手术后五年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。1.为了解某乡钩虫感染情况,随机抽查男200人,感染40人,女150人,感染20人。(1)该乡男性感染率是否高于女性?Ho:男女性的钩虫感染率相同,即π男=π女H1:男性的钩虫感染率高于女性,即π男>π女单侧α=0.05P1=40/200=0.2P2=20/150=0.1333PC=(X1+X2)/(n1+n2)=60/350=0.1714u==查t界值表,υ=∞,得单侧0.10>P>0.05,按α=0.05水准,不拒绝Ho,尚不能认为该乡男性钩虫感染率高于女性。(2)若对该乡居民作驱钩虫治疗,需要按多少人准备药物(全乡人口男7253人,女7109人)?计算该乡钩虫感染率的95%可信区间:=(13.19~21.09)%14362×13.19%=1894(人)14362×21.09%=3029(人)至少需要按1894人,最多按3029人准备药物。2.抽样调查某企业2839名职工高血压病,结果见表.据此,某医生认为:①该企业高血压发病率为8%,并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为100%。②高血压发病与性别有关,男性为10.2%,女性为4.5%,男性明显高于女性(P<0.01)。以上分析是否妥当,试加评述。表5-4男、女年龄组高血压病例分布男性女性年龄组——————————————————————————————受检人数病例数发病率(%)受检人数病例数发病率(%)20~33351.571240.630~30141.314296.340~5176412.41852714.650~5769316.061914.860~1212100.0合计173917810.21100494.5答:该分析不正确。因为:(1)\n|高血压患病率为8%,而不是发病率。原文中60岁以上的发病率是100%,应为患病率,且由于60岁以上受检人数太少,不宜计算相对数。(1)由于男女性受检人数的年龄构成不同,不能直接比较两总患病率,对男女合计进行假设检验更无意义。由于各年龄组患病率出现明显交叉,如:20~和50~岁组的男性患病率均高于女性,而30~和40~岁组的男性患病率均低于女性。此资料宜直接比较各年龄组的患病率,而不宜使用标准化。1.某产院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,畸形儿116例,得以下资料。据此得出结论:“母亲年龄在24~29岁时,畸形儿最多,占总数的92.2%,符合一般规律”。母亲年龄(岁)212324252627282930313233合计畸形儿例数121419241819133111116%0.861.712.116.420.715.516.411.22.60.860.860.86100.00(1)以上结论是否合理?为什么?以上结论不合理,不能以比代率。(2)若要达到作者之目的,应计算什么相对数指标较好?如何计算?若要达到作者的目的,应计算产妇年龄别畸形儿发生率。某年龄(组)畸形儿发生率=7.某市1971~1981年乙型脑炎发病率如表5-5,试作动态分析表5-5某市1971~1981年乙型脑炎发病率动态分析年份发病率绝对增长量发展速度(%)增长速度(%)(1/10万)累计逐年定基比环比定基比环比197120.52——100100——19726.31-14.21-14.2130.7530.75-69.25-69.2519731.87-18.56-4.449.1129.64-90.89-70.3619743.07-17.451.2014.96164.17-85.0464.1719751.08-19.44-1.995.2635.18-94.74-64.8219761.38-19.140.306.73127.78-93.2727.7819772.29-18.230.9111.16165.94-88.8465.9419782.31-18.210.0211.26100.87-88.740.8719792.47-18.050.1612.04106.93-87.966.9319802.76-17.760.2913.45111.74-86.5511.7419812.94-17.580.1814.33106.52-85.676.52本资料从1971年到1974年,发病率呈下降趋势,1975年开始呈上升趋势,故以1975年为基期计算。\n|平均发展速度=平均增长速度=平均发展速度-1=1.182-1=18.2%动态分析:从绝对增长量看,各年乙型脑炎发病率均低于1971年,10年内共降低17.58/10万。总的来看发病率呈下降趋势,但降低的速度是不平衡的;从发展速度和增长速度来看,在最初的1971~1975年是基本下降的,以后又略有回升现象。在1975年至1981年期间发病率平均发展速度为118.2%,平均增长速度为18.2%。8.从表5-6资料,判断某工厂肺癌发生率是否比一般人群高?表5-6某工厂肺癌发生率分组某厂一般人群人数肺癌人数肺癌发生率(1/万)吸烟70054.5不吸烟30011.5Ho:μ=μoH1:μ>μo单侧α=0.05μo吸烟=n1π1=700×0.00045=0.315μo不吸烟=n2π2=300×0.00015=0.045吸烟者的肺癌发生人数X≥5累计概率:P=1-[p(0)+p(1)+p(2)+p(3)+p(4)]P(0)=e-μ=e-0.315=0.7298P(1)=P(0+1)=P(0)×μ/(0+1)=0.7298×0.315/1=0.2299P(2)=P(1+1)=P(1)×μ/(1+1)=0.2299×0.315/2=0.0362P(3)=P(2+1)=P(2)×μ/(2+1)=0.0362×0.315/3=0.0038P(4)=P(3+1)=P(3)×μ/(3+1)=0.7298×0.315/4=0.000299P=1-(0.7298+0.2299+0.0362+0.0038+0.000299)=0.000001,按α=0.05水准拒绝Ho,接受H1,故可认为某工厂吸烟的肺癌发生率明显高于一般人群不吸烟组:Ho:μ=μoH1:μ>μo单侧α=0.05不吸烟者的肺癌发生人数X≥1的累计概率:P=1-P(0)P(0)==e-0.045=0.956P=1—0.956=0.044,按α=0.05水准拒绝Ho,接受H1,故可认为某工厂不吸烟的肺癌发生率高于一般人群。9.就表5-7资料如何比较甲乙两厂某工种某病患病率表5-7甲,乙两厂某工种某病患病率工龄甲厂乙厂(岁)工人数患者患病率(%)工人数患者患病率(%)<3400123.0010011.00≥31001010.004007218.00\n|合计500224.405007314.60从表中可以清楚看到≥3的工龄组的患病率乙厂高于甲厂,<3岁组甲厂高于乙厂,呈现交叉现象。甲厂以患病率低的3年以下工人为主,乙厂则以患病率高的工龄在3年以上的工人为主。这种情况下不能直接比较总患病率,应按不同工龄组进行比较10.设某病患者的自然康复率为30%,分别求10个患者中自然康复1人及以下,8人以上的概率本例π=0.30,1-π=0.7,n=10。依题意10名患者中:(1)康复1人及以下的概率P(X≤1)=P(0)=0.710=0.02825P(1)=P(x≤1)=0.02825+0.12106=0.1493(2)康复8人及以上的概率。P(x≥8)=P(8)==P(x+1)=P(X)×P(9)=p(8)P(10)=0.310=0.000005905则P(x≥8)=P(8)+P(9)+P(10)=0.00159当某病自然康复率为30%时,10名患者中1人及1人以下康复的概率为0.14931,康复8人及8人以上的概率为0.0015911.用某型麻疹疫苗接种一批麻疹易感儿,把接种后已阳转者96名作为观察对象,3年后复查,96名中仍为阳性者为85名,试求该疫苗接种阳转者3年后仍保持阳性的百分率的95%可信区间因为nP=85,nq=11,均大于5,n=96>50,可按正态近似求该疫苗接种3年仍保持阳转率的95%可信区间。=0.85540.0637=(82.17~94.91)%12.用一种新药治疗某种寄生虫病,受试者50人中在服药后1人发生严重反应,这种反应在此病患者中也曾有发生,但过去普查结果为每5000人仅有一人出现。问此药是否提高了这种反应生率?Ho:服药后的反应率与普查时的反应率相等,即受试者每50人服药后平均反应人数为μo\n|H1:服药后的反应率高于普查时的反应率,即μ>μo单侧α=0.05本例n=50,πo=1/5000=0.0002,μo=nπo=50×0.0002=0.01,样本例数为50时,抽得样本严重反应人数X≥1的概率:P=1-P(0)P(0)=P=1-0.99=0.01今P=0.01,按α=0.05,拒绝Ho,接受H1,故可认为此新药能提高了这种反应的发生率。13.同一水样中,每次抽取1ml置培养皿中,共作10个平板培养,共数得菌落146个,试估计该检样菌落数的95%可信区间。X=146(个),X>50,用正态近似法求该检样本菌落数的95%的可信区间为:X±14.某疫苗预防接种后,进行有关的非传染性疾病流行病学考核,结果如下:接种组与对照组各调查10万人,接种组发病22人,对照组发病36人。试问两组发病率有无差别?Ho:两组发病率相同,即μ1=μ2H1:两组发病率不相同,即μ1≠μ2α=0.05本例=22人u=查附表2,t界值表,υ=∞,得0.1>P>0.05,在α=0.05的水准上,不拒绝Ho,尚不能认为两组发病率有差别。15.甲乙两市分别用抽样调查了解已婚妇女宫颈癌的患病情况,甲市调查1万人,患者82例,乙市调查2万人,患者102例。问甲乙两市宫颈癌患病率有无差别?Ho:两市已婚妇女宫颈癌患病率相等,即μ1=μ2H1:两市已婚妇女宫颈癌患病率不相等,即μ1≠μ2α=0.05=82/10000=0.0082,=102/20000=0.0051u==2.9899本题也可以万人为单位,计算更为简单:u=查附表2,t界值表,υ=∞,得0.005>P>0.002,在α=0.05的水准上,拒绝Ho,接受H1,故可认为两市妇女子宫颈癌患病率的差别有显著性,甲市已婚妇女子宫颈癌患病率高于乙市。16.观察某种防治细菌性痢疾(菌痢)措施的效果,结果如表3-6。问能否据此认为该\n|措施有效?表5-8两组人群菌痢发病率的比较(1979年)分组人数菌痢例数(无菌痢数)发病率(‰)试验组41182140975.1对照组521772514513.8合计93359392429.96Ho:π1=π2H1:π1≠π2单侧α=0.05u==查附表2,t界值表,υ=∞,得P<0.005,按α=0.05的水准,拒绝Ho,接受H1,故可认为实验组和对照组的菌痢发病率有差别,实验组的发病率低于对照组,即该措施有效。17.把某肿瘤新发病例按住址点在一张地图上,又将地图划分成许多面积相等的小方格,再分别统计发病数0,1,2,……及相应的方格数,对此资料作Possion分布拟合优度的X²检验,若P<0.05,就可认为此病在人群中的分布不随机,可能有聚集性。你认为如何?答:对此资料作Poisson分布拟合优度的X²检验,若P<0.05按α=0.05水准,拒绝Ho,接受H1,可认为此资料不服从Poisson分布,也即可以认为此病在人群中不呈随机分布,再综合考虑环境(地形、地貌)遗传等资料,结合专业知识确定有无聚集性。18.某乡有人口5000人,已知血吸虫粪检阳性率下降至5%左右。血防站准备进行一次血吸虫感染的普查,拟先将每10人粪便作为一个初筛的混合样本,混合样本血吸虫卵阴性,则该10人均作阴性;混合样本阳性,再对该混合样本的10人粪便逐人复查。问此法比一般的逐人粪便检查会减少多大的工作量?设:k=每组混合样本例数;P=粪检血吸虫卵阳性率;q=阴性率=1-p;N=全部受检人数;N/k=混合样本数,即组数(1)计算每组平均检验次数。由二项分布理论可知:概率检验次数混合样本内粪检q.q.q…q=qk1全部为阴性混合样本内粪检1-qkk+1至少有1例阳性一组平均检验次数=(qk×1)+(1-qk)(k+1)=k-kqk+1(1)(2)计算全部检验期望数。全部检验期望数=(N/k)(k-kqk+1)=N(1-qk+1/k)(2)本例已知:N=5000,K=10,P=0.05,q=1-p=0.95,代入试(2)全部受检期望数=5000×(1-0.9510+1/10)=2506.32比一般逐人检查减少工作量:5000-2506.32=2493.68,减少工作量的百分比为:\n|2493.68/5000=49.87%。19.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如表5-9,试估计该县百白破疫苗接种率的95%可信区间。表5-9某县三类乡百白破疫苗接种率调查结果类别人数抽样人数接种率好73717230.8174较好1489914780.6969差93089300.3022合计305783131本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及其标准误。(1)p=[ΣΝiΡi]/Ν=1/31578[7371×0.8174+14899×06969+9308×0.3022]=19221.0461/31578=0.608685(2)==0.007520该率不接近于0或1,一般认为服从二项分布。因n=3131,较大,可用正态近似法计算其可信区间。95%CI:P±1.96sp=0.608635+1.96×0.007520=(0.5939,0.6234)20.为了解某县某病感染率,现从全县125个村民组(共3万人)中随机抽出10个村民组,对该10个村民组的全部人口进行了调查,结果如下,试据此估计此县农村居民感染率村民组12345678910合计人数1381561761841942152743293503702386感染人数41485670758690101109121797本例采用整群抽样作总体率的点估计和区间估计。按正态近似原理计算:已知:K=125,k=10点估计:p=(K/Nk)(Σαi)=(125/30000/10)×(797)=0.3321=0.0335595% 可信区间:P±1.96sp=(0.2663,0.3979)99%可信区间:P±2.58sp=(0.2455,0.4187)第六章χ2检验一、名词解释:二、填空题:1、行×列表X2检验若有T<1或1<T<5的各自理论数1/5以上,其最好处理办法是___________。\n|2、四格表若有理论数小于1或n<40宜用__________法。3、四格表X2值校正检验条件为______________________。一、是非题:1.χ²检验可推断两个或两个以上构成总体的分类构成比是否相同()2.χ²检验的自由度ν=(R-1)(C-1)()3.有理论数小于1时,三行四列的表也不能直接作χ²检验()4.四格表的确切概率法要求先列出周边合计不变条件下的各种组合的四格表,所有这些四格表的概率之和即为双侧检验P值()5.配对四格表当n>40时,χ²检验的公式选用χ2=(b-c)2/(b+c)()6.χ²检验可用于检验两个或两个以上构成比之间的差异()7.四格表χ²检验,当1<T<5,且n>40选用公式和结果是一样的。()二、单选题:1.样本率与总体率差别的显著性检验公式为:A.u=B.u=C.u=D.t=E.t=2.在样本率与总体率差别的显著性检验中有:A.u>2.58时P<0.01B.u>2.58时P>0.01C.t>t0.01(n’)时P<0.01D.t>t0.01(n’)时P>0.01E.以上都不是3.两样本率与总体率差别的假设检验的目的是:A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个总体率的差别有无显著性D.推断两个样本率和两个总体率有无差别E.推断两个样本率和两个总体率的差别有无显著性4.假设对两个率差别的假设检验分用u检验和X²检验,则算得的u值和X²值的关系有:A.u检验比X²检验准确B.X²检验比u检验准确C.u=X2D.u=E.X2=5.用某中草药预防流感,其用药组与对照组的流感发病情况如下表组别观察人数发病人数发病率(%)用药组1001414对照组1203025则构成四格表的四个格子内的数字是:A.B.86149030\n|1001412030100141202510086120901001412025C.D.14863090E.141430256.R×C列联表X²检验的自由度为:A.R-1B.C-1C.R+C-1D.R×C-1E.(R-1)(C-1)7.在R×C表的X2检验中,设和n分别表示行合计、列合计和总合计,则计算每格理论数的公式为:8.四表格资料用基本公式或专用公式求X²值的条件:A.≥5(为每格实际数)B.≥5(为每格理论数)C.≥5和≥5D.≥5和n≥40(n为总例数)E.≥5和n≥409.本是配对四格表X²检验的资料,误作一般四格表X²检验,则:A.会降低检验效率B.会提高检验效率C.降低检验效率和提高检验效率都可能D.两者效率相等E.两者效率近似相等10.R×C表必须用公式求理论数的格子个数(其他可由减法求出)为:A.R×CB.(R-1)(C-1)C.R(C-1)D.C(R-1)E.R+C-111.行×列表的X²检验应注意:A.任一格理论数小于5,则要用校正公式B.任一格理论数小于5,则要将相应组合并C.若1/5以上格子理论数小于5,则要用校正公式D.若1/5以上格子理论数小于5,则要考虑合理并组E.以上都不对12.两组计数配对资料比较,当(b+c)<40时,宜用_______公式计算检验统计量来判断两组差异的来源。\n|A.(b-c)²/(b+c)B.Σ(|A-T|-1)²/TC.Σ(|A-T|-1)/TD.(|b-c|-1)²/(b+c)E.[(|ad-bc|-n/2)²n]/[(a+b)(c+d)(a+c)(b+d)]13.两组计数非配对资料比较,每组分阳性和阴性两部分,当n>40,有一个理论数1<T<5,用_______公式计算检验统计量。A.(b-c)²/(b+c)B.Σ(|A-T|-0.5)²/TC.Σ(|A-T|-1)²/TD.(|b-c|-1)²/(b+c)E.以上均不对14.某医师用注射疗法治疗椎间盘突出,治疗26例12人治愈,用手术方法治疗25人18人治愈,若进行X²检验用:AΣ(A-T)²/TBΣ(|A-T|-1)²/TCΣ(|A-T|-0.5)²/TD(|A-T|-1)²/TEΣ(A-T)/T15.某医师用电针灸加中药治疗抑郁症病人,治疗16例15人治愈,用西药治疗23人,21人治愈,若比较两组的治疗效果用:AΣ(A-T)²/TBΣ(|A-T|-1)²/TCΣ(|A-T|-0.5)²/TD(|A-T|-1)²/TE确切概率法16.计算麻疹疫苗接种后血清检查的阳转率,分母为_______。A麻疹易感儿数B麻疹患儿人数C麻疹疫苗接种人数D麻疹接种后的阳转人数17.已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是_______。A分性别进行比较B两个率比较的X²检验C不具可比性,不能比较D对性别进行标准化后再比较18.从甲乙两文中,查到同类研究的两个率比较的四格表资料,其X²检验,甲文X²>X²0.01(1),乙文X²>X²0.05(1)可认为_______。A两文结果有矛盾B两文结果基本一致C甲文结果更为可信D甲文说明总体的差别较大19.四个样本率作比较,X²>X²0.01(3)可认为_______。A各总体率不同或不全相同B各总体率均不相同C各样本率不相同D各样本率不同或不全相同20.(概率分布)在以下条件时是对称的:A.当总体率时B.当总体率时C.当总体率时D.当总体率接近0.1或0.9时E.为任意值21.某医师用新药治疗一组高血压病人36例,35例好转,估计该疗法好转95%的可信区间,用_______。AP±1.96SpBP±2.58SpCP±1.96SDP±2.58SE查表法一、问答题:1.χ²检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?2、χ2检验的基本思想是什么?3、四表格资料在何种情况下需要进行校正?为什么?4、行×列表χ2检验的注意事项有哪些?\n|一、计算题1.某医师用甲、乙两药治疗某病,结果如下表,问甲、乙两药疗效有无差别?表6-1甲、乙两药疗效比较药物例数治愈数治愈率(%)甲402972.5乙736994.51.某卫生防疫站在中小学观察三种矫治近视眼措施的效果,近期疗效数据如表,结论为“近期疗效要以夏天无眼药水最好,保健操为次,新医疗法最差”。试对此作分析评价。表6-2三措施的近期有效率比较矫治方法有效人数无效人数(合计)有效率(%)夏天无眼药水518413537.78新医疗法6263218.75眼保健操5131827.78合计6212318533.512.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料整理如表。问两者之间是否存在一定的关系?表6-3某厂职工冠心病与眼底动脉硬化普查结果分析眼底动脉硬化冠心病诊断结果合计正常可疑冠心病0340116357Ⅰ7313692Ⅱ+Ⅲ1002019139合计5134431588注:原表中=6×31/588=0.3163<1,故将Ⅱ和Ⅲ级合并3.表6-4用两种方法检查已确诊的乳腺癌患者120名。甲法检出率为60%,乙法检出率50%,甲乙两法一致的检出率为35%,问:(1)两种方法何者为优?表6-4甲乙两法检验结果乙法甲法合计+-\n|+421860-303060合计72481201.经反复多次实践证明,用一般疗法治疗某病的治愈率约为20%。现改用新疗法治疗,并随机抽取400名该病患者进行治疗,那么这400名患者中至少要多少人治愈才能判断比一般疗法效果好?此判断发生错误的概率有多大?2.某种化学物质经诱发肿瘤试验,实验组15只白鼠中4只发生癌变,对照组10只白鼠无一发生癌变(表6-5)。问两组发癌率有无差别?表6-5某药物肿瘤治疗试验发癌数未发癌数合计实验组41115对照组0(1.6)1010合计421253.某医院收治了100例临床确诊的小儿佝偻病患者,入院时均分别作血生化检查与X光片检查(表6-6)。欲了解此病法何者较敏感,试设计一整理表,并指出宜作何统计处理?表6-6佝偻病患儿入院检查登记表编号生化检验X光片12..1004.某医生观察某新药对预防流行性感冒(流感)的效果,并作了统计处理(如下表),你对此有何意见?表6-7:用药组和对照组流感患病率比较发病数未发病数合计有效率%服药组5013018072.2未服药组4019023082.6合计9032041078.05χ²=6.63,P<0.05答案填空题:1.合理并组2.确切概率法(精确X2.0)3.n≥401≤T<5是非题:1.√2.√3.×4.×5.×6.√7.√单选题:1.A2.A3.B4.D5.A6.E7.C8.E9.A10.B11.D12.D13.B14.A15.E16.C17.D18.C19.A20.A21.E\n|问答题:1.X²检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?(1)X²检验适用于:①两个及两个以上的率或构成比的比较;②计数资料两因素间的相关关系;③频数分布的拟合优度检验。(2)对资料的设计类型和应用条件。1)四格表的X²检验:基本公式T>5且n>40专用公式校正公式1<T<5且n>40或当T<1或n<40时,可使用确切概率计算法直接计算概率,应用时注意区分单、双侧检验。双侧检验。双侧检验取两侧累积概率,单侧检验只取一侧累积概率。2)行×列(R×C)表资料的X²检验:基本公式与四格表基本公式相同。专用公式:可使用实际频数计算X2。适用条件①行×列表不宜有1/5以上的格子的理论频数小于5,或有一格理论频数小于1。②当多个样本率(或构成比)比较的X²检验,拒绝检验假设,只能认为各总体率(或构成比)之间总的有差别,但不能说明彼此间都有差别或某两者间有差别,若要进一步解决此问题,可用X²分割法。③对单向有序列联表,X²检验只说明各处理组的效应在构成比上有无差别。3)列联表资料的X2检验:R×C列联表公式:与R×C(行×列)表相同,但检验假设不同,R×C列联表用于检验有无关联,而R×C(行×列)表用于多个率或构成比的比较。适用条件与行×列表适用条件①相同。2×2列联表或配对资料X²检验,检验两个处理有无差别。b+c>40或校正公式b+c<40检验两种处理间有无相关,公式同四格表所用公式\n|4)频数分布拟合优度的X2公式适用条件遇有理论频数小于5时,可与相邻组合并。2.X2检验的基本思想是什么?X2检验的基本思想是实际数与理论编数的吻合程度,它是根据检验假设来确定的,如作两样本率的比较,我们先假设两组的总体率相同,均等于两组合计的总率,如果检验假设成立,则实际数与理论数之差一般不会很大。出现很大的X2值的概率是很小的若P查看更多