卫生统计学题库

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

卫生统计学题库

简答题1.欲研究广东省6岁儿童的身高情况,在广东省随机抽取了200名6岁儿童进行调查,以此为例说明同质、变异、总体与样本这几个概念。答:同质体现在同为广东省、同为6岁儿童,变异体现在200名儿童的身高不同。总体是指所有广东省6岁儿童,样本为200名6岁儿童。2.卫生统计工作中的统计资料主要的来源有哪些?答:①统计报表。②经常性工作记录。③专题调查或实验。3.简述统计工作全过程的四个步骤。答:研究设计、收集资料、整理资料、统计分析。4.试举例说明常见的三种资料类型。答:(1).计量或测量或数值资料,如身高、体重等。(2).计数或分类资料,如性别、血型等。(3).等级资料,如尿蛋白含量-、+、++、+++、…。5.统计学上的变异、变量、变量值是指什么?答:变异:每个观察个体之间的测量指标的差异称为变异。变量:表示个体某种变异特征的量为变量。变量值:对变量的测得值为变量值。6.简述编制频数表的步骤与要点。答:(1)找出最大和最小值,计算极差。(2)确定组距和列出分组计划:第一组应包括最小值;最末组应包括最大值,并闭口。(3)将原始数据整理后,得到各组频数。7.描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?答:常用描述平均水平的平均数有算术均数、几何均数和中位数。算术均数适合:对称资料,最好是近似正态分布资料。几何均数适合:经对数转换后近似对称分布的原始变量,常用于微生物学和免疫学指标。中位数适合:数据非对称分布、分布不清楚或开口资料的情形。8.描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系数。极差适合:数据分布非对称的情形。四分位数差距适合:数据分布非对称的情形。方差与标准差适合:对称分布或近似正态分布资料,能充分利用全部个体的信息。变异系数适用:当比较两资料的变异程度大小时,如果变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。9.统计描述的基本方法有哪些,各自有何特点?答:统计描述的基本方法:用表、图和数字的形式概括原始资料的主要信息。表:详细、精确。图:直观。指标:综合性好。10.简述变异系数的实用时机。答:变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。11.怎样正确描述一组计量资料?答:(1).根据分布类型选择指标。(2).正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。12.正态分布的主要特征有哪些?108\n答:(1)正态曲线在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。(3)正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)。(4)正态曲线下的面积分布有一定规律。13.参考值范围是指什么?答:参考值范围又称正常值范围,即大多数正常人某指标值的范围。“正常人”是指排除了影响研究指标的疾病和有关因素的同质人群。14.简述估计参考值范围的步骤与要点。答:设计:①样本:“正常人”,大样本n≥100。②单侧或双侧。③指标分布类型。计算:①若直方图看来像正态分布,用正态分布法。②若直方图看来不像正态分布,用百分位数法。15.简述正态分布的用途。答:(1)估计频数分布。(2)制定参考值范围。(3)质量控制。(4)统计检验的理论基础。16.简述可信区间在假设检验问题中的作用。答:可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。故将二者结合起来,才是对假设检验问题的完整分析。17.假设检验时,当P≤0.05,则拒绝H0,理论依据是什么?答:P值为H0成立的条件下,比检验统计量更极端的概率,即大于等于检验统计量的概率。当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于0.05,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。下差别“有统计学”意义的结论的同时,我们能够知道可能犯错误的概率不会大于0.05,也就是说,有了概率保证。18.假设检验中与P的区别何在?答:以t检验为例,与P都可用t分布尾部面积大小表示,所不同的是:值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。P值是由实际样本获得的,是指在H0成立的前提下,出现大于或等于现有检验统计量的概率。19.什么叫两型错误?作统计学假设检验为什么要加以考虑?答:如果H0正确,检验结果却拒绝H0,而接受H1,则犯I型错误,记为α;如果H0错误,检验结果却不拒绝H0,未能接受H1,则犯II型错误,记为β。一般情况下,α越大,β越小;α越小,β越大。如果要同时减少两类错误,则需最大样本含量。因为假设检验的结论都有犯错误的可能性,所以实验者在下假设检验有无统计学意义的结论时,都要考虑到两型错误。20.配对比较是不是就比成组比较好?什么情况下用配对比较比较好?答:配对比较可以控制实验单位个体间的变异,从而减少实验误差,提高检验性能。但这并不是说凡是配对试验就一定比成组比较好。实验是否应做配对比较,首先应根据业务知识判断,看配成对子的个体间是否比不配对的个体间相似程度更高。21.t检验有几种?各适用于哪些情况?答:t检验以t分布为理论基础。小样本时要求假定条件:资料服从正态分布,方差齐同。一般分为三种:一是样本均数与总体均数比较的t检验。即将一个样本均数X与一已知的总体均数作比较;二是配对资料的t检验。例如治疗前后的比较,或配成对子的实验动物之间的比较。三是两个样本均数比较的t检验;两组的样本量可以不相同。此外尚有相关系数、回归系数的t检验。22.什么叫假设检验?医学研究中常用的假设检验有哪些?108\n答:判断总体与样本之间、样本与样本之间的差异有无统计学意义的统计分析方法,一般步骤是:①提出检验假设0H,确定单双侧与检验水准α;②计算检验统计量;③确定概率P值;④判断结果。在医学研究中常用的显著性检验有u检验、t检验、F检验、2c检验及非参数秩和检验等多种,不论那种检验均以假设成立时得到的统计量的概率来判断。23.通过实例说明为什么假设检验的结论不能绝对化?答:统计的结论为概率性的结论。拒绝H0时,可能犯Ⅰ型错误。不拒绝H0时,可能犯Ⅱ型错误。24.方差分析的检验假设(H0)是什么?答:各总体均数相等25.方差分析中,各离均差平方和之间有何联系?各自由度之间又有何联系?完全随机设计、随机区组设计的方差分析的离均差平方和与自由度分别如何分解?答:总的离均差平方和等于各部分离均差平方和之和.总的自由度等于各部分自由度之和.完全随机设计:SS总=SS组内+SS组间V总=V组内+V组间随机区组设计:SS总=SS组内+SS处理组间+SS区组间V总=V组内+V处理组间+V区组间26.三组均数比较时,为什么不能直接作一般的两两均数比较的t检验?答:增大犯第一类错误的可能性.27.两组均数差别的假设检验能否作方差分析,为什么?答:可以.方差分析与t检验关系:k=2时,F=t2,P值相等,即两检验等价。28.方差分析中,组间变异是来源于那些方面的变异?答:该变异除随机原因的影响外,有可能存在处理因素的作用。29.对多组均数作方差分析的主要步骤和结果有那些?答:(1)建立检验假设和检验水准(2)计算统计量F值(列出方差分析表)(3)确定P值和作出推断结论(4)作两两均数之间的比较(若P>0.05则可省略此步骤)30.方差分析的基本思想是什么?答:方差分析的基本思想:就是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,通过比较各部分平均变异与随机误差平均变异,即可了解该因素对测定结果有无影响。31.为什么不能以构成比代率?答:二者说明的问题不同。构成比只能说明某事物内部各组成部分在全体中所占的比重或分布,不能说明某现象发生的频率或强度。32.简述相对数标准化的基本思想。答:基本思想:采用统一的标准人口年龄构成,以消除不同人口构成对两地死亡率的影响,使得到的标准化死亡率具有可比性。33解释在何种情况下应选用率的直接标化法,何种情况选用间接标化法?答:率的直接标化法:已知各组的年龄别死亡率pi。间接标化法:已知各组的死亡总数和各年龄组人口数.34.率的直接标化法,与间接标化法有何不同?答:(1)适用条件不同(见第上题);(2)“标准”不同:前者选定一个“标准人口”或“标准人口构成”。后者选定一套“标准年龄别死亡率”。35.应用相对数时应注意哪些问题?答:应用相对数指标的时候要注意:分母不宜过小;不要以比代率;资料的可比性;样本指标比较时应做假设检验。108\n36.常用相对数指标有哪些?它们的意义上有何不同?答:常用相对数指标:率、构成比、比。率又称频率指标或强度相对数。说明某现象发生的频率或强度。常用来表示某一事物发展的趋势或水平及特征。构成比又称构成指标或结构相对数。部分与全部之比,说明某事物内部各组成部分在全体中所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。比(又称相对比)表示同类的或有联系的两个现象间的对比关系,常用倍数或百分数表示。37.统计学上资料是否“具有可比性”指的是什么?你能举出一些不可比的例子吗?答:除研究因素外,其余重要影响因素应相同或相近。一般观察单位同质,研究方法相同,观察时间相等,以及地区、民族等客观条件一致。例如内科和外科的治愈率就无可比性。38.二项分布、Poisson分布各有哪些特征?答:二项分布和Poisson分布都是离散型分布。二项分布的形状取决于与n的大小:=0.5时,不论n大小,分布对称。≠0.5时,图形呈偏态,随n的增大,逐渐对称。当n足够大,或1-不太小,二项分布B(n,)近似于正态分布N(n,n(1-))。Poisson分布:值愈小分布愈偏,愈大分布趋于对称,当足够大时,分布接近正态分布N(,)。39.简述二项分布、Poisson分布、正态分布的关系。答:当n足够大,或1-不太小时,二项分布近似于正态分布。当n足够大,或1-很小时,二项分布近似于Poisson分布。较大时,Poisson分布近似于正态分布。40.二项分布的应用条件是什么?答:⑴每次试验有且仅有两个互相排斥的结果(A或非A)。⑵每次试验中,发生A的概率相同,均为π。⑶各次试验独立,即n次观察结果相互独立。41.检验的用途有哪些?答:主要适用于计数资料,(1)两个及两个以上的率或构成比的比较(2)交叉分类资料两属性间的关联性检验(3)频数分布的拟合优度。42.以下表资料说明χ2检验的基本思想。(不用计算)答:基本思想:假设观察值来自理论分布,则观察值与理论值就不会差别太大,如果差距太大,则怀疑H0是否成立。完全符合则为0或特别小,x2值越小,越支持H0。43.四格表资料检验的条件有哪些?答:T<1或n<40确切概率法n≥40但有1£T<5要校正n≥40并且T>5不必校正44.某病的发病率对全国人口来说是8.72%,现在某县回顾一年,抽样调查了120人,有16人发病,如果要考察该县的发病率是否高于全国,请问可不可以对该份资料作检验,你认为应该用什么方法?答:不能,用单样本率比较的u检验。45.请指出非参数检验与参数检验相比的优、缺点。答:非参数检验适用范围广,收集资料、统计分析也比较方便。但检验效率没有参数检验高,犯第二类错误的概率较大。46.简述参数检验与非参数检验的定义及两者的区别。108\n答:参数统计是总体的分布类型是已知的,对其中某些未知的参数进行估计和检验的统计方法。特点:依赖于特定的分布类型,比较的是参数。非参数统计是不依赖于总体分布具体形式的统计方法。特点:不受总体参数的影响,比较的是分布或分布位置,而不是参数。47.简述配对比较秩和检验的编秩方法。答:求差值,差值编秩;差值0删去,相同值取平均秩48.配对设计差值的符号秩和检验步骤。答:(1)H0:差值的总体中位数Md=0;H1:Md≠0;=0.05(2)求差值(3)编秩:依差值的绝对值从小到大秩次。绝对值相等者,若符号不同取平均秩次;零差值不参与编秩,同时样本数-1;将差值的正负标在秩次之前。(4)求秩和确定检验统计量:分别求正、负秩次之和,任取T+或T—作检验统计量T,(5)确定P值,作推断结论。49.两组比较的秩和检验的编秩方法。答:将两样本混合编秩次。若有“相同数据”,处于不同组,便取平均秩次;处于同一组,不必取平均秩次。50.对同一资料,又出自同一研究目的,用参数检验和非参检验结果不一致时,宜以何为准?答:当资料满足参数检验方法的条件时,应使用参数检验方法;当资料不满足参数检验方法的条件时,必须采用非参数检验方法。51.非参数检验的适用范围。答:①各种资料的初步分析;②等级资料:某种标志不便准确测定,只能以严重程度、优劣等级、成效大小、名次先后或综合判断等方式定出次序;③资料分布类型不能确定或偏态分布;④综合分析同质性较差的资料,如不同地点、不同年份的某种实验结果;⑤组内个别数据偏离过大,或各组内相差悬殊。52.两个变量之间的相关系数等于0,是否说明这两个变量之间没有关系?答:0相关不等于无关,因为可能无直线关系但有曲线关系53.直线回归及其回归方程有何用途?答:(一)描述Y对X的依存关系。(二)预测(forecast):由自变量X估算应变量Y。Y波动范围可按求个体Y值容许区间方法计算。(三)统计控制:控制Y估算X,逆估计。通过控制自变量X的取值,满足应变量Y在一定范围内波动。54.简述作直线相关与回归分析时应注意的事项。答:(1)回归方程要有实际意义。(2).分析前绘制散点图,考察是否有直线趋势或异常点。(3).直线回归的适用范围一般以自变量的取值范围为限。没有充分理由X的取值不要外延。55.简述直线回归与直线相关的区别与联系。答:(一)、区别(1)资料要求不同:回归可以有两种情况:①Y正态随机,X为选定变量----Ⅰ型回归;②X、Y服从双变量正态分布----Ⅱ型回归。相关:X、Y服从双变量正态分布。(2)应用不同:回归是由一个变量值推算另一个变量的数值,说明依存变化的数量关系。相关是只说明两个变量间是否有关联。108\n(3)意义不同:b表示X每增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间关系的密切程度和方向。(4)取值范围不同:-∞<b<+∞;-1<a<+1。(5)回归系数有单位,相关系数无单位。(二)、关系(1)方向一致:对一组数据若同时计算r与b,其正负号一致。(2)假设检验等价:对同一样本,tr=tb,P值相等。(3)用回归解释相关:决定系数反映Y的总变异中有多大可能可由X来解释。越接近1,回归的效果越好。56.简述直线相关系数意义。答:相关系数描述线性相关的密切程度与方向。相关系数没有单位,-1≤r≤1。r>0表示正相关;r<0表示负相关;|r|=1表示完全相关;r=0表示零相关。57.经检验认为回归方程有意义,表明两变量间存在因果关系,对否?答:不一定。应联系专业知识考察变量间关系。58.用什么方法考察回归直线图示是否正确?答:直线经过(X,Y)点。直线与纵轴交点的纵坐标为截距a。直线应在自变量X的实测范围内。59.依次写出箱式图中涉及到的各个取值。由大到小的次序为:极大值、75P、中位数、25P和极小值。60.直方图中各矩形的高度等于频数(或频率),对吗?答:对于各组距相等的情形,该说法是对的。若某些组段的组距与多数组段所取组距不同时,例如前者是后者的k倍,则该不等距组段的高度为频数(或频率)除以k。确切地说,组段对应的面积等于频数(或频率)。61.统计表的列表原则是什么?答:一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。62.线图和半对数线图的主要区别是什么?答:线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋势;半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增长或减少速度。63.某医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三个基本要素是什么?答:降压药物为处理因素,高血压患者为受试对象,血压(如舒张压)的改变量为实验效应。64.样本含量估计的要素有哪些?答:(1)根据研究目的,建立检验假设(2)定出检验水准,常取0.05=(3)提出所期望的检验效能(4)必须知道由样本推断总体的一些信息,例如,对于两总体均数的比较,需知道两均数间的差值和总体标准差65.什么是盲法?举例说明盲法在临床试验中的重要性。答:为了有效减少实验观察过程中的偏倚,使患者(甚至包括研究者及其他参与者)不知道处理措施的内容,称为盲法。可有单盲法、双盲法和三盲法。例如研究某抗神经衰弱药物的疗效,当患者知晓自己所接受的处理措施时,对疗效的评价往往会受心理因素作用而不够客观。采用盲法,则可以避免疗效测量中可能产生的偏倚。66.实验设计应当遵循哪些基本的原则?随机化原则、对照的原则及重复的原则。67.各举一个配对设计和成组设计的例子。在评价某降压药物的降压作用时,可以采用以下两种方案。108\n配对设计:按体重和舒张压相近、性别和窝别相同将40只大鼠分为20对,每对中随机地取其一接受A药,另一只接受B药。服用一个疗程后,比较两组血压改变量的区别,从而考察药物A和B的疗效。成组设计:将体重和舒张压相近、性别相同的40只大鼠随机地分为两组,取其中一组接受A药,另一组接受B药。服用一个疗程后,比较两组血压改变量的平均水平的区别,从而考察药物A和B的疗效。68.按实验设计的要求和原则,对下列设计加以分析:某医师研究一种新药对慢性支气管炎的近期疗效,以门诊30名病人作为观察对象,以30名住院病人服用传统药物作为对照,经过3周治疗后,统计结果发现新药症状近控率高于传统药物近控率。答:门诊病人和住院病人的病情轻重不均衡。假设门诊病人的病情较轻,则近控率较高可能是由于此原因,从而夸大了新药的作用。建议门诊病人中随机抽取一半接受新药,另一半接受传统药物。住院病人也随机分为两组接受这两种处理。然后分别考察两种药物对不同组别的疗效。69.某研究者欲将15只大白鼠随机分配到甲、乙、丙三组,每组5例。试由查出的随机数字写出分组结果,并简述分组方法。答:动物号:123456789101112131415随机数字:40910145162123111378随机数字对应为0~4,5~9,10~14的个体分别分入甲、乙、丙三组,结果动物号1、2、7、9、11者分入甲组;动物号3、6、8、14、15者分入乙组;动物号4、5、10、12、13者分入丙组70.调查研究的基本抽样方法有那些?按抽样误差由大到小的顺序写出。答:整群抽样、单纯随机抽样、系统抽样和分层抽样。71.举例说明开放式问题和封闭式问题的特点。答:开放式问题未加任何限制,封闭式问题则提供了若干备选项。例如在调查首次妊娠年龄时,可以采用开放式问题:请填写您首次妊娠的具体年龄;也可以采用封闭式问题:您首次妊娠的年龄是:①<20岁②<25岁③<30岁④30及以上。72.常用的获得原始资料的调查方式有哪些?应答率最低和所得资料最为可靠的方式分别是哪种?答:直接观察法、直接采访法和间接采访法。应答率最低的方法是间接采访法,而直接观察法所得资料最为可靠。73.由无限总体抽样和有限总体抽样时所需的样本含量有何不同?答:由无限总体抽样时所需的样本含量大于从有限总体抽样。74.根据调查范围可以将调查方法分为哪些?答:普查(全面调查)、抽样调查和典型调查(案例调查)。75.简述常用的四种随机抽样方法。答:(1)完全随机抽样,即总体中每一个体有同等的机会被抽中或分配到某一组,如抽签或随机数字表法;(2)系统抽样或等距抽样或机械抽样,首先将总体中的个体按某种顺序编码并分为n个组段,间隔为k,接着用完全随机方法在第一组段中抽出一个号码,往后各组依次递加k个号码的个体被抽中;(3)整群抽样,首先将总体分为K群,而后从中抽取k个群体作为样本;(4)分层随机抽样,首先将总体按个体特征分为K层,而后分别从每一层中随机抽样。76.某市卫生防疫站为验证复方制剂A(桉叶、板兰根、防风、白芷和葛根等)预防流感的效果,取城区第一幼儿园的儿童作研究对象,小班儿童为实验组服用制剂A,大班儿童为空白对照组,不服用任何制剂,结果认为制剂A无预防流感的作用。试评述该结果。答:该实验结果是不可靠的,理由是:(1)流感对全体人群都敏感,仅选择儿童作研究对象是不够的,对成人也应进行研究。108\n(2)实验组和对照组缺乏可比性,事实上,大班儿童的免疫力及身体素质状况比小班好,即两组的非处理因素不均衡;(3)如用该幼儿园作研究对象,应分别将大班和小班分为两半放到实验组和对照组。77.何谓人口老龄化?请简述其影响因素。答1:人口老龄化是指老年人口(65岁及以上)在人口中所占的比重升高的现象。在没有迁移的情况下,人口老龄化的进程主要受生育率和死亡率两种因素的影响。生育率下降,使低年龄人口的比重降低,高年龄人口的比重相应增加;死亡率(主要是中老年人口的死亡率)降低,使寿命延长,老年人口比重增加。一般来说,人口老龄化的速度和程度主要取决于生育率的下降速度。当生育率水平下降达到很低的水平且很难再有较大程度的降低时,中老年人口死亡率的降低对人口老龄化的影响才比较明显。78.发病率、时点患病率、时期患病率的区别。答:(1)发病率是指观察期内,可能发生某病的人群中新发病例的频率,其观察期多为年、月、日等,急性常见病多计算发病率。(2)时点患病率反映在检查或调查时点一定人群中某病的现患情况(包括该病的新旧病例数)。观察时点在理论上是无长度的,但实际上观察时间不宜过长,一般不超过个月。(3)时期患病率反映在观察期间一定人群中存在或流行某病的频度,包括观察期间的新发病例和现患病例数,为慢性病的统计指标。79.疾病统计的观察单位“病人”和“病例”的区别。答:(1)一个人每次患病都可作为一个病例。以病例为单位的疾病统计,可研究居民各种疾病的频度、疾病的种类及疾病的变动,以获得居民患病的基本规律。(2)病人是指一个有病的人。在观察期间内,观察对象患有疾病即算作一个病人,不管其患病的种类及患病次数的多少。以病人为单位的疾病统计,在一定程度上反映居民的患病频度,可找出具体的患病人群,便于开展对病人个人的防治工作。80.病死率和死亡率的区别。答:(1)某病病死率表示在规定的观察期内,某病患者中因该病而死亡的频率。它是反映疾病的严重程度的指标。在用病死率进行比较时应注意病情轻重等内部构成不同的影响。计算公式为:观察期内因某病死亡的人数某病病死率=同期该病患者数×1000‰(2)某病死亡率表示在规定的观察期内,人群中因某病而死亡的频率。它可以反映不同地区或年代某种疾病的死亡水平。计算公式为:观察期内因某病死亡的人数某病死亡率=同期平均人口数×1000‰81.简述婴儿死亡率指标的实际意义答:婴儿死亡率指某地某年不满一周岁婴儿的死亡数与同期活产总数的比值。婴儿死亡率=某年不满周岁婴儿死亡数×1000‰/同期活产数婴儿死亡率的高低对平均寿命有重要的影响,它是反映社会卫生状况和婴儿保健工作的重要指标,也是死亡统计指标中较为敏感的指标。婴儿死亡率不受年龄的影响,不同国家或地区之间可以相互比较。82.平均寿命与平均死亡年龄的区别?答:平均寿命是指0岁组预期寿命,仅取决于年龄组死亡率的高低,两地的平均寿命可直接进行比较。平均死亡年龄是指死者死亡时年龄的算术均数,不仅取决于年龄组死亡率的高低,也取决于年龄别人口构成,两地的平均死亡年龄不能直接进行比较。83.简略去死因寿命表的作用。答:研究某种死因对居民死亡的影响,可编制去死因寿命表。其基本思想是,假使消除了某种死因,则原死于该原因的人不死于该原因,寿命就会有所延长。显然,如果消除了对生命威胁大的死因,寿命就会延长更多。去死因寿命表的优点是:①108\n以某死因耗损的预期寿命和尚存人数合理地说明了该死因对人群生命的影响程度。②去死因寿命表的指标既能综合说明某死因对全人口的作用,又能分别说明某死因对各年龄组人口的作用。③去死因寿命表的指标同样不受人口年龄构成的影响,便于相互比较。84.简述寿命表中的几个主要指标。答:寿命的各项指标Xl、Xnd、Xnq、Xe,都用来评价居民的健康水平。其中最主要的指标是平均预期寿命。寿命表尚存人数:反映在一定年龄组死亡率基础上,一代人口的生存过程,一般用线图表示。尚存人数随年龄增加而减少。寿命表死亡人数:反映在一定年龄组死亡基础上,一代人口的死亡过程。一般用直方图表示。横坐标为年龄,纵坐标为死亡人数。寿命表死亡概率:取决于各年龄组死亡率,一般用半对数线图表示。预期寿命:预期寿命是评价居民健康状况的主要指标。一般用线图表示。85.简述寿命表的用途。答:寿命表主要应用于:(1)评价国家或地区居民健康水平。(2)利用寿命表研究人口再生产情况。(3)利用寿命表指标进行人口预测。(4)利用寿命表方法研究人群的生育、发育及疾病的发展规律。86.全死因寿命表可分为哪几类,哪类更常用。答:寿命表是根据某地特定人群的年龄组死亡率编制而成的。一般可分为定群寿命表和现时寿命表。由于人的生命周期很长,用定群寿命表的方法去研究人群的生命过程,不仅随访人数要很多,而且随访时间要数十年。因此,在编制寿命表时,一般不使用定群寿命表,而是使用现时寿命表。现时寿命表是假定同时出生的一代人(一般为10万),按照某年(或某一时期内)特定人群的年龄组死亡率先后死去,直至死完为止,用寿命表方法计算出这一代人在不同年龄组的“死亡概率”、“死亡人数”、刚满某年龄时的“尚存人数”及其“预期寿命”等指标。这些指标不受人群年龄构成的影响,不同的地区可以相互比较。根据年龄分组方法的不同,现时寿命表可分为完全寿命表及简略寿命表两种。完全寿命表年龄分组的组距是1岁,而简略寿命表习惯上将年龄组距定为5岁。因为婴儿死亡率对寿命表的影响相当大,所以简略寿命表也将第1个5岁年龄组拆分为组距为1岁的“0~”岁组和组距为4岁的“1~”岁组,从5岁开始年龄组距才为5岁。87.在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理?答:当作截尾数据处理。88.生存分析可用于发病资料的分析吗?请举例说明。答:可用于慢性病的发病资料分析。89.生存时间能计算平均数、标准差吗?答:.因为这类资料常包含截尾数据,并且常为非正态分布,所以一般不可以计算均数和标准差,应计算半数生存时间。90.Cox回归可估计参数,故属于参数方法?答.属于半参数模型91.简述生存资料的基本要求。答:生存资料的基本要求为:①样本由随机抽样方法获得,并有足够数量;②死亡例数不能太少;③截尾比例不能太大;④生存时间尽可能精确到天数;⑤缺项要尽量补齐。医学统计学第一章绪论一、名词解释:1.同质与变异2.总体和样本3.参数和统计量4.抽样误差5.概率6.计量资料7.计数资料8.等级资料108\n二、是非题:1.用定性的方法得到的资料称作数值变量资料,亦称作计数资料。()2.观察某人群的血型,以人为观察单位,结果分为A型、B型、AB型和O型,是有序分类资料。()3.分类变量或称定量变量,其变量值是定量的,表现为数值大小,一般有度量衡单位,亦称计量资料。()4.调查某地10岁女孩的身体发育状况,以人为观察单位,测得每个人的身高(cm)、体重(kg)、血压(mmHg),此资料称为多项分类变量资料。()5.用定量的方法测定观察单位某个量的大小的资料,称数值变量资料。()7.等级分组资料兼有计数与计量资料的性质。()8.将观察单位按某一属性的不同程度分组计数,所得各组的观察单位称为计数资料。()三、单选题:1.计量资料﹑计数资料和等级分组资料的关系有A.计量资料兼有计数资料和等级分组资料的一些性质B.计数资料兼有计量资料和等级分组资料的一些性质C.等级分组资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.等级分组资料又可叫半计数资料2.为了由样本推断总体,样本应该是A.总体中任意一部分B.总体中的典型部分C总体中有意义的一部分D.总体中有价值的一部分E.总体中有代表性的一部分3.统计学上所说的系统误差﹑测量误差和抽样误差三种误差,在实际工作中有A.三种误差都不可避免B.系统误差和测量误差不可避免C.系统误差和抽样误差不可避免D.测量误差和抽样误差不可避免E.三种误差都可避免4.抽样误差指的是A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.总体参数值和总体参数值之差5.医学统计工作的基本步骤是A.调查资料﹑校对资料﹑整理资料B.调查资料﹑归纳资料﹑整理资料C.收集资料﹑校对资料﹑整理资料D.收集资料﹑整理资料﹑分析资料E.收集资料﹑校对资料﹑归纳资料6.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体答案名词解释:(1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。(2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。108\n(1)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。(2)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。(3)概率:是描述随机事件发生的可能性大小的数值,用p表示(4)计量资料:由一群个体的变量值构成的资料称为计量资料。(5)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。(6)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。是非题:1.×2.×3.×4.×5.√6.√7.×单选题:1.C2.E3.D4.C5.D6.B第二章计量资料统计描述及正态分布一、名词解释:平均数标准差标准正态分布参考值范围二、填空题:1、医学统计资料按研究指标的性质分为________、________和_________三类。2、统计工作的全过程按顺序可分为四个步骤,即_________、_________、________和__________。3、正态分布用N(μ,2)表示,为了应用方便,常对变量X作___________变换,使μ=0,=1,则正态分布转变为___________分布,用___________表示。4、正态曲线下面积的分布有一定规律,理论上___________、___________和___________,区间的面积(观察单位数)各占总面积(总观察单位数)的___________、___________和___________可用于估计医学参考值范围和质量控制方面。5、标准正态曲线下,区间(-1.96,0)的面积占总面积的___________%。6、用___________和___________可全面描述正态分布资料的特征。7、为了说明离散程度应选用变异指标,常用的变异指标有___________、___________、___________和___________。8、___________范围内的面积占正态曲线下总面积的95%。9、样本值中最大值与最小值之差,称为这个样本的___________记___________。10、通常把α称为___________或___________而将u>u1-(α/2)的区域称作拒绝域,α一般取___________有时___________或___________。11、正常值范围的意义是指绝大多数正常人的变量均在此范围中,这个绝大多数习惯上包括正常人的_______、_______、_______、_______而最常用的是_______。12、对于正态分布的资料,在μ±1.96,μ±2.58区间内的变量值,其出现的概率分别为___________和___________。13、频数分布的两个重要特征是指___________和___________,可全面地分析所研究的事物。14、偏态分布资料宜计算___________以表示其平均水平。15、平均数的计算和应用必须具备___________、___________,否则平均数是没有意义。108\n1、正态分布有以下的特征①正态曲线在横轴上方,且_________所处在最高。②正态分布以_________为中心左右对称。③正态分布有两个参数即_________和_________。④正态分布的面积有一定的__________。17.描述一组正态分布资料的变异度,以__________指标为好。18.变异系数CV常用于比较_________或_________的两组或多组资料的变异程度一、是非题:1.平均数是一类用于推断数值变量及资料平均水平(或集中趋势)的指标。()2.反映频数分布的两个重要特征是集中趋势与散离趋势。()3.标准差是最常用的变异指标,它既可以用于正态资料亦可用于非正态资料。()4.计算中位数时要求组距相等。()5.计量单位相同,均数相差不大时,可使用变异系数反应两组变量值的离散程度。()6.变量值之间呈倍数或等比关系的数据,宜用几何均数表示其平均水平。()7.百分位数应用中提到,分布中部的百分位数相当稳定具有较好的代表性,但靠近两端的百分位数只在样本例数足够多时才比较稳定。()8.为了解数值变量分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征以及分布类型。()9.如果少数几个数据比大部分数据大几百倍一般就不宜计算均数()10.原始数据有零,就不能直接计算几何均数()11.正态分布是以均数为中心的钟型分布()12.高峰位于中央,两侧逐渐下降并完全对称的频数分布即为正态分布()13.理论上,对于正态分布资料的P5-P95和±1.96S范围内都包含有95%的变量值。()14.制定正常值范围应选足够数量正常人作为调查对象,所谓正常人就是排影响被研究指标的各种疾病的人()15.描述频数分布离散程度的最常用的指标是变异系数和标准差()16.正态分布用N(0,1)表示,为了应用方便,常对变量X作u=(x-µ)/变换,使μ=0=1则将正态分布转换为标准正态分布用N(μ,2)表示()17.只要单位相同,用标准差和用变异系数来比较两组变量值的离散度结论是完全一致的()18.四分位数间距Q=P75~P25,常用于描述近似正态分布资料的离散程度()19.频数表和频数分布图用以推断变量值的分布特征和揭示变量值的分布规律()20.制定正常值范围,如取95%界限,是指95%的正常人本项指标在此范围()21.指标无论过高或过低均属异常,可用来计算正常值范围()二、单选题:1.以年龄(岁)为例,最常用的组段表示法是A.0─5,5─10,10─15,15─20……;B.0─ ,5─ ,10─ ,15─ ……;C.0─4,5─9,10─14,15─19……;D.─5,─10,─15,─20……;E.以上都不是;2.以下指标中____可用来描述计量资料离散程度。108\n  A.算术平均数    B.几何均数    C.中位数  D.标准差     E.第50百分位数3.偏态分布资料宜用___描述其分布的集中趋势。  A.算术平均数    B.标准差     C.中位数  D.四分位数间距   E.方差4.用均数和标准差可全面描述___资料的分布特征。  A.正态分布     B.正偏态分布   C.负偏态分布  D.对称分布     E.任何计量资料分布5.____可用于比较身高与体重的变异度 A.方差     B.标准差     C.变异系数 D.全距     E.四分位数间距6.各观察值均加(或减)同一个数后,_______。A.均数不变,标准差不一定变B.均数不变,标准差变C.均数不变,标准差也不变D.均数变,标准差不变E.均数变,标准差也变7.各观察值同乘以一个不等于0的常数后,______不变。A.均数B.标准差C.几何均数D.中位数E.变异系数8.____的资料,均数等于中位数。A.对称B.正偏态C.负偏态D.对数正态9.最小组段无下限或最大组段无上限的频数分布表资料,可用____描述其集中趋势。A.均数B.标准差     C.中位数D.四分位数间距   E.几何均数10.描述一组偏态分布资料的变异度,以______指标较好.A.全距(R)B.标准差(s)C.变异系数(CV)D.四分位数间距(Qu-QL)11.计算某抗体滴度的平均水平,一般选择A.算术均数 B.几何均数C.中位数    D.标准差E.标准误12.计算某病的平均潜伏期,一般选择A.算术均数 B.几何均数C.中位数    D.标准差E.变异系数13.表示正态分布资料个体变量值的变异程度的常用指标是A.均数B.全距C.标准差    D.标准误E.变异系数14.平均数是表示A.性质相同的变量值的相对水平B.性质相同的变量值的实际水平C.性质相同的变量值的平均水平D.性质不同的变量值的平均水平E.性质相同的变量值的变异程度15.用变异系数比较变异程度,适于108\nA两组观察值单位不同,或两均数相差较大B两组观察值单位相同,标准误相差较大C两均数相差较大,标准误相差较大D以上都不是16.正偏态资料计算平均水平,首选A.算术均数B.几何均数C.中位数D.加权均数E.百分位数17.均数与标准差的关系是A.均数越大,标准差越大B.均数越大,标准差越小C.标准差越大,均数代表性越好D.标准差越小,均数代表性越差E.标准差越小,均数代表性越好18.有8名某传染病患者,潜伏期分别为:2,1,21,7,12,1,4,13天。其平均潜伏期为天。A.4B.5.5C.7D.12E.9.519.五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种指标比较两组数据变异大小为宜A.SB.SC.全距D.CVE.自由度20.调查50例链球菌咽峡炎患者潜伏期如下,为计算均数平均数,应首选潜伏期12—24—36—48—60—72—84—96—108—120合计病例数1711117542250A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以21.102名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用抗体滴度1﹕1001﹕2001﹕4001﹕8001﹕1600合计人数719342913102A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以22.对于均数μ﹑标准差为σ的正态分布,95%的变量值分布范围为A.μ-σ~μ+σB.μ-1.96σ~μ+1.96σC.0~μ+1.96σD.-∞~μ+1.96σE.μ-2.58σ~μ+2.58σ23.若u服从均数为0,标准差为1的正态分布,则A.u≥2.58的P=0.01B.u≥2.58的P=0.005C.-2.58<u<2.58的P=0.01D.u≥2.58的P=0.05E.u≥2.58的P=0.02524.正态分布有两个参数μ与σ,______曲线的形状越扁平。A.μ越大B.μ越小C.σ越大D.σ越小E.μ与σ越接近025.对数正态分布是一种_____分布A.正态B.近似正态C.左偏态D.右偏态E.对称26.正态分布曲线下,横轴上,从均数μ到+∞的面积占总面积的比例为______108\nA.97.5%B.95%C.50%D.5%E.不能确定(与标准差的大小有关)27.标准正态分布的均数与标准差分别为_____A.0与1B.1与0C.0与0D.1与1E.1.96与2.5828.若X服从以μ,σ²为均数和方差的正态分布,则X的第95百分位数即___A.μ-1.64σB.μ-1.96σC.μ+σD.μ+1.64σE.μ+1.96σ29.若正常成人的血铅含量X服从近似对数正态分布,则可用公式______制定95%正常值范围。(其中:Y=logX)A.<+1.96SB.<+1.64SC.<+1.64SYD.<log-1(+1.64SY)E.<log-1(+1.96SY)30.正态分布曲线下,横轴上,从均数μ到μ+1.96倍标准差的面积为____A.95%B.45%C.97.5%D.47.5%31.标准正态分布曲线下中间90%的面积所对应的横轴尺度u的范围是___A.–1.645到+1.645B.-∞到+1.645C.∞到+1.282D.–1.282到+1.28232.设X符合均数为μ﹑标准差为σ的正态分布,作u=的变量变换则A.符合正态分布,且均数不变B.符合正态分布,且标准差不变C.u符合正态分布,且均数和标准差都不变D.u不符合正态分布E.u符合正态分布,但均数和标准差都改变33.正态分布是以A.标准差为中心的频数分布B.t值为中心的频数分布C.组距为中心的频数分布D.均数为中心的频数分布E.观察例数为中心的频数分布34.用变异系数比较变异程度,适于A两组观察值单位不同,或两均数相差较大B两组观察值单位相同,标准误相差较大C两均数相差较大,标准误相差较大D以上都不是35.决定个体值正态分布的参数是A.变异系数B.全距C.标准误D.标准差E.以上都不是36.正态分布是以A.标准差为中心的频数分布B.t值为中心的频数分布C.组距为中心的频数分布D.均数为中心的频数分布E.观察例数为中心的频数分布37.正偏态资料计算平均水平,首选A.算术均数B.几何均数C.中位数D.加权均数E.百分位数38.均数与标准差的关系是A.均数越大,标准差越大B.均数越大,标准差越小C.标准差越大,均数代表性越好D.标准差越小,均数代表性越差E.标准差越小,均数代表性越好108\n39.计量资料的标准差A.不会比均数大B.不会比均数小C.要比标准误小D.不决定于均数E.以上都不对40.有9名某传染病人,潜伏期分别为(天):2,1,21,7,12,1,4,13,24其平均潜伏期为A.4B.5.5C.7D.12E.9.541.表示变异程度的指标中A.标准差越大,变异程度越小B.标准差越小,变异程度越大C.变异系数越大,变异程度越大D.变异系数越大,变异程度越小E.全距越大,变异程度越小42.正态资料的变异系数应A.一定>1B.一定<1C.可能>1,也可能<1D.一定<标准差E.一定>标准差43.五小鼠出生体重分别为4,5,6,7,8(g);染毒后存活日数分别为2,5,6,7,1(天),问以何种方式说明两组数据变异大小A.SB.SC.全距D.CVE.自由度44.调查50例链球菌咽峡炎患者潜伏期如下潜伏期12—24—36—48—60—72—84—96—108—120合计病例数1711117542250求平均潜伏期,应首选A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以45.102名健康人钩端螺旋体血液抗体滴度分布如下,欲表示其平均水平,宜用─────────────────────────────────────抗体滴度1﹕1001﹕2001﹕4001﹕8001﹕1600合计人数719342913102A.算术均数B.几何均数C.中位数D.百分位数E.以上均可以一、问答题:1.均数﹑几何均数和中位数的适用范围有何异同?2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?3.同一资料的标准差是否一定小于均数?4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?6.医学中参考值范围的含义是什么?确定的原则和方法是什么?7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?二、计算题1.某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.704.073.504.694.384.896.255.324.504.633.614.444.43108\n4.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05(1)编制频数分布表并绘制直方图,简述其分布特征。(2)计算均数、标准s、变异系数CV。(3)计算中位数M,并与均数比较,(4)计算P2.5及P97.5并与±1.96s的范围比较。(5)分别考察1S、1.9S6、2.58S范围内的实际频数与理论分布是否基本一致?(6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,还有百分之几的人血清总胆固醇值比他高?2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑制抗体滴度资料如表。表2-1:平均滴度计算表抗体滴度人数f1:821:1661:3251:64101:12841:25621:5121合计30(1)试计算其平均滴度。(2)有人发现本例用抗体滴度稀释倍数和直接用滴度倒数算得几何标准差的对数值相同,为什么?3.50例链球菌咽峡炎患者的潜伏期如表,说明用均数、中位数或几何均数,何者108\n的代表性较好?并作计算。表2-2:50例链球菌咽峡炎患者的潜伏期潜伏期(小时)病例数f12~124~736~1148~1160~772~584~496~2108~1202合计504.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量如表:表2-3:238人发汞含量频数计算表发汞值人数f(μmol/kg)1.5~203.5~665.5~607.5~489.5~1811.5~1613.5~615.5~117.5~019.5~21.53合计238(1).说明此频数分布的特征,(2).计算均数和中位数,何者较大?为什么?何者用于说明本资料的集中位置较合适?(3).选用何种指标描述其离散程度较好?(4).估计该地居民发汞值的95%参考值范围108\n答案名词解释:1.平均数    是描述数据分布集中趋势(中心位置)和平均水平的指标2.标准差   是描述数据分布离散程度(或变量变化的变异程度)的指标3.标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。4.参考值范围  参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题:1.计量,计数,等级2.设计,收集资料,分析资料,整理资料。3.(变量变换)标准正态分布、0、14.68.27%95%99%5.47.5%6.均数、标准差7.全距、方差、标准差、变异系数8.9.全距R10.检验水准、显著性水准、0.05、0.01(0.1)11.80%90%95%99%95%12.95%99%13.集中趋势、离散趋势14.中位数15.同质基础,合理分组16.均数,均数,μ,σ,规律性17.标准差18.单位不同,均数相差较大是非题:1.×2.√3.×4.×5.×6.√7.√8.√9.√10.√11.√12.√13.×14.√15.√16.×17.×18.×19.√20.√21.√单选题:1.B2.D3.C4.A5.C6.D7.E8.A9.C10.D11.B12.C13.C14.C15.A16.C17.E18.C19.D20.C21.B22.B23.E24.C25.A26.C27.B28.D29.D30.D31.A32.E33.D34.A35.D36.D37.C38.E39.D40.B41.C42.B43.D44.C45.B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。不同点:表2-5.表2-5均数,几何均数和中位数的相异点108\n平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两察值水平端出现不确定值2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?答:1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。(2)计算:中位数和百分位数均可用同一公式计算,即Px=L+(i/fx)(n·x%-ΣfL)可根据研究目的选择不同的百分位数代入公式进行计算分析。(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。3.同一资料的标准差是否一定小于均数?答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。变异大,标准差就大,有时比均数大;变异小,标准差小。4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?(1)样本含量的大小,样本含量越大,标准差越稳定。(2)分组的多少(3)分布形状的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)研究总体中观察值之间变异程度大小5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?(1)概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示方法不同,正态分布用N(µ,σ2)表示,标准正态分布用N(0,1)表示,对数正态分布N(μlgX,σ2lgX)表示。(2)应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。②相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。6.医学中参考值范围的含义是什么?确定的原则和方法是什么?含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。(2)原则:①抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。②对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。③判定是否要分组(如男女、年龄、地区等)确定正常值范围。④决定取双侧范围值还是单侧范围值。108\n⑤选择适当的百分范围⑥确定可疑范围⑦估计界值(3)方法:①百分位数法:Px=L+(i/fx)(n·x%-ΣfL)②正态分布法(对数正态分布):百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。计算题:1.某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.216.515.185.774.795.125.205.104.7040743.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.865.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.043.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05(1)编制频数分布表,简述其分布特征。①找出最大值、最小值求全距(R):全距=最大值-最小值=7.22-2.70=4.50(mmol/L)②求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L)③分组段,划记(表1-1)表2-6某地101例30~49岁健康男子血清总胆固醇值划记表组段(mmol/L)划记频数2.5~13.0~83.5~9108\n4.0~234.5~255.0~175.5~96.0~66.5~27.0~7.51合计101由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。表2-7某地101例30~49岁健康男子血清总胆固醇值(mmol/L)、s计算表血清总胆组中值频数fXfX2累计累计频数固醇值Xf频数(实际)2.5~2.7512.757.56310.00993.0~3.25826.0084.50090.08913.5~3.75933.75126.563180.17824.0~4.252397.75415.438410.40594.5~4.7525118.75564.063660.65355.0~5.251789.25468.563830.82185.5~5.75951.75297.563920.91096.0~6.25637.50234.375980.97036.5~6.75213.5091.1251000.99017.0~7.57.2517.2552.5631011.0000478.252242.315注:Xu为组段上限值(2)计算均数、标准s、变异系数CV。由上计算表1-2可见:478.25/101=4.735(mmol/L)108\n=0.882(mmol/L)CV=100%=0.882/4.735100%=18.627%(3)计算中位数M,并与均数X比较,利用前表计算中位数MM=L+(i/f50)(n50%-ΣfL)=4.5+(0.5/25)(10150%-41)=4.69(mmol/L)本题算术均数为4.735(mmol/L),与中位数4.69(mmol/L)很接近,这也是资料服从正态分布的特征之一。(4)计算P2.5及P97.5并与±1.96s的范围比较。P2。5=3.0+(0.5/8)(1012.5%-1)=3.095(mmol/L)P97.5=6.5+(0.5/2)(10197.5%-98)=6.619(mmol/L)1.96S=4.735±1.960.882=3.01~6.46(mmol/L)用百分位数法求得101例30~49岁健康男子血清总胆固醇值95%分布范围3.095~6.619(mmol/L),与正态分布法求得的95%分布范围3.01~6.46(mmol/L)基本一致。(5)分别考察1S、1.96S、2.58S范围内的实际频数与理论分布是否基本一致(表1-3)表2-8某地101例30~49岁健康男子血清总胆固醇值理论分布与实际分布比较血清总胆固醇实际分布理论分布人数%%3.85~5.627271.2968.273.01~6.469796.0495.002.46~7.0110099.0199.00由上表,范围内,实际分布与理论分布略有不同,而、范围内,实际分布与理论分布基本一致。(6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,还有百分之几的人血清总胆固醇值比他高?前计算得95%正常值为3.01~6.46(mmol/L)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),在95%范围以外,故属于异常u=(X-μ)/σ=(6.993-4.735)/0.882=2.56因ф(2.56)=ф(-2.56),查表1得ф(-2.56)=0.0052估计该地30~49健康男子中约有0.52%的人血清总胆固醇值比他高。2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑制抗体滴度资料如表2-9第(1)(2)栏。108\n表2-9平均滴度计算表抗体滴度人数f滴度倒数X1lgX1flgX1(1)(2)(3)(4)(5)=(2)×(4)1:8280.90311.80621:166161.20417.22471:325321.50517.52571:6410641.806218.06181:12841282.10728.42881:25622562.40824.81651:51215122.70932.7093合计3050.5730(1)试计算其平均滴度。由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5该站30名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为1:48.50表2-10平均滴度计算表抗体滴度人数f滴度倒数X1lgX1flgX1(1)(2)(3)(4)(5)=(2)(4)1﹕8280.90311.80621﹕166161.20417.22471﹕325321.50517.52571﹕6410641.806218.06181﹕12841282.10728.42881﹕25622562.40824.81651﹕51215122.70932.7093合计3050.5730(2)有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对数值的标准差相同,为什么?表2-11滴度对数值计算表抗体滴度X2人数flgX2flgX21﹕82-0.9031-1.80621﹕166-1.2041-7.22471﹕325-1.5051-7.52571﹕6410-1.8062-18.06181﹕1284-2.1072-8.42881﹕2562-2.4082-4.81651﹕5121-2.7093-2.7093合计30-50.57301)由表1-4中数据计算标准差为:slgx1=lg-10.4444=2.78232)由表1-5中数据计算标准差为:slgx2=lg-10.4444=2.7823108\n直接用抗体滴度的对数lgx2与稀释倍数的对数lgx1计算标准差是相等的,因为由上表可见lgx2=lg1-lgX1=-lgx1,而lgx1与-lgx1的离散程度是相同的,所以用抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。3.50例链球菌咽峡炎患者的潜伏期如表2-12,说明用均数、中位数或几何均数,何者的代表性较好?并作计算。表2-1250例链球菌咽峡炎患者的潜伏期的中位数计算表潜伏期(小时)病例数f累计频数12~1124~7836~111948~113060~772~584~496~2108~1202合计50本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几何均数表示其平均水平。如上表,经计算中位数,几何均数、算术均数分别为:M=54.55(小时),G=54.08(小时),=58.56(小时)显然,算术均数受长潜伏期的影响使其偏大,中位数M与几何均数G接近,故描述链球菌咽峡炎患者潜伏期的集中趋势指标使用中位数M或几何均数G均可。4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量如表2-13:表2-13238人发汞含量频数计算表发汞值人数f组中值XfXfX²累计频数累计频率(μmol/kg)1.5~202.550.0125.00208.403.5~664.5297.01336.508636.105.5~606.5390.02535.0014661.347.5~488.5408.03468.0019481.509.5~1810.5189.01984.5021289.0811.5~1612.5200.02500.0022895.8013.5~614.587.01261.5023498.3215.5~116.516.5272.2523598.7417.5~018.50.00.0023598.7419.5~21.5320.561.51260.75238100.00合计2381699.014743.50(1).说明此频数分布的特征:可见发汞值的频数分布高峰位于第2个组段。前4个组段的频数占总频数的81.5%,长尾拖向右侧,呈极度正偏态。108\n(2).计算均数和中位数M,何者较大?为什么?何者用语说明本资料的集中位置较合适?=1699/238=7.139(μmol/kg)M=L+(i/f50)(n50%-ΣfL)=5.5+2/60(23850%-86)=6.6(μmol/kg)由计算结果得知,其原因因为本例呈正态分布,均数计算结果受到少数较大发汞值的影响,使得偏向大发汞值一边.本例用中位数描述偏态资料的集中趋势较好,它不受两端较大值和极小值的影响.(3).选用何种指标描述其离散程度较好?选用四分位数间距描述其离散程度较好.(4).估计该地居民发汞值的95%参考值范围本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大,n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范围较为合适.P95=L+(i/f95)(n95%-ΣfL)=11.5+(2/16)(23895%-212)=13.2625(μmol/kg)第三章均数的抽样误差与t检验一、名词解释:1.标准误2.总体均数可信区间3.假设检验4.检验水准5.检验统计量6.P值7.第I类错误8.第II类错误二、填空题:1.用样本均数估计总体均数的可靠程度宜选用__________。2.一般将概率小于_________和_________的随机事件称为小概率事件。3.对总体所作的假设进行统计推断,作出拒绝或接受假设的结论的方法,称___________。4.样本均数比较,经t检验差别有显著性时,P越小,说明___________。5.t分布的图型形状与___________有关。6.可信区间的两个要素是___________,______。7.准误愈小,表示_________愈小,_________对_________估计愈可靠。8.统计推断包括___________和___________两方面。9.设检验中,不拒绝Ho时,可发生_________错误,其概率用_________表示。三、是非题:1.区间估计以预先给定的概率(可信度)估计总体参数在哪个范围内的方法,称区间估计。()2.样本标准误反映了抽样误差大小,显然n越大抽样误差越大,用样本推断总体的精度越高。()3.抽样误差的大小可以用标准差来表示。()4.参数估计有⑴点(值)估计——用样本统计量值估计相应的总体参数。⑵区间估计——估计总体参数在哪个范围,它不涉及抽样误差,所以比点(值)估计更为重要。108\n()5.从正态总体N(μ,σ)中,随机抽取例数为n的样本,则样本均数也服从N(μσ)的正态分布。()6.抽样研究时,可通过增加样本含量来减少抽样误差。()7.成组比较的t检验要求两组样本例数一定相等。()8.可信区间比假设检验还可以提供更多信息,不但能回答差别有无统计意义,还能提出差别有无实际意义。()9.t检验结果t>1.96,可以认为两样本均数不同。()10.样本含量相同时,配对设计与成组设计相比,前者统计效率较高()11.在配对t检验中,用药前数据减去用药后数据,与用药后数据减去用药前数据作t检验后的结论是相同的()12.t分布曲线的形状与标准差有关()13.拒绝了实际上是成立的Ho,这类“弃真”的错误称为第一类错误或Ⅰ型错误()14.抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征()15.变量变换是各组观察值经变量转换后达到方差齐性()16.样本均数的99%可信区间可用2.58表示()17.计算总体均数可信区间的通式为(,)缩写为()18.当P≤α时,结论为按所取α检验水准拒绝Ho,接受H1;如P>α时,即样本信息支持Ho,就无理由拒绝它,此时只好接受它()19.当t0.01v>t>t0.05v时,则0.01>P>0.05()20.两个均数比较只能用t检验或u检验()21.t检验可用于同一批对象的身高和体重均数差别的假设检验()22.β为第二类错误的概率(1-β)越小,所需的样本例数越多()一、单选题:1.从一个计量资料的总体中抽样,产生的抽样误差的原因是:()A.总体中的个体值存在差异B.总体均数不等于零C.样本中的个体值存在差异D.样本均数不等于零E.样本只包含总体的一部分个体2.σ是指:()A.所有个体值对总体均数的离散程度B.某一个样本均数对总体均数的离散程度C.所有样本均数对总体均数的离散程度D.一些样本均数对总体均数的离散程度E.所有某个含量相同的样本均数对总体均数的离散程度3.在同一正态总体中随机抽样,有99%的样本均数在下述范围内:()A.B.C.D.E.以上都不是4.在同一总体中随机抽取多个样本,用样本来估计总体均数的95%可信区间,则估计精密的是:()108\nA.均数大的样本B.均数小的样本C.标准差小的样本D.标准误大的样本E.标准误小的样本1.表示:()A.总体的95%个体值在该区间内B.样本的95%个体值在该区间内C.平均每100个总体均数,有95个总体均数在该区间内D.平均每100个样本(含量相同)均数,有95个样本均数在该区间内E.平均每100个样本(含量相同)有95个样本所得出的该区间包括总体均数2.总体均数的99%可信区间为:()A.B.C.D.E.以上都不是3.在由两样本均数的差别推断两总体均数的差别的t检验中,检验假设的无效假设是:()A.两样本均数差别无统计意义B.两总体均数差别无统计意义C.两样本均数相等D.两总体均数相等E.两总体均数不等4.由两样本均数的差别推断两总体均数的差别,所谓差别有显著性是指:()A.两样本均数差别有显著性B.两总体均数差别有显著性C.两样本均数和两总体均数的差别都有显著性D.其中一个样本均数和总体均数的差别有显著性E.以上都不是5.在样本均数和总体均数差别的显著性检验中,H0(无效假设):μ=μ0;H1(备择假设):μ≠μ0;结果因为P<0.05而拒绝H0接受H1,是由于:()A.无效假设成立的可能性小于5%B.备择假设成立的可能性大于5%C.无效假设成立的可能性小于5%和备择假设成立的可能性大于95%D.该样本来自该总体(μ=μ0)的可能性小于5%E.该样本来自另一个总体(μ≠μ0)的可能性大于95%6.与标准正态分布(u分布)比较,t分布的:()A.中心位置左移B.中心位置右移C.分布曲线峻峭一些D.分布曲线平坦一些E.以上都不是7.与标准正态分布(u分布)比较,t分布的:()A.均数要小些B.均数要大些C.标准差要小些D.标准差要大些E.以上都不是8.若总例数相同,则两组计量资料的t检验与配对计量资料的t检验相比较,一般为:()A.两组计量资料的t检验的效率要高些B.配对计量资料的t检验的效率要高些C.两者效率相等D.两者效率相差不大E.两者效率不可比9.在两个均数比较的t检验中,计算合并方差的公式为:()A.B.108\nC.D.E.1.推断样本率为16.8%与14.5%所代表的总体有无差别,选用的方法是:()A.样本均数与总体均数比较的t检验B.配对t检验C.成组t检验D.以上都不是2.在比较两个小样本的均数时,需改用校正t检验的情况是:()A.两总体均数相等B.两总体均数不等C.两总体方差相等D.两总体方差不等E.两样本方差不等3.在两组资料比较的t检验中,结果为P<0.05,差别有显著性。P愈小则:()A.说明两样本均数差别愈大B.说明两总体均数差别愈大C.说明两样本均数有差别的可能性愈大D.愈有理由认为两样本均数不同E.愈有理由认为两总体均数不同4.t检验中,不同类型资料的t检验的区别是:()A.检验步骤不同B.统计量t的计算公式不同B.确定P值时查的表不同D.根据P值判断结果的方法不同E.以上都不对5.两组同质资料中,_____小的那个样本均数更有代表性()A.SB.CVC.D.19._________小,表示用该样本均数估计总体均数的可靠性大。A.CVB.SC.SD.R20.统计推断的内容__________。A.是用样本指标估计相应的总体指标B.是检验统计上的“假设”C.A、B均不是D.A、B均是21.两样本均数比较,经t检验,差别有显著性时,P越小,说明。A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同一、问答题:1.标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3.假设检验和区间估计有何联系?4.假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么?5.t检验和方差分析的应用条件有何异同?6.怎样正确使用单侧检验和双侧检验?7.验假设中α和P的区别何在?二、计算题1.某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:108\n表:3-1健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算性别例数均数标准差标准值红细胞数男3604.660.584.84(×1012/L)女2254.180.294.33血红蛋白男360134.57.1140.2(g/L)女255117.610.2124.7(1)说明女性的红细胞数与血红蛋白量的变异程度何者为大?(2)分别计算男﹑女两项指标的抽样误差。(3)试估计该地健康成年男﹑女红细胞数的均数。(4)该地健康成年男﹑女间血红蛋白含量有无差别?1.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月的血沉(mm/小时)如下表,问:(1)甲,乙两药是否均有效?(2)甲,乙两药的疗效有无差别?表3-2甲,乙两药治疗前后的血沉━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前10136111078859治疗后693101042533━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前9109138610111010治疗后6353358274━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━(1)甲,乙两药是否均有效?(2)甲,乙两药的疗效有无差别?2.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别?标准株(11人)1002004004004004008001600160016003200水生株(9人)1001001002002002002004004003.表3-3为抽样调查资料,可做那些统计分析?表3-3某地健康成人的第一秒肺通气量(FEV1)(L)FEV1人数男女2.0~142.5~383.0~1123108\n3.5~27334.0~36204.5~26105.0~1025.5~306.0~6.510合计1181005.某医师就表3-4资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,后(接种后两月)血清抗体(黄疸出血型)的变化。表3-4328例血清抗体滴度及统计量抗体滴度的倒数02040801603206401280s免疫前人数2112719242519376.1111.76.17免疫后人数216577675542523411.9470.525.90t=(411.91-76.1)/=12.6>3,查t界值故P<0.01,说明接种后血清抗体有增长。试问:(1)本例属于何种类型设计?(2)统计处理上是否妥当?6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计和95%区间估计。滴度倒数12481632641282565121024合计人数00171031334224311527.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:得表如下:表3-59例慢性苯中毒患者治疗前后的白细胞总数(×109/L)病人号治疗前治疗后16.04.224.85.435.06.343.43.857.04.463.84.076.05.983.58.094.35.0(1)问该药是否对患者的白细胞总数有影响?(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得t=4.1,问该药是否对患者的血小板有影响?(3)综合上述结果能否提出进一步研究意见.答案填空题:1.标准误2.0.05,0.013.假设检验,(显著性检验)108\n4.两总体均数不同(越有理由说明有统计学意义)5.自由度大小6.一是准确度、二是精度7.抽样误差、样本均数、总体均数8.总体均数估计、假设检验9.第二类错误(Ⅱ型错误)β是非题:1.√2.×3.×4.×5.√6.√7.×8.√9.×10.√11.√12.×13.√14.√15.√16.√17.√18.√19.×20.×21.×22.×单选题:1.A2.E3.D4.E5.E6.E7.D8.A9.D10.D11.D12.B13.E14.D15.D16.E17.B18.C19.C20.D21.C问答题:1.标准差和标准误有何区别和联系?表3-6标准差与标准误的区别标准差(α或s)标准误()意义上描述一组变量值之间的离散趋势描述样本均数间的离散趋势应用上①s越小,表示变量值围绕①越小,表示样本均数与均值分布越密集,说明均数总体均数越接近,说明样本的代表性越好。均数推断总体均数可靠性越大。②可用估计变量值分②可用估计总体布范围均数可信区间与n的关系n越大,s越趋于稳定n越大,越小(2)联系①二者均是表示变异度大小的统计指标。②标准误与标准差大小成正比,与抽样例数n的平方根成反比。③当n一定时,同一份资料,标准差越大,标准误也越大。2.可信区间和参考值范围有何不同?参考值范围是指同质总体中个体变量值的分布范围,如X±1.96s说明有95%的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大,该范围越宽,分布也就越散。而可信区间是指在可信度为(1-α)时,估计总体参数可能存在的范围。即从同一总体中随机抽样,当n一定时,每抽一次即可得一个样本均值,以108\n计算可信区间,如95%可信区间,类似的随机抽样进行一百次,平均有95次,即有95个可信区间包括了总体均数,有5次没有包括括总体均数,5%是小概率事件,实际发生的可能性很小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方法犯错误的可能性最大不超过5%。可信区间与标准误大小有关,标准误越大,可信区间则越大。3.假设检验和区间估计有何联系?假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因此,只有将二者有机地结合起来,相互补充,才是完整的分析。4.假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么?假设检验时,当P<0.05,则拒绝Ho,其理论依据是在Ho成立的条件下,出现大于等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见,假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。5.t检验和方差分析的应用条件有何异同?(1)相同点:在均数比较中,t检验和方差分析均要求各样本来自正态总体;各处理组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。(1)不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。6.怎样正确使用单侧检验和双侧检验?根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率高,但应慎用。7.第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义?(1)假设检验中Ⅰ、Ⅱ型错误的区别。Ⅰ型错误是拒绝了实际上成立的Ho,也称为“弃真”错误,用α表示。统计推断时,根据研究者的要求来确定。Ⅱ型错误是不拒绝实际上不成立的Ho,也称为“存伪”错误,用β表示。它只能与特定的H1结合起来才有意义,一般难以确切估计。(2)Ⅰ、Ⅱ型错误的联系。①当抽样例数一定时,α越大,β越小;反之,α越小,β越大。②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,可适当增加样本含量。③根据研究者要求,n一定时,可通过确定α水平来控制β大小。(3)了解两类错误的实际意义。①可用于样本含量的估计。②可用来计算可信度(1-α),表明统计推断可靠性的大小。③可用于计算把握度(1-β),来评价检验方法的效能等。108\n④有助于研究者选择适当的检验水准。⑤可以说明统计结论的概率保证。计算题:1.某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:表3-7:健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算性别例数均数标准差标准值变异系数(%)标准误红细胞数男3604.660.584.8412.450.0306(×1012/L)女2254.180.294.336.940.0182血红蛋白男360134.57.1140.25.280.3742(g/L)女255117.610.2124.78.670.6387(1)说明女性的红细胞数与血红蛋白量的变异程度何者为大?女性CVRBC=S/×100%=0.29/4.18×100%=6.49%CVHB=S/×100%=10.2/117.6×100%=8.67%由上计算可知该地女性血红蛋白量比红细胞数变异度大(2)分别计算男﹑女两项指标的抽样误差。见上表最后一栏,标准误计算公式。(3)试估计该地健康成年男﹑女红细胞数的均数。健康成年男子红细胞数总体均数95%可信区间为:±1.96Sx=4.66±1.96×0.0306=4.60~4.72(1012/L)其中n=360故近似按υ=∞。同理健康成年女子红细胞数总体均数95%可信区间为4.14~4.22(1012/L)(4)该地健康成年男﹑女间血红蛋白含量有无差别?Ho:µ男=µ女H1:µ男≠µ女α=0.05u==22.83按υ=∞,查附表2,得P<0.0005,按α=0.05水准,拒绝Ho,接受H1,可以认为男女间血红蛋白含量不同,男高于女。2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月的血沉(mm/小时)如下表,问:(1)甲,乙两药是否均有效?(2)甲,乙两药的疗效有无差别?表3-8甲,乙两药治疗前后的血沉━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910甲━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前10136111078859治疗后693101042533差值4431036326108\n━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━病人号12345678910乙━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━药治疗前9109138610111010治疗后6353358274差值37410512936━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━(1)甲,乙两药是否均有效?经计算得:甲药=3.2000(mm/h)乙药=5.0000(mm/h)Sd=1.9322(mm/h)Sd=2.9810(mm/h)S=0.6110(mm/h)S=0.9428(mm/h)n=10n=10Ho:μd=0Ho:μd=0H1:μd≠0H1:μd≠0α=0.05α=0.05t(甲药)=/S=3.2000/0.6110=5.237t(乙药)=/S=5.0000/0.9428=5.303=9,查t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,故可认为甲、乙两药均有效。(2)甲,乙两药的疗效有无差别?由表中资料分别求得治疗前后差值(见表3-8),再作两组比较。H0:甲乙两药疗效相同H1:甲乙两药疗效不同α=0.05=18,查t界值表,得0.20>P>0.10,按α=0.05水准,不拒绝Ho,尚不能认为甲乙两药疗效有差别。1.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下,问两组的平均效价有无差别?标准株(11人)1002004004004004008001600160016003200水生株(9人)100100100200200200200400400由题知:该资料服从对数正态分布,故得:标准株水生株n=11n=9108\n=2.7936=2.2676=0.4520=0.2355(1)两组方差齐性检验:H0:H1:=0.05F=V1=10V2=8F0.05(10,8)=4.30查附表3,得P>0.05,按α=0.05水准,不拒绝Ho,可以认为两总体方差齐。(2)两组均数比较;H0两总体几何均数相等H1两总体几何均数不等α=0.05查t界值表,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H1,故可认为钩端螺旋体病人的血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者1.表3-9为抽样调查资料,可做那些统计分析?表3-9某地健康成人的第一秒肺通气量(FEV1)(L)FEV1人数男女2.0~142.5~383.0~11233.5~27334.0~36204.5~26105.0~1025.5~30108\n6.0~6.510合计118100(1)统计描述。由上表可见,男性调查118人,第1秒肺通气量分布为2.0~6.5,高峰位于4.0~4.5组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可见上表和下图。女性调查100人,第1秒肺通气量分布为2.0~2.5,高峰位于3.5~4.0组段内,以中间频数分布最多,两侧逐渐减少,且左右大体对称,频数分布可见表3-9和图3-1。102.02.53.03.54.04.55.05.56.06.540300女男20图3-1某地健康成人第一秒肺通气量(FEV1)(L)分布由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰位置高于女性,向右推移一个组段。(2)计算集中与离散趋势指标,并对两组进行比较。Ho:男女间第1秒肺通气量总体均数相同H1:男女间第1秒肺通气量总体均数不同α=0.05男性:n=118=4.2373s1=0.6902女性:n=100=3.7250s2=0.6258u==(4.2373-3.7250)/=5.624查t界值表,v=∞,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,故可认为男女间第1秒肺通气量均数不同,男高于女。(3)根据上述分析结果,分别确定95%参考值范围。男性第1秒肺通气量单侧95%参考范围下限为:108\n=4.2373-1.6450.6902=3.16(L)即可认为有95%的男性第1秒肺通气量不低于3.16(L)女性第1秒肺通气量单侧95%参考范围下限为:=3.7250-1.6450.6258=2.69(L)即可认为有95%的女性第1秒肺通气量不低于2.69(L)1.某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前,后(接种后两月)血清抗体(黄疸出血型)的变化。表3-10328例血清抗体滴度及统计量抗体滴度的倒数02040801603206401280s免疫前人数2112719242519376.1111.76.17免疫后人数216577675542523411.9470.525.90t=(411.91-76.1)/=12.6>3,查t界值故P<0.01,说明接种后血清抗体有增长。试问:(1)本例属于何种类型设计?本例属于自身配对设计。(3)统计处理上是否妥当?统计处理上不妥当,因为:①在整理资料过程中,未按配对设计整理,而是拆开对子按成组设计整理,失去原设计的意义。②统计描述指标使用不当,血清浓度是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。对现已整理好的资料,可计算中位数表示平均水平,用四分位数间距表示离散趋势。③假设检验因本资料不宜计算均数,故对均数进行t检验当然是不妥当的。6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计和95%区间估计。滴度倒数12481632641282565121024合计人数0017103133422431152以滴度倒数X的对数值求得X1gx=1.85965,Slgx=0.44245,n=152,则点值估计G=lg-11.85965=72.39患儿病后血清抗体滴度倒数总体均数95%可信区间为lg-1(Xlgx+1.96Slgx/√n)=lg-1(1.85965+1.96×0.44245/√152)=lg-1(1.78931276~1.92999206)=61.5~85.117.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:(1)得表白细胞总数(×109/L),问该药是否对患者的白细胞总数有影响?108\n表3-119例慢性苯中毒患者治疗前后的白细胞总数病人号治疗前治疗后d116.04.21.824.85.4-0.635.06.3-1.343.43.8-0.457.04.42.663.84.0-0.276.05.90.183.58.0-4.594.35.0-0.7H0该药对患者的白细胞总数无影响,即μd=0H1该药对患者的白细胞总数有影响,即μd≠0α=0.05求得(前—后)差值di经计算得:=0.3556Sd=1.9951n=9t==8查附表2,t界值表,得P>0.5,按α=0.05水准,不拒绝Ho,尚不能认为该药对患者的白细胞总数有影响。(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得t=4.1,问该药是否对患者的血小板有影响?H0该药对患者的血小板无影响,即μd=0H1该药对患者的血小板有影响,即μd≠0α=0.05=37.8t=4.1=8查附表2,t界值表,得0.005>P>0.002,按α=0.05水准,拒绝Ho,接受H1,故可认为该药对患者的血小板有影响,可增加患者血小板。(3)综合上述结果能否提出进一步研究意见/综合上述结果,提出以下建议:①在此项研究中,从t检验结果来看,血小板治疗前后变化有意义,而白细胞则无意义,可补充计算两项指标的95%可信区间,结合专业知识,分析治疗前后指标差数有无实际意义。②如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效第四章方差分析108\n一、填空题:1、方差分析的应用条件是___________、___________和___________。2、方差分析的基本思想把变量值看成三种不同的变异,即___________,___________和___________三种变异关系___________。3、多个样本均数间每两个均数的比较常用的统计方法是___________。4、在单因素方差分析中,其各自由度之间的关系是__________。二、是非题:1.四个样本均数的比较,不可以两个两个抽出来作t检验()2.两样本均数的检验,可使用两样本t检验,亦可以用方差分析()3.方差不齐的两个小样本均数检验可采用两样本均数的t检验()4.多个样本均数的两两比较有两种方法可供选择,一是用t检验对每两个对比组作比较,二是先作方差分析然后作多重比较()5.与单因素方差分析相比,两因素方差分析由于从总变异中多分离出配伍组变异,使计算值的分母缩小了,因而提高了研究的效率。()三、单选题:1.在相同自由度()及α水准时,方差分析的界值比方差齐性检验的界值___A.大B.小C.相等D.不一定2.成组设计的方差分析中,必然有_______A.<B.<C.=+D.=+3.在单因素方差分析中:()A.只要求资料是计量的B.只要求资料呈正态分布C.只要求方差齐性D.要求资料是计量的,且呈正态分布E.要求资料正态,且方差齐性4.单因素方差分析的无效假设是:()A.各对比组样本均数相等B.各对比组总体均数相等C.至少有两个对比组总体均数相等D.各对比组总体均数差别无显著性E.各对比组总体均数不等5.在K组每组n例的单因素方差分析中,组间变异的离均差平方和为:()A.B.C.D.E.6.在单因素方差分析中若处理因素无作用,理论上应有:A.F=OB.F=1C.F<1.96D.F<E.以上都不是7.对成对的两组资料作均数差别的假设检验:A.只能用随机区组F检验B.只能用配对t检验108\nC.用随机区组F检验或配对t检验都可D.只能用成组t检验8.在多组均数的两两比较中,若不用q检验而用t检验,则:A.结果更合理B.结果会一样C.会把一些无差别的总体判断为有差别D.会把一些有差别的总体判断为无差别E.以上都不对一、计算题:1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差别?表4-1:某湖水不同季节氯化物含量(mg/L)春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.216.921.520.116.716.221.221.219.614.81.试就下表资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是否会影响生存日数?表4-2:各组大鼠接种后生存日数伤寒百日咳对照5687698710981010911109121110121110141211163.研究酵解作用对血糖浓度的影响,从8名健康人中抽取血液并制备了血滤液,每一个受试者的血滤液又分成4份,再随机地把4份血滤液分别放置0,45,90,135分钟,然后测定其中血糖浓度(mmol/L):结果如下表108\n表4-3放置不同时间血滤液所含血糖浓度(mmol/L)受试者编号放置时间小计0459013515.275.274.494.6119.6425.275.224.884.6620.0335.885.835.385.0022.0945.445.385.275.0021.0955.665.445.384.8821.3666.226.225.615.2223.2775.835.725.384.8821.8185.275.115.004.4419.82试比较0分钟与其他3个放置时间的血糖浓度间是否存在差别?.4.某医师为研究人体肾上腺皮质(羟基类固醇脱氢酶)活性在四个季节中是否有差别,采用分光光度计随机测定了部分研究对象,数据见表,请做统计分析.表4-4:四个季节的人体肾上腺皮质活性季节nS春季420.780.13夏季400.690.20秋季320.680.14冬季360.580.20答案填空题1.各样本是相互独立的随机样本,各样本来自正态总体,处理组总体方差相等(方差齐性)2.总变异、组内变异、组间变异SS总=SS组间+SS组内3.q检验(又称Newman-Keuls法)4.V总=SS组间+SS组内是非题:1.×2.√3.×4.√5.×单选题:1.B2.D3.E4.B5.C6.A7.C8.C计算题:1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差别?108\n表4-1:某湖水不同季节氯化物含量(mg/L)春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.216.921.520.116.716.221.221.219.614.8∑∑Хij167.9159.3131.9129.3588.4ni888832X20.9919.9116.4916.168.39∑Х²ij3548.513231.952206.272114.1111100.84S²i.52988.55554.50983.47125.0166(1)多组均数间比较:表1:方差分析表变异来源SSvMSF总变异281.63531组间变异141.170347.0579.380组内变异140.465285.017查F界值表,得P<0.01,按0.05水准,拒绝H0,接受H1,故可认为不同季节湖水中氯化物含量不同或不全相同。(2)各组均数间两两比较H0:μA=μBH1:μA≠μBα=0.05表2四个样本均数顺序排例组别春夏秋冬X20.9919.9116.491位次1234108\n表3四组均数两两比较q检验对比组两均数之差组数q值P值1与44.8346.099<0.011与34.5035.682<0.011与21.0821.364>0.052与43.7534.735<0.012与33.4224.319<0.013与40.3320.417>0.05春与夏、秋与冬湖水中氯化物含量P>0.05,按α=0.05水准不拒绝Ho,即尚不能认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外,其它4组均P<0.01,按α=0.05水准,拒绝Ho,接受H1,即可认为春夏两季湖水中氯化物含量高于秋冬两季。2.试就表4-2资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是否会影响生存日数?表4-2各组大鼠接种后生存日数伤寒百日咳对照568769871098101091110912111012111014121116∑∑Хij9284112288ni101010309.28.411.29.6∑886732130629244.4002.9335.7334.3553108\n解Ⅰ:假定生存日数服从正态分布(1)方差齐性检验:Ho:三总体方差齐即H1:三总体方差不等或不全相等。α=0.059(4.4+2.933+5.733)/(30-3)=4.3553=0.9461v=2,查附表9,X²界值表,得0.75>P>0.50,按α=0.05水准,不拒绝Ho,故可认为三组资料总体方差齐。(2)三组均数比较(表4-5)Ho:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。H1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全相等α=0.05C=(∑∑Χij)2/n=288²/30=2764.8SS总=∑∑Χij2-C=2924-2764.8=159.2SS组间=∑(∑Χij)2/ni-C=[92²+84²+112²]/10-2764.8=41.6SS组内=SS总-SS组间=159.2-41.6=117.6表4-5方差分析表变异来源SSvMSF总变异159.229组间变异41.6220.84.776组内变异117.6274.3556查附表4,得0.05>P>0.01,在α=0.05水准上,拒绝Ho,接受H1,故可以认为大白鼠感染脊髓灰质炎病毒后,在接种伤寒或百日咳菌苗对生存日数有影响。(3)均数间多重比较:Ho:任一组与对照组总体均数相同H1:任一组与对照组总体均数不同α=0.05伤寒与对照组比较108\n=(11.2-9.2)/=2/0.933338=2.1428v=27,得0.05>P>0.02,按α=0.05水准,拒绝Ho,接受H1,故可认为接种伤寒菌苗组较对照组生存日数减少。百日咳与对照组比较v=27,查附表2,得0.01>P>0.005,按α=0.05水准,拒绝Ho,接受H1,可以认为接种百日咳菌苗组较对照组生存日数减少。3.研究酵解作用对血糖浓度的影响,从8名健康人中抽取血液并制备了血滤液,没一个受试者的血滤液又分成4份,再随机地把4份血滤液分别放置0,45,90,135分钟,然后测定其中血糖浓度(mmol/L)(1)4组血滤液方差齐性检验:Ho:不同放置时间血滤液所含血糖浓度总体方差相等,即H1:不同放置时间血滤液所含血糖浓度总体方差不等或不全相等α=0.05方差齐性检验方法同本例X²=1.16847v=k-1=4-1=3,查附表9,X²界值表,得0.90>P>0.75,按α=0.05水准,不拒绝Ho,可以认为放置不同时间血滤液所含血糖浓度总体方差齐。表4-3放置不同时间血滤液所含血糖浓度(mmol/L)受试者编号放置时间受试者小计0459013515.275.274.494.6119.6425.275.224.884.6620.0335.885.835.385.0022.0945.445.385.275.0021.0955.665.445.384.8821.3666.226.225.615.2223.2775.835.725.384.8821.8185.275.115.004.4419.82ΣΧij44.8444.1941.3938.69169.11ni888885.60505.52385.17384.83635.2847∑252.1996245.0671215.0527187.5585899.87790.12450.13890.13020.06340.1143(2)配伍组设计方差分析:处理:Ho:不同放置时间血滤液所含血糖浓度相同108\nH1:不同放置时间血滤液所含血糖浓度不同或不全相同相同α=0.05配伍:Ho:8位受试者血液所含血糖浓度相同H1:8位受试者血液所含血糖浓度不同或不全相同α=0.05С=(ΣΣⅩij)2/n=169.112/32=893.6935SS总=ΣΣⅩij2-С=899.8779-893.6935=6.1844SS放置时间==(44.842+44.192+41.392+38.692)/8-893.6935=2.98524SS受试者==1/4(19.642+20.032+22.092+21.092+21.362+23.272+21.812+19.82)-893.6935=2.79093SS误差=SS总-SS放置时间-SS受试者=6.1844-2.98524-2.79093=0.40832方差分析表变异来源SSvMSF总变异6.184431放置时间2.9852430.9950851.189受试者2.7909370.3987020.510误差0.40823210.01944查F界值表F0.05(3,21)=3.07F0.01(3,21)=4.87F0.05(7,21)=2.49F0.01(7,21)=3.64放置时间受试者间均P<0.01,按α=0.05水准,均拒绝Ho,接受H1,故可认为不同放置时间、不同受试者间血滤液所含血糖浓度不同或不全相同。(3)不同放置时间血滤液所含血糖浓度均数间多重比较,采用多个实验组与一个对照组均数间两两比较。①Ho:放置45分钟与0分钟血滤液所含血糖浓度相同H1:放置45分钟与0分钟血滤液所含血糖浓度不同α=0.05=0.0812/0.06971=1.16476v=n-k=32-4=28,查附表2,t界值表,得0.40>P>0.20,按α=0.05水准,不拒绝Ho,尚不能认为放置45分钟与0分钟血滤液血糖浓度总均数有差别。②Ho:放置90分钟与0分钟血滤液所含血糖浓度相同H1:放置90分钟与0分钟血滤液所含血糖浓度不同α=0.05108\n=0.4312/0.0697=6.1853v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,可认为放置90分钟较0分钟血滤液所含血糖浓度减少。③Ho:放置135分钟与0分钟血滤液所含血糖浓度相同H1:放置135分钟与0分钟血滤液所含血糖浓度不同α=0.05=0.7687/0.0697=11.0265v=28,查附表2,t界值表,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,故可认为放置135分钟较0分钟血滤液所含血糖浓度减少。4.某医师为研究人体肾上腺皮质(羟基类固醇脱氢酶)活性在四个季节中是否有差别,采用分光光度计随机测定了部分研究对象,数据见表2.8,请做统计分析.表4-4四个季节的人体肾上腺皮质活性季节nS春季420.780.13夏季400.690.22秋季320.680.14冬季360.580.20解:本题仅给出分析思路及主要结果1.采用完全随机设计资料的方差分析:(1)由公式可推得由方差公式可推得(2)计算SS总SS组间SS组内SS总=5.365,SS组间=0.777SS组内=4.588列出方差分析表方差分析表变异来源SSMSF总变异5.365149组间变异0.77730.25908.248组内变异4.5881460.0314(4)确定P值,判断结果查方差分析表,得P<0.01,在=0.05水准上,拒绝Ho,接受H1,可以认为四个季节人体肾上腺皮质(羟基类固醇脱氢酶)活性不同或不全相同.108\n2.进一步作均数间的多重比较分析(略)第五章相对数一、名词解释:1.相对数2.率3.构成比4.相对比5.标准化率法二、填空题:1、分析时不能以构成比代替率,构成比只能说明事物各组成部分的__________不能说明某现象发生的___________。2、反映某现象实际发生频数与可能发生频数的比值可选用___________。3、率的标准化目的是______________________。4、常用的相对数有___________、___________和___________。5、从同一个总体中随机抽出观察相等的多个样本,样本率与总体率,各样本率之间往往有差异,这种差异被称作___________用___________表示。三、是非题:1.标准化就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法()2.构成比的计算公式是:构成比=甲指标/乙指标×100%()3.某年某地出生男婴数除以出生女婴数是相对比()4.计数资料的假设检验样本要满足np与n(1-p)≥5的条件()5.计算相对数时分母不宜过小()6.比较两地胃癌死亡率,若两地胃癌死亡率相等就不必进行率的标准化()7.某现象实际发生数与可能发生数之比称为构成比()8.标准化后的率已消除了内部构成不同对总率产生的影响故可直接比较其大小()9.三个医院的门诊构成作比较时不可作χ²检验()10.由于标准化率有利于数据间比较,故绝大多数统计指标需先进行标准化,而无需考虑是否存在内部构成间的不同()11.率又称频率指标,它说明某现象发生的比重或分布,常以百分率(%)、千分率()、万分率(1/万)等表示()四、单选题:1.在实际工作中,发生误把构成比作率分析的主要原因是由于:A.构成比和率的计算方法一样B.构成比较率容易计算C.构成比较率难于计算D.计算构成比的原始资料较计算率的原始资料容易得到E.计算构成比的原始资料较计算率的原始资料难于得到2.要比较甲乙两厂某工种工人患某职业病的患病率的高低,采取标准化法的原理是:A.假设甲乙两厂的工人数相同B.假设甲乙两厂某工种的工人数相同C.假设甲乙两厂患某职业病的工人数相同D.假设甲乙两厂工人的工龄构成比相同E.假设甲乙两厂某工种工人的工龄构成比相同3.经调查得甲乙两地的冠心病粗死亡率都为40/万,按年龄构成标化后,甲地冠心病标化死亡率为45/万,乙地为31/万,因此可以认为:A.甲地年龄别人口构成较乙地年轻B.乙地年龄别人口构成较甲地年轻C.甲地冠心病的诊断较乙地准确D.乙地冠心病的诊断较甲地准确108\nE.甲地年轻人患冠心病较乙地多4.在医学科研中,率的标化,经常采用全国人口的性别年龄构成,其理由是:A.这样算得的标准化率比较合理B.这样算得的标准化率比较准确C.计算标准化率比较容易D.便于进行比较E.以上都不是5.比较甲乙两县的食管癌死亡率,以甲乙两县合计的人口构成为标准,设以各年龄组人口数为标准算得标化率为P1,以各年龄人口构成比为标准算得的标化率为P2,则:A.P2=P1B.P2>P1C.P2<P1D.P2比P1要准确E.P2比P1要合理6.计算某年某地死亡率的分母是:A.该地该年年初人口数B.该地该年年中人口数C.该地该年年末人口数D.该地该年任意时刻人口数E.以上都不是7.óp是描述A.一个样本率对总体率的离散程度B.一些样本率之间的离散程度C.所有样本率之间的离散程度D.所有含量相同的样本率之间的离散程度E.所有总体率之间的离散程度8.某医生用两种药物治疗两组同病患者,若治愈率相等,但甲组收治的病人数是乙组的10倍,试比较两总体治愈率的95%可信区间:A.甲组的较乙组的精密B.乙组的较甲组的精密C.甲组的较乙组的准确D.乙组的较甲组的准确E.以上都不是9.由样本估计总体率的95%可信区间的计算公式A.π±1.96SpB.P±1.96ópC.π±1.96D.P±1.96SpE.P±t0.05()Sp10.用某药治疗某病患者,5例中有4例治愈,宜写作4/5,而不计算治愈率为4/5×100%=80%,这是由于:A.计算治愈率的方法不正确B.样本治愈率的可信区间太宽C.样本治愈率的可信区间太窄D.总体治愈率的可信区间太宽E.总体治愈率的可信区间太窄11.计算相对数的目的是:A为了表示实际水平B为了便于比较C为了表明绝对水平D为了说明数据大小E为了进行显著性检验12.相对数是表示:A计量资料相对大小的指标B表示平均水平的指标C表示事物关联程度的指标D表示排列等级的指标E计数资料相对水平的指标13.对两个地区恶性肿瘤发病率进行标准化率的比较时,应该:A排除两地人口年龄构成不同的影响B排除两地总人口数不同的影响C排除各年龄组死亡人数不同的影响D排除抽样误差108\nE以上都不是14.两地某病总死亡率比较时,进行标准化可以:A消除总人数不同的影响B消除各年龄组死亡率不同的影响C消除两比较组人口年龄构成不同的影响D消除两组调查时的抽样误差E.消除以上各因素的影响15.相对数中:A发病率即为患病率B死亡率即为病死率C构成比即为相对比D总率即为标化率E相对比即为对比指标16.300例宫颈癌发病与年龄的关系:年龄例数百分比30岁以下3311.0031~9531.6641~13143.6751~604113.67合计300100.00结论如下:A41~以前随年龄增加发病率增加B宫颈癌发病率以41~最高C41~以后随年龄增加而发病率下降D宫颈癌30岁以下最少见E以上全不对17.下表为“锑剂短疗程治疗血吸虫病51例死亡病例临床分析”性别<10岁10~20~30~40~50~计女311451529男37632122合计6181083651可认为:A女性死亡率高于男性B10~死亡率最高C10~以后随年龄增加死亡率下降D例数过少,不能说明死亡率E是构成比,不能下率的结论18.某医院的资料,计算了各种疾病所占的比例,该指标为:A发病率B构成比C相对比D标化发病率E标化发病比19.男性吸烟率是女性的10倍,该指标为:A相对比B流行率C构成比D定基比E标化流行率20.N足够大,样本率不接近于1或0,估计总体率95%的可信区间用:AP±1.96SpBP±2.58SpCP±1.96SDP±2.58SEP±2.33Sp21.相对比是A.B两个有关指标之比,两个指标要求:A性质必须相同B性质必须不同C性质可以相同也可以不同D性质最好相同E以上都不是22.若仅知道样本率,估计率的抽样误差用________指标表示。A.SB.C.D.SpE.σp一、问答题:1.常用的相对数指标有那些?它们的意义和计算上有何不同?为什么不能以比代率?请联系实际加以说明。108\n2、应用相对数时应注意哪些问题?3、什么情况下需要进行率的标准化?标准化的方法有那些一、计算题1.表5-1(1)~(4)栏资料宜计算那些相对数指标?试对围产儿在围产期死亡的主要因素作初步分析。表5-1不同体重,孕周,产次的围产儿死亡情况分析因素分组出生数死亡数(1)(2)(3)(4)体重(g)1000~1029112342500~19326111294000~537348合计2089252411孕周(周)<3818178206038~189937177142~14013244合计2221284075产次(次)11332901940251596739372562594178682≥595469合计19488230892.表5-2为一抽样研究资料(1)填补空白数据,见下表()内。表5-2某地各年龄组恶性肿瘤死亡情况年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)(1)(2)(3)(4)(5)=(4)/(3)6)=(4)/(2)(7)0~82920()42.90()()20~()63()19.0525.73()40~2816117242()()()60~()()32()()()合计1670907159012.59()()(2)根据最后(5)(6)(7)三栏结果作简要分析(3)试估计“0~”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。(4)试比较“20~”与“40~”岁组恶性肿瘤死亡率有无差别。2.试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率。表5-3甲乙两医院乳腺癌病人手术后五年生存率腋下淋巴甲医院乙医院结转移病例数生存数生存率%病例数生存数生存率%无453577.7730021571.67108\n有71045063.38834250.60合计75548564.2438325767.101.为了解某乡钩虫感染情况,随机抽查男200人,感染40人,女150人,感染20人。(1)该乡男性感染率是否高于女性?(2)若对该乡居民作驱钩虫治疗,需要按多少人准备药物(全乡人口男7253人,女7109人)?2.抽样调查某企业2839名职工高血压病,结果见表.据此,某医生认为:①该企业高血压发病率为8%,并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为100%。②高血压发病与性别有关,男性为10.2%,女性为4.5%,男性明显高于女性(P<0.01)。以上分析是否妥当,试加评述。表5-4男、女年龄组高血压病例分布男性女性年龄组——————————————————————————————受检人数病例数发病率(%)受检人数病例数发病率(%)20~33351.571240.630~30141.314296.340~5176412.41852714.650~5769316.061914.860~1212100.0合计173917810.21100494.53.某产院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,畸形儿116例,得以下资料。据此得出结论:“母亲年龄在24~29岁时,畸形儿最多,占总数的92.2%,符合一般规律”。母亲年龄(岁)212324252627282930313233合计畸形儿例数121419241819133111116%0.861.712.116.420.715.516.411.22.60.860.860.86100.00(1)以上结论是否合理?为什么?(2)若要达到作者之目的,应计算什么相对数指标较好?如何计算?7.某市1971~1981年乙型脑炎发病率如下表,试作动态分析。表5-5:某市1971~1981年乙型脑炎发病率动态分析年份发病率绝对增长量发展速度(%)增长速度(%)(1/10万)累计逐年定基比环比定基比环比197120.5219726.3119731.8719743.0719751.0819761.3819772.29108\n19782.3119792.4719802.7619812.948.从下表资料,判断某工厂肺癌发生率是否比一般人群高?表5-6:某工厂肺癌发生率分组某厂一般人群人数肺癌人数肺癌发生率(1/万)吸烟70054.5不吸烟30011.59.就下表资料如何比较甲乙两厂某工种某病患病率表5-7:甲,乙两厂某工种某病患病率工龄甲厂乙厂(岁)工人数患者患病率(%)工人数患者患病率(%)<3400123.0010011.00≥31001010.004007218.00合计500224.405007314.6010.设某病患者的自然康复率为30%,分别求10个患者中自然康复1人及以下,8人以上的概率?11.用某型麻疹疫苗接种一批麻疹易感儿,把接种后已阳转者96名作为观察对象,三年后复查,96名中仍为阳性者为85名,试求该疫苗接种阳转者3年后仍保持阳性的百分率的95%可信区间12.用一种新药治疗某种寄生虫病,受试者50人中在服药后1人发生严重反应,这种反应在此病患者中也曾有发生,但过去普查结果为每5000人仅有一人出现。问此新药是否提高了这种反应生率?13.同一水样中,每次抽取1ml置培养皿中,共作10个平板培养,共数得菌落146个,试估计该检样菌落数的95%可信区间。14.某疫苗预防接种后,进行有关的非传染性疾病流行病学效果考核,结果如下:接种组与对照组各调查10万人,接种组发病22人,对照组发病36人。试问两组发病率有无差别?15.甲乙两市分别用抽样调查了解已婚妇女宫颈癌的患病情况,甲市调查1万人,患者82例,乙市调查2万人,患者102例。问甲、乙两市已婚妇女子宫颈癌患病率有无差别?16.观察某种防治细菌性痢疾(菌痢)措施的效果,结果如表。问能否据此认为该措施有效?表5-8:两组人群菌痢发病率的比较(1979年)分组人数菌痢例数(无菌痢数)发病率(‰)试验组41182140975.1对照组521772514513.8合计93359392429.9617.把某肿瘤新发病例按住址点在一张地图上,又将地图划分成许多面积相等的小方格,再分别统计发病数0,1,2,……及相应的方格数,对此资料作Possion分布拟合优度的χ²检验,若P<0.05,就可认为此病在人群中的分布不随机,可能有聚’108\n集性。你认为如何?18.某乡有人口5000人,已知血吸虫粪检阳性率下降至5%左右。血防站准备进行一次血吸虫感染的普查,拟先将每10人粪便作为一个初筛的混合样本,混合样本血吸虫卵阴性,则该10人均作阴性;混合样本阳性,再对该混合样本的10人粪便逐人复查。问此法比一般的逐人粪便检查会减少多大的工作量?19.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如下表,试估计该县百白破疫苗接种率的95%可信区间。表5-9:某县三类乡百白破疫苗接种率调查结果类别人数抽样人数接种率好73717230.8174较好1489914780.6969差93089300.3022合计31578313120.为了解某县某病感染率,现从全县125个村民组(共3万人)中随机抽出10个村民组,对该10个村民组的全部人口进行了调查,结果如下,试据此估计此县农村居民感染率村民组12345678910合计人数1381561761841942152743293503702386感染人数41485670758690101109121797答案填空题1.比重和分布,频率与强度2.率3.消除混杂因素对结果影响4.率,构成比,相对比5.率的抽样误差δ是非题:1.√2.×3.√4.×5.√6×.7.×8.×9.×10.×11.×单选题:1.D2.E3.A4.D5.A6.B7.D8.A9.D10.D11.B12.E13.A14.C15.E16E.17.E18.B19.A20.A21.C22.D计算题:1.表5-1(1)~(4)栏资料宜计算那些相对数指标?试对围产儿在围产期死亡的主要因素作初步分析。表5-1不同体重,孕周,产次的围产儿死亡情况分析因素分组出生数死亡数死亡构成比(%)死亡率(%)(1)(2)(3)(4)(5)(6)体重(g)1000~10291123451.18119.912500~193261112946.835.84108\n4000~5373481.998.93合计2089252411100.0011.54孕周(周)<3818178206050.55113.3238~189937177143.469.3242~140132445.9917.41合计2221284075100.0018.35产次(次)1133290194062.8014.5525159673923.9214.32372562598.3835.6941786822.6545.91≥5954692.2372.33合计1948823089100.0015.85先就上述资料计算了上表(5)~(6)栏两类指标。由表中死亡率可知;体重低于2500g组围产儿死亡率约为2500g组的20倍;孕周<38周组围产儿死亡率约为38周组的12倍;随着产妇的产次增加,围产儿死亡率也逐渐升高。由表中死亡构成比可知:半数以上的围产儿死亡率集中在体重1000~2500g组和孕周<38周组。为降低围产儿死亡率,对体重偏低,不足月妊儿及多产次产妇应加强产前保护。2.表5-2为一抽样研究资料(1)填补空白数据,见下表()内。表5-2某地各年龄组恶性肿瘤死亡情况年龄人口数死亡总数其中恶性恶性肿瘤死亡恶性肿瘤死年龄别死(岁)肿瘤死亡数占总死亡的(%)亡率(1/10万)亡率(%0)(1)(2)(3)(4)(5)=(4)/(3)6)=(4)/(2)(7)0~82920(138)42.90(4.82)(1.644)20~(46638)63(12)19.0525.73(1.351)40~2816117242(24.42)(149.142)(6.108)60~(9371)(342)32(9.63)(341.479)(36.496)合计1670907159012.59(53.863)(4.279)(2)根据最后(5)(6)(7)三栏结果作简要分析由表中第(5)栏可知:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4;20~岁组次之,占19.5%;60~岁组恶性肿瘤死亡人数最多,但仅占9.36%;0~岁组恶性肿瘤死亡占总死亡比重最底,仅占2.90%由表中第(6)栏可知:恶性肿瘤的年龄别死亡随年龄的增大而增加,以60~岁组为最高,为341.479/10万。故可认为恶性肿瘤对老年人危害最大,应引起足够的重视。由表中第(7)栏可知:年龄别死亡率以40岁以下最低,以后随年龄的增加而增加,60岁以后高达36.496‰。108\n(3)试估计“0~”岁年龄组恶性肿瘤死亡率和年龄别死亡率的可信区间。0~岁组恶性肿瘤死亡率的可信区间:死亡数为4,查poisson分布u的可信区间,可信区间为1.0~10.2。所以恶性肿瘤死亡率的95%可信区间为:(1.0/82920~10.2/82920)=(1.206~12.301)/10万0~岁组年龄别死亡率的可信区间,按式:(4)试比较“20~”与“40~”岁组恶性肿瘤死亡率有无差别。Ho:20~与40~岁组恶性肿瘤死亡率相等,即π1=π2H1:20~与40~岁组恶性肿瘤死亡率不相等,即π1≠π2α=0.05本例:n1=28161x1=42n1-x1=28119n2=46638x2=12n2-x2=46626合计:747995474745X²=37.07查X²界值表,得P<0.005在α=0.05的水准上,拒绝Ho,接受H1,故可认为20~岁组与40~岁组恶性肿瘤死亡率有差别。3.试就表5-3资料分析比较甲乙两医院乳腺癌病人手术后的五年生存率。表5-3甲乙两医院乳腺癌病人手术后五年生存率标化(甲+乙医院合计为标准)腋下淋巴标准病甲医院乙医院结转移例数原生存率(%)预期生存人数原生存率(%)预期生存人数NiPiNiPiPiNiPi(1)(2)(3)(4)=(2)(3)(5)(6)=(2)(5)无34577.77268.3171.67247.26有79363.38502.6050.60401.26合计1138(∑Ni)64.24770.91(∑NiPi)67.10648.52甲医院乳腺癌手术后五年标化生存率×100%=×100%=67.74%乙医院乳腺癌手术后五年标化生存率×100%=×100%=56.99%因为甲乙两医院有无腋下淋巴结转移的病型构成不同,故标化后,甲医院乳腺癌108\n手术后五年生存率高于乙医院,校正了标化前甲医院低于乙医院的情况。1.为了解某乡钩虫感染情况,随机抽查男200人,感染40人,女150人,感染20人。(1)该乡男性感染率是否高于女性?Ho:男女性的钩虫感染率相同,即π男=π女H1:男性的钩虫感染率高于女性,即π男>π女单侧α=0.05P1=40/200=0.2P2=20/150=0.1333PC=(X1+X2)/(n1+n2)=60/350=0.1714u==查t界值表,υ=∞,得单侧0.10>P>0.05,按α=0.05水准,不拒绝Ho,尚不能认为该乡男性钩虫感染率高于女性。(2)若对该乡居民作驱钩虫治疗,需要按多少人准备药物(全乡人口男7253人,女7109人)?计算该乡钩虫感染率的95%可信区间:=(13.19~21.09)%14362×13.19%=1894(人)14362×21.09%=3029(人)至少需要按1894人,最多按3029人准备药物。2.抽样调查某企业2839名职工高血压病,结果见表.据此,某医生认为:①该企业高血压发病率为8%,并随年龄递增,其中40岁以上患者占全部病例的90.3%,60岁以上者发病率为100%。②高血压发病与性别有关,男性为10.2%,女性为4.5%,男性明显高于女性(P<0.01)。以上分析是否妥当,试加评述。表5-4男、女年龄组高血压病例分布男性女性年龄组——————————————————————————————受检人数病例数发病率(%)受检人数病例数发病率(%)20~33351.571240.630~30141.314296.340~5176412.41852714.650~5769316.061914.860~1212100.0合计173917810.21100494.5答:该分析不正确。因为:(1)108\n高血压患病率为8%,而不是发病率。原文中60岁以上的发病率是100%,应为患病率,且由于60岁以上受检人数太少,不宜计算相对数。(1)由于男女性受检人数的年龄构成不同,不能直接比较两总患病率,对男女合计进行假设检验更无意义。由于各年龄组患病率出现明显交叉,如:20~和50~岁组的男性患病率均高于女性,而30~和40~岁组的男性患病率均低于女性。此资料宜直接比较各年龄组的患病率,而不宜使用标准化。1.某产院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,畸形儿116例,得以下资料。据此得出结论:“母亲年龄在24~29岁时,畸形儿最多,占总数的92.2%,符合一般规律”。母亲年龄(岁)212324252627282930313233合计畸形儿例数121419241819133111116%0.861.712.116.420.715.516.411.22.60.860.860.86100.00(1)以上结论是否合理?为什么?以上结论不合理,不能以比代率。(2)若要达到作者之目的,应计算什么相对数指标较好?如何计算?若要达到作者的目的,应计算产妇年龄别畸形儿发生率。某年龄(组)畸形儿发生率=7.某市1971~1981年乙型脑炎发病率如表5-5,试作动态分析表5-5某市1971~1981年乙型脑炎发病率动态分析年份发病率绝对增长量发展速度(%)增长速度(%)(1/10万)累计逐年定基比环比定基比环比197120.52——100100——19726.31-14.21-14.2130.7530.75-69.25-69.2519731.87-18.56-4.449.1129.64-90.89-70.3619743.07-17.451.2014.96164.17-85.0464.1719751.08-19.44-1.995.2635.18-94.74-64.8219761.38-19.140.306.73127.78-93.2727.7819772.29-18.230.9111.16165.94-88.8465.9419782.31-18.210.0211.26100.87-88.740.8719792.47-18.050.1612.04106.93-87.966.9319802.76-17.760.2913.45111.74-86.5511.7419812.94-17.580.1814.33106.52-85.676.52本资料从1971年到1974年,发病率呈下降趋势,1975年开始呈上升趋势,故以1975年为基期计算。108\n平均发展速度=平均增长速度=平均发展速度-1=1.182-1=18.2%动态分析:从绝对增长量看,各年乙型脑炎发病率均低于1971年,10年内共降低17.58/10万。总的来看发病率呈下降趋势,但降低的速度是不平衡的;从发展速度和增长速度来看,在最初的1971~1975年是基本下降的,以后又略有回升现象。在1975年至1981年期间发病率平均发展速度为118.2%,平均增长速度为18.2%。8.从表5-6资料,判断某工厂肺癌发生率是否比一般人群高?表5-6某工厂肺癌发生率分组某厂一般人群人数肺癌人数肺癌发生率(1/万)吸烟70054.5不吸烟30011.5Ho:μ=μoH1:μ>μo单侧α=0.05μo吸烟=n1π1=700×0.00045=0.315μo不吸烟=n2π2=300×0.00015=0.045吸烟者的肺癌发生人数X≥5累计概率:P=1-[p(0)+p(1)+p(2)+p(3)+p(4)]P(0)=e-μ=e-0.315=0.7298P(1)=P(0+1)=P(0)×μ/(0+1)=0.7298×0.315/1=0.2299P(2)=P(1+1)=P(1)×μ/(1+1)=0.2299×0.315/2=0.0362P(3)=P(2+1)=P(2)×μ/(2+1)=0.0362×0.315/3=0.0038P(4)=P(3+1)=P(3)×μ/(3+1)=0.7298×0.315/4=0.000299P=1-(0.7298+0.2299+0.0362+0.0038+0.000299)=0.000001,按α=0.05水准拒绝Ho,接受H1,故可认为某工厂吸烟的肺癌发生率明显高于一般人群不吸烟组:Ho:μ=μoH1:μ>μo单侧α=0.05不吸烟者的肺癌发生人数X≥1的累计概率:P=1-P(0)P(0)==e-0.045=0.956P=1—0.956=0.044,按α=0.05水准拒绝Ho,接受H1,故可认为某工厂不吸烟的肺癌发生率高于一般人群。9.就表5-7资料如何比较甲乙两厂某工种某病患病率表5-7甲,乙两厂某工种某病患病率工龄甲厂乙厂(岁)工人数患者患病率(%)工人数患者患病率(%)<3400123.0010011.00≥31001010.004007218.00108\n合计500224.405007314.60从表中可以清楚看到≥3的工龄组的患病率乙厂高于甲厂,<3岁组甲厂高于乙厂,呈现交叉现象。甲厂以患病率低的3年以下工人为主,乙厂则以患病率高的工龄在3年以上的工人为主。这种情况下不能直接比较总患病率,应按不同工龄组进行比较10.设某病患者的自然康复率为30%,分别求10个患者中自然康复1人及以下,8人以上的概率本例π=0.30,1-π=0.7,n=10。依题意10名患者中:(1)康复1人及以下的概率P(X≤1)=P(0)=0.710=0.02825P(1)=P(x≤1)=0.02825+0.12106=0.1493(2)康复8人及以上的概率。P(x≥8)=P(8)==P(x+1)=P(X)×P(9)=p(8)P(10)=0.310=0.000005905则P(x≥8)=P(8)+P(9)+P(10)=0.00159当某病自然康复率为30%时,10名患者中1人及1人以下康复的概率为0.14931,康复8人及8人以上的概率为0.0015911.用某型麻疹疫苗接种一批麻疹易感儿,把接种后已阳转者96名作为观察对象,3年后复查,96名中仍为阳性者为85名,试求该疫苗接种阳转者3年后仍保持阳性的百分率的95%可信区间因为nP=85,nq=11,均大于5,n=96>50,可按正态近似求该疫苗接种3年仍保持阳转率的95%可信区间。=0.85540.0637=(82.17~94.91)%12.用一种新药治疗某种寄生虫病,受试者50人中在服药后1人发生严重反应,这种反应在此病患者中也曾有发生,但过去普查结果为每5000人仅有一人出现。问此药是否提高了这种反应生率?Ho:服药后的反应率与普查时的反应率相等,即受试者每50人服药后平均反应人数为μo108\nH1:服药后的反应率高于普查时的反应率,即μ>μo单侧α=0.05本例n=50,πo=1/5000=0.0002,μo=nπo=50×0.0002=0.01,样本例数为50时,抽得样本严重反应人数X≥1的概率:P=1-P(0)P(0)=P=1-0.99=0.01今P=0.01,按α=0.05,拒绝Ho,接受H1,故可认为此新药能提高了这种反应的发生率。13.同一水样中,每次抽取1ml置培养皿中,共作10个平板培养,共数得菌落146个,试估计该检样菌落数的95%可信区间。X=146(个),X>50,用正态近似法求该检样本菌落数的95%的可信区间为:X±14.某疫苗预防接种后,进行有关的非传染性疾病流行病学考核,结果如下:接种组与对照组各调查10万人,接种组发病22人,对照组发病36人。试问两组发病率有无差别?Ho:两组发病率相同,即μ1=μ2H1:两组发病率不相同,即μ1≠μ2α=0.05本例=22人u=查附表2,t界值表,υ=∞,得0.1>P>0.05,在α=0.05的水准上,不拒绝Ho,尚不能认为两组发病率有差别。15.甲乙两市分别用抽样调查了解已婚妇女宫颈癌的患病情况,甲市调查1万人,患者82例,乙市调查2万人,患者102例。问甲乙两市宫颈癌患病率有无差别?Ho:两市已婚妇女宫颈癌患病率相等,即μ1=μ2H1:两市已婚妇女宫颈癌患病率不相等,即μ1≠μ2α=0.05=82/10000=0.0082,=102/20000=0.0051u==2.9899本题也可以万人为单位,计算更为简单:u=查附表2,t界值表,υ=∞,得0.005>P>0.002,在α=0.05的水准上,拒绝Ho,接受H1,故可认为两市妇女子宫颈癌患病率的差别有显著性,甲市已婚妇女子宫颈癌患病率高于乙市。16.观察某种防治细菌性痢疾(菌痢)措施的效果,结果如表3-6。问能否据此认为该108\n措施有效?表5-8两组人群菌痢发病率的比较(1979年)分组人数菌痢例数(无菌痢数)发病率(‰)试验组41182140975.1对照组521772514513.8合计93359392429.96Ho:π1=π2H1:π1≠π2单侧α=0.05u==查附表2,t界值表,υ=∞,得P<0.005,按α=0.05的水准,拒绝Ho,接受H1,故可认为实验组和对照组的菌痢发病率有差别,实验组的发病率低于对照组,即该措施有效。17.把某肿瘤新发病例按住址点在一张地图上,又将地图划分成许多面积相等的小方格,再分别统计发病数0,1,2,……及相应的方格数,对此资料作Possion分布拟合优度的X²检验,若P<0.05,就可认为此病在人群中的分布不随机,可能有聚集性。你认为如何?答:对此资料作Poisson分布拟合优度的X²检验,若P<0.05按α=0.05水准,拒绝Ho,接受H1,可认为此资料不服从Poisson分布,也即可以认为此病在人群中不呈随机分布,再综合考虑环境(地形、地貌)遗传等资料,结合专业知识确定有无聚集性。18.某乡有人口5000人,已知血吸虫粪检阳性率下降至5%左右。血防站准备进行一次血吸虫感染的普查,拟先将每10人粪便作为一个初筛的混合样本,混合样本血吸虫卵阴性,则该10人均作阴性;混合样本阳性,再对该混合样本的10人粪便逐人复查。问此法比一般的逐人粪便检查会减少多大的工作量?设:k=每组混合样本例数;P=粪检血吸虫卵阳性率;q=阴性率=1-p;N=全部受检人数;N/k=混合样本数,即组数(1)计算每组平均检验次数。由二项分布理论可知:概率检验次数混合样本内粪检q.q.q…q=qk1全部为阴性混合样本内粪检1-qkk+1至少有1例阳性一组平均检验次数=(qk×1)+(1-qk)(k+1)=k-kqk+1(1)(2)计算全部检验期望数。全部检验期望数=(N/k)(k-kqk+1)=N(1-qk+1/k)(2)本例已知:N=5000,K=10,P=0.05,q=1-p=0.95,代入试(2)全部受检期望数=5000×(1-0.9510+1/10)=2506.32比一般逐人检查减少工作量:5000-2506.32=2493.68,减少工作量的百分比为:108\n2493.68/5000=49.87%。19.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如表5-9,试估计该县百白破疫苗接种率的95%可信区间。表5-9某县三类乡百白破疫苗接种率调查结果类别人数抽样人数接种率好73717230.8174较好1489914780.6969差93089300.3022合计305783131本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及其标准误。(1)p=[ΣΝiΡi]/Ν=1/31578[7371×0.8174+14899×06969+9308×0.3022]=19221.0461/31578=0.608685(2)==0.007520该率不接近于0或1,一般认为服从二项分布。因n=3131,较大,可用正态近似法计算其可信区间。95%CI:P±1.96sp=0.608635+1.96×0.007520=(0.5939,0.6234)20.为了解某县某病感染率,现从全县125个村民组(共3万人)中随机抽出10个村民组,对该10个村民组的全部人口进行了调查,结果如下,试据此估计此县农村居民感染率村民组12345678910合计人数1381561761841942152743293503702386感染人数41485670758690101109121797本例采用整群抽样作总体率的点估计和区间估计。按正态近似原理计算:已知:K=125,k=10点估计:p=(K/Nk)(Σαi)=(125/30000/10)×(797)=0.3321=0.0335595% 可信区间:P±1.96sp=(0.2663,0.3979)99%可信区间:P±2.58sp=(0.2455,0.4187)第六章χ2检验一、名词解释:二、填空题:1、行×列表X2检验若有T<1或1<T<5的各自理论数1/5以上,其最好处理办法是___________。108\n2、四格表若有理论数小于1或n<40宜用__________法。3、四格表X2值校正检验条件为______________________。一、是非题:1.χ²检验可推断两个或两个以上构成总体的分类构成比是否相同()2.χ²检验的自由度ν=(R-1)(C-1)()3.有理论数小于1时,三行四列的表也不能直接作χ²检验()4.四格表的确切概率法要求先列出周边合计不变条件下的各种组合的四格表,所有这些四格表的概率之和即为双侧检验P值()5.配对四格表当n>40时,χ²检验的公式选用χ2=(b-c)2/(b+c)()6.χ²检验可用于检验两个或两个以上构成比之间的差异()7.四格表χ²检验,当1<T<5,且n>40选用公式和结果是一样的。()二、单选题:1.样本率与总体率差别的显著性检验公式为:A.u=B.u=C.u=D.t=E.t=2.在样本率与总体率差别的显著性检验中有:A.u>2.58时P<0.01B.u>2.58时P>0.01C.t>t0.01(n’)时P<0.01D.t>t0.01(n’)时P>0.01E.以上都不是3.两样本率与总体率差别的假设检验的目的是:A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个总体率的差别有无显著性D.推断两个样本率和两个总体率有无差别E.推断两个样本率和两个总体率的差别有无显著性4.假设对两个率差别的假设检验分用u检验和X²检验,则算得的u值和X²值的关系有:A.u检验比X²检验准确B.X²检验比u检验准确C.u=X2D.u=E.X2=5.用某中草药预防流感,其用药组与对照组的流感发病情况如下表组别观察人数发病人数发病率(%)用药组1001414对照组1203025则构成四格表的四个格子内的数字是:A.B.86149030108\n1001412030100141202510086120901001412025C.D.14863090E.141430256.R×C列联表X²检验的自由度为:A.R-1B.C-1C.R+C-1D.R×C-1E.(R-1)(C-1)7.在R×C表的X2检验中,设和n分别表示行合计、列合计和总合计,则计算每格理论数的公式为:8.四表格资料用基本公式或专用公式求X²值的条件:A.≥5(为每格实际数)B.≥5(为每格理论数)C.≥5和≥5D.≥5和n≥40(n为总例数)E.≥5和n≥409.本是配对四格表X²检验的资料,误作一般四格表X²检验,则:A.会降低检验效率B.会提高检验效率C.降低检验效率和提高检验效率都可能D.两者效率相等E.两者效率近似相等10.R×C表必须用公式求理论数的格子个数(其他可由减法求出)为:A.R×CB.(R-1)(C-1)C.R(C-1)D.C(R-1)E.R+C-111.行×列表的X²检验应注意:A.任一格理论数小于5,则要用校正公式B.任一格理论数小于5,则要将相应组合并C.若1/5以上格子理论数小于5,则要用校正公式D.若1/5以上格子理论数小于5,则要考虑合理并组E.以上都不对12.两组计数配对资料比较,当(b+c)<40时,宜用_______公式计算检验统计量来判断两组差异的来源。108\nA.(b-c)²/(b+c)B.Σ(|A-T|-1)²/TC.Σ(|A-T|-1)/TD.(|b-c|-1)²/(b+c)E.[(|ad-bc|-n/2)²n]/[(a+b)(c+d)(a+c)(b+d)]13.两组计数非配对资料比较,每组分阳性和阴性两部分,当n>40,有一个理论数1<T<5,用_______公式计算检验统计量。A.(b-c)²/(b+c)B.Σ(|A-T|-0.5)²/TC.Σ(|A-T|-1)²/TD.(|b-c|-1)²/(b+c)E.以上均不对14.某医师用注射疗法治疗椎间盘突出,治疗26例12人治愈,用手术方法治疗25人18人治愈,若进行X²检验用:AΣ(A-T)²/TBΣ(|A-T|-1)²/TCΣ(|A-T|-0.5)²/TD(|A-T|-1)²/TEΣ(A-T)/T15.某医师用电针灸加中药治疗抑郁症病人,治疗16例15人治愈,用西药治疗23人,21人治愈,若比较两组的治疗效果用:AΣ(A-T)²/TBΣ(|A-T|-1)²/TCΣ(|A-T|-0.5)²/TD(|A-T|-1)²/TE确切概率法16.计算麻疹疫苗接种后血清检查的阳转率,分母为_______。A麻疹易感儿数B麻疹患儿人数C麻疹疫苗接种人数D麻疹接种后的阳转人数17.已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是_______。A分性别进行比较B两个率比较的X²检验C不具可比性,不能比较D对性别进行标准化后再比较18.从甲乙两文中,查到同类研究的两个率比较的四格表资料,其X²检验,甲文X²>X²0.01(1),乙文X²>X²0.05(1)可认为_______。A两文结果有矛盾B两文结果基本一致C甲文结果更为可信D甲文说明总体的差别较大19.四个样本率作比较,X²>X²0.01(3)可认为_______。A各总体率不同或不全相同B各总体率均不相同C各样本率不相同D各样本率不同或不全相同20.(概率分布)在以下条件时是对称的:A.当总体率时B.当总体率时C.当总体率时D.当总体率接近0.1或0.9时E.为任意值21.某医师用新药治疗一组高血压病人36例,35例好转,估计该疗法好转95%的可信区间,用_______。AP±1.96SpBP±2.58SpCP±1.96SDP±2.58SE查表法一、问答题:1.χ²检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?2、χ2检验的基本思想是什么?3、四表格资料在何种情况下需要进行校正?为什么?4、行×列表χ2检验的注意事项有哪些?108\n一、计算题1.某医师用甲、乙两药治疗某病,结果如下表,问甲、乙两药疗效有无差别?表6-1甲、乙两药疗效比较药物例数治愈数治愈率(%)甲402972.5乙736994.51.某卫生防疫站在中小学观察三种矫治近视眼措施的效果,近期疗效数据如表,结论为“近期疗效要以夏天无眼药水最好,保健操为次,新医疗法最差”。试对此作分析评价。表6-2三措施的近期有效率比较矫治方法有效人数无效人数(合计)有效率(%)夏天无眼药水518413537.78新医疗法6263218.75眼保健操5131827.78合计6212318533.512.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料整理如表。问两者之间是否存在一定的关系?表6-3某厂职工冠心病与眼底动脉硬化普查结果分析眼底动脉硬化冠心病诊断结果合计正常可疑冠心病0340116357Ⅰ7313692Ⅱ+Ⅲ1002019139合计5134431588注:原表中=6×31/588=0.3163<1,故将Ⅱ和Ⅲ级合并3.表6-4用两种方法检查已确诊的乳腺癌患者120名。甲法检出率为60%,乙法检出率50%,甲乙两法一致的检出率为35%,问:(1)两种方法何者为优?表6-4甲乙两法检验结果乙法甲法合计+-108\n+421860-303060合计72481201.经反复多次实践证明,用一般疗法治疗某病的治愈率约为20%。现改用新疗法治疗,并随机抽取400名该病患者进行治疗,那么这400名患者中至少要多少人治愈才能判断比一般疗法效果好?此判断发生错误的概率有多大?2.某种化学物质经诱发肿瘤试验,实验组15只白鼠中4只发生癌变,对照组10只白鼠无一发生癌变(表6-5)。问两组发癌率有无差别?表6-5某药物肿瘤治疗试验发癌数未发癌数合计实验组41115对照组0(1.6)1010合计421253.某医院收治了100例临床确诊的小儿佝偻病患者,入院时均分别作血生化检查与X光片检查(表6-6)。欲了解此病法何者较敏感,试设计一整理表,并指出宜作何统计处理?表6-6佝偻病患儿入院检查登记表编号生化检验X光片12..1004.某医生观察某新药对预防流行性感冒(流感)的效果,并作了统计处理(如下表),你对此有何意见?表6-7:用药组和对照组流感患病率比较发病数未发病数合计有效率%服药组5013018072.2未服药组4019023082.6合计9032041078.05χ²=6.63,P<0.05答案填空题:1.合理并组2.确切概率法(精确X2.0)3.n≥401≤T<5是非题:1.√2.√3.×4.×5.×6.√7.√单选题:1.A2.A3.B4.D5.A6.E7.C8.E9.A10.B11.D12.D13.B14.A15.E16.C17.D18.C19.A20.A21.E108\n问答题:1.X²检验适用于解决那些问题?对资料的设计类型和应用条件有何不同要求?(1)X²检验适用于:①两个及两个以上的率或构成比的比较;②计数资料两因素间的相关关系;③频数分布的拟合优度检验。(2)对资料的设计类型和应用条件。1)四格表的X²检验:基本公式T>5且n>40专用公式校正公式1<T<5且n>40或当T<1或n<40时,可使用确切概率计算法直接计算概率,应用时注意区分单、双侧检验。双侧检验。双侧检验取两侧累积概率,单侧检验只取一侧累积概率。2)行×列(R×C)表资料的X²检验:基本公式与四格表基本公式相同。专用公式:可使用实际频数计算X2。适用条件①行×列表不宜有1/5以上的格子的理论频数小于5,或有一格理论频数小于1。②当多个样本率(或构成比)比较的X²检验,拒绝检验假设,只能认为各总体率(或构成比)之间总的有差别,但不能说明彼此间都有差别或某两者间有差别,若要进一步解决此问题,可用X²分割法。③对单向有序列联表,X²检验只说明各处理组的效应在构成比上有无差别。3)列联表资料的X2检验:R×C列联表公式:与R×C(行×列)表相同,但检验假设不同,R×C列联表用于检验有无关联,而R×C(行×列)表用于多个率或构成比的比较。适用条件与行×列表适用条件①相同。2×2列联表或配对资料X²检验,检验两个处理有无差别。b+c>40或校正公式b+c<40检验两种处理间有无相关,公式同四格表所用公式108\n4)频数分布拟合优度的X2公式适用条件遇有理论频数小于5时,可与相邻组合并。2.X2检验的基本思想是什么?X2检验的基本思想是实际数与理论编数的吻合程度,它是根据检验假设来确定的,如作两样本率的比较,我们先假设两组的总体率相同,均等于两组合计的总率,如果检验假设成立,则实际数与理论数之差一般不会很大。出现很大的X2值的概率是很小的若PX则没有理由拒绝它3、四表格资料在何种情况下需要进行校正?为什么?在1≤T<5n≥40时,需要计算校正X2推断统计量X2时是用一种连续概率分布(X2分布)作为对观测频数概率分布的近似,为改善此近似F.Yates提出了一个修正,即取平方之前将正偏差(A-T)减0.5,负偏差加0.5,这样使X2值降低,校正后的概率更接近确切的概率。4、行X列表X2检验的注意事项有哪些?(1)X2检验要求理论数不宜太小,否则将导致分析的偏性,一般认为行X列表中不宜有1/5以上格子的理论频数小于5,或有一个理论数小于1。对理论数频数大小有三种处理方法:①最好增加样本例数以增加理论频数②删去上述理论频数太小的行或列③将太小理论频数所在行或列与性质相近的邻行邻列的实际频数合并。后两法可能会损失信息,也会损失样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。(2)当多个样本率(或构成比)比较的X2检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的来说有差别,但不能说明它们彼此见都有差别,或某两个间有差别,实际工作中,常常还需要知道各组间比较的情况,若要进一步解决此问题,不能采用一般四格表的X2检验进行两两比较,因为这会增大犯Ⅰ型错误的概率,可采用以下方法:①改变显著水准后的两两比较法(Brunden法)前已述及,若将多个样本两两构成四格表,用一般的四格表方法会增大Ⅰ型错误,那么,一种自然的想法就是能否将显著水准适当降低,从而一方面相当于抵消Ⅰ型误差的增加,一方面又可采用一般的四格表方法处理?改变显著性水准的方法正是基于这种思想。Brunden法系将检验水准α调整为αα’=α/2(K-1)(9.10)式中K为样本数,然后用求得的各四格表的X2值与X2α值比较,从而作出推断,也就是说,若取α=0.05,K=6(则α’=0.005),则不能用X20.05(1)=3.84为界值,而要用X20.05(1)=7.88为界值。此外,也可用各四X2检验对应的P值与α’比较而得出结论。②改变显著界值的两两比较法:该法类似于上法,但考虑到了处理组数a,因而更合理,处理组数a是各组按率的大小排列后,欲比较的两组间包括的组数,表9.1列出了用蒙特卡洛模拟法求出K×2表分割为非独立的四格表的显著界值。有了此显著界值后,只要用各四格表的X2值与相应的界值相比即可作出结论。108\nK×2表分割为非独立的四格表的显著界值K处理a2345633.105.485.158.4843.004.486.484.786.539.3353.053.995.237.234.405.707.359.8863.033.944.706.158.054.505.406.558.4510.00计算题:1.某医师用甲、乙两药治疗某病,结果如下表,问甲、乙两药疗效有无差别?表6-7甲、乙两药疗效比较计算表药物治愈数未治愈数合计甲291140乙69473合计9815113Ho:两药疗效相同,即π1=π2H1:π1≠π2α=0.05Tmin=15×40/113=5.31且n>40用公式=10.88查X²界值表,得P<0.01,按α=0.05的水准拒绝Ho,接受H1,故可认为甲、乙两药疗效有差别,乙药疗效较好。2.某卫生防疫站在中小学观察三种矫治近视眼措施的效果,近期疗效数据如表,结论为“近期疗效要以夏天无眼药水最好,保健操为次,新医疗法最差”。试对此作分析评价。表6-2三措施的近期有效率比较矫治方法有效人数无效人数(合计)有效率(%)夏天无眼药水518413537.78108\n新医疗法6263218.75眼保健操5131827.78合计6212318533.51Ho:三组药物近期有效率相等H1:三组药物近期有效率不等或不全相等α=0.05+v=(2-1)(3-1)=2查X²界值表,得0.25>P>0.1,按α=0.05的水准不拒绝Ho,尚不能认为三种措施的近期有效率有差别。1.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料整理如表。问两者之间是否存在一定的关系?表6-3某厂职工冠心病与眼底动脉硬化普查结果分析眼底动脉硬化冠心病诊断结果合计正常可疑冠心病0340116357Ⅰ7313692Ⅱ+Ⅲ1002019139合计5134431588注:原表中=6×31/588=0.3163<1,故将Ⅱ和Ⅲ级合并(1)解法Ⅰ:本题为双向有序分类变量,可设X为眼底动脉硬化等级,Y为冠心病诊断结果,X、Y的等级分别为1、2、3。计算Spearman等级相关系数rs=0.2988,P<0.05,眼底动脉硬化程度与冠心病诊断结果存在正相关。(2)解法Ⅱ:列联表X2检验Ho:冠心病与眼底动脉硬化级别无关H1:冠心病与眼底动脉硬化级别有关α=0.05-1=58.134查附表9,X²界值表,得P<0.005,按α=0.05的水准拒绝Ho,接受H1,故可认为该厂职工冠心病与眼底动脉硬化级别有关。108\n4.表6-4用两种方法检查已确诊的乳腺癌患者120名。甲法检出率为60%,乙法检出率50%,甲乙两法一致的检出率为35%,问:(1)两种方法何者为优?表6-4甲乙两法检验结果乙法甲法合计+-+421860-303060合计7248120Ho:两法分不出优劣,即B=CH1:两法能分出优劣,即B≠Cα=0.05b+c=18+30=48>40v=1,查附表9,X²界值表,得0.10>P>0.05,按α=0.05的水准不拒绝Ho,尚不能认为检出率有差别(2)两种方法的检出结果是否有关系?Ho:两法的检出结果无关系H1:两法的检出结果有关系α=0.05n>40用公式=查X²界值表,得0.05>P>0.01,按α=0.05的水准拒绝Ho,接受H1,故可认为甲、乙两法检出结果有关。1.经反复多次实践证明,用一般疗法治疗某病的治愈率约为20%。现改用新疗法治疗,并随机抽取400名该病患者进行治疗,那么这400名患者中至少要多少人治愈才能判断比一般疗法效果好?此判断发生错误的概率有多大?Ho:两种疗效法治愈率相同,即H1:单侧α=0.05本例n=400108\nu=解之,=0.2+1.645=0.2329X=Np=4000.2329=94(人)400名患者中至少要有94人治愈才能判断新疗法比一般疗法效果好。此判断可能发生错误的概率为5%1.某种化学物质经诱发肿瘤试验,实验组15只白鼠中4只发生癌变,对照组10只白鼠无一发生癌变(表6-5)。问两组发癌率有无差别?表6-5某药物肿瘤治疗试验发癌数未发癌数合计实验组41115对照组0(1.6)1010合计42125Ho:两组发癌率相等,即π1=π2H1:两组发癌率不等,即π1≠π2α=0.05本题n=25<40,故用四格表的确切概率法公式:P=周边合计保持不变的四格表有(1)~(5):取︳A-T︳大于等于1.6表的概率和,即P=p(1)+p(5)=0.1076+0.0166=0.1242,按α=0.05水准不拒绝Ho,尚不能认为两组的发癌率有差别。2.某医院收治了100例临床确诊的小儿佝偻病患者,入院时均分别作血生化检查与X光片检查(表6-6)。欲了解此病法何者较敏感,试设计一整理表,并指出宜作何统计处理?应做配对设计表6-6佝偻病患儿入院检查登记表编号生化检验X光片12..100每个患儿按检查顺序编号,生化指标及X光片阳性记为“+”,阴性记为“-”,根据表6-6登记结果,整理归纳记入表6-9。表6-9生化检查和X线检查结果生化X线检查合计检查+-+αbα+b-cdc+d108\n合计a+cb+dN若在考虑了两法一致的a,d以后,仍拟比较两法何者较敏感,应做配对资料的X²检验.(b+c>40)(b+c<40)v=18.某医生观察某新药对预防流行性感冒(流感)的效果,并作了统计处理(表3-18),你对此有何意见?表6-7用药组和对照组流感患病率比较发病数未发病数合计有效率%服药组5013018072.2未服药组4019023082.6合计9032041078.05X²=6.63,P<0.05(1)因旨在观察新药的效果,根据服药组有效率低于对照组(未服药)就不必进行假设检验。(2)应对本项实验观察的易感者暴露条件进行分析是否均衡可比。第七章秩和检验一、名词解释:1.参数统计1.非参数统计二、填空题:1、符号检验仅适用于___________。2、非参数检验主要优点是___________,非参数不足之处是符合作参数检验的资料,如用非参数检验,因没有充分利用资料提供信息___________3、两组资料作秩和检验n1=10n2=12T=82查表得T0..05(10—2)=84-146T0,01(10,2)=76-154则p___________。4、做配对比较秩和检验时,如果对子数___________超出T界值表范围,可用正态近似法检验。三、是非题:1.非参数统计无严格的条件限制,且多数非参数统计方法较为简便易于理解和掌握,故而应用范围广()2.配对比较的秩和检验的基本思想如果检验假设设成立,则对样本来说,正秩和与负秩和的绝对值不会相差很大()3.三组比较的秩和检验,样本例数均为5,在确定P值时,应查χ²界值()4.非参数不足之处符合作参数检验的资料,如用非参数检验,因没有充分利用资料提供信息,检验效率低于参数检验()四、单选题:1.以下检验方法除_______外,其余均属非参数法。At检验BH检验CT检验DX²检验2.两小样本比较的假设检验,首先考虑_________。A用t检验B用秩和检验Ct检验和秩和检验均可D资料符合t检验还是秩和检验的条件108\n3.等级资料比较,宜用_______。At检验BX²检验C秩和检验DF检验4.在作两样本均数比较时,已知n1、n2均小于30,总体方差不齐且呈极度偏态的资料宜用_________。At’检验Bt检验Cu检验D秩和检验5.三组比较的秩和检验,样本例数均为5,确定P值应查_________。AX²界值表BH界值表CT界值表D三者均不可6.符合t检验条件的数值变量资料,如果采用秩和检验,拒绝H0时_________。A第一类错误增大B第二类错误增大C第一类错误减少D第二类错误减少7.设配对资料的变量值为X1和X2,则配对资料的秩和检验是:A分别按X1和X2从小到大编秩B把X1和X2综合从小到大编秩C把X1和X2综合按绝对值从小到大编秩D按X1和X2的差数从小到大编秩E按X1和X2的差数的绝对值从小到大编秩8.作秩和检验,要求资料:A来自正态总体,方差齐性B来自正态总体,方差较小C来自严重偏态总体D来自正态总体,均数相差较大E以上都不要求9.配对比较的秩和检验的基本思想是:如果检验假设成立,则对样本来说:A正秩和与负秩和的绝对值不会相差很大B正秩和与负秩和的绝对值会相差很大C正秩和的绝对值大于负秩和的绝对值D正秩和的绝对值小于负秩和的绝对值E正秩和与负秩和的绝对值相等10.甲组例和乙组例的两组计量资料或两组等级资料的秩和检验认为:如果两样本来自同一总体,则:A甲组和乙组的秩和相同B甲组和乙组的平均秩次相同C甲组和乙组的秩和的差别完全是由于抽样误差引起D甲组和乙组的平均秩次的差别完全是由于抽样误差引起E以上都不是11.在多组资料比较的H检验中,查H界值表的情况为:A组数=3,每组例数<5B组数=3,每组例数=5C组数=3,每组例数≤5D组数≥3,每组例数<5E组数≥3,每组例数≤512.在多组计量资料或多组等级资料的H检验中,如果P>0.05,则判断结果为:A各组来自不同总体B各组来自同一总体C至少有两组来自不同总体D至少有两组来自相同总体E以上都不对一、问答题:1.参数检验与非参数检验的区别何在?各有何优缺点?2.非参数检验适用那些情况?3.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而108\n同一组的相同数据不必计算“平均秩次?4.两样本比较的秩和检验当n1>10,n2-n1>10时采用u检验,这时检验是属于参数检验还是非参数检验,为什么?六、计算题1.试检验(表7-1)针刺不同穴位的镇痛效果有无差别?表7-1针刺不同穴位的镇痛效果镇痛效果各穴位的观察频数合谷足三里扶突+385347++442923+++122819++++2416332.某实验分别用两种方法对36件样品测定大肠菌指数,得表7-2资料,作t检验(t=1.546,P>0.05),认为两法结果一致,你对此有何意见?表7-2用两法测定36件水源水样品的结果大肠菌指数DY-2法(样品数)发酵法(样品数)950012300639400302300024523800327合计3636均数18493.3321262.53.下表资料是12名宇航员航行前及返航后24小时的心率(次/分),问航行对心率有无影响?表7-3:宇航前后24小时心率(次/分)宇航员号航行前航行后(1)(2)(3)108\n1769327168370654616558093659787748386279979981072781184901263604.配对比较两种方法治疗扁平足效果,记录如下表,问那种方法好?表7-4:甲乙两法治疗扁平足疗效比较病例号甲法乙法(1)(2)(3)1好1差32好1好13好1差34好1中25差3中26中2差37好1中28好1差39中2中210差3差311好1中212差3差313好1中214中2差315好1中216中2差3*1:好2:中3:差5.下表为测得铅作业与非铅作业工人的血铅值(μmol/L),问两组工人的血铅值有无差别?表7-5:铅作业工人和非铅作业工人血铅值(μmol/L)比较_________________________________________________________________________铅作业组非铅作业组血铅值血铅值0.820.24108\n0.870.240.970.291.210.331.640.442.080.582.130.630.720.8710.1n1=7n2=106.比较表两组肝炎婴儿的血清总胆红素有无差别?表7-6两组肝炎婴儿的血清总胆红素肝炎人数(μmol/L)一般组重症组合计<174417~101080~15217160~1910240~22320~44400~22合计3019497.试检验表三组人的血浆总皮质醇测定值有无差别?表7-7:三组人的血浆总皮质醇测定值正常人单纯性肥胖皮质醇增多症测定值测定值测定值0.110.172.700.520.332.810.610.552.920.690.663.590.770.863.860.861.134.081.021.384.301.081.634.301.272.045.961.923.756.628.在研究某地方病的病因工作中,用病区的粮食做动物实验,今有两组大白鼠,分别用甲,乙两种饲料配方饲养,观察鼠的心肌坏死面积(小格数)如下表,问两组间的坏死面积有无差别?(本资料用t检验和秩和检验何者为好?)为什么?108\n表7-8:甲,乙两组心肌坏死面积(小格数)比较甲组乙组面积×频数面积×频数0.0×100.0×150.2×10.2×30.3×10.3×10.4×20.4×20.6×10.9×21.0×11.3×11.6×11.7×12.2×12.8×12.6×17.4×13.3×113.0×14.3×15.1×15.4×15.5×16.1×16.2×19.7×113.8×136.0×1合计n2=29n1=28答案填空题1.非参数统计(秩和检验)2.不受总体分布的限定,适应范围广,检验效率低于参数检验3.P<0.054.n>25是非题:1.√2.√3.×4.√单选题:1.A2.D3.C4.D5.B6.B7.E8.E9.A10.D11.C12.B问答题:1.参数检验与非参数检验的区别何在?各有何优缺点?(1)参数检验与非参数检验的区别。1)参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。2)非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。(2)参数检验与非参数检验的优缺点。1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知和总体方差相等。2)108\n非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一部分,检验的界值表也是有近似的(如配对秩和检验)因此其结果有一定近似性。2.非参数检验适用那些情况?(1)等级顺序资料。(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变换但仍未达到正态或近似正态分布时,宜用非参数检验。(3)未知分布型资料(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。3.为什么秩和检验的编秩在不同对比组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次?因为在不同对比组,不取平均秩次会加大或减小某一组的秩和;而在同一组内,出现相同数据不编平均秩次,该组秩和不受影响。4.两样本比较的秩和检验当n1>10,n2-n1>10时采用u检验,这时检验是属于参数检验还是非参数检验,为什么?两组比较的秩和检验,当n大时,秩和分布近似正态分布,此时不必要再编制比n更大的T检验界值表,而利用秩和分布随n增大渐近正态分布的性质,进行u检验,故仍属于非参数检。计算题:1.试检验(表7-1)针刺不同穴位的镇痛效果有无差别?(1)假设:Ho:三穴位镇痛效果的分布相同H1:三穴位镇痛效果的不同或不全相同α=0.05(2)计算检验统计量:表7-1针刺不同穴位的镇痛效果镇痛效果各穴位的观察频数秩次范围平均秩次合谷足三里扶突合计+3853471381~13869.5++44292396139~234186.3+++12281959235~293264.0++++24163373294~366360.0Ri219352176423462ni118126122366Ri185.89172.73192.31H=12/[N(N+1)]×/ni-3(N+1)=12/[366(366+1)×[219352/118+217642/126+234622/122]-3(366+1)=2.212C=1-Σ(-ti)/(N3-N)=1-[(1383-138)+(963-96)+(953-95)+(733-73)]/(3663-366)=1-0.0838=0.9162HC=2.212/0.9162=2.414108\n(3)确定P值和作出推断结论:本题K=3,v=3-1=2,查附表9,X²界值表,得0.05>P>0.25,按α=0.05水准,未拒绝Ho,尚不能认为三种穴位镇痛效果有差别。2.某实验分别用两种方法对36件样品测定大肠菌指数,得表4-9资料,作t检验(t=1.546,P>0.05),认为两法结果一致,你对此有何意见?表7-2用两法测定36件水源水样品的结果大肠菌指数DY-2法(样品数)发酵法(样品数)950012300639400302300024523800327合计3636均数18493.3321262.5本实验数据应用t检验,存在下列问题:(1)本实验属于配对设计,但整理成频数表已拆开原样本的对子,成为两组比较的形式。(2)频数分布呈极度偏态分布,不宜使用t检验(3)应使用配对设计差值的符号秩和检验。3.表7-3资料是12名宇航员航行前及返航后24小时的心率(次/分),问航行对心率有无影响?(1)假设:Ho:差值总体中位数Md=0H1:差值总体中位数Md≠0α=0.05(2)求检验统计量:表7-3宇航前后24小时心率(次/分)宇航员号航行前航行后差值秩次(1)(2)(3)(4)(5)17693-17-92716831370655446165-4-358093-13-8108\n65978-19-1177483-9-786279-17-1097998-1912107278-6-5118490-6-612636032T+=7T-=71(3)确定P值和作出推断结论:任取T+=7或T-=71,查附表10,T界值表,得P<0.01,在α=0.05水准上,拒绝Ho,接受H1,可以认为航行对心率有影响。4.配对比较两种方法治疗扁平足效果,记录如表7-4,问那种方法好?(1)假设:Ho:两法疗效差值中位数Md=0H1:Md≠0α=0.05(2)求检验统计量:表7-4甲乙两法治疗扁平足疗效比较病例号甲法乙法差数秩次(1)(2)(3)(4)=(2)-(3)(5)1好1差3-2-92好1好10-3好1差3-2-104好1中2-1-4.55差3中214.56中2差3-1-4.57好1中2-1-48好1差3-2-119中2中20-10差3差30-11好1中20-12差3差30-13好1中2-1-4.514中2差3-1-4.515好1中2-1-4.516中2差3-1-4.5*1:好2:中3:差T+=4.5T-=761.5(3)确定P值和作出推断结论:本题有5个差值d=0,故n=11,查附表10,得P<0.01,在α=0.05水准上,拒绝Ho,接受H1,可认为甲法疗效优于乙法。5.表7-5为测得铅作业与非铅作业工人的血铅值(μmol/L),问两组工人的血铅值有无差别?(1)假设:Ho:两组工人血铅值总体分布相同H1:两组工人血铅值分布不同α=0.05108\n(2)求检验统计量:表7-5铅作业工人和非铅作业工人血铅值(μmol/L)比较铅作业组非铅作业组血铅值秩次血铅值秩次0.8290.2410.8710.50.2420.97120.2931.21140.3341.64150.4452.08160.5862.13170.6370.7280.8710.510.113n1=7T1=93.5n2=10T2=59.5(3)确定P值和作出推断结论,本题较小例数n1=7两组例数之差n2-n1=10-7=3,查附表11,得P<0.01,在α=0.05水准上拒绝Ho,接受H1,铅作业组平均秩次为93.5/7=13.36,非铅作业平均秩次为59.5/10=5.95,可以认为铅作业工人的血铅值高于非铅作业工人的血铅值。6.比较表7-6两组肝炎婴儿的血清总胆红素有无差别?(1)假设:Ho:两组肝炎婴儿的血清总胆红素总体分布相同H1:两组肝炎婴儿的血清总胆红素总体分布不同α=0.05(2)求检验统计量:表7-6两组肝炎婴儿的血清总胆红素总胆红素人数秩次范围平均秩次秩和μmol/L)一般组重症组合计一般组重症组<17441~42.51017~10105~149.59580~1521715~312334546160~191032~4136.536.5328.5240~2242~4342.585320~4444~4745.5182400~2248~4948.597108\n合计301949T2=486.5T1=738.5u==计算uC:C=1-Σ(=1-[(43-4)+(103-10)+(173-17)+(103+10)+(23-2)+(43-4)(23-2)]/(493-49)=1-5208/117600=0.9557uC=5.379/=5.520(1)确定P值和作出推断结论:查附表2,t界值表,v=∞,得P<0.001,按α=0.05水准,拒绝Ho,接受H1,可以认为重症组肝炎婴儿的血清总胆红素高于一般组。7.试检验表7-7三组人的血浆总皮质醇测定值有无差别?(1)假设:Ho:三组人的血浆总皮质醇测定值总体分布相同H1:三组人的血浆总皮质醇测定值总体分布不同或不全相同α=0.05(2)计算检验统计量如下表:表7-7三组人的血浆总皮质醇测定值正常人单纯性肥胖皮质醇增多症测定值秩次测定值秩次测定值秩次0.1110.1722.70200.5240.3332.81210.6160.5552.92220.6980.6673.59230.7790.8610.53.86250.8610.51.13144.08261.02121.38164.30271.08131.63174.3028108\n1.27152.04195.96291.92183.75246.6230Ri96.5117.5251Ni101010H=12/[N(N+1)]×ΣRi2/n-3(N+1)=12/[30(30+1)]×(96.52+117.52+2512)/10-3(30+1)=18.122v=k-1=3-1=2,查附表9,X²界值表,得P<0.005,在α=0.05水准上拒绝Ho,接受H1,可以认为三组人的血浆总皮质醇测定值分布不同。(3)多样本两两比较如表4-7Ho:任两组人的血浆总皮质醇测定值总体分布相同H1:任两组人的血浆总皮质醇测定值总体分布不同α=0.05两两比较秩和差数的绝对值各组秩和D=|RA-RB|单纯性肥胖117.5皮质醇增多症251正常人96.521154.5单纯性肥胖117.5133.5本题n=10,k=3,查附表13,D界值表,D0.05(10,3)=92.3,D0.01(10,3)=114.7,在α=0.05水准上,皮质醇增多症与正常人、单纯性肥胖组比较,均拒绝Ho,接受H1,可认为对比组间有差别(P<0.01),而单纯性肥胖与正常人相比,P>0.05,未拒绝Ho,尚不能认为两组间的血浆总皮质醇测定值有差别。8.在研究某地方病的病因工作中,用病区的粮食做动物实验,今有两组大白鼠,分别用甲,乙两种饲料配方饲养,观察鼠的心肌坏死面积(小格数)如表7-8,问两组间的坏死面积有无差别?本资料用t检验和秩和检验何者为好?为什么?表7-8甲,乙两组心肌坏死面积(小格数)比较甲组乙组面积×频数秩和面积×频数秩和0.0×1013×100.0×1513×150.2×12.750.2×32.75×30.3×130.50.3×130.50.4×233.5×20.4×233.5×20.6×1360.9×237.5×21.0×1391.3×1401.6×1411.7×1422.2×1432.8×145108\n2.6×1447.4×1533.3×14613.0×1554.3×15.1×15.4×15.5×16.1×16.2×19.7×113.8×136.0×1合计n2=29T2=968n1=28T1=685应用t检验的条件是所分析的数据来自正态分布总体,而且要求相应的两总体方差相等,故首先列出两组数据的频数分布表。由频数表可见两组数据呈极度偏态,且总体方差不齐(S甲2=50.32,S乙2=7.66,F6.569,P<0.05),故应使用秩和检验。(1)假设:Ho:两组坏死面积的分布相同H1:两组坏死面积的分布不同α=0.05(2)计算检验统计量:u==计算较正uc:C=1-Σ(t3-ti)/(N3-N)=1-[(253-25)+(43-4)+(23-2)+(43-4)]/(573-57)=0.9151uC=(3)确定P值和作出推断结论:查附表2,t界值表,v=∞,得0.05>P>0.01,在α=0.05水准上拒绝Ho,接受H1,故可以认为甲乙两组饲料配方饲养大鼠,心肌坏死面积不同,甲组坏死面积较大。第八章直线相关与回归一、名词解释:相关系数回归系数二、填空题:1、直线回归方程的一般表达式为___________。2、直线回归描述两变量间的___________相关系数r表示两变量间的___________。3、根据回归方程绘制的直线称___________此线与纵坐标的交点称为__________回归直线的斜率称为__________。4、直线相关系数波动范围为___________。108\n5、对同一资料进行直线相关和回归分析,其tb与tr的关系为___________。6、直线相关系数的意义为___________、___________。7、在直线回归分析中,因变量的总离均差平方和可以分解为两部分,即_________和__________。8、直线回归方程中,a为回归直线在Y的__________,即X=0时的Y值,b为样本_________即回归直线的__________。9、r是反映两个变量线性关系__________和__________指标,r没有单位。一、是非题:1.直线相关又称单相相关,用于研究两个连续随机变量X和Y之间线性关系()2.r=0.8就可以认为两变量相关非常密切()3.在直线回归分析中,若已知Y对X存在回归关系,则X为任一值均可根据回归方程算得Y的估计值()4.r=0.85,P<0.05时,表示两变量高度相关()5.两变量(X,Y)间存在直线回归关系,即基本上可以确定两者间有因果关系()6.若回归系数越小,则两变量相关关系也越不密切()7.n=10,r=0.90,可认为两变量呈中高度相关()8.相关系数又称积差相关系数,以符号r表示,说明具有直线关系的两个变量间的相关关系的密切程度与相关方向的指标()8.α为回归直线在Y轴上的截距α>0表示直线与纵轴的交点在圆点的下方,α<0则交点在原点的上方,α=0则回归线通过原点()10.回归直线=a+bx的|a|愈大,在Y轴上的截距愈大()二、单选题:1.下列______公式可出现负值A∑(-)2BΣY²-(ΣY)²/nCΣ(Y)²DΣ(X-)(Y)2.Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重换成国际单位kg,则此方程_______A截距改变B回归系数改变C两者都改变D两者都不变3.直线回归分析中,X的影响被扣除后,Y方面的变异可用指标_______表示。ABCD4.|r|>r0.05(n-2)时,可认为两变量X与Y间_______。A有一定关系B有正相关关系C一定有直线关系D有直线关系5.已知r=1,则一定有_______。Ab=1Ba=1CSY.X=0DSY.X=SY6.已知,那么_______。ABCD两样本决定系数相等108\n7.用最小二乘法确定直线回归方程的原则是各观察点_______。A距直线的纵向距离相等B距直线的纵向距离的平方和最小C与直线的垂直距离相等D与直线的垂直距离的平方和最小8.回归系数的假设检验_______。A只能用r的检验代替B只能用t检验C只能用F检验D三者均可9.相关分析一般是研究:A两组观察单位的两个相同指标间的相互关系B两组观察单位的两个相同指标间的相互差别C两组观察单位的两个不同指标间的相互关系D一组观察单位的两个相同指标间的相互关系E一组观察单位的两个不同指标间的相互关系10.样本的两变量(X,Y)的相关系数r=0时,说明:A两变量间不存在任何关系B两变量间不存在直线关系,但不排除存在某种曲线关系C两变量间存在相互关系的可能性很小D两变量间必然存在某种曲线关系E两变量间的关系不能确定11.若总体相关系数ρ>0,则对从该总体抽取的样本来说有:A.r一定大于0B.r不可能小于0C.r不可能等于0D.r-ρ一定大于0E.以上都不对12.在分析相关系数r时,应注意:A根据|r|大小可将两变量关系分为低度、中度和高度相关B根据两组|r|的大小可直接比较相关的密切程度C若r>0.5,则两变量间必存在直线相关D得r值后尚须作显著性检验才能确定X和Y有无线性相关E以上都不对13.在双变量(X,Y)的相关与回归分析中有:Ar值增加,b值增加B|r|值增加,|b|值增加Cr>0时b<0Dr<0时b>0Er=0时b=014.在双变量(X,Y)的相关与回归分析中有:Ar值与b值的符号相同Br值与b值毫无关系C|r|值愈大|b|值愈大D|r|值愈大|b|值愈小E以上都不是15.对同一双变量(x,y)的样本进行样本相关系数的tr检验和样本回归系数的tb检验,会有:Atb≠trBtb=trC|tb|=|tr|Dtb>trEtb<tr16.研究一种治疗措施和一种疾病的发病率或治愈率的关系能推断两者:A有无统计联系B有无因果关系C有无直接联系D有无间接联系E有无实际意义的联系17.在y对x的直线回归分析中:A|b|值愈大,所描绘的散点愈靠近回归直线B|b|值愈大,回归直线对X轴愈倾斜C|b|值愈大,回归直线对X轴愈平坦D以上均不成立18.回归标准估计误差Sy.x是表示:AY变量的变异程度B样本回归系数的b的变异程度C扣除X变量影响以后Y变量的变异程度D估计值的变异程度E均数的变异程度108\n19.相关系数r的意义是:AX与Y的从属关系B两总体之间的直线相关关系C表示两组资料的相关方向和关系的密切程度D表示X与Y之间的直线相关关系的密切程度和方向E以上都不是20.若相关系数γ≠0,则说明变量之间肯定是:A存在相互关系B不存在相互关系C存在依存关系D不存在依存关系E以上都不对一、问答题:1.应用直线回归和相关分析时应注意那些问题?2.用什么方法考察回归直线图示是否正确?3.r与rs的应用条件有何不同?4.某资料n=100,X与Y的相关系数为r=0.2,可否认为X与Y有较密切的相关关系?5.相关系数与回归系数的区别与联系?二、计算题1.10名20岁男青年身高(cm)与前臂长(cm)如下,问两者有无相关关系?身高170173160155173188178183180165前臂长454244414750474649432.某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘行检测,结果见表,试检验两者有无相关?表8-18个城市肺癌标化死亡率与大气中苯并(a)芘的相关分析肺癌标化死亡率(1/10万)苯并(a)芘城市编号XY(1)(2)(4)15.600.05218.501.17316.231.05411.400.10513.800.7568.130.50718.000.65812.101.203.就下表(1)(2)(4)栏资料分析血小板和出血症的关系。表8-2:血小板数与出血症状的等级相关分析血小板数(×109/L)出血症状病例号XY1120++108\n2130+++3160±4310-5420+6540+7740-81060-91260-101230-111440++122000-4.某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量(g)和体重增加量(g)的数据如下表8-3八只大白鼠进食量(g)和体重增加量(g)鼠号12345678进食量(g)800780720867690787934750体重增加(g)185158130180134167186133(1)此资料有无可疑的异常点?(2)求直线回归方程并对回归系数作假设检验.(3)试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%的可信区间,并说明其含义.(4)求进食量为900g时,个体Y值的95%容许区间,并解释其意义.答案填空题1、=α+bx2、依存关系,相互关系与密切程度3、直线回归、截距、回归系数4、-1——15、r与b假设检验是等价的6、相关关系的密切程度和相关方向指标。7、回归平方和(-)2、剩余平方和Σ(Y-)28、截距,回归系数,斜率9、相互关系的密切程度,相关方向是非题:1.√2.×3.√4.√5.×6.×7.×8.√9.×10.√单选题:1.D2.C3.D4.D5.C6.D7.B8.D9.E10.B11.E12.D13.E14.A15.B16.A17.B18.C19.C20.E问答题:1.应用直线回归和相关分析时应注意那些问题?(108\n1)作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。(2)在进行回归和相关分析之前,应绘制散点图。当观察点的分布有直线趋势时,才适宜作回归、相关分析。如散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。(3)直线回归方程的实用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。(4)双变量的小样本经t检验只能推断总体两变量间有无直线关系,而不能推断相关的紧密程度,样本含量必须很大。(5)相关关系不一定是因果关系,也可能是伴随关系,有相关关系不能证明事物间确有内在联系。1.用什么方法考察回归直线图示是否正确?(1)直线必须通过点()。(2)若纵横坐标无折断号时,将直线左端延长与纵轴相交,交点的纵坐标必等于截距α。(3)直线是否在自变量X的实测范围内。2.r与rs的应用条件有何不同?积差相关系数r用于描述双变量正态分布资料的相关关系。等级相关系数rs适用于下列资料:(1)不服从双变量正态分布而不宜作积差相关分析的资料。(2)总体分布型未知的资料:(3)原始数据是用等级表示的资料。3.某资料n=100,X与Y的相关系数为r=0.2,可否认为X与Y有较密切的相关关系?N=100,r=0.2时,对相关系数进行t检验,按检验水准α=0.05,拒绝Ho(ρ=0),接受H1(ρ≠0),认为两变量有相关关系,但决定系数r2=0.22=0.04,表示回归平方和在总平方和中仅占4%,说明两变量间的相关关系实际意义不大。5.相关系数与回归系数的区别与联系?(1)区别:①资料要求上:回归要求因变量Y服从正态分布,X是可以精确测量和严密控制的变量,称Ⅰ型回归;相关要求两个变量X、Y服从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归②应用上:说明两变量间依存变化数量关系用回归,说明变量间的相关关系用相关。③意义上:b表示X每增(减)一个单位,Y平均改变b个单位,r说明具有直线关系的两个变量间相关关系的密切程度与相关方向。④计算上:b=,r=⑤取值范围:-∞<b<+∞;-1≤r≤1。⑥单位:b有单位,r没单位。(2)联系:①对一组数据若同时计算b和r,它们的正负号一致②b和r的假设检验是等价的,即对同一样本,tb=tr。③用回归解释相关,决定系数r2=lXY2/lXXlYY=SS回/SS总,回归平方和越接近总平方和,则r2越接近1,说明引入相关的效果越好。计算题1.10名20岁男青年身高(cm)与前臂长(cm)如下,问两者有无相关关系?108\n身高170173160155173188178183180165前臂长45424441475047464943(1)计算相关系数:由原始数据及散点图的初步分析,估计本资料有直线趋势。ΣΧ=1725,ΣΧ2=298525,=172.5ΣУ=454ΣУ2=20690,=45.4ΣΧУ=78541=ΣΧ2-(ΣΧ)2/n=298525-17252/10=962.5=ΣΧ2-(ΣΧ)2/n=20690-4542/10=78.4=ΣΧУ-(ΣΧ)(ΣУ)/n=78541-1725×454/10=226(2)与ρ=0进行假设检验。Ho:ρ=0,即身高与前臂长间无直线相关关系H1:ρ=0,即身高与前臂长间有直线相关关系α=0.05υ=n-2=10-2=8查t界值表,得0.002<P<0.005,按α=0.05水准拒绝Ho,2.某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘行检测,结果见表,试检验两者有无相关?表8-18个城市肺癌标化死亡率与大气中苯并(a)芘的相关分析肺癌标化死亡率(1/10万)__________________________________________________________________________城市编号X等级Y等级dd2(1)(2)(3)(4)(5)(6)=(3)-(5)(7)15.6010.05100218.5081.17711316.2361.05600411.4030.10211513.8050.7550068.1320.503-11718.0070.65439812.1041.208416∑d²=28本题资料不服从双变量正态分布,宜计算等级相关系数。Ho:ρS=0,即肺癌标化死亡率与大气中苯并(α)芘无相关关系H1:ρS≠0,即肺癌标化死亡率与大气中苯并(α)芘有相关关系α=0.05由上计算表,rS=1-6Σd2/[n(n2-1)]=1-6×28/[8×(82-1)]=0.6667查附表15,rS界值表,得0.10>P>0.05,按α=0.05水准不拒绝Ho,尚不能认为肺癌标化死亡率与大气中苯并(α)芘间有相关关系。3.就表8-2(1)(2)(4)栏资料分析血小板和出血症的关系。108\n表8-2血小板数与出血症状的等级相关分析血小板数(×109/L)出血症状病例号X等级Y等级dd²(1)(2)(3)(4)(5)(6)=(3)-(5)(7)11201++10.5-9.590.2521302+++12.0-10.0100.0031603±7.0-4.016.0043104-3.50.50.2554205+8.5-3.512.2565406+8.5-2.56.2577407-3.53.512.25810608-3.54.520.259126010-3.56.542.251012309-3.55.530.2511144011++10.50.50.2512200012-3.58.572.25∑d²=402.5本例“出血症状”为等级数据,宜计算等级相关系数。Ho:ρ=0,即血小板数与出血症无相关关系H1:ρ≠0,即血小板数与出血症有相关关系α=0.05因出血症状Y中相同秩次较多,需计算校正rS值r,S。=0=Σ(t3-t)/12=[(63-6)+(23-2)+(23-2)]/12=18.5==-0.5059查附表15,rS界值表,得0.10>P>0.05,按α=0.05水准,不拒绝Ho,尚不能认为血小板数与出血症状间有相关关系4.某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量(g)和体重增加量(g)的数据如下:表8-3八只大白鼠进食量(g)和体重增加量(g)鼠号12345678进食量(g)800780720867690787934750体重增加(g)185158130180134167186133(1)此资料有无可疑的异常点?(2)求直线回归方程并对回归系数作假设检验.108\n(3)试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%的可信区间,并说明其含义.(4)求进食量为900g时,个体Y值的95%容许区间,并解释其意义.解:(1)由散点图及回归直线综合分析,点(800,185)可视为异常点.(2)有原始数据求得直线方程对回归系数作检验Ho:=0,即进食量与增重无直线关系H1:0,即进食量与增重有直线关系=0.05方差分析法SS总=查F界值表,得P<0.05,按=0.05的水准,拒绝Ho,接受H1可认为进食量与增重间有直线关系.t检验法查t界值表,得P<0.01结论同上.第九章统计图表108\n一、名词解释:统计表统计图二、填空题:1.列表的原则是_________、__________、__________、____________。2.统计表的五项基本要求是________、_______、_______、_______和_______。3.描述某地某年210名健康人发汞含量的分布,宜绘制__________图。三、是非题:1.统计表中的标目有横标目和纵标目之分,横标目又称主词是研究事物的指标,通常置于表的左侧,纵标目是研究事物对象,又称宾词列在表的上方,其表达结果与主词呼应()2.百分条图和圆图性质一样,多是用于表示全体中各部分所占的比重大小()3.线图和半对数线图性质相同,多是用于表示事物的发展速度()4.统计分析表有简单和复合表,复合表是指主词分成两个或两个以上的标志()5.直方图可用于表示某现象随另一现象伴随变化的趋势()6.反映连续性资料的频数分布宜选用线图()7.连续性频数分布资料中各组数量多少应绘制直条图()四、单选题:1.统计表有广义和狭义两种,狭义统计表是指:A统计分析表B调查表C统计报表D整理汇总表E计算工具表2.统计分析表有简单表和复合表两种,复合表是指:A有主词和宾词B主词分为两个或两个以上标志C宾词分成两个或两个以上标志D包含两张简单表E包含两张或两张以上简单表3.要制定某年某县恶性肿瘤男、女年龄别死亡率(1/10万)的统计分析表,则主要标志是:A性别B年龄别C死亡率D性别和年龄别E性别、年龄别和死亡率4.不同性质的统计资料,常需不同的统计图加以表达,一般来讲:A连续性的资料宜用直条图B连续性的资料宜用圆形图或构成比直条图C按质分组的资料宜用线图D按质分组的资料宜用直方图或多边图E以上都不对5.制图通则有:A标题应说明图的主要内容,一般放在图的上方B纵横两轴应有标目,一般不标明单位C纵轴尺度一定须从零开始D直条图和线图,其长宽比例一般以5:7为宜E以上都不对6.比较某地区解放以来三种疾病的发病率在各年度的发展速度,宜绘制:A普通线图B直方图C统计地图D半对数线图E圆形图7.图示某地某年流行性乙型脑炎患者的年龄分布,宜绘制:A直条图B圆形图C线图D直方图E统计地图8.统计地图可用于表示:A某现象的内部构成B某现象的地理分布C各现象的比较D某现象的频数分布E某现象的发展速度108\n9.直方图可用于:A某现象内部构成B各现象的比较C某现象随另一现象的伴随变化趋势D某现象的频数分布E某现象的发展速度10.某地两年的三种死因别死亡率,若用统计图表示,可选用:A线图B构成图C直条图D直方图E统计地图11.下列统计图表示统计资料的数量中那项是错误的:A以线条的高低B以面积的大小C以图案D以几何图形E以数字12.哪种图无法考虑长宽比例:A直条图B直方图C普通线图D半对数图E多边图13.下列绘制直条图的要求中,哪项是错误的:A横轴示项目B纵轴示指标数值C直条图等宽,等距D直条图排列由高到低E尺度一般可不等距14.绘制构成比直条图的要求中,哪项是错误的:A任选直条全长为100%B为便于比较,直条上方绘一比例尺C按资料数值大小,在直条中划出相应比例长度D可进行多个事物构成不同年度的纵、横比较E应注意长:宽=7:515.下列统计图中,意义相同的是:A直方图与直条图B普通线图与半对数图C圆图和构成比条图D普通地图与统计地图E直条图与构成比条图16.表示某县1950~1960年肝炎发病率的变动趋势,应绘制:A圆形图B多边图C直方图D直条图E普通线图17.某中学毕业班近视眼发生情况如下班级123456人数605730555752近视眼人数1491015721应选用:A直条图B构成图C普通线图D直方图E多边图18.某市流行性乙型脑炎逐年病死率如下,应选用:年份病死率(%)194948.9195043.1195127.3195221.5195320.0195418.2195512.7A直方图B构成图C普通线图D直条图E半对数图19.1955年某地几种传染病的病死率如下表,应选用:病类病死率(%)108\n白喉10.9流行性乙型脑炎18.0流行性脑脊髓膜炎11.0痢疾2.7脊髓灰质炎3.4A直条图B构成图C直方图D普通线图E半对数图20.某年某地流行性乙型脑炎发生与死亡数如下,应选:地区发生人数死亡人数甲地250158乙地8727丙地7339丁地4928戊地2614合计485266A构成图B直方图C多边图D单式条图E复式条图21.某年某地3~4岁儿童急性传染病构成如下,应选:病类病例数%猩红热292036.5麻疹264033.0百日咳145018.0白喉5306.6痢疾4705.9合计8010100.0A直条图B直方图C构成图D线图E半对数图一、问答题:1.列表的原则和基本要求是什么?2.常用的统计图有哪几种?他们的适用条件是什么?3.某医院对麦芽根糖浆治疗急慢性肝炎161例的疗效列表9-1,试作改进。表9-1麦芽根糖浆治疗急慢性肝炎疗效观察效果总例数有效无效小计近期痊愈好转例%例%例%例%16110867.17043.53823.65332.9二、计算题1.某防疫站1972年开始在城关建立“预防接种卡”使计划免疫得到加强。为说明效果,1975年的5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性21人,小学生145人,阳性22人;中学生236人,阳性15人。相比起来,1974108\n年为:幼儿园儿童144人,阳性37人,小学生1417人,阳性323人;中学生259人,阳性41人。试用适当的统计表和统计图描述上述结果,并作简要分析答案填空题1.突出重点,简单扼要,主谓分明,层次清楚。2.标题,标目,线条,数字,备注。3.频数分布图(直方图)。是非题1.√2.√3.×4.√5.×6.×7.×单选题:1.A2.B3.D4.E5.D6.D7.D8.B9.D10.C11.E12.D13.E14.E15.C16.E17.A18.C19.B20.E21.C问答题:1.列表的原则和基本要求是什么?(1)列表的原则:重点突出,简单明了;主谓分明,层次清楚。(2)列表的基本要求:①应有简明扼要说明统计表内容的标题。既不能过与简略,也不呢能过于繁琐或不确切。②标目文字要简明,有单位的标目要注明,标目不宜过多,层次应清楚。③线条不宜过多。除顶线、底线、纵标目下与合计行上面的线条外,其他线条一般均应省去。表的左上角不宜有斜线。④表内数字小数位数保留应一致,位次应对齐,不宜留空格。暂缺或未记录用“…”表示,无数字用“—”表示,数字是“0”则应填写“0”。⑤备注一般不列入表内,应用“*”号引出,写在表的下面。2.常用的统计图有哪几种?他们的适用条件是什么?常用的统计图有条图、百分条图、圆图、线图、半对数线图、直方图、散点图和统计地图等。(1)直条图:用等宽直条的长短来表示相互独立的各项指标的数值大小,如发病率等。(2)百分条图、圆图:用长条各段的面积、圆的扇形面积来表示事物内部各构成部分的分布情况,即各构成比重的大小,如构成比。(3)普通线图:用线段的升降来表示连续性资料随时间的变迁、某事物现象的动态及变化趋势。(4)半对数线图:用线段的升降来表示连续性资料随时间的变迁和某事物现象发展变化的速度。(5)直方图:用直方面积的大小表示数值变量资料频数分布的情况。(6)散点图:用点的密集程度和趋势表示两变量间的相关关系。(7)统计地图:用不同的纹线或颜色说明指标高低,描述某事物现象在行政区域上的分布情况。3.某医院对麦芽根糖浆治疗急慢性肝炎161例的疗效列表9-1,试作改进。表9-1麦芽根糖浆治疗急慢性肝炎疗效观察效果有效无效108\n总例数小计近期痊愈好转例%例%例%例%16110867.17043.53823.65332.9改后如下表:表9-2麦芽根糖浆治疗急慢性肝炎疗效观察疗效例数疗效构成比(%)无效5332.92好转3823.60近期痊愈7043.48合计161100.00计算题1.某防疫站1972年开始在城关建立“预防接种卡”使计划免疫得到加强。为说明效果,1975年的5月观察了482人的锡克试验反应,其中:幼儿园儿童101人,阳性21人,小学生145人,阳性22人;中学生236人,阳性15人。相比起来,1974年为:幼儿园儿童144人,阳性37人,小学生1417人,阳性323人;中学生259人,阳性41人。试用适当的统计表和统计图描述上述结果,并作简要分析(表9-3)表9-3某县两年不同人群锡克试验反应结果分析19741975调查人数阳性人数阳性率(%)调查人数阳性人数阳性率(%)幼儿园1443725.691012120.79小学生141732322.791452215.17中学生3594111.42236156.36第十章实验与调查设计一、名词解释:1.对照原则2.均衡原则3.随机原则4.重复原则5.完全随机设计6.盲法设计二、填空题:1、实验设计的三个基本要素是__________、__________、__________。2、实验设计的基本原则是__________、__________、__________、__________。3、样本含量大小的估计可通过公式计算,也可用查表估计,两者都必需预先确定__________、__________、__________、__________。4、常用的六种对照形式是______、_______、______、_______、______、_____。108\n5、按调查的范围,调查方法可分为__________和__________,后者又以_________和_________调查最为常用。6、调查设计的四种基本抽样方法是________、________、________、__________。7、为研究新药“胃灵丹”治疗胃病(胃炎,胃溃疡)疗效实验组用胃灵丹治疗,对照组用公认为有效的“胃苏冲剂”这种对照在实验中称为___________对照。一、是非题:1.整群随机抽样就是在总体中,不是一个一个地抽取,而是随机地抽取整群的个体。()2.实验设计中,实验效应的指标应该尽可能选择客观的易于量化的指标()3.在试验中若得到一些特别大或特别小的检测值,必须舍弃,否则会严重影响结果()4.实验对照是指对照组施加处理因素,但不施加某种与处理因素有关的实验因素()5.实验设计的基本原则是齐同,对照,重复,随机()6.实验效应的观察指标应当主观性强,灵敏度高和精确性好()7.指标的精确性包括准确和精密两层意思,准确度指观察值与真值的接近程度,差值属随机误差,精密度指重复观察时,观察值与其均数的接近程度,主要受系统误差影响()8.用已知的正常值作对照是历史对照()9.重复原则主要是指对照组的例数(或实验次数)应具有一定的数量()二、单选题:1.实验设计的基本原则是:A随机、配对、盲法、对照B重复、随机、配对、均衡C随机、盲法、配对、均衡D齐同、均衡、盲法、对照E随机、重复、均衡、对照2.实验设计和调查设计的根本区别是:A实验设计以动物为对象B调查设计以人为对象C实验设计可随机分组D实验设计可人为设置处理原则E两者无区别3.估计样本含量时的容许误差是指:A测量误差B系统误差C样本统计量值之差D总体参数值之差E样本统计量和所估计的总体参数值之差4.实验研究和调查研究相比,主要优点是:A节省时间B节省人力C节省经费D干扰因素少E统计分析指标少5.在实验设计中要确定样本含量,必须先定出:A第一类误差B第二类误差C把握度D第一类误差和把握度E第二类误差和把握度6.作某疫苗的效果观察,欲用“双盲”试验,所谓“双盲”,即:A试验组接受疫苗,对照组接受安慰剂B观察者和实验对象都不知道安慰剂的性质C观察者和实验对象都不知道谁接受疫苗谁接受安慰剂D实验组和对照组都不知道谁是观察者E两组实验对象都不知道自己是实验组还是对照组108\n7.分层抽样要求把总体分层,为了减少抽样误差,要求:A层内个体差异小,层间差异大B层内个体差异小,层间差异小C层内个体差异大,层间差异小D层内个体差异大,层间差异大E分层完全随机8.实验设计的目的是:A排除干扰B找出差异C验证方法D保证科研成果质量E减少误差9.已知某省山区、丘陵、平原的婴幼儿体格发育有较大的差异,现需制定该省婴幼儿体格发育有关指标的正常值范围,调查设计最好采取:A单纯随机抽样B分层抽样C机械抽样D整群抽样E以上都不是10.实验设计的基本三要素是指:A实验效应、受试对象、观察指标B随机化、重复、设置对照C齐同对比、均衡性、随机化D实验效应、受试对象、处理因素E以上都不是11.估计样本含量时,所定容许误差愈小,则:A所要的样本含量愈大B所要的样本含量愈小C不影响样本含量D所定样本含量愈准确E所定样本含量愈粗糙12.各级样本含量有公式计算法和查表法,两者比较有:A结果一样B公式计算法比查表法准确C查表法比公式计算法准确D公式计算法所估计样本含量偏大E查表法所估计样本含量偏大13.随机区组实验设计中,实验对象的分配是:A把实验对象完全随机分配B把实验对象随机分到各对比组C把实验对象随机分到各区组D先按对比组数把相近实验对象配成组,然后在各对比组把实验对象随机分到各区组E先按区组数把相近实验对象配成组,然后在各区组把实验对象随机分到各对比组14.配伍组设计的计量资料比较时,一般首选:A配对t检验B成组t检验C配伍组方差分析D配对秩和检验E配伍组秩和检验15.比较一种未知疗效的药物和已知疗效的药物,最好采用:A空白对照B标准对照C实验对照D相互对照E以上都不是16.在临床试验中用安慰剂的作用是:A消除医生的心理作用B消除实验组对象的心理作用C消除对照组对象的心理作用D消除医生和实验组对象的心理作用E消除医生和对照组对象的心理作用一、问答题:1.1976年某单位报告了果胶驱铅的疗效观察。30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅的均数为0.116mg/L,血铅均数为1.81mg/L。服用20天后再测,尿铅均数降为0.087mg/L,血铅均数降为0.73mg/L。说明果胶驱铅有较好的驱铅作用。2.某单位研究菊花艾叶香预防感冒及空气消毒效果,对象为某幼儿园分住三个楼的儿童。中楼是中班的儿童(160人),东楼是小班(80人)的儿童,此两楼燃香;西楼是大班(160人)的儿童,不燃香为对照组,结论为该艾叶香无预防感冒效果,108\n但有空气消毒作用(肉汤平板上菌落数较少)。1.为寻找营养丰富而有经济实惠的婴幼儿食品,以搞好儿童保健,某研究所利用甘蔗废糖蜜试制了L-赖氨酸(简称赖氨酸盐)。通过实验研究了解膳食中添加赖氨酸盐后对正常儿童生长发育有无影响,如何考虑?2.调查研究和实验研究的主要区别何在?3.估计样本例数的意义何在?需要确定那些前提条件?6.调查研究和实验研究的主要区别何在?7.估计样本例数的意义何在?需要确定那些前提条件?如何进行估算?8.实验为什么要设对照组?如何设对照组?9.常用的实验设计有那些?一、计算题1.根据既往观察,人群接种某预防制剂后,体温高于37.5℃的反应率为10%,今欲推广使用,拟再次证实,要求容许误差在真实反应率的20%以内,α=0.05,问按单纯随机抽样需观察多少人?2.拟用放射免疫法检测某人群(5000人)血液中流行性脑脊髓膜炎(流脑)特异免疫球蛋白含量,根据文献报告,本例为计量资料有限总体抽样的样本含量估计,其标准差为0.5mg/L,容许误差为0.1ml/L,试按单纯随机抽样估计样本例数。3.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如下表,试估计该县百白破疫苗接种率的95%可信区间。表10-1:某县三类乡百白破疫苗接种率调查结果类别人数抽样人数接种率好73717230.8174较好1489914780.6969差93089300.3022合计305783131答案填空题1、处理因素,受式对象,实验效应2、对照原则,均衡原则,随机化原则,重复原则3、第一类错误概率α即检验水准,检验效能1-β,容许误差,总体标准差或用“S”来代替4、空白对照,实验对照,标准对照,历史对照,自身对照,相互对照,5、普查,非全面(抽样调查)典型调查6、单纯随机抽样,系统抽样,整群抽样,分层抽样7、标准对照是非题:108\n1.√2.√3.√4.×5.√6.√7.×8.×9.×单选题:1.E2.C3.E4.D5.D6.C7.A8.D9.B10.D11.A12.A13.E14.C15.D16.C问答题:1.1976年某单位报告了果胶驱铅的疗效观察。30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅的均数为0.116mg/L,血铅均数为1.81mg/L。服用20天后再测,尿铅均数降为0.087mg/L,血铅均数降为0.73mg/L。说明果胶驱铅有较好的驱铅作用。此实验目的是要观察果胶的驱铅作用。人体对外来有害物质有解毒功能,因而铅中毒者在脱离现场后经一段时间,血、尿中铅含量会下降(自然排铅)。该设计最大缺点就在于无对照,其结果不知血铅和尿铅的下降是果胶的作用,还是人体自然排铅的结果。另外,只凭上述血铅和尿铅在治疗前后的均数,不作假设检验就下“果胶有较好的驱铅作用”的结论自然不妥,较好的设计应将30名患者随机分为两组,一组给予果胶,另一组给予具有肯定作用的驱铅药物如EDTA(即标准对照)等,经治疗一定时间后,以两组血铅及尿铅的变化值作假设检验,再下结论。2.某单位研究菊花艾叶香预防感冒及空气消毒效果,对象为某幼儿园分住三个楼的儿童。中楼是中班的儿童(160人),东楼是小班(80人)的儿童,此两楼燃香;西楼是大班(160人)的儿童,不燃香为对照组,结论为该艾叶香无预防感冒效果,但有空气消毒作用(肉汤平板上菌落数较少)。该试验目的是观察野菊花艾叶香预防感冒和空气消毒的作用,但三组之间缺乏均衡性:(1)三栋楼房条件不同。(2)三组儿童年龄不同:不同年龄儿童对感冒抵抗力不同,大班儿童自然会比中班、小班儿童对感冒抵抗力强,故无法观察预防感冒的作用。(3)设立对照也有问题,空气消毒是野菊花艾叶香的燃香作用,还是烟作用无法区别,故达不到试验目的。应设立实验对照。3.为寻找营养丰富而有经济实惠的婴幼儿食品,以搞好儿童保健,某研究所利用甘蔗废糖蜜试制了L-赖氨酸(简称赖氨酸盐)。通过实验研究了解膳食中添加赖氨酸盐后对正常儿童生长发育有无影响,如何考虑:(1)实验组与对照组的设置均衡性:实验组与对照组条件要均衡,除处理因素外,其它条件应尽量相同,因此应选全托儿所的同龄、身体发育正常、健康的儿童作为观察对象,使实验组与对照组应在性别、年龄、生活条件、健康知识等有关因素尽量做到相近。(2)实验对象的随机化分配方法:将符合条件的实验对象依花名册顺序号,使用随机数字表,按随机原则进行分组。样本含量借助参考文献各项指标的数据,设定α,1-β进行样本例数估计。(3)实验持续时间及观察指标、项目:实验持续时间的确定以能看出显著变化为原则,如持续时间短,区别不出效应指标的变化;而持续时间过长,则给试验带来较多的困难与人力、物质的浪费。观察指标:①108\n形态指标:身高、体重、胸围、坐高、皮下脂肪厚度等;②功能指标:脉搏、血压、肺活量、呼吸次数等;③生化指标:Hb(g/L)、WBC(×109/L)等。(4)统计分析表及统计分析方法:1)计算各项指标实验前、后均值、标准差(见表)。2)作统计分析以了解每组实验前后标化是否有统计意义,可按组别对各项指标受试前后进行配对t检验,再对两组实验前后的差数用成组设计两均数比较的t检验,检验实验组与对照组各项指标差别有无统计意义。表不同食物组实验前后儿童生长发育指标比较(±S)指标普通食物组加赖氨酸盐组实验前实验后实验前实验后身高(cm)体重(kg):脉搏(次/分)血压(kPa):Hb(g/L)WBC(×109/L)1.调查研究和实验研究的主要区别何在?按研究是否对观察对象施加干预(即处理因素)可分为调查与实验。调查即研究者只是被动的调查客观实际情况,而未加任何干预。实验比调查能更好地控制误差。基于上述差别,调查与实验研究在统计分析上也不尽相同。(1)调查研究:①研究因素(处理因素)是客观存在的;②不能通过随机化分组的方法来平衡混杂因素。(2)实验研究:①研究者能人为设置处理因素;②受试对象接受何种处理因素或水平是由随机分配而定。2.估计样本例数的意义何在?需要确定那些前提条件?(1)估计样本例数的意义:在调查或实验研究中都要对样本例数进行估计,如果例数太少,有可能把个别情况误认为普遍情况,把偶然性或巧合的现象当做必然规律现象,以至错误地推论到总体,例数太多,势必造成人力、物力的浪费。在保证实验结果有一定可靠性的条件下,确定最少的样本例数,以节约人力和经费。(2)样本含量的估计可分为两类,一类是作参数估计时的样本含量估计;另一类是作指标比较时的假设检验中样本含量的估计。两种方法不同,决定样本含量的因素亦有所不同。现分述如下。1)参数估计时,影响样本含量的因素有:①容许误差δ。容许误差越小,所需样本含量越多;②Ⅰ型错误的概率α。α越小,则所需样本含量越多;③总体标准差σ。σ越大,所需样本含量越大;④总体是无限总体,所需样本含量较多;如系有限总体则总体单位数越小,所需样本含量也越少。108\n1)指标比较时,决定样本含量的因素是:①Ⅰ型误差的概率α。α越小,样本含量越大;②检验效能1-β。β为Ⅱ型误差的概率,1-β越大,所需样本含量越大;③容许误差δ。δ越小则样本含量越大;④总体标准差σ或总体率π。σ越小,n越小,π越接近0.5样本含量越大;⑤单侧检验所需样本含量较少,双侧检验所需样本含量较多。6.调查研究和实验研究的只要区别何在?按研究是否对观察对象施加干预(即处理因素)可分为调查与实验。调查即研究者只是被动的调查客观实际情况,而未加任何干预。实验比调查能更好地控制误差。基于上述差别,调查与实验研究在统计分析上也不尽相同。(1)调查研究:①研究因素(处理因素)是客观存在的;②不能通过随机化分组的方法来平衡混杂因素。(1)实验研究:①研究者能人为设置处理因素;②受试对象接受何种处理因素或水平是由随机分配而定。7.估计样本例数的意义何在?需要确定那些前提条件?如何进行估算?(1)估计样本例数的意义:在调查或实验研究中都要对样本例数进行估计,如果例数太少,有可能把个别情况误认为普遍情况,把偶然性或巧合的现象当做必然规律现象,以至错误地推论到总体,例数太多,势必造成人力、物力的浪费。在保证实验结果有一定可靠性的条件下,确定最少的样本例数,以节约人力和经费。(2)样本含量的估计可分为两类,一类是作参数估计时的样本含量估计;另一类是作指标比较时的假设检验中样本含量的估计。两种方法不同,决定样本含量的因素亦有所不同。现分述如下。1)参数估计时,影响样本含量的因素有:①容许误差δ。容许误差越小,所需样本含量越多;②Ⅰ型错误的概率α。α越小,则所需样本含量越多;③总体标准差σ。σ越大,所需样本含量越大;④总体是无限总体,所需样本含量较多;如系有限总体则总体单位数越小,所需样本含量也越少。2)指标比较时,决定样本含量的因素是:①Ⅰ型误差的概率α。α越小,样本含量越大;②检验效能1-β。β为Ⅱ型误差的概率,1-β越大,所需样本含量越大;③容许误差δ。δ越小则样本含量越大;④总体标准差σ或总体率π。σ越小,n越小,π越接近0.5样本含量越大;⑤单侧检验所需样本含量较少,双侧检验所需样本含量较多。如何进行样本含量估算,根据已知条件,区别调查研究还是实验中统计量的比较,以及数值变量还是分类变量,可按样本估计的专用公式计算,或查样本例数估计专用表。8.实验为什么要设对照组?如何设对照组?设对照可以使处理因素和非处理因素的差异有一个科学的对比。设立对照的目的是抵消对照组与处理组非处理因素的影响,处理因素效应得以充分显示出来。主要有空白对照、安慰剂对照、实验对照、标准对照、历史对照、自身对照和相互对照等六种形式,可以根据研究目的和内容加以选择。9.常用的实验设计有那些?(1)完全随机设计。亦称单因素设计(2)配对设计(3)配伍组设计,亦称随机区组设计,是配对设计的扩大。(4)析因试验设计、拉丁方设计、正交设计,这些都是多因素,高效率的实验设计。计算题1.根据既往观察,人群接种某预防制剂后,体温高于37.5℃的反应率为10%,今欲推108\n广使用,拟再次证实,要求容许误差在真实反应率的20%以内,α=0.05,问按单纯随机抽样需观察多少人?本题为调查总体率的样本含量估计。已知:π=0.1,δ=0.2×π=0.2×0.1=0.02,双侧u0.05=1.96n=(1-π)/δ2=1.962×0.1×0.9/(0.2×0.1)2≈865(人)2.拟用放射免疫法检测某人群(5000人)血液中流行性脑脊髓膜炎(流脑)特异免疫球蛋白含量,根据文献报告,本例为计量资料有限总体抽样的样本含量估计,其标准差为0.5mg/L,容许误差为0.1ml/L,试按单纯随机抽样估计样本例数。已知:N=5000,σ=0.5μg/ml,δ=0.1μg/ml。若规定:双侧α=0.05,u0.05=1.96则:n=(Uασ/δ)2=(1.96×0.5/0.1)2=96.04≈97(人)nC=n/(1+n/N)=97/(1+97/5000)=95.15≈96(人)3.某县进行学龄前儿童百日咳、白喉、破伤风制品的接种调查,据已掌握的情况,将全县各乡分为好、较好、差三类,各随机抽取1/10的学龄前儿童作调查,结果如表10-1,试估计该县百白破疫苗接种率的95%可信区间。表10-1某县三类乡百白破疫苗接种率调查结果类别人数抽样人数接种率好73717230.8174较好1489914780.6969差93089300.3022合计315783131本题为求按比例分配的分层抽样中总体率的可信区间,首先计算接种率及其标准误。(1)p=[ΣΝiΡi]/Ν=[7371×0.8174+14899×0.6969+9308×0.3022]/31578=19221.0461/31578=0.608685(2)==0.007520该率不接近于0或1,一般认为服从二项分布。因n=3131,较大,可用正态近似法计算其可信区间。95%CI:P±1.96Sp=0.608635±1.96×0.007520=(0.5939,0.6234)108
查看更多

相关文章

您可能关注的文档