统计学方法概述

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学方法概述

第七章人群健康研究的统计学方法10/7/20211\n“统计”一词,对一般人来说并不陌生。在报刊上常见用来说明我们工作、事业成绩的数字、表、图,称为统计数字、统计表和统计图。在西方,统计学(statistics)一词,源出于state(国家、情况),专指有关“国情”的学问,最初多用于文字记叙,后发展为数量比较,随着概率论思想与方法的引入,逐渐形成今天在理论与应用方面都已相当完备的独立学科。10/7/20212\n1.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?2.用A,B两种药物分别治疗同病患者各50人,如果A药的治愈率(60%)高于B药(50%),证明A药的疗效优于B药。这种说法对吗?为什么?思考题\n医学统计学的主要研究内容1、统计学设计(1)内容:临床试验设计、实验室研究设计、调查研究设计等。(2)目的:①控制和缩小随机误差,消除系统误差;②节约样本含量;③尽可能多地获取有关信息,达到高效低耗的目的。2、统计分布事物所表现的数量特征是千差万别的,其所呈现的分布规律是进行统计学推断的基础和根据。3、各种统计量(或称统计指标)的性质、特点及其分布规律4、统计分析方法(包括各种数学模型)尤其是随着计算机的普及和发展,多因素分析方法发展很快。10/7/20214\n如何学习医学统计学1、掌握基本概念、基本原理和基本方法。培养统计思维能力。2、掌握常用统计分析方法。对统计公式,要求了解其用途、适用条件和注意事项。切忌死记硬背,关键是灵活运用。3、重视习题课。联系实际,紧密结合专业知识,多做练习题。10/7/20215\n例:治疗某病的新疗法新法:(100例)有效20例,有效率20%;旧法:(100例)有效15例,有效率15%;这两个百分数就是统计描述指标,现在的问题是,这两种疗法的有效率会稳定不变吗?如果说不会,是什么原因?那么,两种疗法的真实有效率会是多少?我们能根据统计描述(20%与15%)就去正式采用还有较大副作用的新疗法?对这样的差异问题,你能再凭直觉去作“否定”?在作任何回答之前,必须判断20%与15%之间的差别是真实的差异,或是仅仅由于“机遇”所致。这里,统计推断可提供帮助。学过统计学,将会了解不仅可判断新疗法是否较好?而且,如果判断它是较好,还能估计判断是错误的可能性有多大。10/7/20216\n统计分析是科研工作中的一种有力工具。它从科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。需要运用统计方法的场合而不去运用它可能造成不应有的缺陷或得出错误的结论。10/7/20217\n例:北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱,甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%。那么如果别的医院,其它大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?显然,不一定恰为94.4%,那么是多少呢?比它高还是比它低?这就是一个求可信区间的问题。10/7/20218\n例:某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78%,平均疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗?由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此药的78%疗效有待探讨。这就要求设立具有可比性的对照组。10/7/20219\n再譬如,用某药治某病,治一例有效,能说100%有效吗?治疗二例有效,能说明100%有效吗?治十例,其中九例有效,能说90%有效吗?显然,观察的例数将是个重要因素,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。10/7/202110\n一些现象既有规律性又有随机性,肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性,而绝非每个吸烟的人都会患肺癌,这体现了随机性;再如,一般来说,白种人身材比黄种人要高些,这就是规律性,但对于具体的一个白人和一个黄种人,就很难说谁高谁矮了,这体现随机性。10/7/202111\n第一节统计学方法概述一、统计学的意义统计学是运用数理统计的原理和方法,研究数据资料的搜集、整理、分析与推断的科学,是认识社会和自然现象客观规律的数量特征的重要工具。医学统计学是认识医学现象数量特征的重要工具,是运用数理统计的原理和方法,结合医学实际,来研究医学科研的实验设计和数据处理的一门科学。“医学统计学是处理医学资料中的同质性(homogeneity)和变异性(variation)的科学与艺术”10/7/202112\n二、统计学中的几个基本概念(一)同质与变异(二)总体与样本(三)参数与统计量(四)误差(五)概率10/7/202113\n(一)同质与变异homogeneityandvariation同质:指观察单位(研究个体)间被研究指标的影响因素相同。个体:即观察单位,是统计研究中的最基本单位。变量:观察单位的研究特征变量值:变量的观察结果变异:指同质的个体之间的差异。10/7/202114\n同质与变异的例子例1调查2008年淄博市7岁男童的身高和体重同质:2008年、淄博市、7岁男童变异:身高和体重各不相同例2研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同10/7/202115\n120名正常成年男子红细胞计数值(1012/L)5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89算术均数=4.72,标准差=0.5710/7/202116\n10/7/202117\n(二)总体与样本populationandsample总体:根据研究目的所确定的同质观察单位某项变量值的集合(全体)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位变量值的集合。10/7/202118\n随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。10/7/202119\n(三)参数与统计量parameterandstatistic参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数总体样本抽取部分观察单位统计量参数推断inference统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。10/7/202120\n(四)误差error误差:泛指实验数据的实测值与真实值之差1系统误差2随机测量误差3抽样误差10/7/202121\n系统误差systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。10/7/202122\n2随机测量误差(randomerrorofmeasurement)或称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机地变化。随机测量误差服从正态分布,可以用概率统计方法处理。10/7/202123\n3抽样误差(samplingerror)我们从同一总体中随机抽取若干个例数相同的样本,其样本统计量之间会有所不同。这种由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异,统计上称为抽样误差。抽样误差在医学生物实验中最主要的来源是个体的变异。所以这是一种难以控制的、不可避免的误差。但抽样误差是有一定规律的。10/7/202124\n(五)概率probability确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。10/7/202125\n必然事件P=1不可能事件P=0随机事件0
查看更多

相关文章