- 2022-08-13 发布 |
- 37.5 KB |
- 52页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
医学统计学 绪论
医学统计学娄冬华loudonghua@sohu.com13851577586\n第一章 绪论\n一. 统计学介绍1. 统计学(Statistics)统计学是一门以社会现象总体数量方面为对象的方法论科学,是研究如何有效地收集、整理和分析受随机影响的数据,并对所考察的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。\n统计学Webster:Statisticsisthesciencedealingwiththecollections,analysis,interpretationandpresentationofmassesofnumericaldata.Armitage:Statisticsisthescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresult.\n2.统计学的发展历史A)古典统计学时期17世纪中叶至18世纪中叶统计学萌芽时期,有记述学派和政治算术学派。(1)记述学派或国势学派创始人是德国的康令(H.Coning,1606-1681)和阿亨瓦尔(G.Achenwall,1719-1772)很少进行数量方面的研究,未涉及统计学的实质。\n(2)政治算术学派创始人是英国的威廉•配第(W.Petty,1623-1687),用计量方法以及对比法综合研究社会经济问题。\nB)近代统计学时期18世纪末至19世纪末,主要有数理统计学派和社会统计学派。(1)数理统计学派产生于19世纪中叶,在概率论的基础上形成,奠基人为比利时的凯特勒(A.Quetelet,1796-1874)提出了误差理论。\n(2)社会统计学派19世纪后半叶,德国克尼斯(K.G.A.Knies,1821-1898)首创,认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学。\nC)现代统计学时期20世纪初至今。同自然科学、工程技术科学紧密结合,进入了统计学发展的鼎盛时期。英国的Gosset(1876-1937)提出了小样本理论。波兰的Neyman(1894-1981)建立了统计假设理论。美国的Wald(1902-1952)创立了决策理论。美国的Cochran(1909-1980)提出了实验设计的理论和方法。\n3.医学统计学以医学为指导,用统计学的原理和方法研究医学的一门应用科学。包括:①研究设计②资料分析\n医学统计学MedicalStatistics卫生统计学HealthStatistics生物统计学Biostatistics\n4.医学科研中统计学的作用吸烟危害健康的论证:Muller(1939)采用病例对照设计搜集到一组肺癌患者,并寻找一组其它特点相类似的非肺癌患者作为对照组,逐一询问是否吸烟、吸烟量、吸烟时间,发现肺癌组吸烟率高,对照组低。由此得出吸烟有害健康的结论。\n但统计学权威Berkson认为,吸烟能提高许多种死因下的死亡率,这一点不可理解。除非有证据证明吸烟对整体健康有害或加速老化,否则会怀疑是对照组的选择及资料搜集带来的偏倚所致。\nFisher认为:已有的研究不能排除遗传的因素,也许有些人具某种遗传因素,既爱吸烟,又易得癌,而没有此因素者既厌吸烟,又难得癌。如果真是如此的话,戒烟就没有意义了。\n瑞典的双生研究,调查了一方吸烟另一方不吸烟同卵双生男274对,女264对,异卵双生男733对,女653对吸烟与不吸烟相比,咳嗽的相对危险度约1.8-2.5倍\n统计软件SASSPSSSTATABMDP\n\n\n二.统计工作的步骤1.设计(design)要对所作工作的全过程有一个全面的设想,明确研究的目的,对研究的事物有一定的了解(可以通过查阅文献资料或作预试验来实现)。\n如:要研究什么?收集什么资料?如何收集?人力财力条件可否?观察对象和观察单位是什么?怎样汇总资料?计算哪些统计指标?样本例数是多少?预期结果怎样?\n2.收集资料(collectionofdata)取得准确完整的原始数据。资料来源有:①统计报表②工作记录(病历或化验报告单)③调查或实验结果。\n3.整理资料(sortingdata)将原始数据系统化条理化,即数据的预处理。\n4.分析资料(analysisofdata)计算有关统计指标,阐明事物的内在联系和规律,包括统计描述和统计推断。\n三.统计中的几个概念1.变量(variable)收集资料中确定了的观察单位称为个体,在统计工作中反映个体的特征称为变量。如要调查某地中学生的健康状况,每一个要调查的学生称为个体,反映中学生的健康指标身高、体重、胸围、肺活量、体温、脉搏数、血压等都称作为变量。又如病人的年龄、性别、红细胞数、血红蛋白含量、患病时间等。\n变量的观察值(观察结果)可以是定量的也可以是定性的,可分为数值变量:可以度量大小,如血压等分类变量无序变量:血型、性别有序变量:如测定某人群血清反应分-、+、++、+++四级\n2.总体和样本(populationandsample)总体是根据目的确定的同质的研究对象的全体总体分有限总体和无限总体样本是从总体中随机抽取的部分观察单位\n如研究某地1995年的正常成人的血压值,现随机抽取150人,分别测定其血压值,则该地1995年全部正常成人的血压值就构成了一个总体,这150人的血压值就是样本。\n统计推断就是要从样本信息去推断总体特征样本要具代表性,须:①随机抽取②例数足够多。\n同质(homogeneous)具有相同性质的事物称为同质的。否则称为异质的或者间杂的(heterogeneous)。同质和异质是相对的概念不同质的个体不能笼统地混在一起分析3.同质与变异(homogeneityandvariation)\n在研究事物的形状时同质和异质示例在研究事物的颜色时\n变异(variation)是指在相同条件下同类事物的观察单位在同一指标上的差别。结果是随机的,不可预测的一种或多种不可控因素(已知的或未知的)作用下的综合表现个体变异是普遍存在的个体变异是有规律的没有个体变异,就没有统计学!\n统计分析的任务就是在同质分组的基础上,通过对变异所呈现出的统计规律性的研究,透过偶然现象,揭示同质事物的本质特征和规律\n4.随机(Random)随机:是指机会均等,目的是保证样本对总体的代表性、可靠性随机抽样有相同的机会被抽到随机分组有相同的机会被分到不同的组中顺序随机\n5.概率(probability)概率是描述某事件发生的可能性大小的一个度量。如抛一枚均匀的硬币,“正面”朝上的概率为50%。对于结果不确定的现象,每一种可能结果都是一个随机事件,简称事件,用A表示,事件A发生的可能性大小记作P(A)或Pr(A)\n小概率事件P≤0.05或≤0.01小概率原理必然事件P=1不可能事件P=0\n区分频率与概率,大样本情况下频率是概率的一个较好的估计值\n频率Relativefrequency在n次随机试验中,事件A发生了m次,则比值称为事件A在这n次试验中出现的频率\n试验者投掷次数出现“正面”次数频率Buffon404020480.5069DeMorgan409220480.5005Fisher1000049790.4979K.Pearson1200060190.5016K.Pearson24000120120.5005Romanovsky罗曼诺夫斯基80640396990.4923\n蒲丰( Buffon)1707—1788,法国博物学家、数学家、生物学家、宇宙学家和作家。\n统计模拟的妙用:计算π圆周率的计算阿基米德:穷竭法刘徽:割圆术……16世纪(法)韦达、(英)瓦利斯、(德)欧拉……\n实验者时间针长l投掷次数相交次数πBuffon17770.522127043.142Walf18500.8500025323.1596Smith18550.6320412183.1554DeMorgan18601.06003823.137Fox18840.7510304893.1595Lazzerini19010.83340818083.1415929Reina19250.541925208593.1795P=2l/aπ\n6.参数与统计量(parameterandstatistic)根据样本观察值计算出的统计指标,称统计量(statistic),常用拉丁字母表示。反映变量值总体分布特征的统计指标,称参数(parameter),常用希腊字母表示。例要了解某地12岁健康男孩的平均身高μ(参数),今测得100名男孩身高值,求得平均数(统计量)。\n四.统计资料的类型根据变量的类型可以将统计资料分成三类。\n1.定性资料(qualitativedata)将观察单位按某种属性或类别分组,所得各组的观察单位数。如调查某人群的血型分布,按O、A、B、AB分组,得各血型组的人数,又如作结核菌素试验,要计算阴、阳性人数。\n2.定量资料(quantitativedata)对每个观察单位用定量方法测定某项指标量的大小,所得资料称计量资料,一般有单位。如体检时的身高、体重、胸围、肺活量、呼吸次数等,又如病人的红、白细胞数、血红蛋白、血小板数。\n3.等级资料(半定量资料)(rankeddata)将观察单位按某种属性或某个标志分组,得到各组的观察单位数,但各组之间具等级顺序。如某病住院病人的治疗结果,按显效、有效、改善、无效分组,又如测定某项血清反应的-、+、++、+++人数。\n根据分析需要,三种资料可以转化每个人的血红蛋白属定量资料若将血红蛋白按量(g/L)的多少分成五等:<60(重度贫血),60-(中度贫血),90-(轻度贫血),110-160(正常),>160(血红蛋白增高)得各等级人数,就是等级资料若按正常与异常分组得各组人数,则得到定性资料定量资料→等级资料→定性资料\n统计有用吗?\n一圆,内接一正三角形,在圆中任作一弦,求弦长大于三角形边长的概率?\n\n\n查看更多