- 2022-08-13 发布 |
- 37.5 KB |
- 46页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
生物统计学课件-01
授课人:田雪Email:tianxue19871224@126.com杭州电子科技大学统计教研室\n成绩评定:平时30%:作业、考勤。期末70%参考教材:\n知识回顾数理统计:应用概率论的原理,通过搜集、整理、分析数据,发现总体内在规律并给出判断和预测。主要内容:参数估计、假设检验。\n生活中的统计学\n\n国家统计局相关官员表示,我国居民消费增长较慢,居民消费支出在GDP中的比重较低。据悉,2008年中国居民消费率(居民消费占GDP的比重)为35.3%,美国为70.1%,印度为54.7%。(09年12月3日新华网)“前三季度中国国内生产总值(GDP)同比增长7.7%,其中第三季度增长8.9%”、“中国城市化率已达45.68%”、“97%外出农民工已就业”\n\n\n统计学分支\n概论第一节生物统计的地位意义第二节生物统计学发展简史第三节生物统计的主要内容第四节生物统计的常用术语第五节生物统计学教学要求\n第一节生物统计的地位意义\n一、概念生物统计学:把概率论和数理统计的科学原理和方法应用于生物科学研究中的数量资料的搜集、整理和分析的科学,是一门应用数学,是现代生物学研究中不可缺少的工具。第一节生物统计的地位意义\n二、生物统计的地位生物数学(Biomathematics):以数学方法研究和解决生物学问题,并对生物学有关的数学方法进行理论研究,介于生物学和数学之间的边缘学科。从研究使用的数学方法划分,生物数学可分为生物统计学、生物信息学、生物系统论、生物控制论和生物方程等分支。第一节生物统计的地位意义\n三、生物统计的作用1、为科学地整理、描述数据提供方法2、判断试验结果的可靠性由于存在试验误差,从试验所得的数据资料必须借助于统计分析方法才能获得可靠的结论。3、提供由样本推断总体的方法。4、提供试验设计的原则和方法第一节生物统计的地位意义\n四、生物统计的意义21世纪是生命科学的世纪,无疑也为生物统计学的发展与应用拓展了广阔的空间。第一节生物统计的地位意义\n生物统计分析软件包的普及将生物统计学从统计学家的书本里解放出来,成为生物学研究者的常用工具。但它也带来了一个严重的弊端——对生物统计方法的误用与滥用。如果把整个统计分析过程变成一个黑箱,那就有可能垃圾进,垃圾出(garbagein,garbageout)。第一节生物统计的地位意义\n五、生物统计学的特点Characteristics1、根据有限数量的样本观察数据来推断和估计事物的总体,是生物统计的基本特点。2、用样本来推断总体,要求样本具有一定的含量和代表性。3、推断有很大的可靠性,但有一定的错误率(如假阳性)。4、实验设计应该先于生物统计分析的思考!第一节生物统计的地位意义\n第二节生物统计学发展简史\n最早建立生物统计思想的是A.Quetelet(1796-1874),把统计学应用于解决生物学、医学和社会学中的问题,第一个认识到大量变异数据中蕴涵规律性(近代统计学的重要思想)最早应用生物统计学的是C.Darwin(1809-1882),进化论的本质是生物统计遗传学奠基人G.Mendel的豌豆杂交实验结果也证实了生物统计的规律第二节生物统计学发展简史\n统计学用于生物学的研究,开始于19世纪末,1870年,英国遗传学家,Galton(1822-1911)提出了相关与回归的概念,被公认为生物统计学的创始人。Galton和他的继承人K.Plarson(1857-1936)于1895年成立了伦敦大学生物统计实验室,提出了检验方法。K.Plarson的学生Gosset(1876-1937)在1908年以“student”笔名发表了“t分布和t检验法”创立了小样本检验代替大样本检验的理论和方法。Fisher于1923年发展了显著性检验及估计理论,提出了F分布和F检验,创立了正交试验设计和方差分析。1901年英国著名统计学家Pearson创办了《生物统计学杂志》(Biometrika),标志着生物数学发展的起点。第二节生物统计学发展简史\nNeyman(1894-1981)和S.Pearson进行了统计理论的研究工作,提出统计假设检验系统,标志着统计学真正形成。Therearefivecomponentstoanexperiment:Hypothesis(假设)Experimentaldesign(实验设计)Experimentalexecution(实验实施)Statisticalanalysis(数据分析)Interpretation(描述)第二节生物统计学发展简史\n第三节生物统计的主要内容\n统计研究设计统计描述统计分析第三节生物统计的主要内容调查设计指调查研究工作全过程的计划。试验设计是指试验研究工作进行前应用数理统计原理,制定试验方案,选择试验材料,对实验因素作合理、有效的安排,最大限度地减少试验误差,使之达到高效,快速、准确、可靠和经济的目的。两者的区别前者:是被动地进行观察,希望干扰因素的影响尽可能减少;后者:研究者能较主动地安排试验因素,控制实验条件,尽可能排除或抵消非试验因素的干扰和影响。\n统计研究设计统计描述统计分析第三节生物统计的主要内容统计表和统计图定量资料集中趋势的度量算术均数、几何均数、调和均数、中位数、分位数和众数定量资料离散趋势的度量标准差、标准误差、变异系数、极差和四分位数间距随机变量及其概率分布离散型:二项分布、波松分布连续型:正态分布、t分布、χ2分布、F分布\n统计研究设计统计描述统计分析第三节生物统计的主要内容a.假设检验b.统计推断estimativestatisticsc.研究变量之间的关系无自变量与因变量之分:直线相关分析、典型相关分析研究多变量内部的从属关系:主成分分析、因子分析等。多变量之间亲疏关系:聚类分析有自变量与因变量之分:直线回归分析、曲线回归分析、多项式回归分析、Logistic概率模型回归分析等d.判别分析根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。\n第四节生物统计的常见术语\n第四节生物统计的常见术语1、总体与样本Populationandsample1)总体根据研究目的确定的研究对象的全体称为总体。构成总体的每个成员称为个体(individual)。含有有限个个体的总体称为有限总体(finitepopulation)。包含有无限多个个体的总体叫无限总体(infinitepopulation)。2)样本总体的一部分称为样本。样本中所包含的个体数目叫样本容量或大小(samplesize)。样本容量常记为n。通常n≤30的样本叫小样本,n>30的样本叫大样本。3)抽样sampling从总体中获得样本的过程。可分为放回式抽样(samplingwithreplacement)和非放回式抽样(withoutreplacement)。随机抽样(randomsampling)是确定样本代表性的有效方法。\n第四节生物统计的常见术语2、特征数表示总体和样本的数量特征的量称为特征数。1)参数Parameter:由总体计算得来的特征数,常用希腊字母表示。用μ表示总体平均数,用σ表示总体标准差。2)统计量statistics:由样本计算得来的特征数,常用拉丁字母表示统计量。用表示样本平均数,用S表示样本标准差。3)总体参数由相应的统计量来估计,例如用估计μ,用S估计σ等。总体样本抽样描述计算统计量推断统计量\n第四节生物统计的常见术语3、平均数mean算术平均数:几何平均数:加权平均数:\n第四节生物统计的常见术语4、方差、标准差和变异系数variance,standarddeviationandvariationcoefficient1)极差,又称范围range:它是样本变量中最大值和最小值之差,一般用R表示。2)方差样本方差:总体方差:\n第四节生物统计的常见术语4、方差、标准差和变异系数variance,standarddeviationandvariationcoefficient3)标准差样本标准差:总体标准差:4)变异系数:是样本变量的相对变异量,是不带单位的纯数。用变异系数可以比较不同样本相对变异程度的大小。\n第四节生物统计的常见术语5、数据类型与频数(率)分布1)连续型数据和离散型数据与某种标准做比较所得到的数据称为连续型数据(continuousdata),又称度量数据(measurementdata);例如,长度、时间、重量等。对连续型数据进行分析的方法,通常称为变量的方法(methodofvariable)。由记录不同类别个体的数目所得到的数据,称为离散型数据(discretedata),又称为计数数据(countdata);例如种子数、株数、人头等。对离散型数据进行分析的方法,通常称为属性的方法(methodofattribute)。\n2)频数(率)表frequencytable用频数分布或频率分布清楚地描述数据变化规律的表格。3)频数(率)图frequencygraph用频数分布或频率分布清楚地描述数据变化规律的图形。3种最常用的频数图为直方图、多边形图和累积频数图。第四节生物统计的常见术语\n第四节生物统计的常见术语6、中位数和众数medianandmode中位数:在累积频数图中1/2总频数位置上的数值。众数:离散型数据的众数是频数图中频数最高的组值;连续型数据的众数是频数图中频数最高的中值。\n第四节生物统计的常见术语7、中心矩、原点矩、偏斜度和峭度centralmonent,momentabouttheorigin,skewnessandkurtosis中心矩: 原点矩:偏斜度:度量数据围绕众数呈不对称的程度。计算公式:其中:m3为三阶中心矩;m2为二阶中心矩。峭度:度量曲线形状的量。计算公式:其中:m4为四阶中心矩。\n第四节生物统计的常见术语8、随机误差与系统误差1)随机误差randomerror也叫抽样误差(samplingerror),是由于许多无法控制的内在和外在的偶然因素所造成。统计学上的试验误差指随机误差。2)系统误差systematicerror也叫片面误差(lopsidederror)。是由试验对象的差异、仪器的灵敏度、药品的用量或种类不符合试验要求以及观测、记录、计算中的错误引起的。\n第五节生物统计学教学要求\n第五节生物统计学教学要求一、生物统计学的课程特点概念多、公式多、表格多、作业多、问题多。学生头痛的课程??老师糊涂的课程??学院怀疑的课程??对于我来说:教学压力很大而感兴趣的一门课程!\n第五节生物统计学教学要求二、基本要求1.掌握正确收集试验数据的方法以及数据资料的整理方法。2.掌握数据资料的基本统计分析方法。3.掌握显著性检验的基本原理与常用方法,能对不同的试验资料应用显著性检验方法进行统计分析与处理。4.掌握相关分析与回归分析的常用统计分析方法。5.掌握常用抽样调查技术和方法。6.具备一定的科学试验设计能力。\n第五节生物统计学教学要求三、学习方法1.弄懂基本原理和公式、理解公式的含义和应用条件,不必深究推导;2.认真做作业,加深对公式及统计步骤的了解;3.培养科学的统计思维方法。生物统计中新的思考方法——从不肯定性或概率的角度来思考问题和分析科学试验的结果;4.联系实际,结合专业,了解统计方法的实际应用;5.从实验设计方法及其原理的角度来贯穿整个生物统计学的学习过程。\n第五节生物统计学教学要求四、教学安排第一章绪论(2学时)第二章概率与概率分布(4学时)第三章常见概率分布(4学时)第四章 统计学的常用术语(4学时)第五章统计推断(4学时)第六章方差分析(单,多因素方差分析)(4学时)第七章 直线回归与相关(一元,多元线性)(4学时)第八章 实验设计(4学时)复习2学时\n国内有关经典著作1.《概率论基础及其应用》王梓坤著科学出版社1976年版2.《数理统计引论》陈希儒著科学出版社1981年版国外有关经典著作1.《概率论的分析理论》P.-S.拉普拉斯著1812年版2.《统计学数学方法》H.克拉默著1946年版概率论的最早著作数理统计最早著作概率统计专业首位中科院院士\n教材\n主要参考书\n主要网站http://bio-soft.net/生物软件网http://www.8sta.com中国统计网http://statdtedm.xilubbs.com/生物统计学论坛http://www.spssclub.comSPSS俱乐部http://club.excelhome.net/中文Excel应用论坛http://www.stata.com/links/stat_software.html统计软件http://home.okstate.edu/homepages.nsf/toc/onlinetutorialsstatistics统计学指南http://www.biooo.com/中国生物论坛\n考试平时:30%(作业,出勤,问题回答情况)考试:70%(笔试)书生有路勤为径,学海无涯苦作舟。Thankyouattention!查看更多