- 2022-08-13 发布 |
- 37.5 KB |
- 16页
![](https://data.61taotao.com/file-convert/2021/07/09/22/16/64c336e9ab0d06bc59b81dffbce31f58/img/1.jpg)
![](https://data.61taotao.com/file-convert/2021/07/09/22/16/64c336e9ab0d06bc59b81dffbce31f58/img/2.jpg)
![](https://data.61taotao.com/file-convert/2021/07/09/22/16/64c336e9ab0d06bc59b81dffbce31f58/img/3.jpg)
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
生物统计学总复习
实用文档生物统计学总复习(2011)生物统计学是指导我们如何利用生命活动中表现出的数量现象,由样本信息推断总体特征的方法论和技法,贯彻通篇的主线是“如何由样本推断总体”,一切概念的引出、一切方法的建立都是为了实现“由样本推断总体”,都是为了保证“由样本推断总体”的过程经济有效,都是为了保证“由样本推断总体”的结果真实可靠。全面理解“样本”、“总体”、“推断”三者的概念、应用、联系是掌握生物统计学的基础,是理解统计原理、统计方法的基础,是联系统计原理与统计方法的纽带。“实验单位”、“抽样”、“总体参数”、“大数定律”、“中心极限定理”、“总体分布”、“抽样分布”、“无效假设推断”、“点估计”、“区间估计”、“置信区间”、“局部控制”、“正交设计”等等,有些是为了描述、定义“由样本推断总体”的过程,有些是为了实现“由样本推断总体”而建立的方法,因此,在理解和掌握的过程中,只有与“由样本推断总体”紧密联系,才能真正理解和掌握。第一章、绪论一、基本概念:1、生物统计学:是应用数理统计的原理和方法来分析和解释生物界数量现象的科学。2、描述性统计:对原始资料进行整理并作基本分析。3、总体与样本:根据研究目的确定的、符合指定条件的全部观察对象称为总体。构成总体的每一个基本单元,称为该总体的个体。4、总体和个体(举例):把所研究的对象的全体称为总体,把总体中的每一个基本单位称为个体。(参考举例:如考察某一地区冬小麦越冬前的苗高,则该地区所有小麦即为总体,每一株小麦苗即为个体。)5、随机抽样与随机样本:所谓随机抽样是指抽样时,不搀杂人们的主观愿望,总体中每一个个体被抽取的机会均等。由随机抽样而得的样本,称随机样本。6、样本和随机样本:从总体中抽取一部分个体称为样本。生物统计学就是要用样本的信息对总体作出推断,为了保证样本信息能够真实、可靠地反映总体,在抽样时必须遵循样本抽取的随机性原则,即要求每一个样本值与总体有相同的概率分布,且不同样本值之间相互独立,称这样的样本为“简单随机样本”,简称随机样本。7、参数与统计量:从总体中计算所得的特征数值,如总体平均数、总体标准差称为参数;从样本中计算所得的特征数值称为统计量,它是总体参数的估计值。8、试验误差:由样本推断总体时,试验抽样中由非处理因素对观测指标产生的影响,可用误差平方和、误差军方来定量描述。试验误差的大小会影响对处理效应的判断,因此在由样本推断总体时,需要对试验误差进行控制,根据实验误差的来源和可控性又可分为系统误差和随机误差。9、系统误差或错误:系统误差是指在试验过程中,人为的作用所引起的差错,如试验人员粗心大意,使仪器矫正不准、药品配制比例不当、称量不准确等都是人为因素造成的,在试验中完全可以避免的。随机误差:由于无法控制的随机因素所引起的差异是不可避免的,称之为机误或随机误差。试验中随机误差只能设法减小,而不能完全消灭,增加抽样或试验次数,可以降低随机机误的数值。10、变异系数:衡量不同样本间,或不同性状样本间变异程度的变异量数,为样本标准差对样本平均数的百分比。CV=S/11、效应:效应是用于描述因子对观测指标的影响而建立的概念,其大小可用平方和或方差定量描述。即引起试验差异的作用称为效应,如不同饲料使动物的体重增加表现出差异,不同品种的玉米产量不同等。)12、互作:文案大全\n实用文档是指两个或两个以上的因子同时存在时互相影响,不能各自独立地对观测指标产生影响,也称连应,是指两个或两个以上处理因素间的相互作用产生的效应。如氮、磷肥并施会对作物产量产生互作效应,如果氮、磷共施的产量效应大于氮、磷单施效应之和,说明氮、磷互作为正效应,如果氮、磷共施的产量效应小于氮、磷单施效应之和,说明氮、磷互作为负效应。)二、基本问题1、生物统计学的研究内容包括统计哪些?(统计原理、统计方法和试验设计。)2、生物统计学核心内容是什么?(如何从样本推断总体)3、生物统计学所研究的对象构成的总体有什么基本特征?(是有变异的总体,既是在同质的对象中往往也存在差异。)4、生物统计与试验设计的关系是什么?(是不可分割的统一整体,试验设计需要以统计的原理和方法为基础,而正确设计的试验又为统计方法提供可靠的信息。)5、统计方法的主要内容可分为哪三个主要方面?(描述性统计、显著性检验、相关与回归)6、生物统计学基本功用包括哪些?(科学地整理分析数据、判断试验结果的可靠性、确定事物之间的相互关系、提供试验设计的原则,为学习相关学科提供基础。)7、生物统计学的研究内容包括哪些?(统计原理、统计方法和试验设计。统计原理阐述统计理论和有关公式,以满足统计方法的需要。统计方法的应用,旨在对客观事物得出本质的和规律性的认识。试验设计是试验工作前应用统计原理,制定科学的试验方案和方法。)8、由样本的统计数来推断总体的参数时,要求统计数既有“准确性”,又有“精确性”。解释“准确性”和“精确性”的概念和二者的区别。(统计工作是用样本的统计数来推断总体的参数,我们用统计数接近参数真值的程度,来衡量统计数“准确性”高低。用样本中各个变数间变异程度的大小,来衡量该样本“精确性”的高低。因此,准确性就不等于精确性,准确性是说明测定值对真值的符合程度大小,而精确性却是多次测定值的变异程度。)9、举例说明效应与互作的概念。(效应是用于描述因子对观测指标的影响力而建立的概念,其大小可用平方和或方差定量描述。引起试验差异的作用称为效应,如不同饲料使动物的体重增加表现出差异,不同品种的玉米产量不同等。互作是指两个或两个以上的因子同时存在时互相影响,不能各自独立地对观测指标产生影响,也称连应,是指两个或两个以上处理因素间的相互作用产生的效应。如氮、磷肥并施会对作物产量产生互作效应,如果氮、磷共施的产量效应大于氮、磷单施效应之和,说明氮、磷互作为正效应,如果氮、磷共施的产量效应小于氮、磷单施效应之和,说明氮、磷互作为负效应。)第二章、绪论一、基本概念:1、数量性状资料:数量化的生物性状资料,简称数性资料,一般包括计量资料和计数资料两类。2、计量资料:能够用度量衡等计量工具直接测定的数性资料,在一定取值范围内,可能取任何整数或小数值,也称连续性变数资料。3、计数资料:是指用计数方式而得来的数性资料。在这类资料中,每一个变数必须以整数来表示,两整数间的数值是不连续的,因此不具有小数,也称间断性变数资料(答离散性变数资料或非连续性变数资料均可)。4、质量性状资料:是指一些能观察到而不易直接测量的性状,如颜色、性别、生死、状态等,简称质性资料。对于质量性状的分析,必须先将质量性状数量化。5、连续型变数资料:即计量资料,是指能够用度量衡等计量工具直接测定的数性资料,在一定取值范围内,可能取任何整数或小数值。6、离散型变数资料:是指计数资料和质量性状资料,即用计数方式而得来的数性资料,或数量化的质量性状资料。在这类资料中,每一个变数必须以整数来表示,两整数间的数值是不连续的,因此不具有小数,也称间断性变数资料或非连续性变数资料。7、资料的整理分析:就是要把大量复杂的数据进行整理归类,使其系统化,便于统计分析,从而得出正确的科学结论。8、依次表:原始数据按数值的大小依次排列起来,由小到大以表格形式表示,称为依次表。文案大全\n实用文档9、频次分布表:将大样本的原始数据进行分组归类,用表格表示出来称为频次分布表。10、基本集中量数:衡量样本或总体取值集中性的统计量。包括平均数、中位数、众数等,最重要的是平均数。11、平均数:是最重要的基本集中量数,是衡量样本或总体取值集中性的统计量。12、变异量数:衡量样本或总体内个体间变异程度的统计量。有极差、平局差、平方和、变异系数、方差和标准差,最重要的是方差和标准差。13、平方和:将样本(或总体)中每一个个体的取值与样本(或总体)平均数之差的平方求和,称之为离均差平方和,简称平方和。14、方差:是一种变异量数,对样本为,对于总体为15、标准差:是一种变异量数,对样本为,对于总体为16、变异系数:衡量不同样本间,或不同性状样本间变异程度的变异量数,为样本标准差对样本平均数的百分比。CV=S/二、问题:1、为什么要进行资料的分类?资料的分类是统计归纳的基础,若不进行分类,大量的原始资料就不能系统化、规格化,只有根据科学原理来分类,才能使资料正确地反映出事务的本质和规律。2、原始数据在整理之前,首先要对全部数据进行检查和核对,最常见的数据差错原因有那些?3、简述数据整理的方法答:首先是按照一定的标志,把记载的数据分门别类的分成若干部分,把同一现象、同一类型的数据进行合并,使它们与其他现象、其他类型区别开来。另外,在数据整理时,要注意数据的完整性、真实性和准确性。对个别极大和极小的数值要反复核实,力求确实可靠。原始数据的整理,其结果需要用数字来表明,可将整理的数据制成依次表。4、数据整理的作用可以按不同的标志把数据的特征反映出来,以便于进一步运用各种统计方法进行计算,来研究它们的规律性和相互关系。5、分组频次分布表和分组频次分布图:原始数据经整理,在依次表的基础上,根据数据的多少进行分组归类,统计各组变数的频数,制成较有规律的分组频次分布表,并根据分组频次分布表作出分组频次分布图。频数分布表和分组频数分布图可直观地反映变数的取值规律,同时便于进一步的统计分析。6、间断性变数资料的整理与分组间断性变数资料的整理与分组通常采用单项式分组法,特点是用样本变数的自然值进行分组,将数据中每个变数分别归入相应的组内,然后制成频次分布表。由整理所得的频次分布表,可以了解数据的集中和变异情况,便于进一步计算与分析。7、连续性变数资料的整理与分组连续性变数资料的整理与分组是采用组距式分组法,在分组前需要确定全距、组数、组距、组中值和组限,然后将每个变数分别归入相应的组内,然后制成频次分布表。由整理所得的频次分布表,可以了解数据的集中和变异情况,便于进一步计算与分析。8、依次表和频次分布表在什么时候使用?二者有什么区别?在原始数据的整理分析时,通常使用依次表和频次分布表来表示对原始数据整理的结果,样本较小时用依次表表示,样本较大时使用频次分布表表示。从依次表和频次分布表中可以初步看出样本取值的规律。文案大全\n实用文档第三章、概率、随机变量及其分布一、基本概念:1、随机抽样:在“由样本推断总体”中,获得有效样本的方法,即使得总体中每一个个体都有均等的被抽到可能。2、随机试验:用来描述随机抽样、及生物属性数量化的过程,即观察者(研究者)采取一定的手段和方法,有目的地观察、记录随机现象的过程。3、随机现象:用来描述随机抽样的结果,站在观察者(研究者)的角度,我们把有着多种变异结果的生命现象,叫做随机现象。即在一定的条件下具有多种可能结果而究竟出现哪一种结果是事先不可预言的现象叫做随机现象。4、随机事件:用来描述一次随机抽样的结果,随机现象的每一个结果叫做一个随机事件,简称为事件。对于同一随机现象进行研究,讨论的范围不同,考虑问题的角度不同,就会产生不同的结果,因而得到不同的随机事件。5、随机变量:用来描述随机抽样的所有可能结果(随机事件),通常用一个变量X表示随机现象的所用可能结果,X取不同的数值就表示不同的事件发生,但X究竟取什么值预先是不知道的,它取任一值都有确定的概率,其所有可能取值的概率之和为1,将这样的变量定义为随机变量。或答:设随机试验的样本空间是Ω=|ω|,如果对于每一个ω∈Ω有一个实数X(ω)和它对应,这样就得到一个定义在Ω上的实值单值函数X(ω),我们称之为随机变量。6、离散型随机变量:如果随机变量的取值是有限个或可数个,则称为离散型的随机变量。或答:描述离散性(间断性)变数资料的随机变量。7、连续型的随机变量:如果随机变量的取值是无数个或不可数,不能按照一定的顺序一一列举出来,则称为非离散型的随机变量。非离散型的随机变量牵涉的范围很广,其中最重要的也是实际工作中经常遇到的是连续型的随机变量。即描述连续性变数资料的随机变量。8、事件的概率:用来刻画随机事件发生可能性大小的数量指标,简称概率。事件的概率是客观存在的,是不依人的主观意志为转移的,事件A的概率用P〔A〕表示,并且规定0≤P〔A〕≤1。9、概率分布:用来描述针对随机现象的随机试验中全部可能的结果(事件)的概率,即用来描述随机变量取值的概率的数学模型,由于它实质上是将100%的可能性在各随机事件上进行分配,因此也称概率分配。或答:将随机变量的一切可能取值以及取得这些值的概率全部表示出来,称为随机变量的概率分布,简称概率分布。概率分布可以用函数式表示,也可以用表格或图来表示。10、概率函数:离散型随机变量概率分布的函数表示,要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。如果我们将离散型随机变量x的一切可能取值xi(i=1,2,…),及其对应的概率pi,记作f(x)=P(X=xi)=pii=1,2,…,则称上式为离散型随机变量x的概率分布,即概率函数。11、概率密度函数:描述连续型随机变量在某个区间取值的概率的密度函数。连续型随机变量(如体长、体重、蛋重)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。我们改用随机变量x在某个区间内取值的概率P(a≤xμ0,在样本平均数的抽样分布中,否定区(域)位只能有一个,相应的检验也只能考虑一侧的概率,这种具有左尾和右尾一个否定区(域)的检验叫单位检验。3、简要说明单样本频率的假设检验的定义,举出一个实例(不作检验)。答:利用一个来自二点总体的样本频率与某一理论频率的差异对二点总体的基本概率做出推断。或答:检验一个样本百分数与已知的二项总体百分数差异是否显著的检验方法。举例:有一批蔬菜种子的平均发芽率p0=0.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,试验种衣剂对种子发芽率有无效。文案大全\n实用文档(或其它例子)4、要检验两个来自二点总体的样本频率p1的p2差异,应采用什么方法,举出一个实例(不作检验)。答:应采用两个样本频率的假设t检验进行检验。举例:某养猪场第一年养猪225头,死亡23头;第二年养猪368头,死亡28头。试检验这两年猪的死亡率是否有显著差异?(或其它例子)三、填空题:1、对平均数作检验时:⑴总体σ2未知,或小样本时,样本呈t分布,检验单个样本与总体的差异或两个样本间的差异,作t检验。⑵总体σ2已知,或大样本时,样本呈正态分布,检验单个样本与总体的差异,或检验两个大样本间平均数的差异,作U检验。2、当样本容量n<30,且总体方差σ2未知时,就无法使用U检验法对样本平均数进行假设检验,这时,要检验样本与指定总体的平均数或两样本平均数间的差异显著性,就必须使用t检验法。第六章、x2检验一、基本概念:拟合优度、拟合优度检验、理论频数、独立性检验1、拟合优度:指观察到的样本表现与某种理论模型吻合的程度。2、拟合优度检验:对观察的样本表现与所选某种理论模型的拟合程度作推断判决。或答:对观察到的样本各结果的实测频数与按某种理论分布进行分配的理论频数的拟合程度作出判断,以推断样本所在总体的概率分布是否与某种理论分布相吻合。3、理论频数:样本假如按照按某种理论分布进行分配时的频数。4、独立性检验:利用两种随机现象同时发生时的样本表现,检验两种随机现象是否相互独立。或答:考察两种分类(分组)方法是否相互独立的检验。第七章、方差分析一、基本概念:处理效应、试验指标、试验因素、因素水平、试验处理、试验单位、重复、固定因素、随机因素、固定模型、随机模型、混合模型、主效应、交互作用、多重比较、方差分析1、处理效应:在一个多处理试验中,因为因素处理的不同而引起的各组观测值的不同,称为处理效应或条件变异。2、试验指标(experimentalindex):为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。3、试验因素(experimentalfactor):试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。4、因素水平(leveloffactor):试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。5、试验处理(treatment):事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料。6、试验单位(experimentalunit):在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。文案大全\n实用文档7、重复(repetition):在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。8、固定因素:是指因素的水平可以严格地人为控制,水平固定后它的效应值也是固定的,试验重复时可以得到相同的结果,对单个或多个固定因素作用的方差分析应采用固定模型。9、随机因素:是指因素的水平是从总体全部水平中随机抽取的样本,水平不能严格人为控制,在水平确定之后其效应值并不固定,重复试验时也很难得出相同的结果,这类试验通过样本对所属总体作出推断时应采用随机模型。10、固定模型:方差分析数学模型之一,是指各个处理的效应值是固定的,各个处理的平均效应是一个常量,且各个处理的效应值之和为零。得出的结论只适合固定因素的这几个处理水平上。11、随机模型:方差分析数学模型之一,是指各个处理的效应值不是固定的数值,而是由随机因素所引起的效应。各个处理的效应值是一个随机变量,是从期望均值为0,方差为σ2的正态总体中得到的随机变量。得出的结论可以推广到随机因素的所有处理水平上。12、混合模型:在多因素试验中,若既有固定因素,又有随机因素存在时,方差分析所采用的模型称为混合模型。13、主效应:方差分析中,各试验因素的相对独立作用称为该因素的主效应。14、交互作用:方差分析中,某一因素在另一因素的不同水平上所产生的效应不同,称两因素间存在交互作用。15、多重比较:要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其它的处理进行比较,这种差异显著性的检验就叫多重比较。16、方差分析:是检验单因素或多因素多水平(处理)效应值间平均数差异,以及各因素间的交互作用的统计方法。它是对因素总体处理效应的显著性检验,在总体效应差异显著的前提下,因素内水平间一对一的比较应采用多重比较。二、问题1、方差分析的基本思想答:是将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。通过方差比较以确定两种原因在总变异中所占的重要程度,如果处理效应和试验误差相差不大,说明试验处理对指标影响不大,如果二者相差较大,处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。2、方差分析的步骤答:⑴先作零假设和备择假设,设定显著性水平.⑵根据实验设计,确定(各)因素是固定因素还是随机因素,以选取事宜所数学模型.⑶将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度.⑷列方差分析表进行F检验,以弄清各变异因素在总变异中的重要程度⑸依据设定的显著性水平,接受零假设或备择假设⑹对作用显著的因素各处理平均数进行多重比较⑺根据因素类型和显著性检验结果,作出正确的结论.固定因素的结论只限于所设计的那几个水平,随机因素的结论适用于实验水平来源的总体所有水平。3、我们学过的多重比较方法有几种?在显著性尺度和适用性上有什么差别?答:我们学过的三种多重比较方法中,在样本数M=2时,LSD法、SSR法和q检验法的显著性尺度是相同的。当M≥3时,三种方法的显著性尺度便不相同,LSD法最低,SSR法次之,q检验法最高。因此,在实际应用中,对于差异性要求较高的试验应该使用q检验法,一般试验可用SSR检验法,试验中各个处理平均数皆与对照比较的可用LSD检验法4、方差分析中,F检验对于多重比较有什么意义?文案大全\n实用文档答:方差分析中,F检验用于判断引起各平均数之间的差异主要是实验误差效应还是处理效应,只有确定通过F检验判断引起各平均数之间的差异主要是处理效应时,基于试验目的,各平均数的多重比较才有意义,才能真实地反映处理效应造成的总体之间的差异。三、填空题:1、方差分析是对各因素总体处理效应的显著性检验,各因素内水平间一对一的比较方法是多重比较。2、在总体处理效应差异显著的前提下,需要进行多重比较的分析。3、最小显著差数法的实质是两个平均数相比较的t检验法。第八章、直线回归与相关一、基本概念:1、回归系数:回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。2、相关系数:是指由于回归因素所引起的变异与总变异之比的平方根。3、决定系数:是相关系数的平方值。定义为由x不同引起的y变数平方和占y变数总平方和的比率。二、问题:1、什么是回归分析与相关分析?答:生物科学研究中,常常需要同时研究两个或两个以上变数之间的协同变异关系,必须把这些变数放在一起进行研究,目的是寻找它们之间所存在的变异规律性。当一个变量的变化受另一个或几个变量的影响,存在着明显的因果关系时,如仔猪的生长速度受遗传特性、营养水平、饲养管理条件等因素的影响,子代的体高受亲本体高的影响,对这样的协同变异关系的定量描述和分析,着重于建立函数式,即建立由自变量x来预测依变量y的回归方程,以确定当给自变数为某一值时依变数所期望的变化量,实现由自变量预测依变量,并对回归方程的有效性进行检验,我们将这样的统计分析称之为回归分析。当两个或几个变量协同变异的变量之间分不清明显的因果关系时,称之为平行关系,对呈平行关系的协同变异关系的定量描述和分析,着重于变量间联系的密切程度,或相互影响的程度,通常用相关系数和决定系数来定量描述,并对相关系数和决定系数进行有效性检验,我们将这样的统计分析称之为相关分析。2、什么是回归模型及回归分析?答:回归模型是指在研究的两个变数中,其中一个变数x是自变数,它是固定的,是试验时预先确定的,没有误差或误差很小,而另一个变数y则是因变数,它不仅随着x的变化而变化,而且有随机误差。回归模型除有自变数和依变数的区别外,尚具有预测的特征,即具有由x的数量变化预测y的数量变化的作用。在统计分析上就是要建立由x来预测y的回归方程,并确定当给自变数为某一值时依变数将会在什么范围内变化。对回归模型资料的这种分析就称为回归分析。3、什么是相关模型及相关分析?答:相关模型是指在研究的两个变数是平行变化关系,皆具有随机误差,分不清谁是自变数,谁是依变数。所以相关模型的特征是仅表示两个变数的协同变异,不具有预测性质。对相关模型资料的分析叫相关分析,这一分析是要测定两个变数在数量关系上的密切程度和性质。4、相关系数与决定系数有什么区别?答:相关系数r既可表示变数间的相关程度,也可表示变数间的相关性质;而决定系数只能表示变数间的相关程度,而不能表示变数间的相关性质。应用决定系数,可以避免对相关系数所表示的相关程度作过分夸张的解释。5、回归系数的显著性检验对回归方程、相关系数、决定系数有什么意义?文案大全\n实用文档答:回归方程、相关系数、决定系数均是有样本信息构造的关于总体参数的估计量,因为试验误差的存在,难以毫无偏差地反映变量之间的是否存在协同变异关系,回归系数的显著性检验可以判断由样本信息构造的反映协同变异的定量指标回归系数、相关系数和决定系数反映的主要是试验误差效应,还是真正的协同变异关系。因回归系数的检验与相关系数的检验有等效性,故回归系数的显著性检验可以反映回归方程、相关系数、决定系数是否有意义。三、填空题:1、直线回归关系中,x是没有误差的固定变数,至少和y比较起来x的误差是小到可以忽略的;而y则是随机变数。2、直线回归关系中,任一x上都有一个y总体,它是呈正态分布的。3、回归分析的目的是要建立由自变数变化来预测依变数变化的回归方程。回归分析的内容一般包括回归方程的确定和回归关系的显著性检验。4、相关分析的目的是要了解变数间变异的密切程度和性质。5、一元相关分析的内容包括相关系数的计算和相关关系的显著性检验。第九章、非参数检验一、基本概念:1、非参数检验:又称为任意分布检验(distribution-freetest),它不考虑研究对象总体分布具体形式,也不对总体参数进行统计推断,如平均数、标准差等。而是利用样本数据之间的大小比较及大小顺序,对样本及其所属总体作差别检验,即检验样本所代表的总体分布形式是否一致。二、问题:1、什么是参数检验和非参数检验答:非参数检验(Nonparametrictests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。2、非参数检验的优缺点有哪些?非参数检验的优点:①适用范围广,不论样本来自的总体分布形式如何,都可适用;②某些非参数检验方法计算简便,研究者在急需获得初步统计结果时可采用;③易于理解和掌握;④可用于不便精确测量的资料或等级资料。非参数检验的缺点:①对符合用参数检验的资料,如用非参数检验,会丢失信息,导致检验效率下降,犯第Ⅱ类错误的可能性比参数检验大。②虽然许多非参数检验计算简便,但有些问题的计算仍显繁冗。2、我们学过的非参数检验有哪些?相对于参数检验,非参数检验有哪些特点?答:我们学过的非参数检验有符号检验、游程检验、秩和检验和秩相关检验。相对于参数检验,非参数检验的特点有:⑴不是针对总体参数进行的;⑵不必考虑总体分布类型;⑶在使用样本信息上仅依靠观察值的相对大小或大小次序即可进行,因而方法简便易行;⑷缺点是,最后加工出来的信息结论稍粗糙。3、由两个小样本观测资料推断两个样本所在总体的总体水平是否有差异时,除了t检验法外,还可以使用何种检验方法进行统计推断。它们相对于t检验法有哪些特点?文案大全\n实用文档答:还可以使用符号检验、游程检验和秩和检验等非参数检验法。相对于t检验法,这些非参数检验法的特点有:⑴不是针对总体参数进行的;⑵不必考虑总体分布类型;⑶在使用样本信息上仅依靠观察值的相对大小或大小次序即可进行,因而方法简便易行;⑷缺点是,最后加工出来的信息结论稍粗糙。第十章、试验设计一、基本概念:1、重复(举例):重复就是将一个基本试验重复做一次或几次。例如,测定不同年龄组正常人的血红蛋白含量的试验,在每一年龄组内测定一人,即为一个基本试验。若将这个基本试验重做5次,即每一年龄组,抽取5人测定,则称该试验有5次重复。2、随机化:随机化是指试验材料的配置和处理的顺序都是随机确定的。用随机排列与重复结合,试验就能提供无偏的试验误差估计值。3、局部控制:局部控制就是分区域分时间地控制非试验因素,使对试验处理的影响除试验因素不一致外,其余条件尽量一致,其作用也是为了降低试验误差。4、完全随机设计(Completerandomization):又称成组设计,采用完全随机化的方法将同质的受试对象分配到各处理组,然后观察、比较各组的实验效应。是用随机化的方式来控制误差变异,试验单位的差异在因为随机化在各组均数之间达到最小。缺点是试验误差极易受到极大值或极小值的影响,只有试验单位的初始条件容易控制时,实验结果才会精确。5、随机区组设计(Randomizedblockdesign)(Blockrandomization):亦称完全随机区组设计(randomcompleteblockdsign)。这种设计的特点是根据“局部控制”的原则,分离出由无关变量引起的变异,其要点是要做到区组内尽量同质,区组内各处理都独立的随机排列,区组间的差异作为独立因素进行分析,使得实验结果的差异更好地反映不同处理的影响。6、拉丁方设计(Latinsquaredesign)是利用拉丁方巧妙安排三个无交互作用因素的试验设计方法,在更多的情况下是用来实现局部控制的试验设计方法,使研究人员得以在统计上控制两个不相互作用的外部变量(非处理因子)并且操纵自变量(处理因子)。每个外部变量(非处理因子)或分区变量(非处理因子)被划分为一个相等数目的区组或水平,自变量(处理因子)也同样被分为相同数目的水平。7、正交试验设计(Orthogonalexperimentaldesign):是研究多因素多水平的一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,代表性点的数量因因素的数量和水平的数量不同而不同,但是确定的,并被制成固定的正交表形式,这些有代表性的点具备了“均匀分散,齐整可比”的特点,即在考察某一因素,如A因素各水平的差异时,A因素各水平对应观测值的均数受到其他因素的影响是均等的,因而能够反映A因素不同水平间的差异。正交试验设计的关键在与试验因素的安排,通常,在不考虑交互作用的情况下,可以自由的将各个因素安排在正交表的各列,只要不在同一列安排两个因素即可(否则会出现混杂)。但是当要考虑交互作用时,就会受到一定的限制,如果任意安排,将会导致交互效应与其它效应混杂的情况。因素所在列是随意的,但是一旦安排完成,试验方案即确定,之后的试验以及后续分析将根据这以安排进行,不能再改变。在完成试验收集完数据后,将要进行的是方差分析,只有F检验显著时,表明引起某一因素不同水平之间样本均数差异的主要原因是处理效应时,样本均数的多重比较才有意义。二、问题:文案大全\n实用文档1、设置重复有什么作用(主要作用)?答:最主要的作用是估计试验误差,试验误差是客观存在的,但只能由n个同一基本试验处理间的差异来进行估计,若没有重复,每一基本试验处理就只有一个数值,则无从求得差异,也就无法估计误差。设置重复的另一个主要作用是降低试验误差,因而也可以提高试验的效度。从可知,重复多,则误差小,若有四次重复的试验,其误差将只有一个重复的同类试验的一半。2、一般来说,生物科学的试验过程可归纳为的DECA四个阶段是指什么?答:D是设计;E是试验;C是检查;A是分析。3、试验设计四个阶段中“设计”阶段的要点是什么?答:明确试验的目的性,研究设计的周密性,回答五个W和一个H:why,为何干?(必要性);what,干什么?(目的);where,何处干?(期限);who,谁来干?(方法)。4、试验设计四个阶段中“设计”阶段的步骤与要求是什么?答:明确目的,把目的深刻化、典型化、具体化。进行设计,确定合理的方案,使因素的影响尽量不被其他变量掩盖,使试验便于统计分析与估计误差。5、试验设计四个阶段中“试验”阶段的要点是什么?答:注意条件的一致性,确保操作的正确性,注意个M:Man,人,操作者;Material,材料;Method,方法;Management,管理。6、试验设计四个阶段中“试验”阶段的步骤与要求是什么?答:进行试验,避免差错,尽量使试验不受偏差影响。三、填空题:1、用随机排列与重复结合,试验就能提供无偏的试验误差估计值2、随机排列的方法可用抽签法或利用随机数字表等方法确定。3、采用重复、随机化和局部控制三个基本原则而作出的试验设计,配合适当的统计分析,就既能准确地估计试验处理效应,又能获得无偏的、最小的试验误差估计,对于所要进行的各试验处理间的比较才能作出可靠的结论。4、一般来说,生物科学的试验过程可归纳为的DECA四个阶段是指、、和答:D是设计;E是试验;C是检查;A是分析。5、一个试验要想获得事半功倍的最佳试验结果,必须有一个较为优秀的试验设计,一个优秀的试验设计必须遵循重复、随机化和局部控制这三大原则,从而才能最大限度地降低试验误差和真正做到无偏地估计试验误差,最终达到提高试验效度的目的。6、试验的最基本功能是比较出各试验处理间有无显著差异。7、从试验处理的多少可以将试验设计成两种和两种以上处理的比较试验两大类。8、两种处理的试验设计有成组设计和成对设计两种,它们最常用的统计分析方法是成组t检验和成对t检验。9、多个处理的试验设计虽复杂,但其基本原理都一样,从试验控制(局部控制)的角度看,有完全随机化试验和随机区组试验两大类,它们实际上也是成组设计和成对设计的发展。文案大全查看更多