高等生物统计学 课件

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

高等生物统计学 课件

试验设计及其数据分析西北农林科技大学理学院徐钊编制\n第3章试验设计与分析(ExperimentalDesignandAnalysis)3.1试验设计的基本术语与原则3.2单因素试验设计与分析3.3两因素试验设计与分析3.4多因素试验设计与分析3.5回归设计与分析3.5回归设计与分析\n常用术语与试验设计的基本原则试验因素1.一些常用术语:指试验中人为控制的,影响试验指标的原因。例如,在研究小麦高产栽培技术时,品种、密度、施N量等都对产量有影响,均可作试验因素当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响,则称为两因素试验或多因素试验。试验因素常用大写字母A、B、C…等表示\n因素水平试验处理就是指实施在试验单位上的具体的项目。在单因素试验中,实施在试验单位上的具体项目就是该因素的某一水平。例如在进行小麦品种的比较试验时,实施在试验单位上的具体项目就是种植某一品种小麦。所以,单因素试验时,试验因素的一个水平就是一个处理。试验处理试验因素的不同水平称为因素水平。例如比较5个小麦品种产量的高低,这5个小麦品种就是品种这个试验因素的5个水平,可记为A1,A2,A3,A4,A5\n所以,在多因素试验时,试验因素的一个水平组合就是一个处理。亦称试验单元,是指施加试验处理的材料单位。田间试验时,试验单位通常指一个试验小区。试验单位在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3个小麦品种和4种播种密度的两因素试验,整个试验有3×4=12个水平组合,实施在试验单位上的具体项目就是某小麦品种与某播种密度的结合。干扰因素影响试验单位均匀一致性的对试验结果造成系统误差的因素。干扰因素不是研究的主要因素,但对试验的精确性有很大的影响。\n2.试验设计的基本原则试验设计的三个基本原则:重复(Replication)随机排列(Randomization)局部控制(LocalControl)采用这三个基本原则进行设计,配合适当的分析,就能从试验结果中提取可靠的结论。例如:在进行不同品种小麦的产量比较试验时,如果各试验小区的肥力相差很大,则试验单位的一致性变得很差,造成试验误差的增大,从而会掩盖品种这个试验因素的效应。因此,土壤肥力是试验的一个干扰因素。\n重复重复是指试验中将同一试验处理设置在两个或两个以上的试验单位上。同一试验处理所设置的试验单位数称为重复数。重复的作用主要有:(a)估计试验误差。如果同一处理只设置在一个试验单位上,那么只能得到一个观测值,则无从看出变异,因而也无法估计试验误差的大小。(b)降低试验误差,提高试验的精确性。即样本平均数抽样误差的大小与重复次数的平方根成反比。适当增大重复次数可以降低试验误差。\n随机排列随机排列是指试验的每一个处理都有同等机会设置在一个重复中的任何一个试验小区上。随机化的目的是为了获得对总体参数的无偏估计。随机排列的实现可以通过抽签法、利用随机数字表法。局部控制当试验单位之间差异较大时,即存在某种系统干扰因素时,可以将全部试验单位按干扰因素的不同水平分成若干个小组,在小组内部使非实验处理因素尽可能一致,实现试验条件的局部一致性,这就是局部控制。局部控制通常通过设置区组来实现,相应的试验设计方法以随机区组设计为代表。局部控制的作用使干扰因素造成的误差从试验误差中分离出来,从而降低试验误差。\n三个基本原则的关系和作用重复随机局部控制无偏的试验误差估计降低试验误差\n单因素试验设计方法与分析1.单因素试验设计方法(一)完全随机设计设计方法完全随机设计是将各处理完全随机地分配给不同的试验单位(如试验小区),每一处理的重复次数可以相等也可以不等。这种设计使得每一个试验单位都有同等机会接受任何一种处理。设计特点完全随机设计适用于试验单位比较均匀一致时。所以完全随机设计常用于土壤肥力均匀一致的田间试验和在实验室、温室中进行的试验。\n例如:欲研究某种生长调节剂对水稻株高的影响,进行6个处理的盆栽试验,每个处理4盆(重复4次),共24盆。设计时先将每盆水稻随机编号:1,2,3,…,24,然后用抽签法从所有编号中随机抽取4个编号作为实施第一处理的4盆,再从余下的20个编号中随机抽取4个作为实施第二处理的4盆,如此进行下去。于是可得各处理实施的盆号如下:第一处理:13,2,7,22第二处理:5,18,24,12第三处理:17,20,11,1第四处理:10,3,15,19第五处理:4,16,9,14第六处理:21,23,6,8\n品种号A1A2A3A4产量(kg/20m2)12814161010161814121320161416161212101418161516合计827284100平均13.67121416.67例1.有一小麦新品系完全随机试验,结果见下表。试检验不同小麦品系平均产量差异是否显著,若差异显著则需做多重比较。\n\n\n2).列出方差分析表,进行F检验变异来源平方和SS自由度均方F统计量品种间67.1667322.3889F=3.4269误差130.6666206.5333总和197.833323\n3).多重比较,采用Duncan法(1)首先将各处理平均数进行排序编号处理A4A3A1A2平均数16.671413.6712序号1234列出多重比较表为:序号43214.67**32.67220.3331.67\n(2)计算临界值,列成表格fepSSR0.05(p,fe)临界值LSR0.05SSR0.01(k,df)临界值LSR0.012022.953.07834.024.194933.103.23494.224.403643.183.31834.334.5184\n结论:小麦品系4的产量极显著高于品系2;其它的两两比较均不显著序号43214.67**32.67220.3331.67\n(二)单因素随机区组设计适用范围:单因素试验时,有一个明显的干扰因素,使得试验单位不一致试验地肥瘦肥力梯度例如:5个不同小麦品种的产量比较试验,试验地按某方向存在明显肥力梯度(见下图),则试验小区间存在肥力差异。设计方法:先将整个试验地按干扰因素(肥力水平)分成若干个区组,每个区组内土壤肥力等环境条件相对均匀一致,而不同区组间相对差异较大;然后在每个区组中随机安排全部处理。\n肥瘦肥力梯度5个不同小麦品种产量试验的随机区组设计图为:区组III24513区组I32145区组II51342设计特点它在完全随机设计的基础上增加了局部控制的原则,从而将试验环境均匀性的控制范围从整个试验地缩小到一个区组,区组间的差异可以通过统计分析方法使其与试验误差分离,所以随机区组设计的试验精确度较高。数据分析采用把区组看成一个因素应用两因素方差分析法进行\n(三)拉丁方设计适用范围:单因素试验时,有两个明显的干扰因素,使得试验单位不一致试验地肥瘦肥力梯度例如:5个不同小麦品种的产量比较试验,试验地按某方向存在明显肥力梯度,按另一个方向存在明显的水分梯度(见下图),肥力和水分两个干扰因素使得试验小区间存在肥力差异。水分梯度\n设计方法:拉丁方设计从横行和直列两个方向对试验环境条件(干扰因素)进行局部控制,使每个横行和直列都成为一个区组;然后在每个区组内随机安排全部处理。肥力区组在拉丁方设计中,同一处理在每一横行区组和每一直列区组出现且只出现一次,所以拉丁方设计的处理数、重复数、横行区组数、直列区组数均相同。例如,5个不同小麦品种产量试验,采用拉丁方设计以控制肥力和水分两个干扰因素,其设计图为:12345ACBDEIBEACDIICADEBIIIDBEACVIEDCBAV水分区组\n设计特点由于每一横行和每一直列都形成一个区组,因此拉丁方设计具有双向的局部控制功能,可以从两个方向消除试验环境条件的影响,具有较高的精确性。数据分析方法\n例2设小麦四品种产量的拉方丁对比试验结果如下表,试分析产量是否有显著差异。\n\n两因素试验设计方法与分析(一)交叉分组试验设计设计方法设试验考察A、B两个试验因素,A因素有a个水平,B因素有b个水平。所谓的交叉分组就是指A因素每个水平与B因素每个水平都要碰到,两者交叉搭配形成ab个水平组合即处理。试验因素A、B在试验中处于平等地位。交叉分组设计就是将试验单位完全随机分成ab个组;然后每组的试验单位随机接受一种处理。交叉分组设计与单因素完全随机设计相似,它是两因素的完全随机设计。区别是以前处理是单因素的某个水平,现在处理是两因素水平的某个组合。设计特点适用于试验单位比较均匀一致时,即不存在明显的干扰因素。数据分析可利用完全随机双因素方差法实现。\n(二)两因素随机区组设计适用范围:有两个地位平等的试验因素;有一个明显的干扰因素,使得试验单位不均匀一致试验地肥瘦肥力梯度例如:玉米品种(A)和施肥(B)的两因素试验,试验地按某方向存在明显肥力梯度(见下图),则试验小区间存在肥力差异。设计方法:与单因素随机区组设计类似,不同之处是在单因素时处理是单因素的每个水平,在两因素时处理是两因素各水平之间的交叉组合。\n肥瘦肥力梯度例如:玉米品种(A)与施肥(B)两因素试验,A因素有A1,A2,A3,A4这四个水平,B因素有B1和B2两个水平,共有8个水平组合即处理,随机区组设计,设置3个区组。设计示意图为:区组IA3B2A1B2A2B1A4B1A2B2A1B1A3B1A4B2区组IIA2B2A1B1A4B1A4B2A3B2A2B1A4B2A3B1区组IIIA4B1A3B2A2B1A3B1A1B1A1B2A2B2A4B2它在交叉分组设计的基础上增加了局部控制的原则,从而将试验环境均匀性的控制范围从整个试验地缩小到一个区组,区组间的差异可以通过统计分析方法使其与试验误差分离,所以比交叉分组设计的试验精确度来得高。设计特点\n(三)裂区设计适用范围:有两个地位不平等的试验因素A和B:A因素是次要因素,精确度要求较低;B因素是主要因素,精确度要求较高。试验有一个明显的干扰因素,使得试验单位不均匀一致设计方法:裂区设计与两因素随机区组设计近似。不同点是后者在每一个区组内A,B两因素的a×b次处理是完全随机化的,只经过一次随机化过程。而裂区设计的每一区组内A因素先分为a个处理,在A的每一个处理内B因素再分为b个处理。也就是说随机化过程分两步进行,分别在A因素的a个处理间及B因素的b个处理之间进行。\n例如:拟进行小麦中耕次数(A,次要因素)和施肥量(B,主要因素)试验,A因素设置3个水平:A1、A2、A3,B因素设置4个水平:B1、B2、B3、B4。试验地按肥力梯度设置3个区组,进行裂区设计。设计示意图为:区组I区组II区组IIIA1A3A2A3A2A1A2A1A3B2B1B3B2B4B3B1B3B4B3B2B3B4B3B2B4B1B2B3B4B4B1B1B2B4B2B2B1B4B1B2B1B1B3B3B4肥力梯度\n设计特点(1)裂区设计副区因素是主要的研究因素,主区因素是次要的研究因素;副区面积小,主区面积大。(2)裂区设计是以牺牲主区因素的精确性来提高副区因素以及副区因素与主区因素的互作效应的精确性。因此,对于副区因素效应来说,裂区设计比随机区组设计精确度高。(3)裂区设计往往是管理实施的需要。如果某一因素比另一因素需要更大的小区面积时,为了管理实施的方便而采取裂区设计。应将需要面积较大的因素作为主区因素,需要面积较小的因素作为副区因素。例如在栽培试验中,施肥和灌溉需要较大的面积,以便于实际操作和控制水肥在相邻小区之间的移动,应将施肥和灌溉作为主区因素,将其它因素作为副区因素。\n多因素试验设计方法与分析(一)正交试验设计适用范围试验考察的试验因素较多(不小于3),并且允许进行的试验次数不多。通常适用于用较少的试验次数找出最佳水平组合。正交设计是利用正交表安排多因素试验、分析试验结果的一种设计方法。它从多因素的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出因素最佳水平组合。设计方法\n正交表是一种特别的表格,是正交设计的基本工具。我们只介绍它的记号、特点和使用方法。正交表的记号及含义记号及含义正交表的列数(最多能安排的因素个数,包括交互作用、误差等)正交表的行数(需要做的试验次数)各因素的水平数(各因素的水平数相等)q正交表的代号\n\n如表示表示各因素的水平数为2,做8次试验,最多考虑7个因素(含交互作用)的正交表。正交表的特点1、正交表中任意一列中,不同的数字出现的次数相等;表示:在试验安排中,所挑选出来的水平组合是均匀分布的(每个因素的各水平出现的次数相同)——均衡分散性\n2、正交表中任意两列,把同行的两个数字看成有序数对时,所有可能的数对出现的次数相同。表示:任意两因素的各种水平的搭配在所选试验中出现的次数相等——整齐可比性这是设计正交试验表的基本准则正交试验设计的基本步骤确定目标、选定因素(包括交互作用)、确定水平;2.选用合适的正交表;3.按选定的正交表设计表头,确定试验方案;4.组织实施试验;5.试验结果分析。\n例如为了解决花菜留种问题,以进一步提高花菜种子的产量和质量,科技人员考察了浇水、施肥、病害防治和移入温室时间对花菜留种的影响,进行了四个因素各两个水平的正交试验,各因素及其水平如下表:因素水平1水平2A:浇水次数不干死为原则,整个生长期只浇水1~2次根据生长需水量和自然条件浇水,但不过湿B:喷药次数发现病害即喷药每半月喷一次C:施肥次数开花期施硫酸铵进室发根期、抽薹期、开花期和结果期各施肥一次D:进室时间11月1日11月15日\n第一步:选择适当的正交表这是一个四因素两水平的正交试验及分析问题,因此要选择型的表,且不考虑交互作用时,仍然是满足条件的最小的正交表,所以选用正交表注:也可由试验次数应满足的条件来选择正交表。,若考虑A与B、A与C的交互作用,则,而是满足条件的最小的正交表,所以还可选用正交表\n其中:由确定。是可求出的,而是未知的,当不考虑交互作用时:可取故N不是唯一的。试验次数N的确定原则所以一般地,由确定N,所以一般地,有\n如三因素四水平43的正交试验至少应安排次以上的试验。如三因素四水平43并包括第一、二个因素的交互作用的正交试验至少应安排的试验次数为若再加上包括第一、五个因素的交互作用的正交试验则至少应安排的试验次数为次以上的试验。又如安排的混合水平的正交试验至少应安排\n第二步表头设计——查交互作用表表示位于第二、第四列的两因素的交互作用要放于第六列。如L8(27)的交互作用表列号12345671(1)3254762(2)167453(3)76544(4)1235(5)326(6)1注意:主效应因素尽量不放交互列。如A、B因素已放1、2列,则C因素就不放3列。\n花菜留种的表头设计列号1234567因子考虑交互作用AB和AC,则例1的表头可设计为注:第6列为空白列,当随机误差列;也可把第7列作空白列。一般要求至少有一个空白列。按正交表得试验方案:只需将各列中的数字“1”、“2”分别理解为所填因素在试验中的水平数,每一行就是一个试验方案。\n第三步按所选定的正交试验方案组织试验,记录试验结果:水列平号试验号ABAXBCAXCD产量12345671111111135021112222325312211224254122221142552121212200621221212507221122127582212112375\n第四步分析正交试验结果方法1直观分析(极差分析)(1)计算极差,确定因素的主次顺序第j列的极差或极差越大,说明这个因素的水平改变对试验结果的影响越大,极差最大的那个因素,就是最主要的因素。(2)根据极差大小对各因素的主次顺序进行排序\n(3)确定最优方案如果不考虑交互作用,则根据各因素在各水平下的总产量或平均产量的高低确定最优方案;如果考虑交互作用,则取各种搭配下产量的平均数,按优化标准确定最优方案。方法2方差分析法基本思想与双因素方差分析方法一致:将总的离差平方和分解成各因素及各交互作用的离差平方和,构造F统计量,对各因素是否对试验指标具有显著影响,作F检验。下面以例说明:\n例3\n\n\n\n\n\n\n
查看更多

相关文章

您可能关注的文档