【农学课件】方差分析

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

【农学课件】方差分析

第七章方差分析第一节方差分析的意义在第五章里介绍了一个或两个样本平均数的假设测验方法,即/测验或“测验的方法,但在农业科学试验屮,更多见的是研究多个样本(处理)之间的差异。当对多个平均数作差异显著性测验时,如果采用/测验或“测验的方法分别作出测验存在着以卜三个缺陷。首先,对于一个多样本资料采用两两平均数间分别作差异显著性测验非常麻烦,会使统计丁作景加大。因为对k个样本平均数进行两两平均数I'可分别作差异显著性测验,所有可能的平均数差值为R伙・1)/2个,当R较大时,统计工作量将骤然加大,羡至无法承受。其次,从统计上夸人了样本间的差异,增加了犯第一类错谋(否定正确的假设皿)的概率。这是因为,当假设两个样本随机抽白同一•正态总体吋,其样本平均数的差数(石-元2)落到抽样分布总体N(M-“2,b爲2)否定区间的概率(事先规定的显著水平Q)被扩犬了。若对每两个样本测验的显箸水平都取4=0.05,实际上的显著水平已不是0=0.05,而是>0.05=例如,对于一个均数差值(石-禺)犯第一类错谋的概率为0.05,两个均数差值时则为1—0.952=0.0975;而10个均数若值吋犯第一类错谋的概率则将达到1-0.95,o=0.4013T=再次,对于一个多样本的试验资料,样本间是属于内在关联(尤其是试验谋差)的信息整体,这时若对两两平均数间单独进行假设测验,就等于将这一整体割裂开來。从统计的人数定律可知,这将带来谋差H由度的损失,并影响对误井估计的精度。因此,对多样本平均数的假设测验,需采用一种更为合适的统计方法—差分析。方差分析的统计方法是由英国著名统计学家R.A.Fisher于1923年提出來的。方差分析的基本原理是将总变异分裂为齐个因索的相应变异,作出其数量估计,从而发现务个因索在变异屮所占的重要程度;除了可控因素所引起的变异外,用其他剩余变异来准确而无偏的估计试验谋芳,作为统计假设测验的依据;再通过显著性检验「测验,发现各个因索在变异屮所占的重要程度,进而对无效假设H小=皿=(各样本的总休平均数相等)作出统计推断。方差分析在农业试验资料的统计分析中占有十分重要的地位,是最常用的一种统计分析方法。特别是在多因索试验和齐种田问设计的试验屮,方差分析可以帮助我们发现起主要作用的因索,从而抓住主要矛盾或关键措施。\n第二节方差分析的步骤一、自由度与平方和的分解在第三章屮已介绍过,样本方差也称为均方,即样本标准差的平方,它是一个表示变异的量,是平方和除以自由度的商。因此要将-个试验资料的总变异分裂成各个变异來源的相应变异,首先必须将总的白由度与平方和分解为各个变异來源的相应部分,即a由度与平方和的分解是方差分析的第-个步骤。现以具有鸟个处理,每个处理含有〃个重复观察值,共有族个观察值的试验资料为例,來说明白由度与平方和分解的过程。这种类型的资料常來白于盆栽试验等完全随机试验设计,资料的整理方法见表7.1。表7.1各处理重复观察值数目相等的完全随机试验数据符号表处理重复观察值T,忑.1…x{.…几石.111•11aa兀1iiaailill…V…ij1aa心T,111kaiiiiiailaaa…Xkj…aiaTk.Xk・总和T..X..1.平方和的分解在方差分析中,经常用线性模型來表示观察值的变异來源构成,表7.1资料的线性模型可表达为x,j=u+1,+£/j(7.1)式屮:p为在假设全部数据都随机抽白同一正态分布总体时的总体平均数;J为第i处理对勺的效应;J为叼的随机误差,以上各参数的样本估计值分别为A=x..元=(£•"..)為=(七・乙,)因此,上述线性模型由样本估计时的表达式为JC..=I..+(I..)+(兀厂忑.)(7.2)如将上述表达式(7.2)屮的〒..项移至等式左边,可得到离均普形式(兀厂x..)=(忑•■元・・)+(兀厂瓦•・)(7.3)\n(7.3)式表明任一观察值七与总平均数元..之差都可分解为处理效应和谋差效应两部分。如果我们用离均邃平方总和(即平方和)这一表示数据变异程度人小的统计量來表示这些变异,则得到关系式ZZ(x.rx..)2=nZ(J.,-x..尸+Z£(x.-I.)2/=1j=\J/=!/=1j=\J(7.4)式屮SZ(x,-xJ?为总变异平方和,用SS「表示;几Z(忑.・x..)2为处理平方和,用SStZ=1J=1J/=1表示;Z£(a;7-x.)2为误差平方和,用SS。表示。即/=1/=!JssT=sst+sse在实际应用计算屮各公式分别为T2SST=Zx2rnkT2其屮「称为矫正数,记为C,即nkssz=-cn(7.5)(7.6)(7.7)⑺8)SSe=SST-SS{(7.9)2.自由度的分解总变异自由度也可分解为两部分,即总变异白由度=处理间白由度+i吴差白由度。总变由于计算总平方和时,资料中的各数据要受到££(兀厂x..)=0条件的约束,所/=|J=l以,总ti由度为异自由度用与表示;处理间自由度用儿表示;误差自由度用冬表示。vT=nk-\(7.10)由于用耳•计算处理间平方和时,耳・要受到£(xz.-x..)=O条件的约束,所以,处理/=1\n间臼由度为vz=k(7.11)由于计算处理内(谋差)平方和时,要受到Z(x/7-X.)=O(/=L2-^)k个条件的约束,⑺12J)所以,谋差自市度为ve=nk-k=k(n-l)实际应用公式可用(7.12-2)3•方差将各变异來源的平方和除以相应的自由度,即得各变异来源的方弄,有总变异处理间i吴差.2SSt首和勺―G(nk-1)(7.13)S;SSn为(兀一丘••厂可一(nk-1)SS«二薔心_兀.)2vek(n-1)(7.14)⑺15)通过计算各部分方琴值的人小,可了解各变异原因所引起的变异程度的人小。4.实例分析[例7.1]以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理得4个苗高观察值(cm),其结果如表7.2。表7.2不同药剂处理水稻的苗高(cni)药剂A(xr)B(x2.)C(x3.)D(x4.)A19212022B23241825C21271927D13201522总和7}769272967^336平均璋192318241=21己知n=4,T=336,则(1)•总变异平方和与总自由度c=r\nk=3362=70564x44\n(1).总变异平方和与总白由度SST=Ex2-C=192+232+A+222-C=7278-7056=222vT1=4x4—1=15(2).处理间平方和与H由度SS,=-C=762+922+722+962-C=7160-7056=104(3).i吴差平方和与自由度SSc=SST-SSt=222-104=118ve=k(n一1)=4x(4-1)=12(4).各变异來源的方差总变异SST222--14.80VT15处理间S,~:ss「-104-34.673谋差se2=SS°W.8312以上药剂内方差S,=9.83系4种药剂内变异的合并方差,它是表7.2资料的试验谋差的估计;而药剂间方差5/=34.67则是试验谋差加上不同药剂对苗髙的效应。二、方差分析的假设测验一F测验F测验是方差分析的第个二步骤。在第五章里对两个样本方差相比较的差异显箸性测验(F测验)曾作过介绍。为测验假设Ho:0i2^o22;对Ha:0.2>022,我们以被测验项的方差小2作分子,以课差的方差旳2作分母,计算F=s詡s?,若实得F>F(W5或忌”则推断否定局,接受弘;若实得FFO.O5=3.49,故推断否定乩:。壬仃几接受Ra:o>o/;即4种药剂间变异显著犬于药剂内变异,不同药剂处理水稻后苗高是不同的。将结果列于表7.3,即方差分析表。表7.34种药剂处理水稻苗高的方差分析变异來源DFSSMSF屉5药剂间310434.673.53*3.495.95谋差121189.38总变异1522214.80*为在5%水平上显著,若**为在1%水平上极显著。三、多重比较F测验杲一个敕体概念,F测验结果显著或极显著仅表明各处理间存在显著的差异,但无法具体说明哪些处理间差异达到显著或极显著,哪些处理间差异不显箸。如例7.1,F测验结果达到显著,仅说明4种药剂处理后水稻苗高差异显著,但在这4种药剂之间,究竟哪两个比较差异显著,哪两个比较差异不显著,F测验没有提供任何信息。要进一步明确这个问题,还需要对处理平均数间作两两相比较的假设测验——多重比较。因此,多重比较是方差分析的第三个步骤。多重比较的方法有多种,在此仅介绍其中应用较广的3种。1.Fisher氏保护最小显著差数(PLSD)法这种测验的实质是r测验。在第五章,我们对两个样本平均数作差异显著性测验时,是川计算得到的/值与从/值表屮杳到的人临界值相比较,从而推断其普异显著性的,即一用-丘2而PLSD法是将|无•-耳|与〈.%坷相比较,而作出忑与兀之间差异显著性的推断。这里t^s--称之为最小显著差数,记为PLSD.,即14—人j\nPLSD'—aEr(7.16)与5--者之间的区别仅在于前者的s—T=b,(丄+丄)式中的合并均方是'Vn\,12由两个样本计算而来的,即$2=隅+W;而厉者的=p7式屮的合并均方鼻2e・X.x.\是由R个样本计算而來的,即宀($S[+ss2+A+ssk)V]+v2+A+Vjt在例7.1屮谋差H由度叫=12,查“临界值表(附表5)r0.05j2=2.179和如)口2=3・012,进而得PLSD(W5=to.05-5.-=2.179X2.22=4.8(cm)Ar/PLSD0.oi=to.or5--=3.012x2.22=6.8(cm)•'j用任两个平均数的差数绝对值丨X,.-x.丨与PLSDo®和PLSDg进行比较,如果I天-兀丨^PLSD005而小于PLSD001,说明两个样本平均数之间差异显著,则在差数的右上角打一个号;如果丨£-兀丨NPLSD响,说明两个样本平均数之间差异极显著,则在差数的右上角打两个号;如果丨瓦-兀丨VPLSD^,说明两个样本平均数茎异不显著,贝I」不标记。例7」的4种药剂处理水稻苗高试验的多重比较结果列于表7.4。表7.44种药剂处理水稻苗高的多重比较(列梯形表法)处理水稻苗高(cm)(X,)差异石-18兀-19X--23D246*51B2354A191C18从表7.4可得出结论:使用4种药剂后,水稻苗高由高至低依次为Q、B、A、C,其中,D显著高于C,其他药剂间水稻苗高差异未达显著水平。\nPLSD法计算方法简单,在过去一个吋期曾得到比较广泛的应用。但由于其本质仍然是f测验,所以,犯第一类错谋的缺陷依然存在。为了减少这种错谋的发生,Fisher提出,仅当F测验确认各处理间差界显著后,方可川它来作多重比较,也就是必须在使用前加以F测验的保护。因此,统计界称此法为保护最小显著差数法。1.新复极差(LSR)法新复极差法乂称为最小显箸极差法。这一方法是D.B.Duncan于1955年提出的,是当前应用最广泛的一种多重比较方法。最小显著极差临界值为LSRn=SE-SSR“(7.17)其中:称之为平均数标准谋;浓为谋差项方差;SSR“为在白由度匕下对于不同Vn资料屮,平均数标准谋SE=(cm),在谋差白由度匕=12p值的SSR’血(见附表8),这里的p为被比较的两个平均数间在顺序排列的平均数序列屮所涵盖的平均数个数。在例7.1下,查p=2,3,4的SSR^和SSRoqi值,并进一步计算LSRo.o5和LSRo.oi值(见表7.5)。计算出LSR.后,用字母标记法将各处理平均数问的差异显著性表示出來(表7.6)。P234SSR().o53.083.233.33SSRo.ui4.324.554.68LSRo.05J24.845.075.23LSRo.oi」26.787」47.35表7.54种药剂处理水稻苗高的LSR值药剂水稻苗高(Z/i)差异显著性5%1%D24aAB23abAA19abAc18bA表7.64种药剂处理水稻苗高的多重比较(标记字母法)标记字母法的作法为先将全部平均数按从人到小依次排序,在q=0.05显著水平比较时,先在最人的平均数片面标英文小写字母并将该平均数与以下各平均数相比,凡差数小于LSR0.05值的(与相应P值下的LSRo.05值相比)为差异不显著,均标字母",直到某一个差数人于LSR0.05值时则标以字母/;;再以标有字母方的这个平均数与其上各平均数依次相比,凡差数不显著的标以字母方;显著的则不标记;然厉以标有字母力的最人平均数为标准,与以下未标记的平均数相比,凡不显著的也标以字母方,直至与某一个平均数相差显著吋标以字母c,…,如此往复进行下去,按英文字母表顺序标记字母,直到所有的平均数都标上字母为止。显著水平q=0.01的标记方法同于&=0.05的标记方法,只是均用英文大写字母标记。这样各平均数后而凡有一个以上相同字母的为差异不显著;凡是一个相同字母都没有的为差异显箸或极显著。从表7.6可得到例7」多重比较的结论为:水稻苗高以药剂D处理为最高,显著高于C\n药剂处理;其它药剂间的水稻苗高无显著差异。3.Dunnetl氏最小显著香数(DLSD)法在试验屮若设有指定对照,则参试处理就有了一个共同的比较标准cC.W.Dunnett于1955年对这类试验提出了用DLSD法进行多重比较。在这一方法中,任一处理平均数都与对照平均数相比较,其临界值为(7.18)DLSDa=Dta・S--式屮:Dt“为Dunnett氏两尾显著临界值(附表7),查表吋参照谋差项H由度叭和处理数k(不包括对照),当各处理观察值数日相等吋(7.19)在例7.1屮,设A药剂为对照,则有2$/屮=2.22(C.)心一口n在谋差项白由度匕,=12,肛3时,查附表7,Dto.u5=2.76,。亦=3.61,进而得到DLSD().()5=2.72X2.22=6.04(cm)DLSDo.oi=3.61X2.22=7.35(cm)药剂水稻苗高(Xi)与对照比较的差数及显箸性D245B234A(CK)19—C18■1表7.74种药剂间水稻苗高的多重比较凡是与对照比较差数的绝对值大于6.04(cm),而小于7.35(cm)的为差异显著,在差数的右上角打一个星号如人于7.35(cm)为差异极显著,在差数的右上角打两个“**”号;如小于6.04(cm)为差异不显著,不标记。例7.1的DLSD法多重比较结果列于表7.7°从而得出结论:D、B和C3种药剂处理水稻苗高均与对照药剂A差异未达显著。第三节方差分析的线性模型和期望均方一、方差分析的线性模型方差分析是建立在一定的线性可加模型的基础上的。所谓线性可加模型是指每一个观察\n值可以划分成若干个线性组成部分,它是分解白由度与平方和的理论依据。下面我们以单个随机样本为例说明这一问题n设在一平均数为“、方差为b?的正态总体屮随机抽取容量为“的i组样本。由于随机课差的存在,每一个石都和总体平均数“有差别,这个差景就是随机谋差6。因而,每一个观察值无都具有线性可加模型其屮另是遵循N(0,o2)的,故门为“的无偏估计;而6=(兀一“)则由样本离差勺=(X.-劝估计。由于绍2二““一了,故样本均方$2=二亦为总体方差/的n—1无偏估计。如果对上述总体施加了某种处理,而处理效应为―则总体平均数为(“+了),而方差仍为O2。因而从该总体屮得到的任一观察值的线性可加模型便成为“=(“+Q)+&这吋样本平均数壬是总体平均数(“+丫)的无偏估计,而2仍为八的无偏估计。假如,将上述总体分成k个组,使每组成为该总体的-个亚总体,分别给子不同的处理,处理效应为耳,则各个亚总体的平均数为"•=(“+巧)。当每个亚总体中皆随机抽取容量为的〃--组样本时,则共得k组样本,其资料模式如表7.1。而任--亚总体的任一观察值也(i=l,2,...,化表示组别;戶1,2...A表示所属组的观察值次序)所具有的线性模型为xfj=“+耳+勺(7.20)上式屮,耳=(“‘-“),并满足2耳=0;而勺=(七一“J相直独立,并具有分布N(0,八)。上式说明,象表7」类型的资料,其每一观察值皆由共同的原总体平均数》、处理效应6和随机谋差勺三个部分相加而成。在以样本符号表示吋,令全试验平均数为元,齐处理平均数为忑,齐处理效应为则卩由兀估计,处理效应q=(“•一//)由ti=(无一可估计,随机i吴差旬=(七•一由句=(勺-“)估计。所以,样本估计值的线性模型为\nX..=X+/,.+e..Xe"并且元是“的无偏估计量,忑是丛的无偏估计量,扩==」・为其所属亚总体的方差n一1的无偏估计量。由于测验假设H。:“]=/=A=山吋,假定“]=“2=人=H=A=rr22=人=2=rr2k川2所以£2=订"也是"2的无偏估计量。'g-1)对于耳部分,每一样本的平方和是m.=77(x,.-x)2,故k个样本的平方和是nit,2=nUxi-x)2^而处理间方差昇为112nXti2nE(xi-x)25,=k-\=r^i是受到随机课差句影响的处理效应方差,故它估计着+旦二。这一部分因试伙-i)验模型的不同而乂有固定模型和随机模型之分。在I古I定模型时,异估计看/+,叫彳,其屮5V22K;=丄,并满足Zrz=0;在随机模型时,$「估计着<T2+/7<Tr2,其屮”2=二,—1fk-\系正态总体N(0,的方差。通常,将以上打称为固定模型处理效应方差,称为随机模型处理效应方并。所以测验2F亠叮对于固定模型來说,实质上是测验H°:T.=0对Ha:耳H0(因为Tj=-“,故亦即测验H°:z=皿八二心二“对Hi血,“2,人,/•不相等);对于随机模型來说,是测验2刃():b「=o对〃A:ct「hO。当耳=0或<7/=0吋,F的期望值=二=1。试验模型属]古I定模型或随机模型的区别仅在于F测验和统计推断上,而与自由度、平方和的分解无关。二、方差分析的期望均方线性可加模型将每-•观察值看作是儿个分量的总和。最简单的情况是平均数“加随机谋\n差但平均数“乂可以是另一些分量的总和,对于完全随机设计,各处理观察值数bl相等资料而言,即有勺=“+行+%仃=1,2,Ayk;j=1,2,A,7?)对于%部分的假定12于上节说明,即它是彼此独立的,以零为平均数的正态分布,且不同处理内具有同质的方差。本节要说明的是关于q部分的假定。固定模型(模型I)和随机模型(模型1【)是由于对效应T有不同的解释而产生的。从理论上讲,固定模型是指各个处理的平均效应巧=(“-“)是固定的一•个常量,且满足Xrf.=0(或刀7尺=0)o随机模型是指各个处理效应耳不是一个常量,而是从平均数为零、方差为的正态总体屮得到的一•个随机样本的结果。在实际工作屮,我们可以这样理解这两种模型的区别。例如在出间试验屮,若我们的目的仅在于了解某儿个特定处理的效应,如要了解水稻新品种的产量或儿种密度、儿种肥料、儿种农药的效应等,则处理效应q为固定的处理效应。换言之,固定模型仅在于了解供试处理范闌内处理间的不同效应,其结论是不能推广应用于范围以外的其他处理的。如果我们的日的不是研究选出供试的那儿个处理的效应,而是要对这些处理所属的总体作出推断,例如,为研究东北地区人豆地方品种的生态类型和特性,我们从人量地方品种屮随机抽取一部分品种作为代表进行试验,以便通过这部分供试品种的试验结果推论務个东北地区人豆地方品种的情况,这种处理效应便是随机模型的处理效应。在随机模型中,因为各处理仅是所属总体的随机样本,故总体方差c「是重要的研究对象。由上可知,周定模型和随机模型,在设计思想和统计推断上是明显不同的。对于固定模型,如进行重复试验,则一定包括同样纟fl别的丫在新试验里,我们的注意力是集屮于研究这些T(效应)的大小上。对于随机模型,如进行重复试验,则必然是要从T的总休屮随机抽収新的一组J而我们的注意力则在于T的变异度方面,并不继续特别地去注意某一个特殊组的因此,在同定模型屮,我们所得的结论仅在于推断特定的处理;在随机模型屮,试验结论则将用于推断处理的总体。\n在估计期望均方的i些参数和F测验方面,周定模型和随机模型也是有明显不同的。这些概念对于方差分析的应用,尤其对于遗传育种方而的研究颇为重要。以下通过实例了以说明。1•固定模型试验a2=2.40,Fk-1[例7.2]以5个水稻品种作人区比较试验,每品种作3次取样,测定其产量,所得数据为单向分纽•资料。本试验需明确各品种的效应,故为固定模型,其方差分析和期望均方的参数估计列于表7.8o变异來源DFSSMS固定模型:EMS品种间487.621.90(72+/?ZC2品种内(试验误差)1024.02.407cr表7.85个水稻殆种产量的方差分析和期望均方表k2(21.90亠。—。362为c$的估计值,K2表示疋的估计值。本例5个品种试验可看作是具有3个重复观察值的5个品种总体的一个样本。方差分析表上的期望均方,乃是在试验重复无数次吋将-定得到的平均均方;现在仅有一个试验,所以,其实际均方值仅为表上相应的期望均方的估计值,即(J2=2.40,k2=6.50也就杲说,试验误差£2=竺竺二Zl匚是十的估计值,即S2->(T2;而品种间方差'k(n-I)2=心(兀-可'则是估计江打和误差,即估计必彳+误差变异数。这是由于此处人一2为'(k-1)(k-1)品种间方差,由》(兀-可‘估计;但因是样本结果,其变异还会受到试验谋芳的影响。更确仏-1)2切地说,由于昂种间变异是以品种平均数忑计算的,其变异屮还包括着「部分,所以n工(入丄一丄匸估计着k-\n乂由于叮是以小区为单位计算的,故s:=n»匸门[估计着,心2+二)=就2+/伙一1)川因此宀厲(或細十+冷)\n周定模型的假设可由F测验看出,由于宀"仝伙-1)(7.21)故如rf=0,则F值将等于1。所以,固定模型是测验假设Ho:巧=0(21,2,AJ),对Ha:厂工0,亦即测验Ho:=“2二人=乩•的假设。因而,一般比较处理效应的试验,都是应当采用固定模型的。2.随机模型试验[例7.3]研究釉粳稻杂交几代系统间单株干草重的遗传变异,随机抽取76个系统进行试验,每系统随机取二个样品测定干草重(g/株)。由于这76个系统是随机抽取的样本,要从这些样本來估计你代系统间单株干草重的遗传变异,所以,这是一个随机模型。将这152个观察值的分析结果列于表7.9o表7.9柚粳杂种尸5代干草重的方差分析和期望均方变异來源DFMS随机模型:EMS系统间7572.79o2+n。?系统内(试验谋差)7617.77o2d2=17.77,占「=27.51,X=40.llg随机模型的期望均方估计方法与上述固定模型相同,其结果写于表7.9下方。但需注意,由于这里的t已不是一个常量,而是从正态总休N(0,o屮随机抽取的样本,因而处理平均数间的期望均方是(o2+no?)o在F测验时,随机模型的F为(7.22)所以,若假设则民1。因而,随机模型的假设为加a;=0对弘:。,工0,显然,这是测验处理效应的变异度(方差),而不是测验处理效应本久如果F测验显著则表示处理间的变异是显著的。本例F=72竺=409>Fu.o5,说明。/是存在的,所以,进17.77一步估计得_($「一$/)_(72・79-17・77)n2=27.51(7.23)数量遗传学的研究指出:衣(或记为诸)为系统间的遗传型变异,称遗传型方差;L\n则称遗传型标准差。而/则为环境条件影响的变异,称环境方差(--般记作云)。遗传型方養加上环境方差组成了表现型方差(兀),因此cr;=cr;+cr:(7.24)遗传型方差对表现型方差的比值,则称为遗传力,记作胪,即沪=—工—(7.25)22,2°pbg+%h2乃遗传型变异占表现型变异的百分率,因而可作为由表现型估计遗传型的可靠程度的测度。如在本例可求得h2=———=0.6076或60.76%27.51+17.77必须注意,这里的O,用的是。2,即单次测定的误差估计;而表示的是单次测定的表现型方羌。所以,此用指出了样本单位为一次测定时的遗屆力值,即由一•次测定值以估计遗传型优劣的可靠秫度。如果能够以n次测定的平均数作为遗传型优劣的估计,则环境方差<7,=亡,于是n2/2_S(7.26)2o入+—n如本例,当以〃=2的样本平均数为单位时,『为h227.5127.51+17.772=0.7558或=75.58%比较上述两个X值,可见以平均数为选择单位时,遗传力较人。这里由二次测定的表现型平均值以估计遗传型的优劣,其百分数为75.58%,比一次测定值的估计百分数60.76%高出14.82%。这是由于平均值比单个观察值减小了环境谋差。除遗传力方2外,遗传型的相対变异度也可作出估计,它称为遗传变异系数(记作ge),(7.27)是遗传型标准差与总平均数的比值,即gcv=CT&/“X100如本例,在表7.9可算得<7,=727^7=5.24,x(u的估计值)=40」1,故5.2440.11xl00=12.81(%)\nge的大小说明该性状遗传型变异的相对大小。ge愈大,选得优良遗传型的潜力愈大;反之,如ge=O,则选择将无效果。本例釉粳杂交尸5代系统间单株干草重的q=12.X1(%),因而,对该性状的选择是会有一定效果的。在育种上,从试验数据估计出遗传型方差<7/、环境方差<7』、遗传力沪和遗传变异系数“卩等遗传参数,能对群体某个性状的遗传变鼻有了一•个清晰的概念。因而,可预期选择的进度和效果,从而避免盲目性。以上介绍的试验属完全随机设计,期望均方和估算遗传参数的方法是比较简单的。更复杂的情况可在熟悉期望均方的基础上类推。有关随机区组和其他设计的期望均方将在以麻章节屮介绍,从而可按不同模型进行正确的方差分析和假设测验以及估计遗传参数。当试验因索在二个或二个以上时,可以在周定模型和随机模型的基础上产生第三种模型:混合模型(或记作模型III)。混合模型是既包括有周定模型的试验因索,乂包括随机模型的试验因索的模型,这类模型凡随机因索仍用”厂表示,而固定模型则用*2表示;根据其期望均方同样可作出正确的假设和F测验以及参数估计。第四节方差分析的基本假定和数据转换一、方差分析的基本假定方差分析的合理性和所得结果的可靠性是建立在以卜三个基本假定之上的,即:(1)对试验所考察性状有影响的各变异来源的效应(包括环境效应)应满足“可加性”;(2)试验谋差应是随机的、彼此独立的,而且作止态分布,即满足“正态性”;(3)所有试验处理必须具有共同的谋差方差,即满足谋差的“同质性”。下面分别叙述之。1.效应的“可加性”这一基本假定可由方差分析的线性可加模型加以说明,如表7.1资料有线性可加模型Xfj=“+耳+勺(7.28)或乂厂p=G+勺.将其写成样本估计值表达式为(勺一元・)=(x,一元・)+(勺一亍/)(7.29)当将所有随机变数代入上述方程式,两边分别取平方并累加时,由于筹式右边乘积项为零的原因,即可得到其平方和分解式SS尸SS(+SSe(7.5式)。因此这种可加性实际上是平方和分解的数学依据。2.课差的“正态性”方差分析是在如下无效假设的基础上进行的,各项被测验的效应方差都是随机抽H同一\n个正态分布总体的样本方差,同时,这一正态总体方差是以试验谋差方差來估计的。若齐试验数据的试验谋差不服从正态分布,贝笊据这一假设正态总体进行的F测验白然也就失去了合理性。各试验数据的随机谋斧可依其线性模型的样本估计值表达式求出,试验谋差的正态性可用力2分布來测验。以表7」类型资料为例,任一观察值勺的试验谋差可用為=(七_兀)來估计。表7.10是不同pH值下盆栽大豆根瘤的鲜重资料,该资料谋差的概率分布情况列于表7.11,以此为例做误差止态性检验。表7.10不同pH值下盆栽大豆根瘤鲜重(单位:g)序号pH=:1pH=2pH=3pH=4pH=5鲜重误差鲜重误差鲜重谋差鲜重误差鲜重误差110284837112121137361601983911-33-2609-24801-33-26012157-13-13-2609-263-540725-15_6无88-14&8-155.2-160.4-11122-1课差标准差s°=2.7668表7.11表7.10资料误差的概率分布组限值频数标准化组下限值理论频率理论频数-8.5〜-6.50-3.070.00940.282-6.5〜一4.52-2.350.04321.296-4.5~-2.52-1.630.13153.945-2.5〜-0.58-0.900.24457.335-0.5~1.511-0.180.2768&3041.5〜3.550.540.19085.7243.5〜5.511.260.08052.4155.5〜7.501.990.01990.5977.5〜9.512.710.00330.099在表7.11中,标准化组限值由式(组限值-久,)/丁,2求得,其中必=兀=0,d,=5,=2.7668:各标准化组限区间的理论频率由累积正态分布表(附表2)中杳得,进而用各组理论频率乘以总次数得各区间理论频数。这样可在无效假设H。:试验谋并服从正态分布N(0,2.76682)之下作关于谋差正态性的力2适合性测验。(0")2=(07282)2+(2」.296)=八.(1.0.099)2E0.2821.2960.099\n由于所得理论次数受到三个条件的限制(4严気;理论总次数等于实际总次数),故y=伙—3)=(9—3)=6,查力2。05.6=12.59,因为/2=12.27<才owe=12.59,故推断接受无效假设H。,说明本资料试验谋差服从正态分布。3.误差方差的“同质性”按照方差分析的无效假设,各项变异來源的方差都來白于假设总体N(0,z2o.()5.4=9.49,推断各处理的误差方差有显著差异。二、方差分析的数据转换在进行科学研究丁作的过程屮,试验工作者所得的各种数据要全部准确地符合上述三个假定往往是不容易的;因而采用方差分析所得的结果,只能认为是近似的结果。但是,在设计试验和收集资料的过程屮,如果能够充分考虑这些假定,则在应用方差分析时,可获得更受信任的结论。对于一些不符合方差分析基本假设的试验资料,在进行分析之前,一般可釆用以下补救方法:1.剔除某些表现“特殊”的观察值、处理或重复。2・将总的试验的方差分裂为儿个较为同质的试验误差的方差。1•针对数据的主要缺陷,采用相应的数据转换;再丿IJ转换片的数据作方差分析。常用的转换方法有:(1).平方根转换:如果样本平均数与其方差有比例关系,采用平方根转换可获得一个同质的方差,同时也对减小非可加性的影响。一般将原观察值x转换成、口。这种转换常用\n于稀有现象的计数资料,例如1册面积上某种昆虫的头数或某种杂草的株数等资料。如果有些观察值冥小,戻至有零出现,则可用转换n(2).对数转换:如果数据表现的效应为非可加性,而成倍加性或可乘性,同吋样本平均数与其极差或标准差成比例关系,采用对数转换可获得一•个同质的方差。对于改进非可加性的影响,这一转换比之平方根转换更为有效。一般将x转换为lgx;如观察值屮有零,而务数值皆不犬于10,则可用lg(x+1)转换。(3).反正弦转换:如果资料为成数或百分数,则它将作二项分布。己知送-分布的方差是决定于其平均数p的,所以,在理论上如果pV0.3和p>0.7皆需作反正弦转换,以获得一.个比较致的方差。反正弦转换是将白分数的平方根值取反正弦值,即将p转换成sin从而成为角度。附表10为百分数的反正弦转换表,查附表10可直接得到p的反正弦值。(4).采用儿个观察值的平均数作方差分析:因为平均数比之单个观察值更易作正态分布,故如抽取小样本求得其平均数,再以这些平均数作方差分析,可减小各种不符合基本假定的因素的影响。下而以一个百分数的反正弦转换为例,说明观察值经转换后的方差分析方法。[例7.4]研究华农2号玉米花粉在不同贮藏条件下的生活力:①花粉盛于烧杯内,上盖纱布,藏于冰箱屮;②花粉盛于烧杯内,宜于T•燥器中,藏于冰箱屮;③花粉盛于烧杯内,在室温下贮藏。经贮藏4小时后,在显微镜卜检查有生活力花粉的百分数,对照为新鲜花粉。每处理检杳了6个视野,其结果如表7.12。试作方差分析。表7.12有不少p值人于70%,故需作反止弦转换。由附表10查得表7.12各个p的反正弦角度值列于表7.13。表7.13是刃相等的单向分组资料,对其作方差分析可得表7.14。在作多平均数的比较吋,因有共同的对照,故用DLSD法。求得处理对照(1)⑵(3)9795937091777868%82727566856476497856635577687164表7.13有生活力花粉冇分数的反正弦值(sin5)处理对照(1)(2)(3)80.077.174.756.872.561.362.055.664.958.160.054.367.253.160.744.4表7.12不同处理有生活力花粉的白分数(p)DLSD005=f”%2.57=11.20因而有各处理平均数和对照平均数的比较列于表7.15。表7.1聲平同处尊手米花聲|活力甲牌处理均数刃坷对照白遥穽克柱艇为必仏遁—”需奁°°腹j353.6方舒?金蔚;弭—5^7⑵6L2-6.876.8——(3)52.0一16.0*62.1测验结果为3个处理的生活力都低于对照。将各反正弦平均数转换为白分数(表7.15第\n4列)可以看出处理①比对照降低12.7%,处理②降低9.2%,处理③降低23.9%,只有处理③与对照存在显著差异。7」方差分析的基本原理是什么?如何进行1=1由度与平方和的分解?如何进行F测验和多重比较?数据的线性模型对于方差分析有何意义?7.2方差分析有哪些基本假定?为什么有些数据需经过转换才能作方若分析?有哪儿种转换方法?7.3处理效应的两种模型有哪些区别?它和期望均方的估计及假设测验有何关系?7.4测定4种密度下金皇后玉米的干粒重(g)各4次得结果如表7・1。试对4种密度下的千粒重作相互比较,并作出差异显著性结论。7.5对A、B、C、D4个小麦品种各抽取5个样本,统计其黑穗病率得表7・2结果。试对该资料作方差分析;再将该资料进行反正弦转换,然后作方差分析。比较这两种分析方法的差别,以明了资料转换的作用。表7・14种密度下金皇后玉米的干粒重(g)种植密度(株/公顷)300006000090000120000247238214210258244227204256246221200251236218210表7・2小麦品种的黑穗病率(单位:%)ABCD0.84.09.86.03.81.956.229.80.00.766.07.06.03.510.384.61.73.292.02.8
查看更多

相关文章

您可能关注的文档