- 2022-08-13 发布 |
- 37.5 KB |
- 36页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
《生物统计学》实验指导
《一生物统计学一》实验指导书吴琼英编写适用专业:生物技术牛物工程江苏科技大学生物与化学工程学院\n2012年9月统计学上的试验数据,往往样本含量都很大,因此其统计分析的计算过程比较复杂而且工作量也很大,目前已有数种成功的统计软件问世,其中常用的有EXCEL、SAS和SPSSo本指导书中共包括六个实验,实验一对SAS软件的基本操作进行介绍,实验二至实验六介绍了统计学中几种常用的SAS程序。通过本课程的学习使学生了解并初步学会使用SAS来分析试验数据,熟悉SAS编程格式、过程选项、语句和语句选项,理解SAS输出的内容、特点和意义。为巩固课本上的学习内容,加强学习效果,本书中主要介绍了与课本章节相关的五种常用SAS程序。包括:利用SAS软件描述样本数据、统计假设检验的SAS程序、方差分析的SAS程序、线性回归分析的SAS程序和常用试验设计方差分析的SAS程序等,均为验证性实验项目。本书适用于生物技术与生物工程专业的本科实验教学。实验一SAS软件基本操作1实验二利用SAS软件描述样本数据5实验三统计假设检验的SAS程序14实验四方差分析的SAS程序17实验五线性回归分析的SAS程序21\n实验六常用试验设计方差分析的SAS程序25\n实验一SAS软件基本操作实验学时:2实验类型:验证实验要求:必修一、实验目的1.SAS程序的管理系统。2.SAS程序的编丐。3.SAS程序的执行。二、实验内容1.SAS系统的启动单击开始菜单“程序”,光标移到“TheSASSystem”程序处,屏幕上会显示“TheSASSystemforWindows9.0",选择并单击即启动SAS,或直接从桌面的SAS快捷键进入。2.显示管理系统(1)SAS启动后在屏幕上出现的是显示管理系统,该系统主要冇3个窗口(输出、U志、编辑窗口)。屏幕的左上角是命令框,在命令框内键入OUTPUT,则屏幕上会显示出OUTPUT窗口。不同窗口之间的转换可以通过在命令椎内键入相应命令来进行。如:KEYS:进入KEYS窗口,显示功能键的位置(2)一些主要窗口的功能:PROGRAMEDITOR(PGM):输入SAS程序和数据。LOG:显示执行程序过程中的冇关信息。OUTPUT:显示程序执行的结果。KEYS:显示功能键的位置。OPTIONS:查看SAS系统设置。(3)—些常用的命令BYE:退出SAS系统。CLEAR:清除当前工作窗口内容。FILE(文件名):将当前工作窗口屮的内容储存到指定文件屮。HELP:帮助。NUMS:显示PGM窗口数字区。RECALL:调出上次执行过的程序,以便校正、补充。SUBMIT:在PGM窗口输入程序后,键入命令,提交SAS执行这一程序。ZOOM:放大当前工作窗口,使窗口充满整个屏幕,3.SAS程序的编写一个SAS程序是由数据步(DATASteps)和过程步(PROCSteps)组成的。(1)数据步\n所谓数据步是以DATA语句开始的一纽SAS语句。建立外部数据文件或在作业流中输入数据;将外部数据文件转换为SAS数据集。SAS是不能直接使用一个外部数据文件的,必须先由数据步转化为SAS数据集,然后才能提交给SAS进行分析。①市外部数据文件建立SAS数据集外部数据文件可以通过许多途径产生,但授方便的是在SAS系统的PGM窗口生成。下面以在SAS系统的PGM窗口生成外部数据文件为例,说明如何建立外部数据文件。例如,为了检验不同种类的肥料和三种不同程度的管理水平对作物产量的影响,设计了一个两因素交叉分组试验,四种不同肥料记为1、2、3、4,是一随机因素,三种管理水平记为L、M、H,是一固定因索,所得产量公斤数如下:外部文件-•般是矩形的,每个数值间要有一个空格,每一行对应一个观测,每一列对应一个变量。如第一行对应的是第一次观测,即用第一种肥料、低水平管理所得产量为18公斤。笫一列为肥料变量、第二列为管理变量、第三列为产量变量。管理水平LM•H肥1182842料2212844种3192550类4223447在PGM®口输入以上数据,数据输完之后,在命令椎内健入fileTAtrial.daf,回车。上输入的格式如下:述数据即以trial为文件名存入F盘内。当然,也可以用其它文件1828竝力2844192550223447LMHLMHLMHLMH22333444名存入具它位置,外部数据文件的扩展名一律使MJ.dato或者,单击菜单栏中的“file”,在下拉菜单中选“saveas”,选定文件夹,在对话框内键入文件名。这样所得到的数据文件,SAS并不能分析处理,必须转换为SAS数据集(DATASET)o由外部数据文件转换为SAS数据集是由数据步(DATA步)完成的。DATA步包含了为创建SAS数据集所需的若干SAS语句。切换到PGM窗口,在命令框内键入NUMS,这时在PGM窗口内出现数字区。从第一行开始输入DATA步的SAS语句,DATA步的组成如下:'F:\tiial.dat';inputfm$y;run;各语句的功能如卜:DATA:表示一个DATA步的开始,指示SAS系统要创建一个名为“trial”的SAS数据集。INF1LE:川來打开外部数据文件,所要打开的外部数据文件名要川单引号括起。INPUT:是对外部数据文件的描述,SAS将根据INPUT语句的描述读入全部数据。RUN:指示SAS系统执行上述语旬,由一个外部数据文件Wal.dat,创建一个称为gal,的SAS数据集。\n几点注意事项:•SAS语句书写格式冇很大的宽容度。书写时町以从一行的任意位置开始。同一行可以写几个语句,同一语句也可以写成几行,语句间必须以%"隔开。•语句的书写可以用大写字母或小写字母,也可大小写字母混合使用。•INPUT语句中变量名的顺序要与数据集中相应的变量顺序一致。•对于字符变量(如上例中的m),在变量名后应加上$号。①库标记任何SAS文件都包含两级命名,中间用隔开。一级名是库标记,用來识别数据集存储的位置,二级名才是数据集的名字。SAS数据库分为临时数据库和永久数据库。SAS启动后自动生成两个库标记,一个名为WORK,另一个名为SASUSER.M者是一临时库,后者是一永久库。凡是只用二级名命名的数据集,它的一级名都是WORKo前面创建的数据集“trial”,它的全名应当是“work.trialS小数点前面的work,指明数据集trial在work库内。SAS在引川work库屮的数据集进行分析处理时,库标记町以省赂,因此只需二级名即可。在SAS结束后,WORK库屮的所有数据集都将被删除,下次使川时,仍需从外部文件重新创建SAS数据集。在创建SAS数据集时,如以SASUSER为-•级名,则指明为永久库。若上述数据集名为“sasuser.trial",则为永久数据集,永久数据集一级名不能省略。在结束SAS后数据集被保留。在下次启动后仍町使川。②在作业流中输入数据若实验数据没冇事先做成外部数据文件,也可以在川SAS分析处理数据的过程中输入。仍以前例数据为例,说明在作业流中输入数据,以便产生SAS数据集的DATA步。DATAtrial;inputfm$y;cards;(以卜输入数据,格式同前)cards语句表示数据是作业流屮的一」部分。(2)过程步过程步(PROC步)是以PROC语旬为开头的一个或一些SAS语句。每一个过程语句实际上是一个已经编好的一组程序的名字,执行该语句即执行了这一组程序。过程步是SAS用來处理分析数据的。处理不同类型统计问题需要不同的PROC步。4.SAS程序的执行(1)提交程序在命令框内键入SUBMIT命令,即将上述程序提交给SAS分析处理,在LOG窗口内显示运行过程中相关的信息。运行结束后,在output窗口显示运行结果。(2)修改错谋语句不论是DATA步还是PROC步,若忘记键入或语句出现具它错误,在运行过程屮LOG窗口即出现错课信息,这时应调回原输入程序进行修改。\n调回的方法为:切换到PGM窗口,在命令椎键入RECALL命令,调岀原输入程序,检查产生错误原因,修改后,重新运行。(3)储存与打印运行的结果和编写的程序可以储存起來。若想储存所编写的程序,则切换到PGM窗口;若想储存运行的结果,则切换到OUTPUT窗口,然后在命令框键入吒1"路径及文件名",当前工作窗口内容即存储在外部文件中。若在命令窗口键入“flleTRN…,则把当前工作窗口信息送到打印机打印。三、实验组织运行要求通过本实验使学生对SAS软件有一个初步的了解,掌握SAS程序在编写过程中的注意事项及外部数据文件的建立方法,从而为后续的实验打下基础。实验分批分组进行,以班级为单位,确保每人都有使用计算机练习的机会。教师以例题形式对程序进行讲解,并对学生进行个别指导。四、实验条件计算机,SAS软件。五、实验步骤根据实验指导书练习SAS软件的基木操作。六、实验报告写出SAS程序在编写过程中的注意事项及外部数据文件的建立方法。\n实验二利用SAS软件描述样本数据实验学时:2实验类型:验证实验要求:必修一、实验目的1.利川MEANS语句描述数据。2.利川PROCFREQ过程编制频数分布表。3.利川GCHART过程绘制离散型数据的柱状图;川CAPABILITY过程绘制连续型数据的频率直方图。二、实验内容1.用MEANS语句描述数据例2.1计算课本上习题1.2的平均数和标准差。解:在进行分析Z前,最好先建立一•个外部数据文件。如果不建立外部数据文件,在作业流中输入数据也可以。一般來说,在数据量比较大,有可能重复使用时,最好建立一-个数据文件。在这里我们创建一个称为2-1data的外部数据文件,存储在F盘中。用MEANS过程描述数据的最基本的程序如下:optionslinesize=76;dataabc;infileT:\2-ldata.daf;inputx;run;procmeans;run;提交SAS运行后,所得结果如下:表2.1例2.1输出的结果TheSASSystemAnalysisVariable:XNMeanStdDevMinimumMaximum25063.27600003.013994155.000000070.0000000打印的结果屮包払数据个数,平均数,标准差,最小值和最大值。这是MEANS语句在缺省时得到的基本结果。若需要对数据作更详细的描述,则耍指明所需的统计量。用MEANS过程所计算的统计量,在这里也一并列出。MEANS过程所计算的统计量是用关键词表示,这些关键词及其含义如下:N:输入的观测值个数\nMEAN:变量的平均数STD:变量的标准差MIN:变量的授小值MAX:变量的最大值RANGE:变量的极差SUM:变量所冇值的和VAR:变量的方差USS:每一变量原始数据的平方和(未校止平方和)CSS:每一变量的离均差平方和(校正平方和)CV:变异系数STDERR:每一变量的标准谋差(平均数的标准差)T:在Ho:“=O时的/值(见课本5.1.4)PRT:在Ho屮=0的假设下,统计量/大于/临界值绝对值的概率(见课本4.1.1)CLM:置信区间的上限和下限(见课木6.2.1)LCLM:置信区间的下限UCLM:置信区间的上限另外,在PROCMEANS语句中还冇12个选项,其中几个主要选项如下:DATA=(SAS数据集):指出SAS数据集的名称,若省略,则使用最近产生的数据集MAXDEC=(数字):所输出的结果屮,小数部分的最人位数(0〜8),缺省时为8位FW=(域宽):指出打印的结果屮每个统计量的域宽,缺省时为12VARDEF=(DF/N):VARDEF=DF为缺省值,表示计算方差时,使MJn-1作分母VARDEF=N表示计算方差时,使川观测值个数n作分母ALPHA=(a值):指出在计算置信区间时,选用的显著水平例2・2计算课木上习题1.2的离均差平方和、方差、偏斜度和平均数的0.95置信区间。解:仍然使川2-1data外部数据文件。MEANS过程如下:optionslinesize=76;dataabc;infile'F:\2-ldata.dat5;inputx;run;procmeansdata=abcmaxdec=4fw=8alpha=0.05cssvarskewnesselm;run;运行的结果如下:表2.2例2.2输出的结果TheSASSystemAnalysisVariable:XCSSVarianceSkewnessKurtosisLower95.0%CLMUpper95.0%CLM\n2261.969.0842-0.1548-0.189462.900663.6514在PROCMEANS语句屮,data=abc选项是可以省略的,因为PROCMEANS语句所分析的止是最近的SAS数据集,若需从SAS数据库中调用某一数据集时,则DATA选项不可省略。在建立外部数据文件时,应每个数据占一行,250个数据占250行(只占一列)。这样输入数据太麻烦,核对起來也不方便。如果想连续输入数据,则应在INPUT语句的变量后加上@@,即“inputx@@;“,具体说明见例2.4。在进行科学研究时,需要处理的变量数冃往往很多,而变量Z间还存在一定关系,经常要计算在某一变量特定水平下,其它变量的一些特征数。例如,在做人群健康情况调查时,涉及的变量多达十儿个其至儿十个。如,性别、年龄、身高、休重、吸烟程度、饮酒程度、视力、听力、血压、脉搏、血黏度、胆固醇含量……。如果要计算不同程度吸烟者或不同性别受检者的各项指标或其屮若干项指标的某些统计量,只需加上VAR语句和CLASS语句,便能很容易完成此项工作。VAR语句指明所需描述的变量,CLASS语句可以按观测值的不同类别分类计算指定的统计量。例2.3在做小麦育种时,调查了杂交后代的若干性状,选取其中一部分列在下表中(表2.3)o在表2.3中共列举了四个变量,即:株高、穗长、穗粒数和成熟早晚。分别用hop、loe、nog和fas代表上述四个变量,以成熟的早(e)、中5)、晚⑴分类,分别计算株高与穗长的平均数、标准差和标准误差以及穗粒数的范围和变异系数。表2.3608.060m618.050m618.5611617.554e657.5501636.546e627.0481637.545m668.054m617.050e637.048e678.0501668.0541707.044e628.054e658.0551639.056e679.052m647.046e628.056e\n659.058m688.548e\n646.544m637.052e628.048e637.0501698.0521637.552m687.046e617.552e657.548e668.0481708.046e688.048m628.562m658.566m609.064e697.548e668.046e687.542m709.046m697.0421728.052e667.552m708.050m697.5501718.050e676.0381677.548e解:先建立一个称Z为2-3data的外部数据文件,外部数据文件的格式如表2.3所示。PROCMEANS程序如F:optionslinesize=76;datawheat;infileT:\2-3data.daf;inputhoploenogfas$;run;procmeansmaxdec=2fw=8maxminmeanstdstderr;varhoploe;classfas;procmeansdata=wheatrangecv;varnog;\nclassfas;run;输出结果见表2.4o表2.4例2.3输出的结果TheSASSystemFASNObsVariableMaximumMinimumMeanStdDevStdEnore23HOP72.0060.0065.093.640.76LOE9.006.507.700.670」4112HOP69.0061.0065.752.700.78LOE8.506.007.540.690.20m15HOP70.0060.0065.203.080.79LOE9.006.508.030.690.18TheSASSystemAnalysisVariable:NOGFASNObsRangeCVc2320.00000009.161237211223.000000011.8202275m1524.000000013.31564561.频数分布表的编制可以利用PROCFREQ过程编制频数分布表。例2・4利用PROCFREQ过程,编制课本上例1.1原始数据的频数分布表。解:将120天中每天新牛儿体重超过3公斤的人数,建成一个名为2-4data的外部数据文件,存储在F盘中。编制频数分布表的程序如下:optionslinesize=76;datababy;infile4F:\2-4data.dat5;inputnumber@@;run;procfreq;run;INPUT语句中的@@称为双尾符,它的作用是在SAS从数据文件中读取数据时,读完一个数据行的笫一个观测后指针并不移到下一•行,而停留在观测后的第二列,接着读这一行的笫二个观测,在指针移过数据行末尾时,自动为该行解固。因此,在建立数据文件时,每一个数据行可以输入几个观测。如建立2-3data.dat数据集时,每一个数据行就不仅是一个观测的四个值,而可以是几个观测,譬如:60&060m61&050m618.5611617.554e657.5501636.546e.…\n匕述程序输出的结果如表2.5。表2.5例2.4输出的结果TheSASSystemNUMBERFrequencyPercentCumulativeFrequencyCumulativePercent310.810.8421.732.551210.01512.561915.83428.373932.57360.88342&310789.29108.311797.51032.5120100.0可以川同样的方法编制非数值型变量的频数分布表。例2.5编制表2.3中“成熟早晚”的频数表。解:datawheat;infile'F:\2-3data.dat';inputhoploenogmatureS;run;procfreq;tablemature;run;所得结果如下:表2.6例2.5输出的结果TheSASSystemCumulativeCumulativeMATUREFrequencyPercentFrequencyPercente2346.02346.011224.03570.0m1530.050100.0对于连续型数据,也可以川PROCFREQ过程编制频数分布表。例2.6编制课本上表1-2高粱三尺三株高的频数分布表。解:先建立一个名为2-6data的外部数据文件。SAS程序如2procfonnat;valuehfint141-143=,141-143,144-146=,144-146,147-149=,147-149,150-152=,150-152,153・155=T53・155‘156・158='156・158‘159・161=T59・16「162・164='162-164'\n165・167=T65・167‘168・170=T68・17(T;run;datasorghum;infile'F:\2-6data.dat';inputhight@@;run;procfreq;tablehight;formathighthfmt.;run;这里使丿IJPROCFORMAT过程的口的是将数据按使川者的要求格式化。VALUE语句屮要给出被定义的输出格式名,在这里称为hfmto若以组界分组,还需加上或“汕号,如143.5-<146.5=,144-146,等。在PROCFREQ过程的FORMAT语句中一定要在hfmtZ后加上一个“.二输出结果如下:表2.7例2.6输出的结果TheSASSystemHIGHTFrequencyPercentCumulativeFrequencyCumulativePercent141-14311.011.0144-14622.033.0147-14944.077.0150-1521313.02020.0153-1552323.04343.0156-1582828.07171.0159-1611515.08686.0162-1641010.09696.0165-16733.09999.0168-17011.0100100.01.频数分布图的绘制绘制离散型数据的柱状图,可以川GCHART过程。以课本上例1.1的数据为例,程序如下:datababy;infile4F:\2-4data.dat5;inputnumber@@;run;procgchail;vbarnumber;run;\n如果需要水平条状图,只需将vbar改为hbar即可。执行上述程序的结果如下图:\n图2.1离散型数据的柱形图用CAPABILITY过程绘制连续型数据的频率直方图最简单的程序如下:datasorghum;infileT:\2-6data.dat5;inputhight@@;run;proccapabilitygraphicsnoprint;varhight;histogram;上述的GRAPHICS和NOPRTNT的含义分别是,打出高分辨率的图象和不打出概括性统计量表。执行上述程序的结果如图2.2。直方图的组距是程序自动选定的,组业的大小可以通过改变中值来调整。若组距定为3厘米,可以加进选项“midpoint142to169by3=图2.2是频率直方图,若要得到频数直方图,还需加入选项“vscalc=count二PROCCAPABILITY程为:proccapabilitygraphicsnoprint;varhight;histogram/midpoint=142to169by3vscale=count;run;所得直方图如图2.3所示。HIGHTHIGHT图2.2频率直方图图2.3改变中值后所绘出的频数直方图三、实验组织运行要求实验分批分组进行,以班级为单位,确保每人都有使用计算机练习的机会。教师以例题\n形式对程序进行讲解,学生自主解题,教师进行个别指导。四、实验条件计算机,SAS软件。五、实验步骤1•审题,选择正确的数据处理方法。2.编程,运行程序。3.输出结杲,根据题意,对结果进行生物学解释。六、思考题课本习题1.10、1.17。七、实验报告写出每题的编写程序、输出结果,并根据题意对输出结果进行化物学解释。\n实验三统计假设检验的SAS程序实验学时:2实验类型:验证实验耍求:必修一、实验目的1.学习使用PROCMEANS过程进行单个样本t检验、配对数据t检验。2.学习使用PROCTTEST过程进行成组数据t检验。二、实验内容1.单个样木的t检验对于课本5.1.4所介绍的单个样本t检验,可以使用PROCMEANS过程计算。这里以课木中例5.5的数据为例,说明如何使用PROCMEANS过程进行检验。在这里数据采用在作业流中输入,因此不必建立外部数据文件。optionslinesize=76;datamaize;inputweight@@;diff=weight-300;cards;308305311298315300321294320procmeansntprt;vardiff;run;在PROCMEANS语句中的t是在Ho:g=0假设下所得到的统计量,在这里Ho:尸300,因此在INPUT语句后,用赋值语句建立一个新变Mdiff,diff是每一观测值与300Z差,检验这个差值的期望是否为0,输出结果如下:表3.1单个样木t检验的输出结果TheSASSystemAnalysisVariable:DIFFNTProb>|T|92.49540120.03722.配対数据t检验配对数据t检验的SAS程序与单个样木的t检验程序基本相同,不同点只是在INPUT语句屮包含三个变量,在赋值语句屮的新变量是两个变量的差而不是变量与一个常量的差。以课木中表5・3的数据为例,SAS程序如下:optionslinesize=76;\ndatamatdat;inputidprepropostpro@@;diff=prepro-postpro;cards;18.4787.99427.5127」4137.222&2674&0538.28057.6896.74068.5287.63276.9725.91387.3718」6995.7607.570107.9307.569117.2556.322126.7956.417procmeansnimeanstderrtprt;vardiff;run;输出结果见表3.2。表3.2配对数据t检验的输出结果TheSASSystemAnalysisVariable:DIFFNMeanStdErrorTProb>|T|120」2925000.26395130.48967360.63401.成组数据t检验可以使用PROCTTEST过程做成组数据t检验。以课本中例5.9的数据为例,说明成组数据t检验的SAS程序。optionslinesize=76;datawheat;inputstraindays@@;cards;110111001991991981100198199199199210029821002992982992982982992100procttest;classstrain;vardays;run;上述的class语句称为分类语句,在t检验中的分类变量(品种),应在CLASS语句中给予说明,以便PROCTTEST程按不同类别(品种)进行检验。输出结果见表3.3。表3.3成组数据t检验的输出结果TheSASSystemTTESTPROCEDUREVariable:DAYSSTRAINNMeanStdDevStdError11099.200000000.918936580.29059326\n11098.900000000.875595040.27688746\nVariancesDFProb>|T|Unequal0.747418.00.4645Equal0.747418.00.4645ForHo:Variancesareequal,F*=1.10DF=(9,9)Prob>F'=0.887表3.3中给出了方差齐性检验和t检验结果以及方差不具齐性时,用Aspin-Welch方法计算的近似t统计量的自由度。从表的最后一行得知,方差具齐性,因此只选川Equal行的结果即可。Pn)b>|T|的含义是变量T大于统计量t的概率,P(T>t)o(参考课本“小概率原理”一节)。不论是单侧检验还是双侧检验,该概率值都是一样的。做单侧检验时PV0.05差异显著,在做双侧检验时P<0.025时差异显著。三、实验组织运行要求实验分批分组进行,以班级为单位,确保每人都有使用计算机练习的机会。教师以例题形式对程序进行讲解,学生白主解题,教师进行个别指导。四、实验条件计算机,SAS软件。五、实验步骤1.审题,选择正确的检验方法。2.编程,运行程序。3.输出结果,根据题意,对结果进行生物学解释。六、思考题1.两组雌鼠喂以不同饲料,8周所增体重:高蛋口1341461041191241611078311312997低蛋口701181018510711294检验以两种不同饲料喂鼠,所增体重差异是否显著?2.为研究生花生与炒花生蛋口质的生理价值,从随机获得的10窝小口鼠小,每窝选出两只条件相近的个体,分别接受生花生和炒花生,蛋口质生理价值结果如下:窝别12345678910生花生61605663566359564461炒花生55544759516157546358问生花生和炒花生的生理价值差异是否显著?3.已知甲品种玉米果穗平均长为24.5厘米,由于口然灾害造成玉米生长不良,从所收获的玉米果穗中随机抽出10只,测定它们的长度,结果为:22、18、22、23、20、23、24、25、22、19,问口然灾害对玉米生长所造成的伤害是否极显著?七、实验报告写岀每题的编写程序、输出结果,并根据题意对输出结果进行生物学解释。\n实验四方差分析的SAS程序实验学时:2实验类型:验证实验耍求:必修一、实验目的学习先建立外部数据文件,再使用PROCANOVA过程对数据进行方差分析和多重比较。二、实验内容例下面以课木中例&1的数据为例,给出单因素方差分析的SAS程序。解:先按以下输入方式建立一个称为4-1data的外部数据文件。164.6165.3164.8166.0165.8264.5265.3264.6263.7263.9367.8366.3367.1366.836&5471.8472.1470.0469.1471.0569.256&2569.8568.3567.5SAS程序如下:optionslinesize=76;datawheat;infileT:\4-ldata.daf;inputstrainhight@@;run;procanova;classstrain;modelhight=strain;meansstrain/duncan;meansstrain/lsdcldiff;run;在PROCANOVA过程屮的CLASS语句(分类语句)是必须的,而且一淀要放在MODEL语句之前。在方差分析屮要使用的分类变量(因索),首先要在CLASS语句中说明。分类变量可以是数值型的,也可以是字符型的。MODEL语句川來规定因素对实验结果的效应,一般形式为,因变量=因素效应。木例即为株高=品系效应。MEANS语旬应放在MODEL语旬Z后,MEANS语句后列出希望得到均值的那些变量。MEANS语句冇很多选项,下面列出几个与本教材冇关的选项,将选项写在MEANS语旬的“/”之后。DUNCAN:对MEANS语句列出的所冇主效应均值进行DUNCAN检验。SNK:对MEANS语句列出的所冇主效应均值进行Student-Newman-Keuls检验。T|LSD:对MEANS语句列出的所冇主效应均值进行两两t检验,它相当于在样木含量\n相同时的LSD检验。ALPHA=均值间对比检验的显著水平,缺省值是0.05。当用DUNCAN选项时只能取0.01、0.05和0.10,对于其它选项,a可取0.0001到0.9999之间的任何值。CLDIFF:在选项T和1^。时・,过程将两个均值Z差以置信区间的形式输出。CLM:在选项T和LSD时,过程把变量的每一水平均值以置信区间的形式输出。执行上述程序,输出结果见表4.1。表4.1方差分析输出结果TheSASSystemAnalysisofVarianceProcedureClassLevelInformation...ClassLevelsValuesSTRAIN512345Numberofobservationsindataset=25DependentVariable:HIGHTSource_DFSumofSquaresMeanSquareFValuePr>FModel4131.74000032.93500042.280.0001En-or2015.5800000.779000..CorrectedTotal24147320000R-Square0.894244CV・1.311846RootMSE0.88261HIGHT67.2800SourceDFAnovaSSMeanSquareFValuePr>FSTRAIN4131.74000032.93500042.280.0001TheSASSystemAnalysisofVarianceProcedureDuncan'sMultipleRangeTestforvariable:HIGHTNOTE:ThistestcontrolsthetypeIcomparisonwiseeixorrate,nottheexperimentwiseerrorrateAlpha=0.05df=20MSE=0.779NumberofMeans2345CriticalRangeLI641.2221.2591.285Meanswiththesameletterarenotsignificantlydifferent・DuncanGroupingMeanNSTRAINA70.800054B68.600055C67.300053D65.300051\nD64.400052TheSASSystemAnalysisofVarianceProcedureTtests(LSD)forvariable:HIGHTNOTE:ThistestcontrolsthetypeIcomparisonwiseerrorratenottheexperimenhviseerrorrate・Alpha=0.05Confidence=0.95df=20MSE=0.779CriticalValueofT=2.08596LeastSignificantDifference=LI644Comparisonssignificantatthe0.05levelareindicatedby'***'・LowerDifferenceUpperSTRAINConfidenceBetweenConfidenceComparisonLimitMeansLimit451.03562.20003.3644***432.33563.50004.6644***414.33565.50006.6644***425.23566.40007.5644***54-3.3644-2.2000■1.0356***530.13561.30002.4644***512.13563.30004.4644***523.03564.20005.3644***34-4.6644-3.5000■2.3356***35-2.4644-1.3000-0.1356***310.83562.00003」644***321.73562.90004.0644***14-6.6644-5.500043356***15-4.4644-3.300021356***1331644-2.0000-0.8356***12-0.26440.90002.064424-7.5644-6.4000■5.2356***25-5.3644-4.2000■3.0356***23-4.0644-2.9000■1.7356***21-2.0644-0.90000.2644三、实验组织运行要求实验分批分组进行,以班级为单位,确保每人都有使用计算机练习的机会。教师以例题形式对程序进行讲解,学生白主解题,教师进行个别指导。四、实验条件计算机,SAS软件。\n五、实验步骤1・审题,选择止确的检验方法。2.编程,运行程序。3.输出结果,根据题总,对结果进行生物学解释。六、思考题下面是选育津丰小麦吋所记载的部分数据:株号品系号0-3-10-3-20-3-30-3-40-3-6163566153612655461586036458676060465576256665615762556066857606063765606759618655966616996363636065106462655963对以上性状各品系之间的差界显著性做检验,若渡界是显著的,还要做多重比较。七、实验报告写出编写的程序、输出结果,并根据题意对输出结果进行牛•物学解释。\n实验五线性回归分析的SAS程序实验学时:2实验类型:验证实验耍求:必修一、实验目的学习使用PROCREG过程对-数据进行一元线性回归分析,使用PROCCORR过程计算变量间相关系数。二、实验内容1.一元线性回归分析与检验例5・1以课木上表10・1中的数据为例,求出一元回归方程、检验回归显著性。解:使用PROCREG过程进行分析,SAS程序如下:optionslinesize=76;datasoil;inputsaltdw@@;cards;0800.8901.6procreg;952.41153.21304.01154.8135modeldw=salt;run;输出结果见表5.1o表5.1输出的结果TheSASSystemDependentVariable:DWAnalysisofVarianceSourceDFSumofSquaresMeanSquareFValueProb>FModel1Error52232.142862232.1428631.5660.0025353.5714370.71429■CJhlal.61429RootMSE&40918R-square0.8633DepMean10&57143AdjR-sq0.8359C・V・7.74530ParameterEstimatesParameterStandardTtorHO:VariableDFEstimateErrorParameter=0Prob>|T|nMTERCEP1SALT181.7857145.7298894114.2740.0001-LL160Z1.41.286481745.6J80.0025.\n表5.1的笫一部分是对回归所做的方差分析,笫二部分给出了截距(表中INTERCEP),即回归方程中的常数项G和回归系数b(表中的SALT)o可以得出回归方程:y=81.785714+11.160714X并给出在Ho:a(p)=0下,对a和b所做的t检验。1.相关系数的计算利川CORR过程计算变量间相关系数的最简单的语句即:proccorr;run;这时将给出所有变量两两间的相关系数,显著性概率和单变量有关的统计量。为了满足对数据的特殊要求,在PROCCORR屮还有许多选项。例如:SSCP输出平方和与交义乘积和。在PROCCORR过程屮还有一•些具它语句。具屮常卅的有VAR语句,WITH语句等,简单介绍如下:VAR语句列出计算相关系数的变量,例如:proccorr;varabc;将计算a、b、c三个变量两两间的相关系数。WITH语句WITH语句与VAR语句联合使用,可以计算变量间特殊组合的相关系数,如:proccorr;varab;withijk;将得到a与i、j、k和b与i、j、k间的相关系数。例5・2表5.2给出了高粱在NaCl胁迫后的萎蔦程度(Y)与若干根中蛋白(人)、叶中蛋白(厶)和脯氨酸5。)Z间的关系,计算变量间的相关系数。表5.2高粱在NaCl胁迫后的萎蔦程度与蛋白及脯氨酸Z间的关系萎蔦度(刀7?1R7R87?15厶3L9脯氨酸(PRO)0.96781010247014700.1550.9661910272015800.1190.9547990277010200.1050.9300791051550000.0931.004512100023300.2270.98568700017600.2171.003211911916237336100.2710.9735136000000.3511.007510623202602882460.270\n1.01868433502482402570.2820.972511437202463112370.2341.026018839102752592070.2221.024518138003204372380.6501.036416840803133362120.4071.020113047203533402950.5571.028314657203572106000.611解:先建一个名为5-2data的外部数据文件。SAS程序如下:optionslinesize=76;dataprotein;infile'F:\5-2data.dat';inputyrlr7r8rl51319pro;run;proccorr;varyrlpro;run;proccorrsscp;varypro;withrl513;run;输出结果见表5.3o表5.3例5.2的相关分析TheSASSystemCoiTelationAnalysis3'VAR*Variables:YRlPROSimpleStatisticsVariableNMeanStdDevSumMinimumMaximumY160.99500.031215.91930.93001.0364Rl16121.875034.2226195079.0000188.0000NRQ16…Q2982….……Q」249—4/7710....一…QQ93IL…PearsonCoiTelationCoefficients/Prob>|R|underHo:Rho=0/N=16YRlPROY1.000000.683320.720950.00.00350.0016Rl0.683321.000000.640050.00350.00.0076PRO0.720950.640051.000000.00160.00760.0TheSASSystemCorrelationAnalysis\n2WITH1Variables:R15L32'VAR'Variables:YPROSum-of-SquaresandCrossproductsYPROR152789.5730001109.972000L33623.4785001255.415000SimpleStatisticsVariableNMean••SiUl.DfY….Sum.MinimumMaximumR1516171.5625160.387427450373.0000L316224.8750124.197135980437.0000Y160.99500.031215.91930.93001.0364PRO160.29820.17494.77100.0930…0.6500PearsonCorrelationCoefficients/Prob>|R|underHo:Rho=0/N=16YPROR150.777360.692790.00040.0029L30.749690.560340.00080.0240三、实验组织运行要求实验分批分组进行,以班级为单位,确保每人都有使用计算机练习的机会。教师以例题形式对程序进行讲解,学生口主解题,教师进行个别指导。四、实验条件计算机,SAS软件。五、实验步』1.审题,选择正确的检验方法。2.编程,运行程序。3.输出结果,根据题意,对结來进行生物学解释。六、思考题1.动物饲养实验中,原始体重X与所增体垂Y如下,求回归方程并检验回归系数的显著性。X5249575755605462y59585960506053702.不同水稻品种的蛋白质和赖氨酸含量如下:蛋白质8.778.698.3610.059.80&408.09&7010.259.00賴氨酸0.2980.2800.3270.2610.2750.3270.3000.2950.2550.265计算相关系数「,并对其显著性进行检验。七、实验报告写出每题的编写程序、输出结果,并根据题意对输出结果进行生物学解释。\n实验六常用试验设计方差分析的SAS程序实验学时:2实验类型:验证实验耍求:必修一、实验目的学习使用procanova程序对随机化完全区组实验、两因素随机化区组实验、正交实验进行方差分析。二、实验内容1.随机化完全区组实验的方差分析随机化完全区组实验方差分析的SAS程序,类似于两因素交叉分组实验的SAS程序。例6・1一个采用随机化完全区组设计的品种比较试验,有五个品种参加产量评比,试验共设计了三个区组,结果如CARDS语句所示。解:方差分析的SAS程序如下:optionslincsizc=76;datawheat;inputblockvarietyyield@@;cards;111812361331142115302123223023342418253031223230333434183542procanova;classblockvariety;modelyield=varietyblock;meansvariety/duncan;mn;输出结果见表6.1c表6.1品种比较试验方差分析的结果TheSASSystemAnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesBLOCK3123...YAR1EIY……_JL234$—Numberofobservationsindataset=15TheSASSystemAnalysisofVarianceProcedure\nDependentVariable:YIELDSourceDFSumofSquaresMeanSquareFValuePr>FModel6635.200000105.8666676.460.0096Error8131.20000016.400000CorrectedTotal14766.400000R-SquareC.V.RootMSEYIELDMean0.82881014.567244.0496927.8000...SourceDEAdqy&SSMcartSou蚯F_Value_Pc>F._VAR1ET4620.400000155.1000009.460.0040TheSASSystemAnalysisofVarianceProcedureDuncan'sMultipleRangeTestforvariable:YIELDNOTE:ThistestcontrolsthetypeIcomparisonwiseerrorrate,nottheexperimentvviseerrorrateAlpha=0.05df^8MSE=16.4NumberofMeans2345CriticalRange7.6257.946&125&233Meanswiththesameletterarenotsignificantlydifferent・DuncanGroupingMeanNVARIETYA34.00035AA33.00033AA32.00032B21.00031BB19.000341.两因素随机化区组实验的方差分析两因素随机区组实验的方差分析与三因素交叉分组实验的方差分析程序基本相同。例6・2课本上表9・11中的实验,共需32名同质受试者,因32名同质受试者很难找到,因此将实验的两个重复安排为两个区组,每一区组只要16名同质受试者。解:先创建一个名为6-2data的外部数据文件。SAS程序为:optionslinesize=76;\ndatawork;infile'F:\6Jdata.dat';inputblockabenergy@@;run;procanova;classblockab;modelenergy=blockaba*b;testh=ae=a*b;meansa/duncane=a*b;run;输出结果见表6.2o表6.2例6.2方差分析输出的结果TheSASSystemAnalysisofVarianceProcedureClassLevelInfomiationClassLevels.YsJjassBLOCK212A41234B4J..2J.4__Numberofobservationsindataset=32TheSASSystemAnalysisofVarianceProcedureDependentVariable:ENERGYSumofMeanSourceDFSquaresSquareFValuePr>FModel1613.13290000.8208062&160.0001Enor151.50838750.1005592CorrectedTotal3114.6412875R-SquareC.V.RootMSEENERGYMean0.89697714.328640.317112.21313DfAnovaSSMeanSauareFValuePr>FBLOCK10.277512500.277512502.760」174A33.996337501.3321125013.250.0002B30.450562500.150187501.490.2567..AZB.9.……&4Q84&72Q..0.93427639…f_\nTestsofHypothesesusingtheAnovaMSforA*BasanerrortermSourceDFAnovaSSMeanSquareFValuePr>FA33.996337501.332112501.430.2982TheSASSystemAnalysisofVarianceProcedureDuncan'sMultipleRangeTestforvariable:ENERGYNOTE:ThistestcontrolsthetypeIcomparisonwiscerrorrate,nottheexperimentwiseerrorrateAlpha=0.05d匸9MSE=0.934276NumberofMeans234CriticalRange1.0931.141L169Meanswiththesameletterarcnotsignificantlydifferent.DuncanGroupingMeanNAA2.640084AA2.290081AA2.265082AA1.6575831.正交实验的方差分析例6.3为考查浸捉温度、浸提时间、乙醇浓度三因素对捉取竹叶黄酮的影响,侮因素分别取三个水平进行正交实验,采用正交表L9(3°)安排实验,实验结果如下:表6.3因素水平表水平浸提温度(A)浸提时间(B)乙醇浓度(C)155°C80min60%265°ClOOmin70%375°C120min80%表6.4正交实验表实验号-AB因素CD黄酗得率(mg/g)11111&852212229.861313339.6114212311.2505223111.389623129.3707313211.056832137.8159332112.268\n解:SAS程序为:DATAAA;INPUTABCX;CARDS;558060&85255100709.86155120809.61165807011.250651008011.38965120609.37075808011.05675100607.815751207012.268PROCANOVA;CLASSABC;MODELX=ABC;RUN;输出结果如下:表6.5例6.3实验结果TheANOVAProcedureClassLevelInformationClassLevelsValuesA3556575B380100120c3607080Numberofobservations9TheANOVAProcedureDependentVariable:XR-SquarcCocffVarRootMSE0.84728310.932871.111168XMean10.16356SourceDFSumofSquaresMeanSquareFValuePr>FModel613.700310002.283385001.850.3917Error22.469388221.23469411CorrectedTotal816.16969822SourceDFAnovaSSMeanSquareFValuePr>FA22.473372221.236686111.000.4996B21.017642890.508821440.410.7082c210.209294895.104647444.130.1948三.实验组织运行要求实验分批分组进行,以班级为单位,确保每人都冇使川计算机练习的机会。教师以例题形式对程序进行讲解,学生自主解题,教师进行个别指导。四、实验条件计算机,SAS软件。\n五、实验步骤1•审题,选择正确的检验方法。2.编程,运行程序。3.输出结果,根据题意,对结果进行生物学解释。六、思考题1.2.并对下列木瓜蛋白酶酶解液抑制金黄色匍萄球菌的制备条件正交实验数据进行方差分析:正交试验因素水平表水平因素ApHB温度(°C)C加酶量(%)D酶解时间(min)15301.69026351.910537402.2120正交实验及结果试验号ABCD抑菌圈直径(mm)111117.00212227.30313336.90421227.55522337.35623117.30731336.95832117」0933227.30七、实验报告写出每题的编写程序、输出结果,并根据题意对输出结果进行生物学解释。查看更多