- 2022-08-13 发布 |
- 37.5 KB |
- 30页



申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学(sas复习总结)
sas\n程序步分为两种:数据步(datastep)data:数据步的开始、命名要创立的数据集。Input:确定输入的数据所对应的变量。cards:输入数据。过程步(procstep)proc:过程步的开始。Output:输出过程步运行结果\nSet语句:1、引用数据集2、纵向合并数据集(合并时不会根据id进行匹配)merge语句:横向合并数据集(合并时会根据id变量匹配)\n常用统计描述过程\nprocfreq:调用freq过程列频数分布表。procmeans:调用means语句对变量进行简单的统计描述。procunivariate:调用univariate过程对变量进行详细统计描述。table:指出列表变量,并生成包含频数表数据的数据集。var:指出分析变量。\nhistogram:指明对绘制直方图所用的数据变量并绘图。procgchart:调用ghart过程绘图。pie:绘制圆饼图gplot:绘制散点图plot:指出绘图的纵坐标和横坐标\n二项分布Poisson分布正态分布\nPDF函数:求概率密度二项分布P(X)=PDF(“Binomial”,X,Prob,N)Poisson分布P(X)=PDF(“Poisson”,X,Lamda)\n计算累计概率密度的常用函数二项分布Poisson分布\n如求X服从二项分布,则P(X=k)=probbnml(p,n,k)-probbnml(p,n,k-1)=PDF(“Binomial”,k,p,n)如X服从泊松分布,则P(X=k)=Poisson(p,k)-Poisson(p,k-1)=PDF(“poisson”,k,p)。求概率密度函数的两种方法\nCDF函数:求正态分布累积概率密度的函数cdf(‘NORMAL’,k,mean,std):用于计算均数为mean,标准差为std的正态分布的随机变量x≤k的累积概率。probnorm函数:标准正态分布函数probnorm(u):求出从-∞到u位置的面积大小Probit函数:求标准正态分布的Z值的函数probit(prob):求出从-∞到Z的位置面积为prob时的Z值SAS中常用的正态分布相关函数\nCDF函数:求正态分布累积概率密度的函数cdf(‘NORMAL’,k,mean,std):用于计算均数为mean,标准差为std的正态分布的随机变量x≤k的累积概率。probnorm函数:标准正态分布函数probnorm(u):求出从-∞到u位置的面积大小Probit函数:求标准正态分布的Z值的函数probit(prob):求出从-∞到Z的位置面积为prob时的Z值常用的正态分布相关函数\n置信区间总体均数的可信区间t分布法SAS函数:TINVt=TINV(p,df)可求t分位数的函数,p是从-∞到当前t分位数位置的面积。df=n-1(自由度)\nT检验\n(均数、标准差、标准误、t检验)procmeansmeanstdstderrtprt;varx;run;procunivariatenormal;varx;run;procttestH0=40.4;vara;run;方法1方法2方法3\nProcunivariatenormal*进行正态性检验procttest:调用ttest过程进行t检验paired:指出t检验重要比较的变量对class:指出分类变量\n方差分析\nPROCANOVA的过程格式PROCANOVA;CLASS变量表;MODEL因变量表=效应;MEANS效应〈/选择项〉;\nPROCGLM的过程格式PROCGLM;CLASS变量表;MODEL因变量表=效应;MEANS效应〈/选择项〉;\n五、方差分析所用的过程ANOVA过程(AnalysisOfVariance)GLM过程(GeneralLinearModel)Hovtest使用levene检验选项bartlett:使用bartlett方法选项snk:使用snk方法选项bon:使用bonferroni方法选项dunnett:使用dunnett方法(要注明对照组)Treat:处理组block:区组\n卡方检验\nprocfreq;tablesr*c/chisqexpectedexact;weightf;run;注:1.tables语句中的chisq选项指定进行卡方检验,expected选项指定输出理论频数2.exact输出确切概率/四格表资料不加此选项也可以输出确切概率3.weight语句指定权重变量为f\n注:agree选项进行mcnemar检验与一致性检验;exactmcnem语句进行mcnemar检验同时输出确切概率,适用于b+c<40的情况。procfreq;tablesr*c/agree;exactmcnem;weightf;run;\n非参数检验\nPROCNPAR1WAY过程格式PROCNPAR1WAYWilcoxon;CLASS变量;VAR变量表;Freq频数变量;RUN;*调用npar1way进行非参数检验(秩和检验)\n相关分析\n线性相关proccorr秩相关proccorrspearman分类变量的关联性分析(属两种属性独立性的χ2检验——定性变量之间的联系:查看Chi-Square和ContingencyCoefficient)\n线性回归\nprocreg;modely=x/clmcliclb;ploty*x/confpred;run;注:model语句,建立自变量对因变量的回归方程,等号的左边表示因变量y,等号的右边表示自变量x;选项clm指定输出预测值95%的置信区间;选项cli指定输出95%的预测个体所在的范围;选项clb指定输出回归系数的95%置信区间。plot语句,指定输出以y变量为纵坐标x变量为横坐标的散点图,并拟合回归线,选项conf和pred指定输出95%的置信区间和95%的预测个体所在的范围的曲线。\n线性相关:proccorr;varxy;run;秩相关:proccorrspearman;varxy;run;列联相关:procfreq;weightf;tabler*c/chisqnocolnorownopct;run;回归分析:procreg;modely=x/clmcli;ploty*x/confpred;run;完。查看更多