应用统计学zuizhongban

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

应用统计学zuizhongban

中国地质大学院系:班级:学生姓名:学号:指导老师:\n一.1.求出性别、工资等级的频次分布表,性别的众数、工资等级的中位数,并用工资等级做条形图。(1)性别、工资等级的频次分布表FREQUENCIES VARIABLES=性别 工资/ORDER=ANALYSIS.\n(2)性别的众数FREQUENCIES VARIABLES=性别 /STATISTICS=MODE/ORDER=ANALYSIS.(3)工资等级的中位数FREQUENCIES VARIABLES=工资 /STATISTICS=MEDIAN/ORDER=ANALYSIS.(4)工资等级条形图FREQUENCIES VARIABLES=工资/BARCHART FREQ /ORDER=ANALYSIS.\n2.求工资的均值、最大值、最小值、标准差、四分位数、十分位数,并用工资做带正态曲线的直方图。(1)工资的均值、最大值、最小值、标准差。FREQUENCIES VARIABLES=工资  /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN/ORDER=ANALYSIS.\n(1)工资的四分位数、十分位数.FREQUENCIES VARIABLES=工资FREQUENCIES VARIABLES=工资  /NTILES=4/NTILES=10/ORDER=ANALYSIS./ORDER=ANALYSIS.(2)工资的带正态曲线的直方图FREQUENCIES VARIABLES=工资/HISTOGRAM NORMAL /ORDER=ANALYSIS.\n3.求工资的峰度、偏度,对照带正态曲线的直方图理解结果。FREQUENCIES VARIABLES=工资  /STATISTICS=SKEWNESS SESKEW KURTOSIS SEKURT/ORDER=ANALYSIS.偏度系数为0.534,为正值,说明工资的分布为右偏分布。所以在直方图上,更多的分布在右边。\n峰度系数为-0.950,为负值,说明工资的分布为扁平分布,数据的分布越分散。所以在直方图上,曲线呈扁平状。3.对工资进行探索性分析。用Excel创建数据透视表:(1)在表的行变量中给出年龄(2)在列变量中给出职称(3)对工资进行交叉汇总求和项:工资职称年龄1234总计2545501900645026160016002716001600287450745029585058503079507950322000200033150045006000349850450014350351220012200364000400037305030503864004200106004533003300463300330048142001420050340034005150005000总计9250251504150036400112300二.1.某年中国10省市人均国民收入(3577,2981,1148,1124,1080,1383,1628,4822,1696,1717),单位:元,试建立该组数据的95%置信区间。EXAMINE VARIABLES=人均国民收入  /PLOT NONE  /STATISTICS DESCRIPTIVES  /CINTERVAL 95\n  /MISSING LISTWISE/NOTOTAL.故置信区间为[1213.55,3017.65]2、现有一组样本观察值(10.01,10.02,10.02,9.9)。假设原假设µ=10,检验该H0是否正确。T-TEST  /TESTVAL=10  /MISSING=ANALYSIS  /VARIABLES=观察值/CRITERIA=CI(.9500).由于0包含在置信区间(-0.1587,0.3137)内,不能拒绝原假设。既没有证据表明总体均值=10是错误的。3、\n某工厂为检验不同包装商品的销售效果,随机抽取样本,问不同包装的商品销售是否有显著性差异?(α=0.05)SUMMARY组观测数求和平均方差列1433182.7526.25列243609031.33333列3429974.7536.91667方差分析差异源SSdfMSFP-valueFcrit组间465.52232.757.3888890.0126284.256495组内283.5931.5总计74911    结论:由于P=0.012628<0.05,故拒绝原假设,表明不同包装的商品销售是有显著性差异的4.施肥方式和水温对产量的影响各自是否显著?(α=0.05)方差分析:无重复双因素分析SUMMARY观测数求和平均方差行1360201行2345151行3330101行432171列145313.2532.91667列245112.7528.25列34521339.33333方差分析差异源SSdfMSFP-valueFcrit行29439878.43.34E-054.757063列0.520.250.20.8239755.143253误差7.561.25\n总计30211    结论:由于F=78.4大于临界值4.757063,所以拒绝原假设,表明水温对产量有显著性影响。由于F=0.2小于临界值5.143253,所以不拒绝原假设,不能认为施肥方式对产量有显著性影响。如果用P-value进行分析,所得结论也是一样。用于检验行因素的P-value=3.34E-05小于a=0.05,所以拒绝原假设;用于检验列因素的P-value=0.823975大于a=0.05,所以不拒绝原假设5.其进行一元线性回归分析。若2005年国内生产总值GDP达到80亿元,试对其货运周转量做出区间预测由散点图可以大致看出GDP跟货运周转量之间的关系大致是线性的。SUMMARYOUTPUT回归统计MultipleR0.842872RSquare0.710433AdjustedRSquare0.698368标准误差6.937899观测值26方差分析 dfSSMSFSignificanceF\n回归分析12834.2732752834.27358.882436.5457E-08残差241155.22672548.13445总计253989.5   Coefficients标准误差tStatP-valueLower95%Upper95%Intercept10.292733.1390771013.2789040.0031713.81399516916.77147XVariable10.4853710.0632529277.6734896.55E-080.3548230090.615918P-value小于0.05故回归方程为:Y=0.485371x+10.2973当GDP为80亿元时,货运周转量的点估计值y=0.485371*80+10.2973=49.1货运周转量95%的置信区间为49.1±6.937899*1.98*1.1=49.1±15.8即33.3≤y≤64.9
查看更多

相关文章

您可能关注的文档