- 2022-08-13 发布 |
- 37.5 KB |
- 88页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学基础(打印版)
统计学基础1\n统计学是一门关于用科学的方法收集、整理、汇总、描述和分析数据资料,并在此基础上进行推断和决策的科学。狭义的统计用来统指数据或从数据中得到的一些数字(信息)。统计学是怎样一门学科?2\n方差分析:确定“自变量”是否对“因变量”有重要影响相关分析:度量变量之间的相关程度回归分析:用数学公式表示自变量与因变量之间的数量关系我们将要学习——3\n常用统计学术语总体与样本根据研究目的确定的研究对象的全体称为总体(population),其中的一个研究单位称为个体(individual);总体的一部分称为样本(sample)。如:研究某一班学生的身高,所有学生身高的观测值的全体就构成该班学生的身高总体;而观测15名学生身高所得的15个观测值则是全班学生的身高总体的一个样本,这个样本包含有15个个体。4\n变量与常数相同性质的事物间表现差异性或差异特征的数据称为变量或变数。自然界的同类事物中,都存在一定的变异,如人的身高、体重等。常数表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的,如某样品的平均数、标准差等。常用统计学术语5\n参数与统计量为了表示总体和样本的数量特征,需要计算出几个特征数。由总体计算的特征数叫参数(parameter);由样本计算的特征数叫统计量(statistic)。常用希腊字母表示参数,例如用μ表示总体平均数;常用拉丁字母表示统计量,例如用x表示样本平均数。总体参数由相应的统计量来估计,例如用x估计μ。常用统计学术语6\n算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为。Excel中算术平均值函数:Average(N1,N2,……)常用统计量7\n标准差用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。如果各观测值变异小,则平均数对样本的代表性强;如果各观测值变异大,则平均数代表性弱。因而仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。常用统计量8\n统计量Σ称为均方(meansquare缩写为MS),又称样本方差,记为S2,即S2=相应的总体参数叫总体方差,记为σ2。对于有限总体而言,σ2的计算公式为:σ2μ)2/N常用统计量9\n统计学上把样本方差S2的平方根叫做样本标准差,记为S,即:相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为:σ=常用统计量10\nExcel中,样本方差函数:VAR(N1,N2,……)总体方差函数:VARP(N1,N2,……)样本标准差函数:STDEV(N1,N2,……)总体标准差函数:STDEVP(N1,N2,……)常用统计量11\n变异系数(方差系数)两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。标准差与平均数的比值称为变异系数,记为C·V。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。常用统计量12\n例1:下表给出了东风汽车和上海机场两种股票在12个交易日的价格,试比较两种股票价格的分散程度。常用统计量的应用实例日期东风汽车上海机场日期东风汽车上海机场200503103.1716.06200503182.9716.52200503113.1616.55200503212.9416.65200503143.1017.27200503222.7117.17200503153.1016.82200503232.7416.90200503163.0916.60200503242.7616.86200503173.0216.65200503252.7516.7913\n由上表可求出:常用统计量的应用实例上海机场股价分散程度小于东风汽车股价分散程度。14\n例2:某公司研制出了A、B、C、D4种新型生产设备,让6个熟练工人分别操作相同的时间,统计他们生产的零件数量如下表所示,试在0.01的显著水平下检验这4种设备单位时间生产的零件是否存在显著差异。方差分析A754650567348B475065724649C485052464965D68484963517015\n例3:为考察温度对某一化工产品得率的影响,选了5种不同的温度,同一温度下各做3次试验,测得结果如下表。试问温度对得率有无影响(α=0.05)方差分析温度(℃)6065707580得率(%)90979684849293968386889293888216\n例2的结果显示,不同的机器单位时间生产的零件数量是不一样的,而这种差别是由于机器不同还是其它原因引起的?例3中不同的得率是因为温度的不同引起的,还是由于误差或其它原因引起的?单纯从平均数,我们无法判断不同的机器加工或不同的温度是否对结果造成显著的影响。方差分析17\n方差亦称均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得出一系列不同的观测值。造成观测值不同的原因是多方面的,有的是处理不同引起的,叫处理效应或条件变异,有的是试验过程中偶然性因素的干扰和测量误差所致,这一类误差称试验误差。方差分析的基本思想是将测量数据的总变异按照变异原因不同分解为处理效应和试验误差.并作出其数量估计。方差分析简介18\n通过方差比较以确定各种原因在总变异中所占的重要程度,即用处理效应和试验误差在一定意义下进行比较,如二者相差不大,说明试验处理对指标影响不大,如二者相差较大,处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。除处理效应外,剩余变异就是由试验误差引起的,从而作为统计推断依据,由此在试验中选择合适的试验处理或确定进一步试验的方向。方差分析简介19\n方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。方差分析简介20\n在单因素方差分析中,影响总体均值的因素只有一个。与单因素方差分析对应的是单因素试验。在单因素试验中,因素有k个水平,获得k组独立的样本观测值,每组观测值包含的数目为n。单因素方差分析21\n单因素试验的结果以k行n列表示,对应每个结果(元素)为xij,如下表:单因素方差分析水平(因素不同取值)结果(元素)值均值水平1x11,x12,……,x1nx1水平2x21,x22,……,x2nx2…………水平kxk1,xk2,……,xknxk总均值x22\n首先在单因素试验的基础上,求出总方差SST、组间方差SSt、组内方差SSe。总方差组间方差组内方差单因素方差分析方法23\n从公式中可以看出,总方差衡量的是所有观测值xij对总均值x的偏离程度;组内方差衡量的是同一处理内的观测值xij对该组均值xi的偏离程度,反映随机误差的大小;组间方差衡量的是组均值xi对总均值x的偏离程度,反映系统误差的大小。单因素方差分析方法24\n在此基础上,得到组间均方差和组内均方差:组间均方差组内均方差单因素方差分析方法25\n在方差相等的假定下,要检验k个总体的均值是否相等,须首先给定原假设和备择假设。原假设H0:均值相等,即μ1=μ2=…=μk备择假设H1:均值不完全相等单因素方差分析方法26\n构造F统计量:该统计量服从分子自由度为k-1,分母自由度为k(n-1)的F分布。单因素方差分析方法27\n给定显著性水平a,如果根据样本计算出F统计量小于等于临界值Fa(k-1,kn-k),则说明原假设H0成立,总体均值相等,样本的差异仅仅是因为随机误差引起;而如果F统计量的值大于临界值Fa(k-1,kn-k),则说明原假设H0不成立,总体均值不完全相等,样本的差异并非仅由随机因素引起。单因素方差分析方法28\n例2:某公司研制出了A、B、C、D4种新型生产设备,让6个熟练工人分别操作相同的时间,统计他们生产的零件数量如下表所示,试在0.01的显著水平下检验这4种设备单位时间生产的零件是否存在显著差异。方差分析实例A754650567348B475065724649C485052464965D68484963517029\n(1)计算平均值总平均值组内平均值方差分析实例30\n(2)计算总方差、组间方差、组内方差方差分析实例31\n(3)计算均方差方差分析实例32\n(4)计算F统计量(5)显著性检验查表,查出F0.01(3,20)=4.94,因F查看更多