- 2022-08-13 发布 |
- 37.5 KB |
- 37页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学 第一章 统计学的基础理论
统计分析与应用STATISTICS2021/9/41\n第一章统计学基础理论第二章列联分析第三章回归分析第四章方差分析第五章非参数检验第六章主成分分析与因子分析第七章聚类分析第八章模糊综合评判与模糊聚类分析2021/9/42课程内容\n《统计学》,贾俊平等,中国人民大学出版社,2009年11月第4版《统计学》,贾俊平等,中国人民大学出版社,2008年11月第3版《统计学—从数据到结论》,吴喜之著,中国统计出版社,2006年《例解商务统计学》,TerryF.Triola著,陈鹤琴等译,清华大学出版社,2001年2021/9/43主要参考书目\n2021/9/44第一章统计学的基础理论第一节统计学及其应用领域第二节统计数据第三节统计学的基本概念2021/9/44\n一、统计学的定义二、统计学的分科三、统计学的应用2021/9/45第一节统计学及其应用领域\n2021/9/462021/9/46一、统计学的定义统计学是一门关于搜集、处理、分析、解释数据并从数据中得出结论的科学。搜集数据运用统计调查方法,搜集研究所需的各种定性与定量数据处理数据根据研究的目的,将原始数据进行系统的加工和整理,使之符合分析研究的需要分析数据根据研究目的和要求,运用合适的统计分析方法,对数据进行科学分析,得出分析结论解释数据结合相关领域的专业理论,对统计分析结论进行必要的解释与说明,得出专业性的分析结论\n2021/9/47二、统计学的分科统计学的分科按方法构成分描述统计学推断统计学按方法应用分理论统计学应用统计学\n研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。主要内容:统计数据的搜集方法;数据的加工处理方法;数据的显示方法;数据分布特征的概括与分析方法等。描述统计学(DescriptiveStatistics)2021/9/48\n是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。主要内容:参数估计:利用样本信息推断总体特征假设检验:利用样本信息检验对总体的某个假设是否成立推断统计学(InferentialStatistics)2021/9/49\n是指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学理论。从事统计理论和方法研究的人员需要有坚实的数学基础。由于概率论是统计推断的数学和理论基础,因而广义地讲统计学也应该包括概率论在内。理论统计学(TheoreticalStatistics)2021/9/410\n是研究如何应用统计方法去解决实际问题。由于在自然科学及社会科学研究领域中,都需要通过数据分析来解决实际问题,因而,统计方法的应用几乎扩展到了所有的科学研究领域。应用统计学的不同分支所应用的基本统计方法都是一样的,即都是描述统计和推断统计的主要方法。但由于各应用领域都有其特殊性,统计方法在应用中又形成了一些不同的特点。应用统计学(AppliedStatistics)2021/9/411\n说出哪些领域运用统计,哪些领域不运用统计,都很困难几乎找不到一个不用统计的领域统计是适用于所有科学领域的通用数据分析方法只要有数据的地方,都会用到统计三、统计学的应用2021/9/412统计的应用一切社会科学领域一切人类生活领域一切自然科学领域一切生产活动领域\n一、数据的计量尺度二、数据的类型三、数据的来源四、数据的调查方式五、数据的调查方法六、数据的质量要求第二节统计数据2021/9/413\n一、数据的计量尺度2021/9/414根据调查对象的性质进行分类,各类之间是并列关系。定类尺度与等距量表是一个等级,但该尺度存在绝对“0”点,“0”在此处表示不存在,故可计算比率。测度多类别之间不同程度的顺序关系,存在类别差和顺序差。测度顺序和各顺序位置之间的距离。这种尺度不存存在绝对“0”点,“0”在此处是有意义的数字。定序尺度定距尺度定比尺度\n数据的类型计量尺度分类分类数据顺序数据数值型数据搜集方法分类观察数据试验数据时空属性分类截面数据时序数据混合数据2021/9/415二、数据的类型\n分类数据是只能归于某一类别的非数字型数据。如,人口的性别:男和女;产品类别:食品、衣着、家电等;顺序数据是只能归于某一顺序类别的非数字型数据。如产品的质量等级:一等品、二等品等;数值型数据是按数量尺度测量的数据。一般可直接进行加减乘除运算,且使用自然、物理、货币等单位计量。分类数据和顺序数据说明是事物的品质特征-----品质数据或定性数据;数值型数据是说明事物的数量特征----定量数据不同计量尺度的数据2021/9/416\n观测数据:通过调查或观察而搜集到的统计数据。如有关社会经济数据均为观测数据。试验数据:在试验中,利用监控手段,通过控制试验对象而搜集到的统计数据。如对医药疗效试验数据;生物成长的试验数据等。观测数据一般不能再生,只能通过观察得到;大多数试验数据来源于科学实验,一般可以重复取得。不同搜集方法的数据2021/9/417\n截面数据在相同或近似相同的时间点上搜集的数据;描述多个现象在某一时刻的变化情况;比如,2010年我国各地区的国内生产总值数据。时序数据在不同时间上搜集到的数据;描述一个现象随时间变化的情况;比如,1990年至2010年国内生产总值数据。混合数据在数据集中含有时间序列和截面数据成分的数据;描述多个现象随时间变化的情况;比如,1990年到2010年我国各地区的国内生产总值数据。不同时空属性的数据2021/9/418\n数据的来源间接来源直接来源专门调查科学实验三、数据的来源2021/9/419\n四、数据的调查方式2021/9/420数据调查方式普查典型调查重点调查抽样调查统计报表调查\n数据调查方法询问调查访问调查邮寄调查电话调查电脑辅助调查座谈会个别深访观察与实验观察试验五、数据的调查方法2021/9/421\n数据的质量要求精度最低抽样误差准确最小非抽样误差关联满足研究需要及时保证数据失效一致时间序列可比经济保证最低成本六、数据的质量要求2021/9/422\n一、总体和样本二、参数和统计量三、变量四、概率分布第三节统计学的基本概念2021/9/423\n总体就是根据一定目的确定的所要研究事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体,简称为总体。构成统计总体的个别事物则称为总体单位。样本从总体中抽取出来,作为代表这一总体的部分单位组成的集合体称为样本。一、总体和样本2021/9/424\n参数用来描述总体特征的概括性数字度量参数一般是未知常数统计量用来描述样本特征的概括性数字度量统计量是随机变量可以由样本数据计算出来二、参数和统计量2021/9/425\n说明现象某种特质的概念变量的取值称为变量值变量按取值特征不同,可分为离散变量与连续变量变量按计量尺度不同,可分为分类变量、顺序变量、数值型变量三、变量2021/9/426\n概率分布的理论十分丰富按涉及的对象不同,可分为总体分布、样本分布、抽样分布概率分布按精确程度不同,可分为精确分布与渐进分布按属性不同,可分为理论分布与经验分布按涉及的随机变量的性质不同,可分为离散变量的概率分布与连续变量的概率分布2021/9/427四、概率分布\n总体分布总体中各元素的观察值所形成的相对频数(频率)分布。分布通常是未知的(因为几乎得不到总体所有观察值),可以(根据理论分析)假定它服从某种分布样本分布一个样本中各观察值形成的相对频数(频率)分布,也称经验分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布抽样分布样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布总体分布、样本分布、抽样分布2021/9/428\n理论分布根据数学原理,所推导出来的随机变量的分布模型。对于离散随机变量,常用的理论分布模型有两点分布、二项分布、泊松分布、超几何分布;对于连续随机变量,常用的理论分布模型有正态分布、指数分布、均匀分布,以及由正态分布导出的分布、分布、分布(统计三大分布)。经验分布一个样本中各观察值形成的相对频数(频率)分布。这种分布是可知的,是一种实际发生的分布。理论分布与经验分布2021/9/429\n精确分布在总体X的分布类型已知时,若对任意自然数,都能导出统计量的分布的数学表达式,这种分布称为精确的抽样分布。它对样本量较小的统计推断非常有用。精确分布大多数是在正态分布情况下得到的。渐进分布在统计学的抽样分布理论中,至今已求出的精确分布并不多。抽样分布很难求,即便求出来精确的抽样分布,也因为过于复杂而难于应用。因此,人们往往寻求在样本量无限增大时统计量的极限分布,这种极限分布常称为渐进分布。精确分布与渐进分布2021/9/430\n正态分布分布分布分布常用概率分布2021/9/431\n如果连续随机变量X的密度函数为:则随机变量服从均值为,方差为的正态分布,记为标准正态分布:准则正态分布2021/9/432\n设随机变量相互独立,且服从标准正态分布,则它们的平方和服从自由度为的分布。记为分布的期望与方差分别为:分布的上侧分位值定义为:分布2021/9/433\n设随机变量,,且X与Y独立,则随机变量:服从自由度为的分布,记为随着自由度的增加,分布的密度函数越来越接近标准正态分布的密度函数。实际应用中,一般当n≥30时,分布与标准正态分布就非常接近。分布的数学期望与方差分别为分布2021/9/434\n设随机变量Y与Z相互独立,且Y和Z分别服从自由度为m和n的分布,则随机变量X:服从第一自由度为m,第二自由度为n的分布分布与分布存在如下关系:如果随机变量X服从分布,则X2服从的分布。分布的期望与方差分别为:分布2021/9/435\n2021/9/436\n2021/9/437查看更多