统计学考前复习大纲

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学考前复习大纲

第一章总论一、统计的概念:其实包括三种不同而又密切相关的涵义:即统计资料、统计工作和统计学。二、统计学:它是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。三、统计学的研究对象:(狭义)研究大量社会经济现象的总体数量方面,即社会经济现象的数量特征、数量关系、数量界限。四、统计学具有以下特点:数量性:统计研究过程是从数量上认识事物的性质和规律。总体性:指反映现象总体的数量特征。具体性:统计所研究对象的数量是具体的量。社会性:统计研究的数量是是社会现象的数量。五、统计研究全过程的基本环节:统计设计(它是整个统计研究的前期工程)、统计调查、统计整理、统计分析(其方法有两类:描述统计和推断统计)、统计资料的积累、开发与应用六、统计学研究的基本方法:(一)大量观察法:对要研究事物的全部或足够数量进行观察的方法。可使现象中非本质的偶然因素相互抵消,从而反映现象总体的数量特征。数理根据:大数规律,随机现象出现的基本规律,其一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。(二)统计分组法:是根据一定的研究目的和现象的总体特征,将调查得到的大量资料,按照一定的标志划分为不同性质或类型的组别,使组内的单位具有相对的同质性,组间的单位具有明显的差异性。适用于统计工作的全过程。(三)综合指标法:即用统计指标去概括和分析现象总体的数量特征和数量关系的方法。总体的前提条件:总体的同质性。七、统计的职能:信息职能、咨询职能(是前者职能的延伸)、监督职能(晴雨表作用)八、总体:它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。具有同质性、大量性、差异性特点。九、总体单位:是组成总体的性质相同的个别事物,叫总体单位,简称单位,也叫个体。十、总体和总体单位的关系:两者是相对而言的,随着研究目的和总体范围的不同而相互转化。同一个研究对象,在—种情况下为总体,但在另一种情况下又可能变成总体单位。十一、样本:是从总体中按随机抽取出来部分总体单位组成的集合体。样本容量是样本所包含的总体单位数。十二、标志:说明总体单位特征的概念或名称。说明总体单位数量特征的名称或概念,叫做数量标志;说明总体单位属性特征的名称或概念,叫做品质标志,品质标志不能用数值表示。十三、统计指标:说明总体数量特征的名称或概念及数值。构成要素:指标名称、指标数值、指标计量单位、计算方法、指标所属时间和空间。十五、指标与标志之间存在密切的联系:1、标志和指标的关系是个体和整体的关系。标志反映总体单位的属性和特征,而指标则反映总体的数量特征。统计指标是由各单位的标志表现汇总而来的。2、由于总体和单位的概念会随着研究目的不同而变化,在一定条件下,指标和标志之间存在一定的变换关系。因此指标与标志的概念也是相对而言的。十六、按说明的总体现象的内容不同统计指标可分为:数量指标:也称为总量指标,用绝对数来表示。反映现象或过程的总规模和水平。质量指标:是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系相对比关系。按表现形式划分:总量指标:反映现象的总规模、总水平。相对指标:反映现象之间的对比关系。平均指标:反映现象总体各单位某一数量标志的一般水平。按反映的时间状态划分:静态指标:反映即定时间上现象的规模、水平、数量关系等。动态指标:反映现象在一段时间内发展变化的情况。按数据的取值依据划分:客观指标:是对统计对象的实际度量或计算。主观指标:反映人们的主观感受十七、变异:是指标志的不同表现。标志变异可分为属性变异和数量变异变量:在统计中,说明现象的某一数量特征的概念被称为变量。包括可变的数量标志和统计指标。变量值是指变量的具体数值表现。十八、变量根据变量值连续出现与否:连续型变量、离散型变量。连续型变量:指其数值连续不断,在相邻的两个值之间可以无穷分割,可以用小数表示,也可以用整数表示。离散型变量:可按一定顺序一一列举其数值的变量。变量值只能表现为整数。根据变量的取值确定与否:确定性变量、随机变量确定性变量:是指变量值的变化受某种或某几种确定性因素的影响,其变化是沿着一定的方向呈上升或下降的变动。随机性变量:是指变量值的变化受某种或某几种不确定性因素的影响,其变化不是沿着一定的方向发展,而是带有很大的偶然性。第二章统计数据的搜集一、统计工作的四个中心阶段:统计设计、统计调查、统计整理、统计分析二、统计调查:是按照预定的统计研究的目的和任务,运用科学的调查方法与手段,有计划有组织地从客观实际采集数据的过程。主要是原始资料,同时也包括对次级资料的搜集三、对统计调查的要求:准确性、及时性、完整性四、数据计量尺度的种类:按计量的精确程度不同:定类尺度、定序尺度、定距尺度、定比尺度定类尺度:是最粗略、计量层次最低的计量尺度,它是按照客观现象的某种属性对其进行分类。定类尺度的主要数学特征是“=”或“≠”定类尺度各类别间是平等的,没有高低、大小、优劣之分。定序尺度:是对客观现象各类之间的等级差或顺序差的一种测度定序尺度的主要数学特征是“<”或“>”不仅可以将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。定距尺度:是对现象类别或次序之间间距的测度。不但可以用数字表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度的主要数学特征是“+”或“-”使用的计量单位一般为实物单位(自然或物理)或者价值单位。定比尺度\n:是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成的相对数(或平均数)用于反映现象的结构、比重、速度、密度等数量关系,主要数学特征是“x”或“÷”。五、统计调查的各种形式:按调查单位的范围大小分为:全面调查、非全面调查按调查时间是否连续分为:经常性(连续)调查、不连续调查按调查的组织方式不同分为:定期报表、专门调查(普查、重点调查、典型调查、抽样调查)六、统计数据的搜集方法(调查或实验):观察法、访问法、问卷法、报告法、实验法、卫星遥感技术(了解)七、统计调查方案的设计:确定调查目的和任务,确定调查对象与调查单位,确定调查项目,调查表格和问卷设计,确定调查时间、调查期限、调查空间、调查方法,调查的组织工作八、调查对象:指是某项调查中被研究的总体,它是由性质相同的许多调查单位组成的。调查单位:指构成调查对象的每一个总体单位。注意调查单位与填报单位的区别:当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集、整理,并向上报告时,填报单位与报告单位则不一致。九、调查时间:是指调查资料所属的时间。(包括时期时间和时点时间)调查期限:是指进行统计调查工作的起止时间,包括搜集和报送资料的整个工作所需要的时间。为保证统计资料的及时性,应尽量缩短调查期限。十、统计调查方式:统计报表、普查、抽样调查、重点调查、典型调查十一、统计报表:是按照国家有关法律的规定,自上而下的统一布置,自下而上地逐级定期提供基本统计资料的一种方式。按报表的性质和内容:基本统计报表:全国性,由国家统计局统一制发专业统计报表:由国务院由各业务主管、部门统一制发按填报单位:基层报表:由基层企事业单位填报的。综合报表:由上级主管部门和地方统计部门根据各基层单位提供的报表逐级汇总填报的报表。按报送周期:定期报表:日报、旬报、月报、季报、半年报、年报,报送年度资料十二、普查:专门组织的一次性全面调查。目的:掌握某些关系国情国力的重大事项的准确而全面的数据。特点:是专门组织的调查,是一次性调查,是全面调查。作用:可以为抽样调查提供抽样框,可以搜集统计报表所不能提供的反映重大国情国力的基本统计信息。局限:由于需要大量的人力、物力和财力,不宜经常进行。组织原则:规定统一的普查标准时点、选择合适的普查期限、普查方法步调一致、普查项目必须统一、重大国情普查应按一致周期进行。十三、抽样调查:按照随机原则从总体中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。特点:按随机原则抽取样本单位目的是推断总体的数量特征抽样误差可以事先计算并控制优点:能用较少的人力、物力和时间达到全面调查的目的调查资料的准确性较高、受人为干扰的可能性较小应用范围:1、总体范围大,单位数目多的调查对象。2、有破坏性的调查。3、用于在经济上不必要进行全面调查的对象。4、用于工业生产过程的质量控制。5、用来检查和修正全面调查资料。14.重点调查:为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料局限:只适用于客观存在着重点单位的情况优点:调查单位少,比较经济,资料比较详尽,方法灵活适用范围:总体中存在重点单位。只需要了解总体基本情况15、典型调查:在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行调查的一种非全面调查组织方式。特点:调查单位是根据调查目的有意识地选择出来的、调查单位少,便于作深入细致的调查、典型调查可以深入了解与事物发展有关的各种实际情况典型单位的选择:划类选典、取中选典、突出选典注意事项:要根据不同的调查目的和要求选择不同的典型、根据调查对象的不同特点来选择调查类型、关键要保证所选的典型单位有充分的代表性作用:深入研究某些重大问题、可以用来研究新生事物、用来研究同类事物发展变化的一般规律和趋势、结经验和教训、估算总体数量特征,验证全面调查数字的真实性局限:不能确定推断的把握程度,无法计算和控制推断误差十六、统计数据的误差:统计数据的误差是指统计数据与客观现实之间的差距种类:1、登记性误差:由于调查者或被调查者的人为因素所造成的误差。理论上讲可以消除。2、代表性误差:用样本数据进行推断时所产生的误差。通常无法消除,但事先可以进行控制和计算。十七、统计数据的质量要求:精度、准确性、关联性、及时性、一致性、最低成本第三章统计数据的整理一、统计分组:是指根据事物的特点和统计研究的目的,选择一定的分组标志将统计总体区分为若干性质不同的组成部分的统计研究方法。统计分组必须遵循两个原则,穷尽性原则和互斥性原则。作用:1、区分社会经济现象的性质和不同类型。2、反映现象总体的内部结构。3、分析现象之间的依存关系。二、统计分组的种类:1、按品质标志分组和按数量标志分组2、简单分组和复合分组:简单分组:即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。复合分组:是指对所研究的总体按两个或两个以上的标志层叠或交叉起来分组。可用于对事物多方面、多层次的分析研究。\n三、统计分组的方法:统计分组的关键问题是要如何选择分组标志和划分各组之间的界限问题。选择分组标志,就是要确定将统计总体区分为若干个性质不同组的标准或依据。划分各组边界,就是要在分组标志的变异范围内,划定出各相邻组之间的性质界限和数量界限。四、次数分布:在统计分组的基础上,将总体的所有单位按组归类整理,计算各组的单位数,并按组的顺序加以排列,就形成了说明总体单位总数在各组分配情况的次数分布,又称次数分配、分布数列或分配数列。总体单位数叫次数或频数,各组次数与总次数之比叫频率。有品质分布数列和变量分布数列,都有两个要素构成:组的名称(组别)和各组的单位数(频数,也称次数)。变量数列的种类:单项式数列:指每组变量值只有一个数值来表示所形成的数列。组距式数列:指在变数列中每个组是用一段变量值区间来表示的数列形式(等距数列、异距数列)五、编制分配数列的方法:将原始资料按数值大小依次排列、确定组距和组数、确定组限(上限不在内原则)、归类汇总、计算各组次数,编制组距数列六、统计表的构成:1、统计表的表式结构:从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。2、统计表的内容组成:统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标七、统计图的类型:直方图:首先建立直角坐标系,横轴代表分组变量,纵轴表示频数或频率。以各组距为宽,各组的频数或频率为高,绘制代表各组的直方块,便形成直方图。折线图:也称多边形图,是在直方图的基础上绘制。将每个直方块的顶端中点确定一点,然后将这些点用直线顺次相连,即形成折线图。起点通常放在距左边最低组半个组距的横轴上,终点通常放在距右边最高组半个组距的横轴上。曲线图:当变量数列的组数无限时,折线便表现为一条平滑曲线。曲线图的绘制方法与折线图基本相同,只是在连接各组次数坐标点时应当用平滑曲线。八、频(次)数分布图的类型:钟形分布:钟形分布的特征是“两头小,中间大”,即中间的变量值分布的次数多,靠近两边的变量分布的次数少,其曲线图宛如一口古钟。U型分布:U型分布的形状与钟形分布相反,靠近中间的变量值分布次数少靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。J型分布:J型分布有两种类型,一种是次数随着变量的增大而增多,另一种是成反J型分布,其次数随着变量的增大而减少。第四章总量指标和相对指标一、总量指标:是反映现象在一定时间、地点和条件下的总规模、总水平和工作总量的一种统计指标,又称为绝对数指标。分为两类:一是现象总体的总量,二是现象总量的增减量。总量指标按其反映现象总体总量的内容不同分为:总体单位总量:是反映总体中总体单位数目多少的绝对数指标。总体标志总量:是反映总体中各单位某一数量标志的标志值总和的绝对数指标。总量指标按反映的时间状况不同分为:时期指标:反映总体现象在某一段时期内所达到的总量。特点:(1)不同时期数值可以相加,且相加有意义。(2)指标数值大小与时间长短有直接关系;(3)指标数值通过连续登记取到。时点指标:反映总体现象在某一时刻所达到的总量。特点:(1)不同时点数值相加无意义;(2)指标数值大小与时间间隔长短没有直接关系;(3)指标数值通过一次性调查得到。二、相对指标:两个有联系现象的数值对比的结果,以反映事物间在数量上相互联系的形式和程度,也称相对数。两种表现形式:无名数、有名数。三、相对指标的类型:表格1六中相对数指标的比较不同时期比较同一时期比较不同现象比较同类现象比较动态相对数强度相对数不同总体比较同一总体中比较相对数部分与部分比较部分与总体比较实际与计划比较比例相对数结构相对数计划完成相对数课本P58-62,计算:计划完成相对指标第五章平均指标一、平均指标:在同质总体内,运用一定的方法将总体各单位在某一标志下的数量差异抽象化,以反映总体在一定时间、地点和条件下所达到的一般水平的统计综合指标,称之为统计均值,也称平均数。分类:从计算方法上看分为:数值平均数(算术平均数、调和平均数、几何平均数)、位置平均数(中位数、众数)从考查内容上看分为:静态平均数(根据分布数列计算)、动态平均数(根据时间数列计算)二、算术平均数与强度相对指标的区别(把握):1、概念不同:强度相对数是两个有联系而性质不同的总量指标对比而形成相对数指标。算数平均是反映同质总体单位标志值一般水平的指标。2、主要作用不同:强度相对数反映两不同总体现象形成的密度、强度、普遍程度。算术平均数反映同一现象在同一总体中的一般水平。3、计算公式及内容不同:算术平均数分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一一对应的关系。而强度相对数是两个总体现象之比,分子分母没有一一对应关系。三、标志变异指标:指反映总体单位标志值分布特征的另一个重要的综合指标,它反映着总体各单位标志值的差异程度,即反映分配数列中以平均数为中心的各标志值变动范围或差异程度,又称标志变异程度。作用:1、利用标志变异指标,可以衡量平均数的代表性高低。\n2、标志变异指标可以反应研究总体的稳定性和均衡性。课本P70-92,计算:加权算术平均数、加权调和平均数、中位数、众数、标准差及其系数、偏度和峰度第六章抽样推断一、抽样调查:是按照随机原则从全部研究对象中抽取一部分单位进行观察,并依据获得的样本数据对全部研究对象的数量特征做出具有一定可靠性的估计和判断,以达到对现象总体认识的一种方法。特点:1、它是按照随机原则从总体中抽取样本。2、它是由部分推算整体的一种方法。3、抽样误差可事先计算并加以控制。二、抽样误差概念:在抽样调查中,误差是指调查所得结果与总体真实数值之间的差异。两个来源:登记性误差,在调查和汇总过程中由于观察、测量、登记、计算等方面的差异或被调查者提供虚假资料而造成的误差。代表性误差,用样本指标推断总体指标时,由于样本结构与总体结构不一致,样本不能完全代表总体而产生的误差。代表性误差又分为系统误差和随机误差两种:系统误差:是指由于非随机因素引起的样本代表性不足而产生的误差,表现为样本估计量的值系统性偏高或偏低,故也称偏差。抽样误差(随机误差):又称为偶然性误差,是指遵循随机原则抽样,由于随机因素(偶然性因素)引起的代表性误差。在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。影响抽样误差的因素有:总体各单位标志值的差异程度、样本的容量、抽样的方法、抽样调查的组织形式实际应用中,关于抽样误差,有三个密切联系而又相互区别的概念:实际抽样误差抽样平均抽样极限误差抽样平均误差:是所有可能组成样本的样本指标总体指标的平均离差,即所有样本指标的标准差。抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。作用:它反映了样本所有指标可能取值的离散程度,同时也反映了样本指标与总体指标的平均离差程度。抽样极限误差:指估计值同总体真值之间的可能范围,是抽样估计所允许的误差的上下界限。估计量优劣的标准:1、无偏性:是指样本估计量的均值应等于被估计总体参数的真值,即2、一致性:也称相合性,是指随着样本容量的增大,估计量越来越接近被估计的总体参数3、有效性:是指作为优良的估计量,除了满足无偏性外,其方差应比较小区间估计的要素:点估计值、抽样极限误、估计的置信度(可靠程度、概率保证程度)影响样本容量的因素:总体方差、允许误差范围、置信度、抽样方法、抽样组织方式抽样调查的组织形式:1、简单随机抽样:优点:简便易行。缺点:总体N或σ很大时,不能保证样本的代表性。2、分层抽样(类型抽样):特点:样本结构趋近于总体结构,提高了样本的代表性。降低了影响抽样平均误差的总体方差。总体方差由组间方差和组内方差所构成。类型抽样对于各个类型组是全面调查,组间方差可以不考虑,影响抽样误差的总体方差主要是组内方差。3、系统抽样(等距抽样):特点:组织简便,便于实施4、整群抽样:优点:方便,易于组织,比较节省调查费用。缺点:调查单位过分集中于少数群,代表性较低。整群抽样对抽样误差的影响分两种情况:1、如果总体小,群间方差大,则样本代表性降低,抽样误差增加。2、如果总体群内方差大,群间方差小,则样本代表性提高,抽样误差减少。为减少抽样平均误差,总体在分群时注意增大群内方差,降低群间方差。5、多阶段抽样:特点:便于组织、逐级抽样、方式灵活。课本P177-198,计算:抽样平均误差、点估计、区间估计(一定考)、简单随机抽样的平均误差、简单随机抽样的样本容量确定第七章时间序列分析一、时间数列的概念:把反映现象发展水平的统计指标数值,按照时间先后顺序排列起来所形成的统计数列,又称时间序列,动态数列。两个构成要素:现象所属的时间、与时间对应的统计指标数值。分类:据对时间序列(时期序列、时点序列)、相对时间序列(静态、动态)、平均数时间序列(静态、动态)编制原则:时间长短要统一、总体范围要一致、指标的经济内容应统一、各项指标的计算方法、计算价格和计算单位都应统一时间序列常用分析方法:1、指标分析法:通过时间数列的分析指标来揭示现象的发展变化状况和发展变化程度。2、构成因素分析法:通过对影响时间数列的构成因素进行分解分析,揭示现象随动态变化而演变的规律。二、一般平均数与序时平均数的区别:区别:1、计算的依据不同:前者是根据变量数列计算的,后者则是根据时间数列计的;2、说明的内容不同:前者表明总体内部各单位的一般水平,后者则表明整个总体在不同时期内的一般水平3、抽象的差异的性质不同:前者抽象的是总体内不同单位之间的差异;后者抽象的是同一总体不同时间上数值之间的差异。三、长期趋势:指客观现象由于受某种基本因素的影响,在一段相当长时间内,持续向上或向下发展变化的趋势。联系:都是反映事物的一般水平。课本P102-112,计算:时间序列的增量分析、平均分析和速度分析课本P113-123,计算:一般最小平方法(长期趋势变动)、按季(或月)平均法(季节变动)第八章统计指数分析一、广义指数:凡用来反映社会经济现象数量变动的相对数,都可称为指数。狭义指数:指数是表明复杂经济现象总体数量综合变动的相对数。(不能直接相加的现象)二、指数的分类:\n按反映的现象范围分类(个体指数、总指数)按反映现象特征不同分(数量指标指数、质量指标指数)按指数的编制方法不同分(综合指数、平均数指数)按编制时选择的基期不同分(定基指数、环比指数)按反映的时间不同分类(动态指数、静态指数)三、指数的作用:1、综合地反映复杂经济现象总体的变动方向和程度。2、分析在复杂经济现象总体的变动中,各构成因素影响的大小。3、分析复杂经济现象总体的变化趋势和规律。课本P135-149,计算:综合指数(数量指标指数、质量指标指数)、因素分析(总量指标变动的两因素分析、平均指标变动的两因素分析)第九章相关与回归一、相关关系:指现象之间客观存在的不严格、不确定的数量上的相互依存关系。按相关的形式划分:线性相关:当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关。非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。按相关的程度划分:完全相关(即函数关系)、不完全相关、不相关按相关的方向划分:正相关、负相关按相关关系涉及的变量多少划分:单相关、复相关和偏相关。|r|<0.3不相关、0.3<|r|<0.5低度相关、0.5<|r|<0.8显著相关(中度相关)、0.8≤|r|高度相关二、相关分析:是用来研究变量之间相关密切程度与相关方向的一种统计分析方法。三、回归分析:是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。四、相关分析与回归分析的区别:1、在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。2、相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。3、相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。联系:相关分析是回归分析的基础和前提、回归分析是相关分析的深入和继续课本P210-220,计算:简单相关系数、简单线性回归方程
查看更多

相关文章

您可能关注的文档