- 2022-08-13 发布 |
- 37.5 KB |
- 21页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
《统计学》辅导纲要
《统计学》辅导纲要第一章绪论主要内容:1.统计的含义2.统计的特征3.统计研究对象的特点4.统计学中的几个基本概念重点掌握:1.统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。2.统计研究具有数量性和总体性两个重要的特征。统计研究的数量性特征表明统计是从数量方面入手来认识和反映现象的。数字是统计的语言。总体性是统计研究的另一个重要特点。所谓总体性,是指统计是从总体上反映和分析事物的数量特征,而不是着眼于个别事物。因为事物的本质和发展规律只有从整体上观察,才能做出正确的判断。个别事物由于受种种偶然因素的影响,其数量特征并不能代表整体。3.统计的研究对象具有如下的特点:(1)总体性。统计认识社会经济现象的数量方面必须是对总体现象的认识,而非对个体现象的认识。因为,只有通过对总体的数量方面的观察,才能发现现象存在的共性和规律性。(2)社会性。统计对象的社会性可以从三个方面进行考察,一是统计的认识对象是社会经济现象的数量方面,因而统计本身也就有了社会性。二是统计认识的主体是社会的人,人的阶级性(社会性)决定了认识立场和认识结论上的社会性。三是一切社会经济活动都和人的利益有关,不同的人群有着不同的利益和利益关系,因此人们相互间的利益分割和利益冲突,必将在统计上显示出来。4.统计学中的几个基本概念(一)总体和样本由许多性质相同的个别事物组成的整体,叫统计总体,简称总体。我们可以概括出统计总体的如下特征:(1)同质性:即构成总体的各单位必需在某一方面性质相同。(2)大量性:即总体应该由为数众多的单位构成。(3)差异性:即构成总体的各单位除了某一方面或几方面性质相同以外,必须在其他方面存在着差别,这是统计的必要条件。样本是指按照随机原则从同质总体中抽选出来的那部分单位组成的小的总体,是统计推断的基础。(二)标志和指标标志是说明总体单位特征的名称或概念,有数量标志和品质标志之分。说明总体单位数量特征的名称或概念,叫作数量标志;说明总体单位属性特征的名称或概念,叫作品质标志。说明总体特征的概念叫统计指标。一个完整的统计指标应包括指标名称、指标数值、指标计量单位、指标所属的时间和空间范围等要素。(三)变量和变量值\n自身变化会引起其他变量变化的量,叫自变量;受其他变量影响而变化的量,叫因变量。受某些确定性因素影响,现象的量会沿着某一方向持续变化,这样的量就是确定性变量。变量的连续性或离散性,是以变量值是否可以无限分割为标准的,即,凡是一个变量相邻的两个变量值之间可以继续分割,取得新的变量值,那么,这样的变量称为连续变量,第二章统计数据的收集主要内容:1.统计调查的种类2.统计调查的组织方式3.调查误差重点掌握:1.统计调查的种类(1)按组织方式分,有统计报表和专门调查两种方式统计报表是指国家有关部门制定,颁发的统计调查表,各填报单位按照规定的内容定期如实填报,提供统计资料。专门调查是指相对于统计报表调查方式的另一种调查方式。为了取得某些在统计报表中不具备的统计资料,就需要组织专门调查。专门调查的方式有普查、重点调查、抽样调查和典型调查等。(2)按调查对象包括的范围分,有全面调查和非全面调查两种方式全面调查是指对统计总体内的每一总体单位一一进行调查。非全面调查是指相对于全面调查而言的,它主要包括重点调查、抽样调查和典型调查。(3)按调查登记的时间分,有经常性调查和临时性调查两种方式经常性调查,随着调查对象情况的变化,随时将变化的情况进行连续不断地登记。临时性调查是间隔一定时间或不定期进行的调查。2.统计调查的组织方式我国统计调查的组织方式包括:普查、统计报表制度、重点调查、典型调查、抽样调查。普查和统计报表制度属于全面调查,抽样调查、重点调查、典型调查属于非全面调查。3.调查误差(1)登记性误差登记过程的重复、遗漏,记录失误,调查者记忆不清而回答错误,故意瞒报、虚报等造成登记性误差。(2)用总体中的部分单位推算总体时必然产生代表性误差第三章统计数据的整理主要内容:1.统计分组的方法重点掌握:根据分组标志的特征不同,统计总体可以按品质标志分组,也可以按数量标志分组。(一)按品质标志分组按品质标志分组是指反映事物属性差异的品质标志作为分组标志进行分组,并在品质标志的范围内划定各组界限,将总体划分为若干个性质不同的组成部分。(二)按数量标志分组\n按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志进行分类,在数量标志的变异范围内划定各组界限,将总体分为性质不同的若干组成部分。数量标志包含的数据类型就是定量数据。根据总体各单位某一数量标志值的变动特征,可供选择的分组方式有以下两种:(1)单项式分组单项式分组即按每一具体的变量值分组。(2)组距式分组组距式分组即在变量值的变动范围内,将其划分为几个区间,把变量区间内的所有变量值作为一个组,这种用变量的一定地区代表一个组的分组方法称为组距式分组。第四章数据分布特征的测度主要内容:1.集中趋势的测度2.离散程度的测度3.偏态与峰度的测度重点掌握:集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。反映数据集中趋势的测度值主要包括:众数、中位数、分位数、均值。1.众数是指总体中最常见的标志值,在次数分布数列中,就是出现次数最多的变量值,用表示。它主要用于测度定类数据的集中趋势,当然也适用于作为定序数据以及数值型数据集中趋势的测度值。在单项分配数列中即未分组的数列中,确定众数比较容易,直接能观察出来,出现次数最多的那一组变量值就是众数。在组距分配数列中即分组的数列中,根据分配数列次数最多的组确定为众数所在组,还要根据该组与前后相邻两组分配次数的关系推算众数。2.中位数是指对样本数据由小到大排序后,处于中间位置上的变量值,用表示。中位数是一个位置代表值,它主要用于测度定序数据的集中趋势。首先把n个单位的变量值按大小顺序排列,然后计算中位数所在的位次,其公式为:中位数位置=。如果总体单位数n是奇数,则居于中间位置的变量值是唯一确定的,这个位置的变量值就是中位数。如果总体单位数是偶数,则居于中间位置的变量值不是唯一确定的,应该是中间位置的两个变量值的算术平均数为中位数。即:\nM=X3.数值平均数是根据总体各单位所有变量值计算而得的平均指标,它包括算术平均数、调和平均数、几何平均数等。算术平均数又称均值,是全部数据的算术平均值。它在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于定居数据和定比数据,但不适用于数值型。其基本计算公式是:根据资料不同,计算算术平均数有简单算术平均数和加权算术平均数两种。根据未经分组整理的原始数据计算算术平均值,分子是有各单位标志值即变量值简单加总的结果,因此称它为简单算术平均数。设一组数据为,则均值的计算公式如下:调和平均数也称调和均值,是均值的另一种表现形式。在实际工作中,由于所获得的数据不同,有时不能直接采用均值的计算公式来计算平均数,这就需要使用调和平均数的形式进行计算。(4.8)这就是调和平均数公式,式中表示调和平均数。4.几何平均数是n项变量值连乘积的n次方根。几何平均数适合于计算现象的平均比率或平均速度,反应现象增长率的平均水平。因此,凡是现象的变量值的连乘积等于总比率或总速度,都可以使用几何平均数来计算平均比率或平均速度。简单几何平均数适用于计算未分组数列的平均比率或平均速度,其计算公式为:加权几何平均数对于分组数列,应该采用加权几何平均数计算其平均比率或平均速度,其计算公式为:\n离散趋势反映的是各变量值原理其中心值的程度,因此也称为离中趋势,是要求出一个值来表示个案与个案之间的差异情况。这种测量法与集中趋势一起分别从两个不同的侧面描述和揭示一组数据的分布情况,与集中趋势测量法有互补的作用5.异众比率()就是非众数的次数与全部个案数目的比率。可见异众比率是对众数的补充,异众比率越小,说明众数的代表性越好;反之,异众比率越大,则说明众数的代表性越差。公式如下:其中为众数的频数,为变量值的总频数。6.全距又称极差,它是一组数据中最大值与最小值之差。全距是对定序及以上尺度的变量离散程度的测量。极差越小,表明资料越集中,集中趋势统计量的代表性越高。计算全距的一般公式为:7.方差和标准差是衡量变异程度最常用的指标,方差通常用表示。对于未经整理的原始数据公式为:对于组距分组数据公式为:标准差又称均方差,方差的平方根即为标准差,通常用表示,分析定距变量的离散情况,最常用的方法是标准差。未分组数据:组距分组数据:8.\n离散系数是一种相对的离散量数统计量,它使我们能够对同一总体中的两种不同的离散量数统计量进行比较,或者对两个不同总体中的同一离散量数统计量进行比较。离散系数是标准差与平均数的比值,用百分比表示。记离散系数为V,则公式为:9.利用众数、中位数和平均数之间的关系就可以判断分布是对称、左偏还是右偏,但要测度偏斜的程度则需要计算偏态系数。统计分析中测定偏态系数的方法很多,一般采用矩的概念计算,其计算公式为三阶中心矩与标准差的三次方之比。具体公式如下:式中:为偏态系数。10.峰度是分布集中趋势高峰的形状。在变量数列的分布特征中,常常以正态分布为标准,观察变量数列分布曲线顶峰的尖平程度,统计上称之为峰度测度。测度峰度的方法,一般采用矩的概念计算,即运用四阶中心矩与标准差的四次方对比,以此来判断各分布曲线峰度的尖平程度。公式如下:式中:为峰度系数。第五章时间数列统计分析主要内容:1.时间数列的含义和分类2.时间数列的水平分析3.时间数列的速度分析4.动态数列的因素分析重点掌握:1.时间数列是某一指标数值按时间先后顺序加以排列而形成的统计序列。由于时间数列从动态上反映社会经济现象的数量发展变化,所以又称动态数列。时间数列按指标性质的不同,可分为总量指标数列、相对指标数列、平均指标数列。其中总量指标数列是最基础的,后两种数列是由其派生出来的。总量指标时间数列也称绝对数时间数列,是由总量指标按时间的顺序排列而成的数列。它反映现象在不同时间上所达到的规模、水平或工作总量。总量指标时间数列按指标所反映的时间状况不同又可分为时期数列和时点数列。(1)时期数列:各项数\n据都是按一定时期测算的数值。它具有时间量纲(如一月、一季或一年),反映事物在一段时期(过程)内的发展总量。(2)时点数列:数列中各项数据都是在一定时点上测算的数值,常表现为时点数。反映事物在某一时刻(瞬间)所达到的状态。(3)相对指标数列按时间先后顺序排列形成的数列称为相对数时间序列。它反映社会经济现象之间数量对比关系的发展变化过程。(4)平均数时间数列是由一系列同类平均指标按照时间的先后顺序排列而成的时间数列。它反映的是社会经济现象一般水平的发展过程及其变动趋势。与相对指标时间数列类似,它也是由两个总量制表时间数列对比形成的派生数列。2.时间数列的水平指标主要有:发展水平、平均发展水平、增长量(水平)、平均增长量。(1)发展水平是指时间数列中的每一项具体指标数值,它反映了某种社会经济现象在不同时间上所达到的水平,也是计算各项时间分析指标的基础。发展水平一般是时期或时点总量指标,如销售额、在册工人数等;也可以是平均指标,如:平均工资、单位产品成本等;还可以是相对指标,如:计划完成程度、商品流转次数等。(2)平均发展水平又称之为序时平均数,它是将整个时间数列作为一个整体,反映这个整体的一般水平。3.时间数列反映了一个现象的动态过程,因此通过数量对比便可以分析现象数量上变化的程度。增长量指标是反映现象数量变动的常用指标,它是指某种社会经济现象在一定时期内增长或减少的绝对数量。它等于报告期水平与基期水平之差。其计算公式为:增长量=报告期水平–基期水平由于对比的基期不同,增长量有逐期增长量(也称“环比增长量”)和累计增长量(也称“定基增长量”)两种,逐期增长量是两个相邻时期发展水平之差,即:逐期增长量=报告期水平-前一期水平累计增长量是表示某种社会现象在一定时期内(从固定基期到报告期)累积增长的总量。其计算公式为:累积增长量=报告期水平-某一固定基期水平用公式表示即为:逐期增长量=a1-a0,a2-a1,……,an-an-1累计增长量=a1-a0,a2-a0,……,an-a04.根据时间数列反映现象发展变化的速度指标有:发展速度和增长速度,平均发展速度和平均增长速度。(1)发展速度是以相对数形式表示的动态指标,是两个不同时期发展水平指标对比的结果。主要用来说明报告期的水平是基期水平的百分之几或若干倍。公式为:发展速度=报告期水平/基期水平,计算公式为当发展速度大于1时,说明报告期水平较基期上升;发展速度小于1,说明报告期水平较基期下降;当发展速度等于1时,则报告期水平和基期持平。发展速度由于采用的基期不同,可分为定基发展速度和环比发展速度。定基发展速度是报告期水平与某一固定时期水平之比,说明社会经济现象在一个较长时期内的变动程度;环比发展速度是各期水平与前一期水平的对比,表明报告期的水平对比前一期水平的逐期发展变化的情况,用算式表示为:环比发展速度:定基发展速度:\n 很显然,定基发展速度等于相应各时期环比发展速度的连乘积。(2)增长速度是表明社会现象增长程度的时间相对指标,它是根据增长量与其基期水平对比求得。增长速度为正,说明现象数量的增长程度,增长速度为负,反映现象数量的减少程度即负增长。与发展速度一样,增长速度也有定基增长速度和环比增长速度之分。定基增长速度是指报告期的累积增长量与某一固定基期水平之比。它表明社会经济现象在某一较长时期内总的相对增长速度。其计算公式为:定基增长速=报告期累计(定基)增长量/固定基期发展水平=(报告期发展水平-固定基期发展水平)/固定基期发展水平=定基发展速度—100%环比增长速度是指报告期逐期增长量与前一期水平之比,它表明社会经济现象逐期的相对增长方向和程度。其计算公式为:环比增长速度=报告期逐期增长量/上一期发展水平=报告期逐期(环比)增长量/上一期发展水平=(报告期发展水平-上一期发展水平)/上一期发展水平=环比发展速度—100%(3)平均发展速度就是各期环比发展速度的序时平均数,用以说明现象在较长时间内发展变化的平均速度。平均发展速度的常用计算方法有水平法和累积法两种。水平法。也称几何平均法。由于总速度不等于各年环比发展速度之和,而是等于各年环比发展速度之连乘积,所以要用几何平均法来计算。方程式法也称累计法。它的实质是要求在最初水平a基础上,各期按平均发展速度计算所得的水平之和,应等于同期实际水平之和。即:a+a+…+a=a+a+…+a(4)平均增长速度是说明现象在较长时期内逐期平均增长的相对程度。显然,从含义上看,它是环比增长速度的统计平均,是平均发展速度基础之上减100%。即:平均增长速度=平均发展速度-100%5.事物的发展变化同时受多种因素的影响,在诸多影响因素中,有些对事物的发展起着长期的、决定性的作用,致使事物的发展呈现出某些趋势和一定的规律性,各类事物普遍存在的影响因素,构成动态数列的共有因素,按它们的性质和作用,可以归纳为长期趋势、季节变动、循环变动和随机变动四种。(1)长期趋势(以T表示):长期趋势是指由于某种本质因素的影响,现象在相当长的时间内,呈现的持续上升或下降的发展势态。它是现象在一段时间内发展变化的规律性表现,是动态数列分析的重点。(2)季节变动(以S表示):季节变动是指动态数列受自然因素和社会因素影响而发生的有规律的周期性波动。季节变动的周期通常为一年。(3)循环变动(以C表示):循环变动是指现象以若干年为一周期,近乎规律性从低至高再从高至低的周而复始变动。循环波动不同于趋势变动,它不是朝着单一方向的持续运动。而是涨落相间的交替波动。(4)随机变动(以I表示):随机变动亦称不规则变动或剩余变动,是动态数列除了上述三种变动之外剩余的一种变动,是偶然因素引起的一种随机波动。\n第六章假设检验主要内容:1.假设检验的一般问题2.方差已知条件下的总体均值检验3.方差未知条件下的总体均值检验重点掌握:1.统计假设:就是对总体的分布类型或分布中某些未知参数作某种假设,然后由抽取的子样所提供的信息对假设的正确性进行判断的过程。总体参数包括总体均值、比例、方差等。假设检验:是事先对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程。特点是采用逻辑上的反证法和依据统计上的小概率原理。假设检验的基本步骤(1)根据实际问题提出原假设H0及备择假设H1(2)构造一个合适的检验统计T或者Z统计量等(3)对于给定的检验水平a,查表确定分位数(临界值)λ(4)由样本值x1,x2,…,xn计算统计量之值T(5)将T或者Z与临界值比较,作出判断,以T双侧检验为:当|T|>Ta/2(或T>Ta/2或T查看更多
相关文章
- 当前文档收益归属上传用户