- 2022-08-13 发布 |
- 37.5 KB |
- 38页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学原理全套教案
•统计学原理第一章绪论教 学 目 的本章对统计学的基本问题进行了介绍,如统计学的研究对象、统计学的研究方法、统计工作过程、统计的职能、统计组织以及统计学的一些基本概念等等。本章的教学目的是,通过学习对统计学科的性质有一个基本的认识。一,统计一词的三种涵义及相互关系:统计工作、统计资料、统计学1,统计工作统计实践活动,它是对社会经济现象数量方面进行搜集、整理和分析的活动过程。2,统计资料它是统计实践活动过程中所取得的各项数字资料以及与之相关的其它实际资料的总称。3,统计学统计学是关于认识客观现象总体数量特征和数量关系的科学统计工作与统计资料是统计实践活动与统计成果的关系统计工作与统计学是统计实践活动与统计理论的关系二,统计学的研究对象及其特点1,统计学的研究对象社会经济统计学的研究对象就是社会经济现象的数量方面,包括数量特征和数量关系2,统计学研究对象的特点社会性从质与量的辩证统一中来研究现象的量社会经济统计活动通过对社会经济现象总体数量的观察,来认识人类社会活动的条件、过程、结果,反映物质资料的占有关系、分配关系、交换关系以及其它社会关系总体性社会经济统计是以社会经济现象的总体数量特征作为自己的研究对象变异性社会经济统计研究的总体的数量特征不是一成不变的构成总体的总体单位的各种特征其表现是不相同的三,统计学的研究方法1,大量观察法大量观察法指统计研究社会经济现象和过程,要从总体上加以考察,就总体中的全部和足够多的单位进行调查观察并加以综合研究。2,统计分组法统计分组法指根据事物的内在性质和统计研究任务的要求,将总体单位按照某种标志划分为若干组成部分的研究方法。例如:人口按年龄分组、企业按经济类型分类、国民经济按部门分类等。3,综合指标法综合指标法是指运用各种统计综合指标来反映和研究社会经济现象总体的一般数量特征和数量关系的研究方法。在统计分析中广泛运用着各种综合指标来反映总体内部的各种数量关系。如动态分析、因素分析、回归与相关分析等。4,统计模型法统计模型法指根据一定的经济理论和假定条件,用数学方程去模拟现实经济现象相互关系的一种研究方法。统计模型包括三个基本要素:社会经济变量、基本关系式、模型参数\n5,归纳推断法归纳是一种从个别到一般,从事实到概括的一种推理方法,推断是通过对样本数据的观察,推断出总体的数量特征的研究方法。四,统计学的几个基本概念1,统计总体与总体单位统计总体:是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个体构成的整体。总体单位:是构成总体的个别事物。总体单位可以是人、物,也可以是企业机构、地域或状态、长度、时间等等。例如:①了解城镇居民生活状况,城镇全部居民就构成统计总体,城镇每一位居民就是总体单位。②了解工业企业经营情况,全部工业企业就构成统计总体,每一个工业企业就是总体单位。注意:总体与总体单位不是固定不变的,总体的范围可大可小,要根据研究目的确定总体的范围,当总体确定了则相应的总体单位也就确定了。根据总体包括的总体单位是否有限,统计总体可以分为无限总体和有限总体。无限总体:总体中包括的单位无限多,数不清。有限总体:总体中包括的单位有限多。可以数清。2,单位标志与标志表现单位标志:简称标志,指总体中所共同具有的属性和特征。标志表现:标志的具体表现形式。标志品质标志:表明单位属性方面的特征。其表现只能是文字。数量标志:表明单位数量方面的特征,其表现是数值,称为标志值。3,变异与变量变异:就是差异,指某个标志在总体各单位表现的不同。变量:一般把可变的数量标志称为变量。变量连续变量:其取值是连续不断的,不能以整数断开。如身高、体重、产值等变量。离散变量:其数值可以按一定顺序一一列举出来,通常取整数形式。如人数、企业数、机器台数等变量。4,统计指标与指标体系统计指标:反映实际存在的社会经济总体某一综合数量特征的社会经济范畴。如工业总产值、商品销售额等。统计指标特点具体性:经济理论规定了指标的内涵,是客观现象量的具体反映。可量性:统计指标均可用数值表现,不存在不能用数值表示的统计指标。综合性:统计指标既是同质总体大量个别单位的总计,又是个别单位标志值的差异综合。\n指标种类数量指标:反映总体现象的总规模、工作总量。如总人口、企业总数等。质量指标:反映总体现象的相对水平,或工作质量。如平均工资、人口密度、出生率等。统计指标体系:是各种相互联系的指标构成的整体,用以说明所研究现象各方面相互依存和相互制约的关系。5,统计的职能国家统计系统是社会经济统计的主体,是国家管理系统的重要组成部分。现代国家管理系统包括决策系统、执行系统、信息系统、咨询系统和监督系统,国家统计则兼有其中的信息、咨询、监督三种系统的职能。6,统计的组织综合统计系统国家统计局地方各级统计机构专业统计系统国务院各业务部门统计机构地方各级业务部门统计组织基层单位的统计组织企事业单位统计组织乡镇统计组织练习:一、判断对错1、社会经济统计的研究对象是社会经济现象总体的各个方面。(×)2、统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×)3、社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。(√)4、总体的同质性是指总体中的各个单位在所有标志上都相同。(×)5、品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。(√)6、品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。(×)二、单项选择题1、构成统计总体的个别事物称为(D)A、调查单位B、标志值C、品质标志D、总体单位2、对某城市工业企业未安装设备进行普查,总体单位是(B)A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业企业3、几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是(D)A、品质标志B、数量标志C、标志值D、数量指标4、统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是(A)。A、绝对数B、相对数C、平均数D、百分数5、在全国人口普查中(B)。A、男性是品质标志B、人的年龄是变量C、人口的平均寿命是数量标志D、全国人口是统计指标\n三、多项选择题部分1、要了解某地区的就业情况(ABD)A、全部成年人是研究的总体B、成年人口总数是统计指标C、成年人口就业率是统计标志D、某人职业是教师是标志表现E、反映每个人特征的职业是数量指标2、下列各项中,属于统计指标的有(ACD)A、1999年全国人均国内生产总值B、某台机床使用年限C、某市年供水量D、某地区原煤生产量E、某学员平均成绩3、在工业普查中(BCE)A、工业企业总数是统计总体B、每一个工业企业是总体单位C、固定资产总额是统计指标D、机器台数是连续变量E、职工人数是离散变量第二章统计调查教学目的统计调查是统计工作过程的第二个阶段,即搜集统计数据资料的阶段。所搜集的数据资料的质量状况直接影响到统计分析的结果,因此,搜集统计资料必须有一套科学的方式、方法。本章对此问题进行了介绍。通过本章的学习,要求了解统计调查的意义、种类,掌握统计调查方案的内容,各种统计调查方式、方法的应用条件。一,统计调查的基本要求和统计调查的种类统计调查的基本要求准确性及时性统计调查的种类根据被研究总体的范围划分全面调查非全面调查按调查登记的时间是否连续划分连续调查非连续调查按搜集资料的方法划分直接调查凭证调查派员调查问卷调查二,统计调查方案的内容统计调查方案是指导统计调查工作的纲领性文件。调查方案设计的好坏直接影响到调查数据的质量。不同调查任务的调查方案在具体内容和形式上会有一定的差别,但包括的主要内容大体是一致的1,调查目的调查目的是调查所要达到的具体目标调查目的的写作应简明扼要。例如:我国人口普查的目的是“为准确地查清我国在人口数量、地区分布、构成和素质方面的变化,为科学地制定国民经济和社会发展战略与规划,统一安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料”。2,调查对象和调查单位调查对象是根据调查目的确定的调查研究的总体或调查范围。调查单位是构成调查对象的每一个单位,是搜集数据资料的基本单位。例如:人口普查的调查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人。人口普查的调查单位是每一个人。注意:调查单位与填报单位的区别。\n3,调查项目和调查表调查项目是调查的具体内容它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;也可以是调查单位的某种属性或特征如一个人的性别、职业,一个企业的经济类型等。调查表是用于登记调查数据的一种表格,一般由表头、表体和表外附加三部分组成。•某企业基本情况报表(表头)制表机关调查项目项目代码计量单位实际数值甲 1人乙2台丙3人4,调查时间和时限调查时间:是调查资料所属的时间。即规定所调查的是哪个时期或时点的资料。调查时限:是进行调查工作的期限。即从调查工作开始到结束的时间长度。例如:第四次人口普查规定的标准时间是“1990年7月1日0时”,并要求在“1990年7月1日至10日完成普查的登记工作”。1990年7月1日0时就是调查时间,1990年7月1日至10日就是调查时限。调查的组织工作这项内容包括的比较多,如调查机构的确定,调查人员的选择、培训,调查经费的来源和支预算出,以及其它一些调查工作的准备等。三,统计调查方法•普查抽样调查统计报表重点调查典型调查1,普查涵义:普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的全面调查。特点:普查是专门调查普查通常是一次性的或周期性的普查是全面调查普查是一种不连续调查普查必须规定标准调查时间作用:普查主要用来搜集那些反映国情国力方面的基本统计资料。例如:人口普查、工业普查、物资库存普查、乡镇企业普查、商业饮食业普查等等。2,抽样调查涵义:抽样调查是一种非全面调查,它是按照随机原则从总体中抽取部分单位进行观察,用以推断总体数量特征的一种调查方式。特点:是一种非全面调查,但是又要达到对总体数量特征的认识。按照随机原则抽选调查单位。优点:经济性、时效性、准确性、灵活性作用:能够解决全面调查无法或难以解决的问题。可以补充和订正全面调查的结果。可以用于对总体的某种假设进行检验。\n组织形式简单随机抽样对总体不进行任何整理,直接从总体中按照随机原则抽选调查单位。类型随机抽样将总体各单位按某一标志大小顺序排列,然后依一定间隔抽取样本单位进行调查。等距随机抽样先对总体各单位按主要标志进行分类,再按随机原则抽选调查单位。整群随机抽样先将总体各单位划分为许多群,再以群为单位,从中随机抽选部分群,对中选群的所有单位进行调查3,重点调查与典型调查•二者共同点都属于非全面调查•二者区别重点调查是对总体中的重点单位进行调查(根据客观标准选择重点单位)重点单位指其某一主要标志的标志总量在总体标志总量中占有绝大比重。如:对大型钢铁基地进行调查典型调查是对总体中的典型单位进行调查(在对现象分析的基础上有意识地选择典型单位)典型单位指总体中具有典型性的单位。如先进典型、落后典型等,更重要的是能够代表现象一般水平的典型四,调查资料的检查准确性完整性及时性1,准确性检查就是对调查误差的检查登记性误差由于错误判断事实或错误登记事实而发生的误差。这种误差可以避免代表性误差根据样本单位的数量特征推断总体数量特征时产生的误差。这种误差不可避免检查方法登记性误差:逻辑检查、计算检查代表性误差:可计算出误差,并通过调整一些条件控制误差的大小。练习:•一、判断对错1、全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。(×)2、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。(×)3、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。(√)4、采用重点调查搜集资料时,选择的调查单位是标志值较大的单位。(×)5、统计调查误差就是指由于错误判断事实或者错误登记事实而发生的误差。(×)6、典型调查既可以搜集数字资料,又可以搜集不能用数字反映的实际情况。(√)7、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。(×)二、单项选择题1、连续调查与不连续调查的划分依据是(B)。A、调查的组织形式不同B、调查登记的时间是否连续C、调查单位包括的范围是否全面D、调查资料的来源不同\n2、对一批商品进行质量检验,最适宜采用的方法是(B)。A、全面调查B、抽样调查C、典型调查D、重点调查3、下列调查中,调查单位与填报单位一致的是(D)。A、企业设备调查B、人口普查C、农村耕地调查D、工业企业现状调查4、抽样调查的主要目的是(B)。A、计算和控制抽样误差B、推断总体总量C、对调查单位作深入研究D、广泛运用数学方法5、下述各项调查中属于全面调查的是(B)。A、对某种连续生产的产品质量进行检验B、某地区对工业企业设备进行普查C、对全面钢铁生产中的重点单位进行调查D、抽选部分地块进行农产量调查三、多项选择题部分1、在工业设备普查中(BDE)A、工业企业是调查对象B、每个工业企业是填报单位C、每台设备是填报单位D、每台设备是调查单位E、工业企业的全部设备是调查对象2、制定统计调查方案,应确定(ABCE)A、调查目的和调查对象B、调查单位和填报单位C、调查项目和调查表D、调查资料的使用范围E、调查的时间和时限3、抽样调查和重点调查的共同点是(AB)A、两者都是非全面调查B、两者选取单位都不受主观因素的影响C、两者都按随机原则选取单位D、两者都按非随机原则选取单位E、两者都可以用来推断总体指标4、调查单位是(CE)A、需要调查的总体B、需要调查的总体单位负责人C、调查项目的承担者D、负责报告调查结果的单位E、调查对象所包含的具体单位第三章统计整理教学目的统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。一,统计整理的意义和方法1,统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程2,统计整理的方法:分组、汇总、编表二,统计分组的含义和种类\n1,根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分2,分组•按研究任务和作用不同类型分组结构分组分析分组•按分组标志的多少不同简单分组复合分组•按分组标志的性质不同品质分组变量分组三,统计分组的方法品质分组方法按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。如:人口按性别分组、按职业分组、企业按经济类型分组变量分组方法单项式分组以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。组距式分组以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。在进行组距分组时,会涉及到一些问题,包括等距分组和不等距分组、组限、组中值。等距分组各组组距均相等。如:10—20,20—30,30—40,等。组距为10。这种分组适用于均匀分布的总体。不等距分组各组组距不一定相等。如:10—20,20—50,50—60,60—70等。其中第二组与其它各组组距不同。这种分组适用于资料分布离差较大或特殊的研究目的。组限组限就是每一组两端的数值。每一组的起点值称为下限,每一组的终点值称为上限。确定组限的方法有两种:间断式确定组限和重叠式确定组限。组中值每组上限与下限之间的中点数值,代表各组变量值的一般水平,是各组的假定平均数。开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2四,统计分布和分配数列的编制(一)统计分布统计分布又称分配数列。它是把总体的所有单位按组归并排列后形成总体中各个单位在各组间的分布。它由两部分组成:总体所分的各个组和各组所拥有的单位数(次数或频数)。次数和频率的大小反映了各组标志值对总体标志水平所起的作用的大小,次数和频率的数值越大则其起的作用越大,反之越小。频率:各组的频率大于0,各组的频率总和等于1。(二)分配数列的种类分配数列是在分组的基础上形成的,根据分组时采用的分组标志不同,分配数列可分为:1,品质分配数列\n(一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。)2,变量分配数列a)单变量分配数列b)组距分配数列等距数列/不等距数列(三)分配数列的编制1、品质分配数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。经济类型企业数(个)比重(%)国有企业股份制企业合资企业独资企业1008050204032208合计2501002、变量分配数列的编制:其基本步骤为:第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单变量分组或组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:组距=全距/组数全距=最大变量值—最小变量值。第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)第五步:汇总出各组的单位数(注意:离散型变量各组单位数的汇总方法),计算频率,并编制统计表。3、累计频数或频率分配数列的编制方法序号计划完成程度(%)工人数(人)比重(%)向上累计向下累计人数比重人数比重160—7021.021.0200100270—8052.573.519899.0380—90147.02110.519396.5490—1003115.55226.017989.55100—1106532.511758.514874.06110—1205226.016984.58341.57120—1302311.519296.03115.58130—14084.020010084.0合计200100(四)统计分布的类型钟型分布、U型分布、J型分布、洛伦茨分布1,钟型分布:特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。\n2,U型分布:特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状宛如英文字母U。3,J型分布:特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母J。4,洛伦茨分布:专门用以检定社会收入分配的平等程度。这种累计分布曲线图最早由美国洛伦茨博士提出的,故又称洛伦茨曲线图。五,统计表的结构和种类统计表是表现统计资料整理结果的表格1,统计表的结构从表的形式看:由标题、横行和纵栏、数字资料等部分组成。从表的内容上看:由主词和宾词组成。主词指总体所分的各个组,宾词用来说明主词的各个指标。2,按照主词是否分组和分组的程度分为:统计表的种类简单表:主词未经分组的统计表。分组表:主词按某一标志进行分组的统计表。练习一、判断对错1、对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(×)2、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。(×)3、分配数列的实质是把总体单位总量按照总体所分的组进行分配。(√)4、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(×)5、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(√)6、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%(×)7、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(√)二、选择题1、统计整理的关键是(B)A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表2、下列分组中属于按品质标志分组的是(B)A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组3、有一个学生考试成绩为80分,在统计分组中,这个变量值应归到(C)组。A、60—70分B、70—80分C、80—90分D、90—100分4、某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于(B)分组。A、简单分组B、复合分组C、分析分组D、结构分组5,在次数分配数列中(CDE)A、总次数一定,频数和频率成反比B、各组的频数之和等于100C、各组频率大于零,频率之和等于1D、频率越小,则组的标志值所起的作用越小\nE、频率表明各组标志值对总体的相对作用程度第四章综合指标教学目的综合指标法是统计研究的基本方法之一。从广义上说,所有的统计指标都可以称为综合指标。但这里讲的综合指标是将所有的统计指标按其指标数值的表现形式不同归纳起来的三大类基本指标,它们是:总量指标、相对指标和平均指标。通过本章的学习要求了解三类基本指标的概念、特点,掌握各类指标的计算方法,并能结合实际资料进行计算分析。•第一节总量指标一、总量指标的概念和作用1、概念:总量指标是反映社会经济现象发展的总规模或工作总量的综合指标。2、作用它是对社会经济现象认识的起点。是编制计划、实行经营管理的重要依据。是计算相对指标和平均指标的基础。二、总量指标的种类1、按反映现象总体内容的不同•总体单位总量•总体标志总量2、按反映时间状况的不同•时期指标可以连续统计指标数值大小受时期长短制约•时点指标不可以连续统计指标数值大小与时间间隔长短无关三、总量指标的计量单位•实物单位自然单位:头、辆、人度量衡单位:米、公斤、吨双重单位:台/千瓦、人/平方公里复合单位:吨公里、千瓦小时•货币单位•劳动量单位四、总量指标统计的要求1、计算总量指标必须对指标的含义、范围做严格的确定。2、计算实物总量指标时,要注意现象的同类性。3、计算总量指标要有统一的计量单位第二节相对指标一、相对指标的概念、作用及表现形式概念:相对指标是两个相互联系的现象数量的比率,用以反映现象的发展程度、结构、强度、普遍程度。作用:•为人们深入认识事物发展的质量与状况提供客观依据\n•可以使不能直接对比的现象找到可以对比的基础。表现形式无名数:百分数、千分数、成数、系数、倍数等。有名数:由分子、分母指标的计量单位构成。二、相对指标的种类及计算方法(一)结构相对指标结构相对指标是反映总体内部构成特征或类型的统计指标。计算方法指标特点以总体总量作为比较标准,求出各组总量占总体总量的比重,又称比重指标。各组或各部分占总体的比重之和,必须为1或100%(二)比例相对指标比例相对指标是反映总体内各个局部、各个分组之间,量的比例关系的统计指标。计算方法指标特点是同一总体内不同部分数量对比的结果。一般用百分比表示,也可用几比几的形式表示(三)比较相对指标说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类事物在不同条件下的数量对比关系。计算方法指标特点同类指标在不同空间下进行对比一般用百分数或倍数表示(四)强度相对指标是用来表明某一现象在另一现象中发展的强度、密度或普遍程度的相对指标。计算方法指标特点\n是两个性质不同而又有联系的总量指标之间的对比。指标数值的计量单位可以是无名数,如百分数、千分数,也可以是有名数,如:吨公里、人/平方公里等有正、逆指标之分(五)动态相对指标反映同类现象在不同时间上变动程度的相对指标计算方法指标特点•是不同时间的同类指标进行对比•计算结果用百分数表示(六)计划完成程度相对指标基本公式:1、以绝对数形式计算计划完成程度相对指标检查短期计划完成情况检查某一时期的计划完成情况:月度、季度、年度检查计划执行的进度:计划期内某一段时间的实际完成数与计划全期的计划数进行对比检查长期计划完成程度累计法:按各年完成任务的总和下达计划任务水平法:按计划期末应达到的水平下达计划任务2、以相对数形式计算计划完成程度相对指标当计划任务以相对数的形式下达时,检查计划完成程度就用相对数的形式检查。\n第三节平均指标一、平均指标的概念、特点和作用1、概念:反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平。2、特点•平均指标将总体内各单位的差异抽象化了•平均指标是一个代表值,代表总体综合数量特征的一般水平。3、作用反映总体各单位变量分布的集中趋势。比较同类现象在不同单位的发展水平,用来说明生产水平、经济效益或工作质量的差距。分析现象之间的依存关系。4、种类•数值平均数算数平均数调和平均数几何平均数•位置平均数众数中位数(一)算数平均数1、算数平均数的基本公式(用此公式计算算数平均数,必须注意分子与分母之间存在的内在经济联系。即分子是分母所具有的标志值)2、算数平均数的计算形式(1)简单算数平均数:(2)加权算数平均数:适用于分组资料根据分组资料计算算数平均数,平均数的大小不仅受到各组变量值大小的影响,而且受到各个变量值出现次数多少的影响,因此需用下式计算其平均数:计算公式:用“比重”权数计算算数平均数的公式为:公式中:“X”代表各组变量值,“f”代表各组变量值出现的次数或频数,“∑”为合计符号。\n(3)简单算数平均数与加权算数平均数的关系•权数起作用必须有两个条件一是:各组标志值必须有差异。如果各组标志值没有差异标志值成为常数,也就不存在权数。二是:各组的次数或比重必须有差异。如果各组次数或比重没有差异,意味着各组权数相等,权数成为常数,则不能起到权衡轻重的作用,这时加权算数平均数就等于简单算数平均数•用公式表示二者的关系:(二)调和平均数调和平均数是各个标志值倒数的算数平均数的倒数,所以又称倒数平均数。•调和平均数的计算方法•(三)众数众数是现象总体中最普遍出现的标志值。众数的确定方法(1)由单项数列确定众数数列中出现次数最多的变量值就是众数。(2)由组距数列确定众数步骤:①找出众数所在的组②根据公式计算众数(四)中位数将总体中各单位的标志值按大小顺序排列,处于数列中点位置的标志值就是中位数。中位数的计算方法(1)根据未分组资料计算中位数步骤:①将资料按大小顺序排列②计算中位数的位次:(n+1)/2③确定中位数(2)根据单项数列计算中位数步骤:①计算数列的中间位置点:②计算累计次数找出中位数所在的组③确定中位数\n(3)根据组距数列计算中位数步骤:①计算数列的中间位置点:∑f/2②计算累计次数,找出中位数所在的组③用公式计算中位数众数和中位数的主要特点:不受极端变量值的影响第四节变异指标一、变异指标的概念及作用二、变异指标的种类及计算方法全距平均差标准差变异系数(一)全距:最大变量值与最小变量值之差优点:计算简便、意义明确不足:不能全面反映各单位标志值的变异情况(二)平均差1、涵义:是总体各单位标志值对算数平均数的离差绝对值的算数平均数2、特点:根据总体单位所有标志值来计算差异程度以算数平均数为计算的标准对离差取绝对值3、计算方法(三)标准差1、涵义:是总体中各单位标志值对算数平均数离差平方的算数平均数的平方根2、计算方法:简单标准差公式加权标准差公式计算标准差的简化式(四)变异系数1、涵义:用相对数形式反映各个变量值与其平均数的离差程度,其数值表现为系数或百分数\n2、计算方法:是全距、平均差、标准差与算数平均数的比值。变异系数包括:全距系数、平均差系数、标准差系数使用最多的是标准差系数。•标准差系数第五章抽样估计教学目的与要求抽样估计是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计第一节抽样推断的一般问题一、抽样推断的概念和特点1、概念:抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。2、特点它是由部分推断整体的一种认识方法。抽样推断建立在随机取样的基础上。抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制。3.作用对无法或很难进行全面调查时,可用抽样推断了解总体情况。抽样推断可以对全面调查的结果加以验证、补充或订正抽样推断应用于要求资料信息及时性很强的现象。运用抽样推断可以对总体的某种假设进行检验,判断这种假设的真伪,以决定行动的取舍。二、抽样推断的内容•参数估计•假设检验三、有关抽样的基本概念(一)总体和样本•总体:也称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。•样本:又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。(二)参数和统计量•参数:指反映总体数量特征的综合指标\n(三)样本容量和样本个数1,样本容量:一个样本包含的单位数。用“n”表示。一般要求n≥302,样本个数:从一个全及总体中可能抽取的样本数目。(四)重复抽样和不重复抽样重复抽样:又称回置抽样可能组成的样本数目:N*N…N不重复抽样:又称不回置抽样。可能组成的样本数目:N(N-1)(N-2)……(N-n+1)第二节抽样误差一、抽样误差的含义由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。二、影响抽样误差大小的因素1、总体各单位标志值的差异程度2、样本的单位数3、抽样方法\n4、抽样调查的组织形式三、抽样平均误差1、概念:抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽样平均数与总体平均数抽样成数与总体成数的平均误差程度。2、计算方法:抽样平均数的平均误差抽样成数平均误差(一)抽样平均数平均误差的计算公式:采用重复抽样:此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。当总体标准差未知时,可以采用以下方法:1.用过去调查所得到的资料。可以用全面调查的资料,也可以用抽样调查的资料。如果有几个不同的总体方差的资料,则应该用数值较大的。2.用样本方差的资料代替总体方差。概率论的研究从理论上作了证明,样本方差可以相当接近于总体方差。这是实际工作中经常使用的一种方法,但它只能在调查之后才能计算。3.用小规模调查资料。如果既没有过去的材料,又需要在调查之前就估计出抽样误差,实在不得已时,可以在大规模调查之前,组织一次小规模的试验性调查。4.用估计的材料。例如,在农产量抽样调查中用农产量预计估产的资料,根据预计估产的资料计算出总体方差。通过例题可说明以下几点:①样本平均数的平均数等于总体平均数。②抽样平均数的标准差仅为总体标准差的③可通过调整样本单位数来控制抽样平均误差。采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。(二)抽样成数平均误差的计算公式采用重复抽样:采用不重复抽样:四、抽样极限误差1,含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差\n2,计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值•抽样平均数极限误差:•抽样成数极限误差:五、抽样误差的概率度1,含义:抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“Z”表示。•公式表示:(z是极限误差与抽样平均误差的比值)•上式可变形为:(极限误差是z倍的抽样平均误差)2,常用的概率度和概率的函数关系表图概率度Z概率F(Z)0.538.29%168.27%1.6990%1.9695%295.45%399.73%第三节抽样估计的方法一、总体参数优良估计的标准(一)反映总体指标的参数主要有总体平均数、总体成数、总体方差和总体标准差,如果抽取一个容量充分大的样本,通过反复试验能够证明计算出来的样本指标数值(样本平均数、样本成数、样本标准差等)都接近于被估计的总体指标参数,那么这种估计量就是可取的、优良的。(二)优良估计量的标准1.无偏性:无偏性是指用样本指标估计总体指标时,样本指标的平均数应等于总体平均数,也就是说,每一个具体的样本指标与总体指标都可能有误差,但如果进行多次反复的抽样,各个样本指标的平均数应等于总体指标,即以这个样本指标作为总体指标的估计量,平均来说是没有偏误的。样本的算术平均数和样本成数,均符合无偏性的要求。2.一致性:是指用样本指标估计总体指标时,随着样本容量不断增大,样本指标逐渐接近总体指标,当样本容量充分地大时,样本指标也充分地接近总体指标。容易证明,样本平均数和样本成数分别是总体平均数和总体成数的一致估计量;3.有效性:是指在估计总体指标时,应采用方差最小的那个估计量,因其方差最小,最具有代表性,从而估计更为有效。\n二、总体参数的点估计概念:参数点估计又称为定值估计,它的基本特点是根据抽样资料计算样本统计量,直接作为相应总体参数的估计值,代表总体参数,即以实际计算的抽样平均数作为相应总体平均数的估计值,以实际计算的抽样成数作为相应总体成数的估计值等。点估计的推算方法:直接推算法和系数推算法(一)直接推算法就是根据样本指标(平均数或成数)所估计的总体参数与另—个有关的总量指标直接推算所需要的总量指标的一种方法。1.依据抽样平均数所估计的总体平均数与总体单位数相乘推算总体标志总量的估计值。2.依据抽样成数所估计的总体成数与总体中某类单位的数目相除推算出总全单位总量的估计值。(二)系数推算法也称间接推算法。它是将抽样调查资料和全面调查资料对比,求出一个系数,然后用此系数来推算总体总量或对全面调查资料进行修正,以提高其质量的一种方法。总体参数点估计的特点:优点:简便、易行,原理直观。不足:没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保障程度有多大。三、总体参数的区间估计总体参数区间估计的特点:弥补定值估计的不足•区间估计三要素估计值抽样误差范围概率保证程度F(Z)三、总体参数区间估计的方法(一)根据给定的抽样误差范围,求概率保证程度•分析步骤:1、抽取样本,计算抽样指标。2、根据给定的极限误差范围估计总体参数的上限和下限。3、计算概率度。4、查表求出概率F(Z),并对总体参数作出区间估计。(二)根据给定的概率F(Z),推算抽样极限误差的可能范围•分析步骤:1、抽取样本,计算样本指标。2、根据给定的F(Z)查表求得概率度Z。3、根据概率度和抽样平均误差计算极限误差。4、计算被估计值的上、下限,对总体参数作出区间估计。•第四节抽样组织设计一、简单随机抽样1、含义:按随机原则直接从总体N个单位中抽取n个单位作为样本。2、样本单位数的计算方法:通过抽样极限误差公式计算必要的样本单位数抽样平均数抽样成数\n重复抽样:不重复抽样:3.影响必要抽样数目的因素有:(1)总体被研究标志的变异程度总体的标志变异程度大,需多抽样本单位;反之则可少抽。具体可看总体各单位被研究标志方差的大小。方差大,抽样数目应确定得多些;相反则少些。(2)对推断精确度的要求对推断的精确度要求越高,允许误差越小,这时就需要多抽取一些样本单位。对推断的精确度要求较低,允许误差大一些,则可以少拙取一些样本单位(3)对推断可靠性的要求抽样推断的可靠程度也就是概率,概率与Z值有关:如果要求可靠程度高,Z值就大,需要多抽样本单位;反之,如果要求的可靠程度低,概率小,Z值也小,则可以少抽样本单位。(4)抽样调查的组织方式和方法同一对象要求有同样的精确度和保证程度,用等距抽样和类型抽样,抽样数目可定得少些;若用纯随机和整群抽样方式,抽样数目就要定得多些。至于用重复抽样或不重复抽样方法,后者的抽样数目可确定得少些(5)人力、物力和财力的允许条件二、类型抽样先对总体各单位按主要标志加以分组,然后再从各组中按随机的原则抽选一定单位构成样本。三、等距抽样先按某一标志对总体各单位进行排队,然后依一定顺序和间隔来抽取样本单位的一种组织形式。四、整群抽样将总体各单位划分成许多群,然后从其中随机抽取部分群,对中选群的所有单位进行全面调查的抽样组织形式。第六章假设检验一、假设检验的含义如,某厂生产一批产品.产品总数N=1000件,必须经检验合格方能出厂,按规定次品率不能超过5%,否则不准出厂。我们事先对这1000件产品(称为总体)的次品率(称为总体未知参数)一无所知。但是我们可以根据以往的资料假设其次品率不超过5%(称为原假设),然后随机抽取50件样品,检验出其次品率为8%(称为样本参数值),现在的问题是我们能否根据这8%的样本次品率来判断整批产品的次品率不超过5%,且伴有一定的可信程度呢?•含义:像这种根据一定随机样本所提供的信息,用它来判断总体未知参数事先所作的假设是否可信的统计分析方法,叫作假设检验。二、假设检验的基本思想:首先对研究的命题提出一种假设。称为原假设或0假设,即从原来总体没有变化出发,这样就有一个总体参数,而且它的分布也是知道的。例如某轴承厂生产某型号轴承,按规定轴承标准承载压力4000公斤,标准差为200公斤,承载压力按正态分布。我们就可以4\n000公斤压力作为总体参数建立比较标准。从实际总体中抽取样本,根据实际观察的资料计算统计量的取值,通过样本统计量取值与假设的总体参数比较来判断。要求两者完全一致的可能性是极少的,那么差异要达到多大才算是显著呢?所谓显著性是指差异程度而言的,程度不同说明引起差异的原因也有不同:一种是条件差异。即由于工艺或试验条件的改变所引起的差异;一种是随机差异。即由于生产或试验过程中受偶然因素的影响,所引起结果的差异。两种原因的共同作用导致各种各样的误差,如果样本统计量与假设总体参数之间的差异超过了通常偶然因素起作用的程度,它说明所发生的差异,除了随机因素之外还存在条件差异的因素,因此我们可以据此否定总体的变动纯粹由随机原因引起,没有显著差异的原假设。其次,确定显著性水平。我们所以拒绝原假设,并不是因为它存在逻辑的绝对矛盾,或实际上不可能存在这种假设,而仅仅因为它存在的可能性很小。根据小概率事件原理,概率很小的事件在一次试验中几乎是不会发生的。如果根据原假设的条件正确计算出某一结果发生的概率很小,理应在一次试验中不至于发生,然而在一次试验中事实上又发生了,则我们认为原假设不正确,而拒绝接受。进行假设检验时应该事先规定一个小概率的标准,作为判断的界限,这个小概率标准称为显著性水平。由于原假设的分布是已知的,因而样本统计量和总体参数的离差在一定范围内的概率也可以知道,离差超过这个范围的概率也同样知道,如果统计量与参数的差异过大,以至发生这种事件的概率很小,而且小到低于给定的标准,我们就拒绝原假设,如果计算出的统计量与参数差异的相应概率大于给定标准,我们就接受原假设。这样,我们把概率分布分为两个区间:例如给定小概率标准α=0.05,凡概率小于5%的差异都是小概率事件,属于拒绝区间,如图中分布两端的阴影部分,而1-α=0.95,则是对立事件的概率,其概率在95%以内的,为接受区间,如图中央部分所示。事件属于接受区间,原假设成立,判断总体无显著差异;事件属于拒绝区间,推翻原假设,认为总体有显著差异,其区间以小概率标准α=0.05为界限,所以称为显著性水平,α所对应的概率度称为显著性水平的临界值。例如α=0.05时,在正态分布的情况下,则临界值Z=1.96。我们以概率小于0.05的事件作为小概率事件,也就等于说大于临界值Z=1.96的事件作为小概率事件,这样我们可以直接利用概率表查找临界值作为判断的依据。显著性水平主要视拒绝区间所可能承担的风险来决定,应该根据研究问题的性质和对结论准确性的要求而有所不同。通常多采用0.1、0.05、0.01、0.001等显著性水平。例如民意测验采用显著性水平0.1,其他社会经济现象的检验取0.05,产品质量检验取o=0.01,工程技术检验取0.001,甚至取0.0001等等三、假设检验的一般步骤:1.设立假设,2.确定显著性水平α和相应临界值.\n3.抽取样本计算统计量和相应概率区间的概率度,4.加以比较判断,从而作出接受或拒绝假设的决定。(一)设立假设首先提出原假设,记为H0,原假设总是假定总体没有显著性差异,所有差异都是由随机原因引起的。所以这种假设又称无效假设。其次提出备择假设,记为H1,如果原假设被拒绝等于接受了备择假设,所以备择假设也就是原假设的对立事件。1.双侧检验:检验样本平均数(或成数)和总体平均数(或成数)有没有显著性的差异,而不问差异的方向是正差或负差时,则原假设取等式,如:2.单侧检验:如果不仅仅检验样本平均数(或成数)和总体平均数(或成数)有没有显著的差异,而且追究是否发生预先指定方向的差异(正差异或负差异),则原假设取不等式形式,如:(二)决定检验的显著性水平α,以及相应的Z临界值1.双侧检验:给定显著性水平α,按对称分布的原理平均分配到左右两方,每方各为α/2,相应得到下临界值为-Zα/2,上临界值为Zα/2。如图2.单侧检验:给定显著性水平α,根据问题的要求确定是左单侧检验,还是右单侧检验,其临界值为-Zα或Zα,如图表示右单侧检验,其临界值为Zα。(三)求Z值抽取一个随机样本,并从H0假设为真出发,计算抽样平均数或抽样成数,再求相应概率区间的概率度Z值。(四)将实际求得的Z值和事先给它的临界值作比较双侧检验:如果Z≥Zα/2或Z≤-Zα/2,就拒绝原假设H0,而接受备择假设H1;如果Z≤Zα/2或Z≥-Zα/2,就不能否定原假设,而接受原假设是真实的.左单侧检验:如果Z≤-Zα,就拒绝原假设H0,而接受备择假设H1;如果Z>-Zα,就不能否定原假设,而接受原假设是真实的。右单侧检验:如果Z≥Zα,就拒绝原假设H0,而接受备择假设H1;如果Z查看更多
相关文章
- 当前文档收益归属上传用户