- 2022-08-13 发布 |
- 37.5 KB |
- 66页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学-复习材料
第一章绪论一、本章的重点与难点(一)本章重点掌握统计学的涵义、研究对象及性质;了解统计学的发展简史;理解统计的作用与特点;掌握统计学中常用的术语。(二)本章难点了解统计学的研究对象和性质,掌握统计学的常用术语:总体和样本、变量和变量值、统计量与参数、重复抽样和不重复抽样。二、内容提要(一)统计与统计学“统计”一词包括三层含义,即统计工作、统计数据和统计学。统计学是一门搜集、整理和分析统计数据的方法学科,其目的是探索数据内在数量的规律性,以达到对客观事物的科学认识。统计数据的搜集是取得统计数据的过程,是进行统计分析的基础;统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要;统计数据的分析是统计学的核心内容,是通过统计描述和统计推断的方法探索数据内在规律的过程。统计学提供了探索数据内在规律的一套方法。(二)统计学的分科根据统计方法的构成,可将统计学分为描述统计学和推断统计学;根据统计方法研究和应用,可将统计学分为理论统计学和应用统计学。描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理,进而通过综合、概括与分析得出反映客观现象的规律性数量特征;推断统计学则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。理论统计学是指统计学的数学原理,它主要研究统计学的一般理论和统计方法的数学理论,它是统计方法的理论基础;应用统计学是研究如何应用统计方法去解决实际问题。(三)统计学与其他学科的关系1.统计学与数学的关系统计方法和数学方法一样,并不能独立地直接研究和探索客观现象的规律,而是为各学科提供了一种研究和探索客观规律的数量方法。统计学与数学又有本质区别:数学只是为统计理论和统计方法的发展提供数学基础,而统计学的主要特征是研究数据;数学研究的是抽象的数量规律,而统计学则是研究具体的、实际现象中的数量规律;数学研究所使用的是纯粹的演绎,而统计学则是演绎与归纳相结合,并以归纳为主导。2. 统计学与其他学科的关系统计方法可以帮助其他学科探索学科内在的数量规律性,但对这种数量规律性的解释以及通过这种规律性研究各学科内在的规律,只能由各学科的研究来解决。(四)统计学的产生和发展统计学的发展过程始终是沿着两条主线展开的:一是以“政治算术学派”为开端形成和发展起来的以社会经济问题为主要研究对象的社会经济统计;二是以概率论的研究为开端并以概率论为基础形成和发展起来的、以方法和应用研究为主的数理统计。\n在统计学产生和发展的过程中,出现了许多不同的统计学派,如德国的“国势学派”,英国的“政治算术学派”,产生于19世纪中叶的“数理统计学派”、“社会统计学派”等等。三、标准化试题(一)填空题1.“统计”一词通常有三种涵义,即____、____和____。2.统计数据的_____是统计学的核心内容,是通过_____和_____的方法探索数据内在规律的过程。3.根据统计方法的_____,可将统计学分为描述统计学和推断统计学;根据统计方法的_____,可将统计学分为理论统计学和应用统计学。 4.数学研究使用的是纯粹的演绎,而统计学则是演绎与_____相结合。 5.17世纪中叶英国人威廉·配第的代表作《_____》的问世,标志着统计学说的诞生。 6.德国统计学家恩格尔在《比利时工人家庭的生活费》一文中,提出了著名的“_____”,并由此法则引申出“_____”。 7.法国数学家拉普拉斯所著的《概率论分析》一书,以_____为桥梁,使概率论与政治算术联系起来。 8.统计学的产生和发展的两条主线是_____和_____。(二)判断题1.统计学是随着人类社会的发展和社会管理的需要而发展起来的。( ) 2.统计数据的整理是对统计数据的加工处理过程,是统计学的核心内容。( ) 3.“政治算术学派”的创始人是威廉·配第和拉普拉斯。( ) 4.比利时统计学家凯特勤对统计学的主要贡献是将自然科学的研究方法引进社会现象的研究中来。( ) 5.以社会经济问题为主要研究对象的社会经济统计是以“国势学派”为开端形成和发展起来的。( ) 6.数学和统计学一样,并不能独立地直接研究和探索客观现象的规律,而是给各学科提供了一种研究和探索客观规律的数量方法。( ) 7.概率论最初的研究是为赌徒们找出掷骰子取胜的一套办法,所以数理统计学研究领域最早的论著为《论赌博》。( )8.运用统计方法可以研究各学科的规律和解决其具体问题。( )(三)单项选择题 1.人们在使用“统计”一词时,通常有三种不同的涵义,其中不正确的一项是( ) A.统计工作 B.统计方法 C.统计数据 D.统计学 2.统计是从社会经济现象的( )A.质的方面去研究其量的方面B.量的方面去研究其质的方面C.质与量的辨证统一中研究其量的方面 D.质与量的辨证统一中研究其质的方面 3.根据统计方法的构成,可将统计学分为( ) A.描述统计学和推断统计学 B.描述统计学和应用统计学 C.理论统计学和推断统计学 D.理论统计学和应用统计学 4.统计学研究中使用的方法是( ) A.纯粹的演绎 B.纯粹的归纳 C.演绎与归纳相结合,以归纳为主导 D.演绎与归纳相结合,以演绎为主导 5.政治算术学派的创始人之一是( ) A.高尔登 B.凯特勤 C.约翰·格朗特 D.皮尔逊\n 6.为运用数学理论研究概率论开辟道路的论著是( )A.《政治算术》 B.《概率论书简》C.《论赌博》 D.《概率论分析》 7.在统计史上被认为有统计学之实而无统计学之名的统计学派是( ) A.数理统计学派 B.政治算术学派 C.社会统计学派 D.国势学派 8.统计对社会经济现象总体数量的认识是( ) A.从定性到定量 B.从定量到定性 C.从个体到总体 D.从总体到个体 (四)多项选择题 1.统计的涵义一般有( ) A.统计工作 B.统计会议 C.统计学 D.统计报刊 E.统计资料 2.政治算术学派的创始人有( ) A.阿罕华尔 B.凯特勤 C.威廉·配第 D.恩格尔 E.约翰·格朗特 3.根据统计方法的构成,可将统计学分为( ) A.应用统计学 B.推断统计学 C.理论统计学 D.描述统计学 E.统计数学 4.下列属于应用统计学范畴的是( ) A.生物统计学 B.农业统计学 C.卫生统计学 D.社会统计学 E.人口统计学 5.对社会经济统计的产生和发展有一定影响的人物主要有( )A.威廉·配第 B.凯特勤 C.李·普莱 D.恩格尔 E.约翰·格朗特 (五)简答题 1.“统计”一词有哪几种涵义?它们之间的关系如何? 2.简述统计学的基本分科。 3.统计学与数学之间有何关系? 4.统计学的发展是沿着哪两条线展开的?四、参考答案 (一)填空题 1.统计工作 统计资料 统计学 2.分析 统计描述 统计推断 3.构成 研究和应用4.归纳5.政治算术6.恩格尔法则 恩格尔系数7.大数法则8.以“政治算术学派”为开端形成和发展起来的以社会经济问题为主要研究对象的社会经济统计 以概率论的研究为开端并以概率论为基础形成和发展起来的以方法和应用研究为主的数理统计 (二)判断题 1.(√) 2.(×) 3.(×) 4.(√) 5.(×) 6.(√) 7.(√) 8.(×) (三)单项选择题 1.(B) 2.(D) 3.(A) 4.(C) 5.(C) 6.(C) 7.(B) 8.(C) (四)多项选择题\n 1.(A)(C)(E) 2.(C)(E) 3.(B)(D) 4.(A)(B)(C)(D)(E) 5.(A)(C)(D)(E) (五)简答题 1.“统计”一词包括三种涵义,即:统计工作、统计资料和统计科学。三者之间的关系是:统计资料是统计工作的成果;统计科学与统计工作是理论与实践的关系。 2.根据统计方法的构成,可将统计学分为描述统计学和推断统计学;根据统计方法研究和应用,可将统计学分为理论统计学和应用统计学。 3.统计方法与数学方法一样,并不能独立地直接研究和探索客观现象的规律,而是给各学科提供了一种研究和探索客观规律的数量方法。数学为统计理论和统计方法的发展提供了数学基础,而统计学的主要特征是研究数据;数学研究的是抽象的数量规律,而统计学则是研究具体的、实际现象的数量规律;数学研究所使用的是纯粹的演绎,而统计学则是演绎与归纳相结合,占主导地位的是归纳。4.统计学的发展过程始终是沿着两条主线展开的:一是以“政治算术学派”为开端形成和发展起来的以社会经济问题为主要研究对象的社会经济统计;二是以概率论的研究为开端并以概率论为基础形成和发展起来的以方法和应用研究为主的数理统计。\n第二章统计数据与数据获取一、本章的重点与难点(一)本章重点了解数据划分类型;掌握获得数据的调查方法和实验方法;掌握统计调查的意义;掌握统计调查的种类、抽样调查的组织形式及统计调查的误差;掌握统计报表的特点。(二)本章难点调查问卷的设计、各种调查方法的特点与适用条件。二、内容提要(一)数据的计量与类型1.数据的计量尺度统计数据是对客观现象进行计量的结果,其计量尺度主要有四种:①定类尺度;②定序尺度;③定距尺度;④定比尺度。2.数据的类型与分析方法数据的类型有两大类,即品质数据(定性数据)和数值数据(定量数据)。统计数据是统计变量的表现,变量分为三种类型:①定类变量;②定序变量;③数字变量。通常统计变量是指数字变量。3.统计指标及类型统计指标是统计工作中最常用的概念,是用来反映总体数量状况的数值。按其反映的内容或数值表现形式分为总量指标、相对指标和平均指标;按其反映的时间状况分为时期指标和时点指标。(二)统计数据的来源统计数据的来源有直接来源和间接来源。社会经济数据主要直接来源于专门调查。主要的调查方式有普查、抽样调查、统计报表。主要的调查方法有询问调查、邮寄调查、电话调查、电脑辅助调查、座谈会、个别深度访问以及观察法和实验法。统计数据的间接来源主要是公开出版、报道和尚未公开的数据,通常将其称为第二手数据。(三)调查方案设计调查方案设计包括确定调查目的、确定调查对象和调查单位、设计调查项目和调查表等主要内容。(四)统计数据的质量1.统计数据的误差影响统计数据质量水平的是统计误差,统计误差有登记误差和代表性误差两种。2.统计数据的质量要求统计数据的的质量评价标准有六个:①精度;②准确性;③关联性;④及时性;⑤经济性;⑥一致性。\n三.标准化试题(一)填空题1.统计数据的直接来源主要有两个渠道:一个是专门组织的调查,一个是统计实验。社会经济数据的主要来源是_______。2.普查通常是___________或周期性的。3.抽样调查是从调查对象的总体中__________抽取一部分单位作为样本进行调查。4.调查方法归纳起来可分为____________和观察实验两类。5.代表性误差通常是_____________,但可以计算和控制。(二)单项选择题1.可进行加减乘除运算的数据是()A.定类B.定序C.定距D.定比2.抽样调查最显著的优点是()A.经济性B.时效性C.适应面广D.准确性高3.检查产品寿命应使用哪种调查方法()A.普查B.抽样调查C.重点调查D.典型调查4.下列误差中哪一项不属于代表性误差产生的原因()A.抄录错误B.没遵循随机原则C.样本结构与总体结构存在差异D.样本容量不足5.检查在宁高校在校生生活费用支出情况,选择南京大学和南京财经大学进行调查是属于()A.普查B.抽样调查C.重点调查D.典型调查(三)多项选择题1.普查是()A.非全面调查B.专门调查C.全面调查D.经常性调查E.一次性调查2.统计指标根据作用和表现形式不同,可分为()A.数量指标B.总量指标C.相对指标D.平均指标E.质量指标3.下列哪些是时点指标()A.人口出生数B.商品库存量C.资产总额D.产品生产产量E.工资总额4.下列哪些是相对指标()A.人口密度B.人均产值C.职工平均工资D.产品销售量E.人口出生率5.非全面调查形式有()A.重点调查B.抽样调查C.典型调查D.统计报表E.普查(四)判断题1.一次性调查是指只调查一次,以后不再调查。()2.普查属于一次性调查。()3.抽样调查可以推断总体。()4.登记误差是不可以消除的。()5.人均GDP是平均指标。()(五)简答题1.请你设计一份调查方案。2.请你设计一份调查问卷。 四.参考答案\n(一)填空题1.专门调查2.一次性3.随机4.询问调查法5.无法消除(二)单项选择题1.(A)2.(A)3.(B)4.(A)5.(C)(三)多项选择题1.(B)(C)(E)2.(A)(E)3.(B)(C)4.(A)(B)(E)5.(A)(B)(C)(四)判断题1.(×)2.(√)3.(√)4.(×)5.(×)(五)简答题略 第三章统计资料的整理一、本章的重点与难点(一)本章重点掌握统计分组的原则与步骤;掌握变量数列的定义和编制方法;了解次数分布的特点与类型;了解各种统计图的定义和概念,掌握其特点和应用要求;掌握统计表的编制规则和应用步骤。(二)本章难点统计分组的意义、分组标志的选择、组距和组限的确定。二、内容提要(一)数据的预处理数据预处理包括审核、筛选和排序。1.对不同渠道取得的数据在审核内容和方法上有所不同。直接调查取得的原始数据从完整性和准确性上去审核。二手数据除审核其完整性和准确性外,还要审核其适用性和时效性。2.数据的筛选包括两个方面:一是剔除错误数据;二是剔除不符合特定条件的数据。3.数据排序是按一定的顺序将数据进行排列,以便发现数据的特征和趋势。(二)品质数据的整理与显示品质数据的整理是对数据进行分类,计算出每一类别的频数、频率或比例、比率,并用图形进行显示。(三)数值型数据的整理与显示品质数据的整理与显示方法都适用于数据型数据的整理与显示,但数据型数据还有一些特定的方法,而且这些方法不适用于品质数据。(四)统计表统计表是用于显示统计数据的基本工具,由表头、行标题、列标题、数字资料以及表外附注组成。\n三、标准试题(一)填空题1.数据的预处理包括数据的审核、筛选、___________等。2.数值型数据的分组方法有单变量值分组和____________两种。3.统计表是用于____________的基本工具。4.统计表一般由表头、行标题、列标题、_____________和表外附注组成。5.人口死亡率按年龄分布呈___________形分布。(二)单项选择题1.统计整理的资料()A.只包括直接资料B.只包括二手数据C.包括直接资料和二手数据D.是统计分析的结果2.下面哪一个是数量标志()A.学号B.性别C.民族D.钢产量3.下列哪一个是品质标志()A.所有制B.收入水平C.考试分数D.年龄4.某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为()A.230B.200C.210D.1805.变量数列的组中值是()A.组间变量值B.组内任意一变量值C.总体单位变量值D.上限与下限的平均数(三)多项选择题1.采用等距或异距分组主要取决于()A.现象性质差异的变动程度B.组距的大小C.组数的多少D.统计研究的目的E.变量的类型2.统计分组的关键在于()A.按品质标志分组B.按数量标志分组C.选择分组标志D.划分各组界限E.按主要分组标志分组3.分组标志的选择()A.根据总体划分的满意标准B.根据统计研究目的进行C.适应被研究对象的特征D.必须是数量标志E.必须考虑历史资料的可比性4.统计表的构成有()A.表头B.行标题C.列标题D.数字资料E.表外附加5.对原始资料的审核的内容是()A.完整性B.准确性C.时效性D.适用性E.经济性(四)判断题1.单变量值分组通常只适用于离散变量且变量值较少的情况。()2.在连续变量或变量值较多的情况下,可采用组距分组。()3.统计分组通常规定“上组线不在内”。()4.数据预处理是在统计数据分组或分类之后所做的必要处理。()5.对品质数据主要是分组整理,对数值型数据主要是分类整理。()(五)简答题1.影响次数分布的主要因素有哪些?\n2.如何选择分组标志?三、参考答案(一)填空题1.排序2.组距3.显示统计数据4.数字资料5.U(二)单选题1.(C)2.(D)3.(A)4.(A)5.(D)(三)多选题1.(A)(D)2.(C)(D)(E)3.(B)(C)(E)4.(A)(B)(C)(D)(E)5.(A)(B)(四)判断题1.(√)2.(√)3.(√)4.(×)5.(×)(五)简答题1.①组距与组数;②组限与组中值;③总体单位实际分布的特征或类型。2.①根据统计研究目的进行;②适应被研究对象的特征;③必须考虑历史资料的可比性。 第四章 样本数据集中趋势的度量方法一、本章的重点与难点(一)本章重点掌握各种平均数的定义、计算公式、步骤;掌握中位数的定义、计算公式、步骤;掌握众数的计算方法;掌握四分位数数的计算方法;了解Excel在平均数、中位数、计算中的应用。(二)本章难点掌握平均数、中位数以及众数的概念、计算公式和应用。二、内容提要 集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。 1.众数众数是一组数据中出现次数最多的变量值,用Mo表示,主要用于测度定类数据的集中趋势。由单项式数列确定众数比较简单,数列中出现次数最多的那个标志值就是众数。由组距式数列确定众数,是先根据出现次数确定众数所在组,然后利用下列公式计算众数的近似值: (4-1) 从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高点所对应的数值即为众数。如果数据的分布没有明显的集中趋势或最高峰点,众数可能不存在;如果有两个最高峰点,也可以有两个众数。 2.中位数中位数是一组数据从小到大排序后,处于中间位置上的变量值,用Me表示,主要用于测度定序数据的集中趋势。\n 计算未分组数据的中位数时,先对数据进行排序,然后确定中位数的位置,其公式为:中位数位置,最后确定中位数的具体数值。 计算分组数据的中位数时,先根据公式确定中位数所在的组,然后用下列公式计算中位数的近似值: (4-2) 中位数是一个位置代表值,其数值大小不受极端数值影响,因此具有稳健性或耐抗性的特点。中位数的另一个特征是:各变量值与中位数的离差绝对值之和最小。 3.均值均值也称算术平均数,是全部数据的算术平均,是集中趋势最主要的测度值,主要适用于定距数据和定比数据,但不适用于定类数据和定序数据。 (1)简单均值。计算未分组资料的均值,可采用简单均值计算公式: (4-3)(2)加权均值。计算经过分组的资料的均值,需采用加权均值计算公式: (4-4) 均值具有两个重要的数学性质:一是各变量值与其均值的离差之和等于零,即:;二是各变量值与其均值的离差平方之和等于最小值,即:最小值。(3)调和均值。在计算均值时,如果掌握基本公式的分子资料而没有分母资料,就需要使用调和平均数的形式进行计算: (4-5) 调和均值是算术均值的变形,二者在本质上是一致的,唯一的区别是计算时使用了不同的数据。调和均值适用于定比数据,不适用于定距数据。 (4)几何均值。几何均值是N个变量值乘积的N次方根,计算公式如下: (4-6) 4.众数、中位数和均值的比较 (1),数据是正态分布; (2),数据是左偏分布;(3),数据是右偏分布。注意:第四章的标准化试题与参考答案与第五章合并在一起。第五章 样本数据变异程度的测量一、本章的重点与难点(一)本章重点\n掌握极差的概念与计算;掌握方差与标准差的计算与应用;掌握变异系数的计算与应用;掌握Excel中统计函数的使用。(二)本章难点方差(或标准差)与变异系数的应用条件。二、内容提要(一)离散程度的测度 1.异众比率又称离异比率或变差比,是指非众数组的频数占总频数的比率,公式如下: (5-1) 2.极差也称全距,是一组数据的最大值与最小值之差。对于组距分组数据,极差是个近似值。 3.平均差是各变量值与其均值离差绝对值的平均数,未分组数据计算公式为: (5-2)组距分组数据计算公式为: (5-3) 平均差以均值为中心,反映了每个数据与均值的平均离差程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大。4.方差与标准差方差是各变量值与其均值离差平方的平均数,是测度定距和定比数据离散程度的最主要方法。标准差是方差的平方根。未分组数据方差计算公式为: (5-4)组距分组数据方差计算公式为: (5-5) 样本方差与总体方差在计算上的区别是:总体方差的分母是总频数N,样本方差的分母是总频数减1,即N-1。5.标准差系数是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,公式为: (5-6)标准差系数主要用于比较不同总体或样本数据的离散程度。 三、标准化试题 (一)填空题 1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的_____,反映所有数据向其中心值靠拢或聚集的程度;二是分布的_____,反映各数据远离其中心值的趋势;三是分布的_____,反映数据分布的形状。 2._____是一组数据中出现次数最多的变量值,它主要用于测度_____的集中趋势。\n3._____是一组数据按从小到大排序后,处于中间位置上的变量值,它主要用于测度_____的集中趋势,当然也适用于_____和_____的集中趋势。 4.均值也叫_____,是全部数据的算术平均,是集中趋势的最主要测度值,它主要适用于测度_____和_____的集中趋势。 5.均值的两个重要的数学性质是:各变量值与其均值的_____等于零;各变量值与其均值_____等于最小值。 6.简单均值是加权均值的_____事实上简单均值也有权数存在,只不过各变量值出现的权数均_____。 7.权数对于均值的作用,决定于作为权数的_____的比重大小。 8.调和平均数也叫_____,它是_____的一种变形。调和平均数只适合于_____,而对于_____则不宜使用。 9.几何平均数也称_____,它主要用于计算_____的平均数。它只适合于_____数据。 10.在一组数据分布中,当均值等于中位数等于众数时属于_____分布;当均值大于中位数大于众数时属于_____分布;当均值小于中位数小于众数时属于_____分布。 11.异众比率是指_____的频数占总频数的比率。其值越大,说明众数的代表性_____;反之,众数的代表性_____。 12.平均差是以_____为中心,反映了_____的平均离差程度,所以又称为_____。 13._____是各变量值与其均值离差平方的平均数,是测度定距数据和定比数据_____最主要的方法。 14.离散系数的作用主要用于比较_____总体或样本的离散程度,离散系数越大,说明均值的代表性_____;离散系数越小,说明均值的代表性_____。15.为了比较某校人数不等的两个班级学生学习成绩的优劣,需要计算_____;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算_____。 (二)判断题 1.根据组距式数列计算得到的均值只能是一个近似值。( ) 2.假定每一个变量值都扩大一倍,则扩大后的均值与原均值相等。( ) 3.对分组数据进行不同时期比较时,如果各组均值都有不同程度的上升,则总的均值一定也上升。( ) 4.众数的大小取决于众数组相邻组次数的多少。( ) 5.中位数是根据变量所处的中间位置来确定的,因此它不受变量数目和极端数值的影响。( ) 6.若已知甲数列的标准差小于乙数列,则可断言:甲数列均值的代表性好于乙数列。( ) 7.根据同一组数据计算全距和平均差,前者大于后者。( ) 8.根据同一组数据计算的结果,若均值大于众数,则次数分布曲线向左偏斜。( ) 9.集中趋势是指一组数据向其最大值靠拢的倾向,测度集中趋势也就是寻找数据的最大值。( ) 10.如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在。( ) 11.均值受各组变量值大小和各组权数大小的影响。( ) 12.若A、B、C三个公司的利润计划完成程度分别为95%、100%和105%,则这三个公司平均的利润计划完成程度应为100%。( ) 13.调和均值与算术均值在本质上是一致的,只是计算形式不同而已。当计算均值缺少基本公式的分子资料时可用调和均值来解决。( ) 14.当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,应采用几何均值来计算平均比率。( ) 15.某投资者连续三年股票投资收益率分别为4%、2%和5%,则该投资者三年内平均收益率为3.66%。( )\n 16.异众比率是指众数组的频数占总频数的比率。( ) 17.平均差是利用绝对值来消除离差的正负号的,所以它更适合于代数运算。( ) 18.离散系数最适合于不同性质或不同水平数列均值代表性的比较。( ) (三)单项选择题 1.由组距式数列确定众数时,如果众数组相邻两组的次数相等,则( ) A.众数为零 B.众数组的组中值就是众数 C.众数不能确定 D.众数组的组限就是众数 2.受极端数值影响最小的集中趋势值是( ) A.算术均值 B.调和均值 C.几何均值 D.众数和中位数 3.计算平均比率最适宜的方法是( ) A.算术均值 B.调和均值 C.几何均值 D.众数和中位数 4.影响均值大小的因素有( ) A.变量 B.变量值 C.变量的个数 D.数量标志 5.均值是将总体内各单位数量差异( ) A.抽象化 B.具体化 C.一般化 D.形象化 6.已知某班学生的平均年龄为17.8岁,其中18岁的人数最多,则该分布属于( ) A.正偏 B.左偏 C.右偏 D.正态 7.加权均值中的权数为( ) A.变量值 B.次数的总和 C.变量值的总和 D.次数比重 8.标准差系数抽象了( ) A.总体单位数多少的影响 B.标志变异程度的影响 C.总体指标数值大小的影响 D.均值高低的影响 9.某车间三个班生产同种产品,6月份劳动生产率分别为2、3、4(件/工日),产量分别为400、500、600件,则该车间平均劳动生产率计算式应为( ) A. B. C. D. 10.某公司2001年管理人员年均收入35000元,生产人员为25000元;2002年各类人员年均收入水平不变,但管理人员增加15%,生产人员增加25%,则两类人员平均年收入2002年比2001年( ) A.提高 B.下降 C.持平 D.无法判断 11.分配数列各组变量值都减少,每组次数加1倍,中位数( ) A.减少 B.增加1倍 C.增加2倍 D.不变 12.离散程度测度值中,由总体中最大变量值和最小变量值之差决定的是( ) A.方差 B.标准差 C.平均差 D.极差 13.离散程度的测度值愈大,则( ) A.反映变量值愈分散,均值代表性愈差B.反映变量值愈集中,均值代表性愈差C.反映变量值愈分散,均值代表性愈好D.反映变量值愈集中,均值代表性愈好\n 14.已知甲数列的均值为100,标准差为12.8;乙数列的均值为14.5,标准差为3.7。由此可以断言( )A.甲数列均值的代表性好于乙数列B.乙数列均值的代表性好于甲数列C.两数列均值的代表性相同D.两数列均值的代表性无法比较 15.计算中位数公式中的Sm-1,其涵义是( ) A.中位数所在组的频数 B.中位数所在组的累计频数 C.中位数所在组以前各组的累计频数 D.中位数所在组以后各组的累计频数 (四)多项选择题 1.加权均值等于简单均值的条件是( ) A.各组频数均相等 B.各组变量值不等 C.各组频数不等 D.数列为组距数列 E.各组频数都为1 2.加权均值的大小受下列因素的影响( ) A.各组变量值大小 B.各组频数多少 C.与各组变量值大小无关 D.与各组频数多少无关 E.各组变量值和频数共同影响 3.下列现象应采用调和均值计算的有( ) A.已知各组工人月工资和相应的工资总额,求平均工资B.已知某企业各车间废品率和废品量,求平均废品率C.已知各车间计划完成百分比和计划产量,求平均计划完成百分比D.已知各车间工人劳动生产率和产品产量,求平均工人劳动生产率E.已知某企业各产品的产量和单位成本,求平均单位成本 4.中位数公式中的Sm-1表示( ) A.中位数所在组的累计频数 B.中位数所在组以下的累计频数 C.按较小制累计的累计频数 D.中位数所在组以上的累计频数 E.按较大制累计的累计频数 5.均值是( ) A.总体数量特征的代表值 B.只能根据同质总体计算 C.总体分布集中趋势的度量 D.总体分布离中趋势的度量 E.代表现象发展的一般水平 6.在计算加权均值选择权数时,应该考虑的条件是( ) A.权数必须是单位数比重 B.权数可以是总体单位数 C.权数可以是单位数比重 D.权数必须是总体单位数 E.权数与变量值相乘具有经济意义 7.比较两组工作成绩发现:均值甲组小于乙组,标准差甲组大于乙组,由此可推断( )A.乙组均值代表性高于甲组 B.甲组均值代表性高于乙组C.乙组工作的均衡性好于甲组 D.甲组工作的均衡性好于乙组E.甲组离散程度大于乙组 8.下列离散程度测度值中,用无名数表示的有( )A.极差 B.平均差 C.标准差D.平均差系数 E.标准差系数 9.加权均值等于简单均值的条件是( ) A. B. C. D. E.\n 10.将所有变量值都减去10,那么其( ) A.均值不变 B.均值也减去10 C.方差不变 D.标准差不变 E.标准差系数不变 11.将所有变量值都扩大10倍,那么其( )A.均值不变 B.均值也减去10 C.方差不变 D.标准差不变 E.标准差系数不变 12.位置平均数是指( ) A.算术均值 B.调和均值 C.几何均值 D.众数 E.中位数 13.均值的数学性质有( ) A. B. C. D. E. 14.众数是( )A.由变量值在数列中的位置决定的B.依据变量值出现的次数决定的 C.总体单位变量值的平均值D.总体的一般水平 E.与总体中的极端值无关 15.几何均值的计算应满足的条件是( ) A.若干个比率的乘积等于总比率 B.相乘的各比率必须是正数 C.若干个比率之和等于总比率 D.相乘的各速度不能是负数 E.若干个速度相乘的结果是总速度 16.不同总体间的标准差不能简单进行比较,这是因为( ) A.均值不一致 B.标准差不一致 C.总体单位数不一致 D.计量单位不一致 E.与均值离差之和不一致 17.平均差的缺点是( ) A.最易受极端值的影响 B.不能反映数据的离散程度 C.在数学性质上不是最优的 D.未充分利用每个数据信息 E.数学处理中要考虑绝对值,计算中有许多不便18.在数据集中趋势的测度值中,不受极端值影响的测度值是( ) A.调和均值 B.几何均值 C.中位数 D.众数 E.算术均值 (五)简答题1. 什么叫集中趋势?测度集中趋势常用指标有哪些?2. 什么是几何均值?其适用场合是什么?3. 均值、众数和中位数有何关系?4. 什么叫离散趋势?测度离散趋势常用指标有哪些?5. 为什么要计算离散系数? (六)计算题 1.某车间工人日生产零件分组资料如下:零件分组(个)工人数(人)40-5050-6060-7070-8080-90 20 40 80 50 10 合 计 200\n要求(1)计算零件的众数、中位数和均值; (2)说明该数列的分布特征。 2.某公司所属三个企业生产同种产品,2002年实际产量、计划完成情况及产品优质品率资料如下:企 业实际产量(万件)完成计划(%)实际优质品率(%)甲乙丙10015025012011080959698试计算(1)该公司产量计划完成百分比; (2)该公司实际的优质品率。 3.某企业2003年一、二季度生产某产品产量资料如下:产 品等 级产品产量(台)出厂价格 (元)一季度二季度一等品二等品三等品75010050600300100 1800 1250 800 要求(1)计算平均等级指标,说明二季度相对一季度产品质量的变化情况;(2)由于质量变化而给该企业带来的收益(或损失)。 4.某区两个菜场销售资料如下:蔬 菜名 称单 价(元) 销售额(元) 甲菜场 乙菜场ABC 2.5 2.8 3.5220019501500165019503000试计算比较两个菜场价格的高低,并说明理由。 5. 某班同学《统计学》成绩资料如下: 统计学成绩(分)学生人数(人)40-5050-6060-7070-8080-9090-100 5 7 8 20 14 6 根据上述资料计算平均成绩、标准差及标准差系数。 6.计算5、13、17、29、80和150这一组数据的算术均值、调和均值和几何均值,并比较它们的大小。 四、参考答案 (一)填空题1.集中趋势 离散程度 偏态和峰度2.众数 定类数据3.中位数 定序数据 定距数据 定比数据\n4.算术平均数 定距数据 定比数据5.离差之和 离差平方之和6.特例 相等7.单位数占总体单位数8.调和均值 算术平均数 定比数据 定距数据9.几何均值 比率或速度 定比10.正态 左偏 左偏11.非众数组 越差 越好12.均值 每个数据与均值 平均离差13.方差 离散程度14.不同 越差 越好15.均值 离散系数(或标准差系数) (二)判断题 1.(√) 2.(×) 3.(×) 4.(√) 5.(×) 6.(×) 7.(√) 8.(×) 9.(×) 10.(√) 11.(√) 12.(×) 13.(×) 14.(√) 15.(√) 16.(×) 17.(×) 18.(√) (三)单项选择题1.(B) 2.(D) 3.(C) 4.(B) 5.(A) 6.(B) 7.(D) 8.(D) 9.(D) 10.(B) 11.(A) 12.(D) 13.(A) 14.(A) 15.(C) (四)多项选择题1.(A)(E)2.(A)(B)(E)3.(A)(B)(D) 4.(D)(E)5.(A)(B)(C)(E) 6.(B)(C)(E)7.(A)(C)(E) 8.(D)(E)9.(A)(B)(C)(D) 10.(B)(C)(D)11.(B)(E) 12.(D)(E)13.(B)(C)(D)(E) 14.(B)(D)(E)15.(A)(B)(D)(E) 16.(A)(D)17.(C)(E) 18.(C)(D) (五)简答题 1.集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。测定集中趋势常用的指标有:众数、中位数和分位数、均值等。 2.几何均值也称几何平均数,它是N个变量值乘积的N次方根。几何均值是适用于特殊数据的一种平均数,它主要用于计算比率或速度的平均值。 3.从分布角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均值。同一组数据的众数、中位数和均值具有以下关系:在单峰分布条件下,如果数据的分布是对称的,则;如果数据是左偏分布的,则;如果数据是右偏分布的,则。 4.数据的分散程度是数据分布的一个重要特征,它所反映的是各变量值远离其中心值的程度,因此也称为离中趋势。测定离中趋势的指标主要有异众比率、四分位差、方差和标准差、极差、平均差以及离散系数等。 5.为了消除不同组别变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 (六)计算题 1.零件分组(个)工人数(人)组中值 x标志总量xf累计频数 S\n40-5050-6060-7070-8080-90 20 40 80 50 1045556575859002200520037508502060140190200 合 计 200-12900- 因为,所以,该数据分布属于左偏分布。 2.(1)产量计划完成百分比: (2)实际优质品率: 3.(1)平均等级: 二季度比一季度平均等级下降0.28级。 (2)由于质量下降而带来的损失: 由于产品质量下降而损失元。 4.\n乙菜场比甲菜场平均价格高0.16元,理由是销售量结构变动影响。 5.成绩(分)人数(人)40-5050-6060-7070-8080-9090-100 5 7 8 20 14 622538552015001190570793.55330.1566.753.35139.95476.553967.742311.04533.9966.981959.282859.29合 计 604390-9205.06 6. 第六章概率论基础知识一、本章的重点与难点(一)本章重点了解随机实验、样本空间、随机事件、条件概率、概率运算的基本性质;掌握随机变量概率分布的概念和规律,并能够做出相应的图形;掌握二项分布和正态分布的概念类型和数字特征;了解连续型随机变量和离散型随机变量概率分布的区别;掌握几个常用的随机变量分布。\n(二)本章难点掌握二项分布和正态分布的概念类型和数字特征;了解连续型随机变量和离散型随机变量概率分布的区别;利用Excel工具进行统计正态分布、二项分布的概率和累积分布。二、内容提要(一)随机实验在一定条件下具有多种可能结果,呈现出不确定性,哪种结果将会发生,事先不能确定的现象,同时具备统计规律性的现象,称为随机现象。概率论是研究随机现象规律性的一门科学。需要对客观事物进行观察,观察的过程即为实验。概率论中所说的实验是指随机实验,它具有下列三个特性:1.可以在相同的条件下重复进行;2.每次实验的结果具有多种可能性,并且实验所有可能的结果是事先已知的;3.进行一次实验之前不能确定哪一个结果会出现。在概率论中,将具有上述三个特点的实验成为随机实验。(二)样本空间对于随机实验,尽管在每次实验之前不能预知实验的结果,但实验的所有可能结果组成的集合是已知的。我们将随机实验E的所有可能结果组成的集合称为E的样本空间,记为S。样本空间的元素,即E的每一个结果,称为样本点。假设我们投掷硬币3次,每次投掷有2种可能,因此有8种可能结果,(正、正、正)、(正、正、反)、(正、反、反)、(正、反、正)、(反、反、反)、(反、正、正)、(反、反、正)(反、正、反)。样本空间的元素是由实验的目的所确定的,例如,在E和Ω中同是将一枚硬币连抛三次,由于实验的目的不一样,其样本空间也不一样。(三)随机事件在随机实验中,可能发生也可能不发生的事件,随机实验的结果称为随机事件,简称事件。随机事件通常用大写字母A,B,C,…表示,它是样本空间S的子集合。由于在一次实验中,可能出现这个结果,也可能出现那个结果,因此,指定的某个随机事件可能发生,也可能不发生。在每次实验中,当且仅当由子集A中的一个样本点组成的单点集,称为基本事件。随机事件由基本事件组成的集合。例如,随机实验E是“抛2次硬币”,事件“两枚出现相同面”,就由两个基本事件组成:“正、正”,“反、反”。事件“至少出现1个正面”,就由3个基本事件“正、正”、“正、反”、“反、正”组成。如果在每一次实验中,某个结果必定出现,或者必定不出现,则分别称为必然事件和不可能事件。样本空间S包含所有的样本点,它是S自身的子集,在每次实验中它总是发生的,称为必然事件。空集Φ不包含任何样本点,它也作为样本空间的子集,它在每次实验中都不发生,成为不可能事件。(四)相容事件与不相容事件\n在随机实验中,不能同时发生或其交集为空集的几个事件,称为不相容事件,反之就称为相容事件。例如,随机实验E为“先后投2枚硬币”,A事件“两枚出现相同面”(由事件“正、正”和事件“反、反”构成)与B事件“两枚出现不同的面”(由事件“正、反”和“反、正”构成),就是两个不相容的事件。C事件“至少出现1枚正面”(由“正、正”、“正、反”、“反、正”组成)与D事件“至少出现1枚反面”(由“反、反”,“正、反”、“反、正”组成),就是两个相容的事件。若形象地把事件看成平面上的点集,那么,若A与B没有共同的点,则A与B就是不相容事件;若A与B有共同的点,则A与B就是相容事件。(五)概率概率的定义:设E是随机实验,S是其样本空间,给E的每一个事件A赋一个实数,若满足如下条件,就称为的概率:(1)对每一个事件,有;(2);(3)两两互不相容的事件有的并集的概率,等于各个的概率之和:(六)概率运算的基本性质(1)设是的对立事件(若把事件看成平面上的点集,则是样本空间S中、除以外的所有的点),则。当为样本空间S时,为空集Φ,从而可以得到空集Φ的概率为0:(2)对任意两个事件与,有其中,是与的交集的缩写。若与的交集为空集(即A与B不相容或不相交),则A与B的并集的概率,就是、两个事件的概率之和:\n(3)若事件,即中的点都包含于中,都是中的点,则。(七)古典概率型随机实验“概率型”是指某种概率模型,“古典概型”是一种最简单、最直观的概率模型。若一个随机实验的基本事件的个数有限,且基本事件出现的概率相等,则该随机实验成为等概率随机实验或等可能概型。抛均匀的硬币、抛均匀的骰子,都是等概率随机实验的例子。在等概率随机实验中,事件的概率计算公式是:包含的基本事件个数/该实验中基本事件的总个数例如,随机实验E“先后抛2枚均匀的硬币”,共有4个基本事件:“正、正”,“正、反”,“反、正”,“反、反”。若我们要考察的事件A是“至少有1枚正面朝上”,那么,事件A包括3个基本事件“正、正”、“正、反”、“反、正”,所以P(A)=3/4。下面的例题应用到古典概型随机实验中的事件出现的概率计算公式。例1:一口袋装有6只球,其中4只白球、2只红球。从袋中取球两次,每次随机的取一只。第一次取一只球,.观察其颜色后放回袋中,搅匀后再取一球。求⑴取到的两只球都是白球的概率;⑵取到的两只球颜色相同的概率;⑶取到的两只球中至少有一只是白球的概率。解:以A、B、C分别表示“取到的两只球都是白球”,“取到的两只球都是红球”,“取到的两只球中至少有一只是白球”。易知“取到两只颜色相同的球”这一事件即为A∪B,而C=。在袋中依次取两只球,每一种取法为一个基本事件,显然此时样本空间中仅包含有限个元素。且由对称性知每个基本事件发生的可能性相同,第一次从袋中取球有6只球可供抽取,第二次也有6只球可供抽取。由组合法的乘法原理,共有36种取法。即样本空间中元素总数为36。对于事件A而言,由于第一次有4只白球可供抽取,第二次也有4只白球可供抽取,由乘法原理共有16种取法,即A中包含16个元素。同理,B中包含4个元素。于是====由于,得(八)条件概率1.条件概率\n在实际问题中,常常会遇到这样的问题:在得到某个信息以后(即在已知事件发生的条件下),求事件发生的概率。这时,因为求的概率是在已知发生的条件下,所以称为在事件发生的条件下事件发生的条件概率。记为。由此引入条件概率的一般定义:设,是两个事件,且,称为在事件发生的条件下事件发生的条件概率。例2:设某种动物由出生起活到20年以上的概率为80%,活到25年以上的概率为40%。如果现在有一个活了20年的这种动物,求它能活25年以上的概率。解:设事件={能活20年以上};事件={能活25年以上},按题意,,由于,因此。由条件概率定义,则有2.乘法公式由条件概率定义式,易得:这就是所谓概率的乘法公式或乘法定理。利用这个公式可以计算积事件。乘法公式可以推广到个事件的情形。例3:在一批由90件正品,3件次品组成的产品中,不放回接连抽取两件产品,求第一件取正品,第二件取次品的概率。解:设事件={第一件取正品};事件={第二件取次品}。按题意,,.由乘法公式,则有3.全概率公式和贝叶斯定理若随机实验E中的一组事件满足:(1)若,i≠k,即这些事件不相容;(2)即这些事件是样本空间S的一个划分;这样,任意事件也就可以被划分为互不相容的子事件:,于是由概率的性质,有:\n这就是全概率公式。例4:设一个仓库中有10箱同样规格的产品,已知其中有5箱、3箱、2箱分别为甲、乙、丙三厂生产,且甲、乙、丙三厂生产该产品的次品率依次为,从这几箱产品中任取一箱,再从取得的这几箱中任取一件产品,求得正品概率。解:设依次表示取得这箱产品为甲、乙、丙三厂生产,用B表示取得产品为正品,由于互斥了解全概率公式应用条件:贝叶斯公式(对于概率运算和风险决策非常有用的定理)把条件概率的定义扩展一下,就可以得到贝叶斯公式:其中,事件的概率是事先给出的,通常称为先验概率。而在事件B出现后(出现的条件下)事件的概率,就称为后验概率,或者说,是因事件B的出现而“矫正”了的事件的概率。例5:(物流管理问题)某企业的产品配件全部委托甲、乙两家公司快递,两家公司都承诺在第二天中午12点之前送到,在以往的委托中,甲公司承担了60%企业业务,其中90%的业务是在承诺时间。乙公司承担40%快递业务,其中80%是在承诺时间完成的。现在某顾客反映他的配件没有按时抵达,试计算该配件由甲公司和乙公司递送的概率是多少?解:事件甲:甲公司递送,事件乙:乙公司递送,A按时抵达现在求和:\n4.随机事件的独立性设,是两个事件,一般而言,这表示事件的发生对事件的发生的概率有影响,只有当时才可以认为的发生与否对的发生毫无影响,就称两事件是独立的.其直观意义也比较明确:若无论事件的发生与否,对事件的概率都没有影响,那么,事件对于事件是独立的。由于从“相对于独立”,推导出“相对于独立”,所以,只要成立,我们就说,与是相互独立的。事实上,若事件相对于事件是独立的,即,那么,当时,有即事件相对于事件也是独立的。若两事件满足,则称相互独立。若四对事件中有一对是相互独立的,则另外三对也是相互独立的。任意两个事件,满足下列条件之一,就称为相互独立的随机事件:⑴且;⑵且。对任意两个相互独立的事件,有(九)离散型随机变量及其分布规律有些随机变量,它全部可能取到的不相同的值是有限个或可列无限多个,这种随机变量称为离散型随机变量。要掌握一个离散型随机变量的统计规律,必须且只需知道的所有可能取值以及每一个可能值的概率。离散型随机变量的概率是指:离散型随机变量所有可能取的值为,取各个可能值的概率,即事件的概率,例如,抛骰子,对于出现的任一个点数都有:就是表示离散型随机变量X取数值k时的概率。\n1.离散型随机变量的概率分布离散型随机变量的概率分布指:离散型随机变量取遍每一个实验结果的概率分布情况。概率分布也可以用表格的形式来表示,如表6-1:表6-1离散型随机变量的概率分布表……………………上面的表格6-1直观地表示了随机变量取各个值的概率的规律。取各个值各占一些概率,这些概率合起来是1。可以想象成:概率1以一定的规律分布在各个可能值上。例1.设袋中装有6个球,编号为{-1,2,2,2,3,3},从袋中任取一球,求取到的球的号的分布律。解:因为可取的值为-1,2,3,而且,,所以的分布律如下表6-2所示。表6-2离散型随机变量分布计算表的取值-123的概率2.离散随机变量的累积概率的概率,称为随机变量(小于等于)的累积概率,在例1中,随机变量的累积概率为。3.离散随机变量的累积概率分布离散随机变量的累积概率分布是指:离散随机变量小于等于每一个可能的实验结果x(用数字表示结果)的概率的分布情况。这个结果同样可以用表格6-3表示:表6-3离散随机变量累积概率分布的取值-123\n的概率14.离散随机变量的均值和方差离散型随机变量的均值:其中,是随机变量的所有可能取值中的第个值。离散型随机变量的方差:其中,是随机变量的所有可能取值中的第个值。(十)连续型随机变量及其分布规律除了离散型随机变量外,还有一类重要的随机变量——连续型随机变量,这种随机变量可以取某个区间或的一切值。由于这种随机变量的所有可能取值无法像离散型随机变量那样一一排列,因而也就不能用离散型随机变量的分布律来描述它的概率分布,刻画这种随机变量的概率分布可以用分布函数,但在理论上和实践中更常用的方法是用所谓的概率密度。设随机变量的分布函数,如果存在一个非负可积函数使得对于任意实数x,有则称为连续随机变量,而称为的概率密度函数(或分布函数),简称概率密度(或分布密度)。由概率密度的定义及概率的性质可知概率密度必须满足:⑴,从几何上看,概率密度函数的曲线在横轴上方;⑵,这是因为是必然事件,所以从几何上看,对于任一连续型随机变量,概率密度函数与数轴所围成的面积是1;⑶对于任意实数有;⑷若在点处连续,则有1.连续型随机变量的累积概率的概率,称为随机变量(小于等于某个)的累积概率。随机变量时,累积概率相应的图形是图6.1所示\n图6.1连续型随机变量累积概率图2.连续型随机变量的累积概率分布连续型随机变量的累积概率分布是指:连续型随机变量小于等于每一个可能的实验结果(用数字表示结果)的概率的分布情况。3.连续型随机变量的累积概率分布函数连续型随机变量的累积概率分布函数是指:连续型随机变量小于等于每一个可能的实验结果(用数字表示结果)的概率,函数表示为。在这里所讲的“连续型随机变量的概率分布函数”,准确的称呼都应该是“连续型随机变量的累积概率分布函数”。4.连续型随机变量的概率密度函数连续型随机变量的概率密度函数,是这样一个数学函数式:在该曲线下面任何一个区间的面积,等于随机变量在该区间上取值的概率。概率密度函数记为,是概率密度函数在处的取值。连续型随机变量的密度函数可以表达为具体的解析式,比如正态分布的密度函数可以表达为连续型随机变量的概率密度分布与离散型随机变量的概率分布相对对应;连续型随机变量的(累积)概率分布与离散型随机变量的累积概率分布相对应。在离散型随机变量的问题中,累积概率是概率的求和关系。在连续型随机变量问题中,(累积)概率就应当是概率密度的积分关系。于是,连续型随机变量的(累积)概率分布函数,与其概率密度函数的关系里如下:或者5.连续型随机变量均值和方差连续型随机变量的均值:其中,是限定随机变量X可能取值范围的量。\n连续型随机变量的方差:由均值与方差的定义,不难看出“连续型随机变量的概率密度分布,与离散型随机变量的概率分布”的对应关系。(十一)、离散分布与连续分布的区别⑴离散分布的随机变量在离散点取值(可以是有限多个,也可以是无限多个离散点),并在这些点上存在概率值;⑵连续分布的随机变量在(连续)区间上取值,并且只有在这些区间上其概率值才可能为正值,在连续随机变量的任何取值点(离散点)上,其概率值均为零;⑶连续型随机变量的概率密度分布,与离散型随机变量的概率分布相对应;⑷连续型随机变量的(累积)概率分布,与离散型随机变量的累积概率分布相对应。(十二)几种常用的随机变量分布1、两点分布(0-1分布)例如,抛(不均匀的)硬币,出现正面的概率是,出现反面的概率就是。设:出现正面时随机变量的取值为,出现反面时随机变量的取值为,则两点分布表述为,。若服从两点分布,则记为。两点分布的均值是,即,方差是,即。两点分布的概率分布如下表6-4所示。表6-40-1分布102、二项分布如果随机变量只可能取的值为,抛次(不均匀)的硬币(又称贝努利实验),正面出现次的概率为其中.则称服从参数为的二项分布,记为。当时,二项分布就是两点分布。二项分布的均值是,方差是。例2:设有20台机床,独立地各加工一件齿轮,若各机床加工的废品率都是0.2,求得到的20件齿轮产品中恰有一件废品的概率。解:此例可以看做是贝努里实验问题。设表示20件齿轮产品中的废品的个数,则。即有:\n3、泊松分布如果随机变量所有可能取的值为0,1,2,…,它取各个值的概率为其中是常数,则称服从参数为的泊松分布,记为。随机变量的均值为,即,方差也是λ,即。泊松分布在各个领域中有着广泛的应用。例如某段时间内电话机接到的呼唤次数,候车的乘客数,放射性物质在某段时间内放射的粒子书,某页书上的印刷错误的个数等都可以用泊松分布来描述。例2:已知某厂生产的产品中废品率为1%,问400只这类产品,废品至少有5只的概率是多少?解:400只产品中废品的个数应该服从二项分布:由于比较大,比较小,且,即是一个常数,故可以认为是近似地服从泊松分布:其中,,这样,所求的概率为:当服从泊松分布时,可以从泊松分布表中查得,即有:,代入上式,得:4、均匀分布如果随机变量的概率密度为则称服从上的均匀分布。如果服从上的均匀分布,那么对于任意满足\n的,,应有。该式说明取值于中任意小区间的概率与该小区间的长度成正比,而与该小区间的具体位置无关,这就是均匀分布的概率意义。例如飞机灭蝗,可以假设撒药是均匀的,那么每块土地上农药的含量,只与其面积有关,而与其位置无关,这就是均匀分布。例3:设电阻值是一个随机变量,均匀分布在900Ω~1100Ω。求的概率密度及落在950Ω~1050Ω的概率。解:按题意,的概率密度为故有.5、指数分布如果随机变量X的概率密度则称X服从指数分布(参数为λ)。指数分布也称为寿命分布,如电子元件的寿命,电话通话的时间,随机服务系统的服务时间等都可近似看做是服从指数分布。6、正态分布通常我们把总体看作是一个随机变量,有它自身的分布,(大多数均视为正态分布),其分布中有参数,这些参数往往与总体特征数有关。正态分布有两个参数:,,其中就是的期望,就是的方差。所以我们常把总体的特征数叫做总体参数。这些总体特征数不易直接求出,由于样本是总体的一部分,故可根据样本的统计量的信息推断总体参数。为了介绍总体参数的推断,这里先来介绍几个与正态分布有关的概率分布。如果随机变量X的概率密度为其中,,为常数,则称服从参数为,的正态分布,记。例如一个地区(或一个民族)的人的身高(或收入)、机器生产的某种零件的长度等,(设其为随机变量)都服从正态分布。曲线和轴之间的面积表示概率。当然,不论图中曲线如何陡或如何平,只要是概率密度函数之间的面积就总是1。相应的(累积)概率分布函数为其中,为均值,为方差。正态分布的数学符号是。符号中的表示均值,\n表示方差。这两个参数确定了,正态分布的图形形状也就随之确定了。方差越大,正态分布的概率密度函数图就越扁平。反之,方差越小,正态分布的概率密度函数图就越陡,峰值就越高。这是由于概率密度函数曲线与轴之间面积必须为1的缘故。当时,正态分布称为标准正态分布.对任何一个正态分布而言,只要做一个变换,令相应的随机变量就服从标准正态分布例4:求服从正态分布的随机变量X的取值落在区间的之间概率(=1,2,3)。解:=Ф()=由正态分布表可查出:以上计算表明,正态随机变量几乎都分布在区间之间。例5:公共汽车的高度是按男子与车门顶碰头的机会在0.01以下来设计的,设男子身高(cm)服从正态分布(170,36),试确定车门的高度。解:、设车门的高度为(cm),依题意有:即因为,查标准正态分布表得Ф(2.33)=0.9901>0.99,所以得,即h=184(cm),故车门的设计高度至少应为184cm方可保证男子与车门碰头的概率在0.01以下。三、标准化试题1.用随机变量来描述掷一枚骰子的试验结果,并写出它的分布律.\n2.某试验成功的概率为,代表第二次成功之前试验失败的次数,写出的分布律.3.表1能否为某个随机变量的分布律?为什么?表11230.150.450.64.产品有一、二、三等品和废品四种,一、二、三等品率和废品率分别为55%、25%、19%、1%.任取一件产品检验其质量等级,用随机变量表示检验结果,并写出其分布律和分布函数.5.设某种试验成功的概率为0.7,现独立地进行10次这样的试验.问是否可以用一个服从二项分布的随机变量来描述这10次成功的次数?如何描述?请写出它的分布以及分布的数学期望和标准差.6.如果你是一个投资咨询公司的雇员,你告诉你的客户,根据历史数据分析结果,企业A的平均投资回报比企业B的高,但是其标准差也比企业B的大.你应该如何回答客户提出的如下问题:(1)是否意味着企业A的投资回报肯定会比企业B的高?为什么?(2)是否意味着客户应该为企业A而不是企业B投资?为什么?7.某公司估计在一定时间内完成某项任务的概率如表2:表2天数12345概率0.050.200.350.300.10(1)求该任务能在3天之内(包括3天)完成的概率;(2)求完成该任务的期望天数;(3)该任务的费用由两个部分组成—20000元的固定费用加每天2000元,求整个项目费用的期望值;(4)求完成天数的标准差.8.求题4中随机变量的期望和方差,以及.9.设随机变量的概率密度函数为求;的数学期望.10.一工厂生产的某种设备的寿命(以年计算)服从指数分布,概率密度为\n工厂规定,出售的设备若在售出一年之内损坏可予以调换.若工厂售出一台设备盈利100元,调换一台设备需花费300元,试求厂方售出一台设备净盈利的数学期望.11.设与为随机变量,,,,.在下列情况下,求和(1)(2)(3)12.查表求:.13.某零件的寿命服从均值为1200小时,标准差为50小时的正态分布.随机地抽取一只零件,试求:(1)它的寿命不低于1300小时的概率;(2)它的寿命在1100小时和1300小时之间的概率;(3)它的寿命不低于多少小时的概率为95%?14.一工厂生产的电子管寿命(以小时计算)服从期望值为的正态分布,若要求:,允许标准差最大为多少?四、参考答案1.令为掷一枚骰子的试验结果,则的取值为1,2,3,4,5,6,并且取其中任一值的概率都是1/6.其分布律如下:1234561/61/61/61/61/61/62.的分布律为:0123n\n3.1230.150.450.6不能,因为0.15+0.45+0.6=1.2>1.4.12340.550.250.190.1分布函数为:5.本题中实验的结果只有两种,成功,不成功,符合Bernoulli实验的特征.令为10次实验中成功的次数,显然的取值范围就是0,1,2,,10,而且取的概率为:其中为0-10间的自然数.显然可以服从二项分布的随机变量来描述这10次实验中成功次数.具体分布就是:数学期望:标准差:6.(1)平均投资回报反映的是长期的平均结果.就某一年或短期而言,并不能说A的投资回报一定比B高.(2)不一定.实际上,选择的结果依赖于不同决策者对待风险的态度.7.某公司估计在一定时间内完成某项任务的概率如下:(1)3天之内完成的概率为:0.05+0.20+0.35=0.60.(2)任务完成的期望天数天.(3)费用=20000+2000完成任务天数费用期望值(费用)=(元)(4)方差则标准差\n8.期望方差9.(1)(2)10.设备寿命小于一年的概率又因为设备寿命小于一年时厂方的收益为100-300=-200元,而设备寿命大于一年时厂方的收益为100元,故出售一台设备净盈利的数学期望(元)11.三种情况下,的值都相同,且为:而的值各不相同,分别为:(1)(2)(3)12.13.据题意有,故:(1)(2)\n(3)设寿命不低于小时的概率为95%则有:得,,(小时)14.所以允许标准差最大为31.25\n第七章推断统计一、本章的重点与难点(一)本章重点了解抽样推断的基本概念,抽样推断的意义、特点及作用;掌握抽样误差的概念、影响因素及计算方法;掌握常用的样本统计量,正态分布,及由正态分布引出的分布、分布和分布,置信度和置信区间的概念,以及点估计和区间估计的方法;了解抽样方案设计的基本原则、抽样组织形式的选择;掌握样本容量的确定方法。(二)本章难点掌握抽样的方法与类型;掌握抽样误差的计算方法;掌握置信区间计算以及正态分布及分布、分布和分布的特点;能够利用Excel软件进行推断估计。二、内容提要(一)抽样与抽样分布的基本概念总体和个体:通常把所要调查研究的事物或现象的全体称为总体,组成总体的每个元素称为个体,一个总体中所含的个体的数量称为总体容量。样本、样本容量与样本个数:从总体中抽取的部分个体称为样本,样本中所含个体的数量称为样本容量。从总体中可能抽取或可能构成的样本的数目称为样本个数。参数与统计量:参数是总体的数量特征,对于某个总体来说,其参数是定值。统计量是样本的数量特征,它的值是随着样本的不同而变化的,因此是个随机变量。抽样与抽样分布:为了推断总体的某些重要特征,需要从总体中按一定抽样技术抽取若干个体,这一抽取过程称为抽样。每个随机变量都有其概率分布,样本统计量的概率分布即抽样分布。(二)抽样方法从总体中抽取样本的方法有概率抽样和非概率抽样两种。1.概率抽样也叫随机抽样,是按照随机原则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、整群抽样和等距抽样。2.非概率抽样也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干个体构成样本的方法。(三)参数估计的基本方法1.点估计当总体随机变量的分布函数形式为已知,但它的一个或多个参数未知时,若从总体中抽取一个样本,用该样本对某一未知参数所作的一个数值点的估计,称为参数的点估计。点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。对于同一参数,用不同方法来估计,可能得到不同的估计量。一个好的估计量通常要求满足三个准则:一致性、无偏性和有效性。2.区间估计是用一个区间去估计未知参数,即把未知参数值估计在某两界限之间。设是来自密度的样本,对给定的,如果能找到两个统计量及使得,则称是置信度,也称为置信概率;是置信度为的的置信区间;称为显著性水平。在进行区间估计时,必须同时考虑置信概率与置信区间两个方面,置信概率越大(即估计的可靠性越大),则置信区间相应也越大(即估计精确性越小)。因此,可靠性与精确性要结合具体问题、具体要求来全面考虑。\n(四)总体均值和总体比例的区间估计1.总体均值的区间估计(1)总体方差已知时对总体均值的区间估计:在给定显著性水平下,总体均值在的置信水平下的置信区间为:(2)未知时总体均值的区间估计当总体为正态总体而方差未知时,要用统计量来构造总体均值的置信区间。此时总体均值的置信区间为:2.总体比例的区间估计在许多实际问题中,常常需要估计总体中具有某种特征的单位占总体全部单位的比例。我们称这个比例为总体比例,记为;称样本具有该种特征的单位占样本全部单位的比例为样本比例,记为。在的置信水平下,总体比例的置信区间为:3.样本容量的确定(1)估计总体均值时,样本容量的确定:重复抽样公式:不重复抽样公式:(2)估计总体比例时,样本容量的确定:重复抽样公式: 三、标准化试题 (一)填空题1.通常把所要调查研究的事物或现象的全体称为,而把组成总体的每个元素称为,一个总体中所含的个体的数量称为。2.为了推断总体的某些重要特征,需要从总体中按一定抽样技术抽取若干个体,将这一过程称为。3.在实际应用中,抽样方法主要有两种:__和。4.概率抽样最基本的组织方式有:纯随机抽样、分层抽样、和等距抽样。5.中心极限定理告诉我们不管总体服从什么分布,其__的分布总是近似服从正态分布。6.抽样调查是遵循抽选样本,通过对样本单位的调查来对研究对象的总体数量特征做出推断。7.和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,只是推断的角度不同而已。\n8.只要使用非全面调查的方法,即使遵守随机原则,___也不可避免会产生。9.参数估计有两种形式:一是_,二是_。10.判别点估计优良性的三个准则是:、和。11.抽样的允许误差是指与的最大绝对误差范围。12.对于简单随机重复抽样,若其他条件不变,则当允许误差范围Δ缩小一半,抽样单位数必须为原来的倍。若Δ扩大一倍,则抽样单位数为原来的。13.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是,允许误差是,抽样平均误差是。14.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量。15.置信区间表达了区间估计的精确性,置信概率表达了区间估计的可靠性,它是区间估计的可靠概率;而表达了区间估计的不可靠的概率。16.影响必要样本容量的因素有总体方差、和可靠性系数等。 (二)判断题1.抽样误差是抽样调查中无法避免的误差。()2.抽样误差的产生是由于破坏了随机原则所造成的。()3.重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。()4.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。()5.当总体单位数很大但分布不均匀时,不宜采用抽样调查的方法。()6.遵循随机原则抽样,可以使样本与总体同分布,进而提高样本的代表性。()7.抽样调查所遵循的基本原则是可靠性原则。()8.样本指标是一个客观存在的常数。()9.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。()10.抽样平均误差就是抽样平均数的标准差。() (三)单项选择题1.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的()A.2倍B.3倍C.4倍D.5倍2.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做()A.分层抽样B.简单随机抽样C.整群抽样D.等距抽样3.计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算()A.最小一个B.最大一个C.中间一个D.平均值4.抽样误差是指()A.计算过程中产生的误差B.调查中产生的登记性误差C.调查中产生的系统性误差D.随机性的代表性误差5.抽样比例是一个()A.结构相对数B.比例相对数C.比较相对数D.强度相对数6.比例和比例方差的关系是()A.比例越接近于0,比例方差越大B.比例越接近于1,比例方差越大C.比例越接近于0.5,比例方差越大D.比例越接近于0.25,比例方差越大7.整群抽样是对被抽中的群做全面调查,所以整群抽样是()A.全面调查B.非全面调查C.一次性调查D.经常性调查8.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为()\nA.4%B.4.13%C.9.18%D.8.26%9.根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是()A.甲产品大B.乙产品大C.相等D.无法判断10.抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差()A.甲企业较大B.乙企业较大C.不能做出结论D.相同(四)多项选择题1.抽样调查中的抽样误差()A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.只能在调查结果之后才能计算E.其大小是可以控制的2.重复抽样的特点是()A.各次抽选相互影响B.各次抽选互不影响C.每次抽选时,总体单位数始终不变D.每次抽选时,总体单位数逐渐减少E.各单位被抽中的机会在各次抽选中相等3.抽样调查所需的样本容量取决于()A.总体方差B.允许误差C.样本个数D.置信度E.抽样方法4.分层抽样误差的大小取决于()各组样本容量占总体比重的分配状况B.各组间的标志变异程度C.样本容量的大小D.各组内标志值的变异程度E.总体标志值的变异程度5.在抽样调查中()A.全及指标是唯一确定的B.样本指标是唯一确定的C.全及总体是唯一确定的D.样本指标是随机变量E.全及指标是随机变量 (五)简答题1.什么叫抽样?抽样方法主要有哪两种?2.什么是中心极限定理?3.什么叫估计量?评价估计量优劣有哪些标准?4.确定必要的抽样数目有何意义?必要抽样数目受哪些因素影响? (六)计算题1.某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。调查结果显示:平均亩产为450公斤,亩产量的标准差为52公斤。试以95%的置信度估计该地区粮食平均亩产量的区间。 2.某地对上年栽种一批树苗共3000株进行了抽样调查,随机抽查的200株树苗中有170株成活。试以95.45%的概率估计该批树苗成活率的置信区间和成活总数的置信区间。 3.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:月收入(元)80090095010001050110012001500工人数(人)679109874(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。(2)试以0.9545的置信度估计月收入在1000元及以上工人所占比重。 \n4.对一批产品按不重复抽样方法抽选200件,其中废品8件。又知道抽样总体是成品总量的1/20,当概率为95.45%时,可否认为这一批成品的废品率低于5%? 5.某企业从长期实践中得知,其产品直径是一随机变量,服从方差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8、15.3、15.1、15、14.7、15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。 6.某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质品率为85%,试计算当把握程度为95%时优质品率的区间范围。 7.检验某食品厂本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品? 8.某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?四、参考答案(一)填空题1.总体总体容量2.抽样3.概率抽样;非概率抽样4.整群抽样5.样本均值6.随机原则7.参数估计8.抽样误差9.点估计区间估计10.一致性无偏性有效性11.样本估计值;总体参数12.41/413.10004020.4114.少15.显著性水平16.允许误差(二)判断题1.(√)2.(×)3.(√)4.(√)5.(×)6.(√)7.(×)8.(×)9.(×)10.(√)(三)单选题1.(C)2.(D)3.(B)4.(D)5.(A)6.(C)7.(B)8.(D)9.(A)10.(B)(四)多选题1.(A)(C)(E)2.(B)(C)(E)3.(A)(B)(D)4.(A)(C)(D)5.(A)(C)(D)(五)简答题参见教材(六)计算题1.2.3.(1)996.31元–1080.35元(2)50.89%-75.77%4.不能。废品率的置信区间为:1.3%-6.7%5.14.96cm–15.04cm6.80.1%-89.9%7.99袋8.651件 \n第八章 指数一、本章的重点与难点(一)本章重点统计指数的意义和种类;综合指数和平均指数的形式;数量指标指数和质量指标指数的编制方法;指数体系的概念与作用和因素分析的基本原理。(二)本章难点综合指数的编制方法,包括数量指标综合指数和质量指标综合指数;总量指标的因素分析方法。二、内容提要(一)指数编制的基本问题1.指数及其性质指数是反映不能直接加总的多要素组成的社会经济现象前后时期数量变动的相对数。指数具有相对性、综合性和平均性三个基本性质。2.指数的种类此外,指数按采用基期的不同,可分为环比指数和定基指数;按其对比内容的不同,可分为动态指数和静态指数;按对比场合的不同,可分为时间性指数和区域性指数等。3.指数编制的基本问题编制指数时,需要解决的具体问题主要有项目的选择、基准点的确定、权数的确定以及计算公式的选择等。项目的选择主要是解决好样本的选择问题。样本的选择应具备三个基本要求,即:充分性、代表性和可比性。基准点的选择、权数的确定和计算公式的选择主要取决于计算指数的预期目的和用途。(二)综合指数的编制综合指数是计算总指数的一种基本形式,它分为数量指数和质量指数。在计算综合指数反映某一指标综合变动时,需要将作为同度量因素的另一指标固定在同一时期。通常将同度量因素固定在基期时,称为拉氏(Laspeyres)指数;将同度量因素固定在报告期时,称为帕氏(Paasche)指数。1.数量指数的编制根据我国指数理论的要求,编制数量指数时,将作为同度量因素的质量指标固定在基期,公式为: (8-1)2.质量指数的编制\n根据我国指数理论的要求,编制质量指数时,将作为同度量因素的数量指标固定在报告期,公式为: (8-2)(三)平均指数的编制平均指数是以某一时期的总量为权数对个体指数加权平均计算出来的一种总指数,是综合指数的变形。1.加权算术平均指数加权算术平均指数是以基期总量为权数对个体指数加权平均计算出来的,其公式为: (8-3)2.加权调和平均指数加权调和平均指数是以报告期总量为权数对个体指数加权平均计算出来的,其公式为: (8-4)(四)指数体系与因素分析指数体系是指由三个或三个以上在经济上有联系、在数量上保持一定关系的指数所组成的整体。其因素分析包括总量指标指数的两因素分析和平均指标指数的两因素分析。1.总量指标指数两因素分析相对数指数体系: (8-5)绝对数指数体系: (8-6)2.平均指标指数两因素分析相对数指数体系: (8-7)绝对数指数体系: (8-8)三、标准化试题(一)填空题1.从广义上看,_____对比形成的相对数都可称为指数;从狭义上看,指数是用于测定总体各变量在不同场合下_____的一种特殊相对数。\n2.指数具有三个基本性质,它们是_____、_____和平均性。3.指数按其反映的内容不同,可分为_____和_____;按其对比场合不同,可分为_____和_____。4.在编制指数时,所选样本除数据本身的准确性外,还应具备三个基本要求,它们是_____、_____和_____5.综合指数是计算_____的基本形式,它是由两个_____对比形成的指数。6.编制数量指数一般是以相应的_____为同度量因素;而编制质量指数一般是以相应的_____为同度量因素。7.平均指数是从_____出发来编制总指数的,它的主要计算形式为_____和_____两种。8.在指数体系中,总变动指数等于_____的乘积;总变动指数的绝对增加额等于它的各个因素指数引起的绝对增加额的_____。9.商品零售物价指数为105%,商品零售量指数为98%,则商品零售额指数为_____。10.以基期变量值加权的指数称为_____指数;以报告期变量值加权的指数称为_____指数。11.在指数体系中,指数之间的数量存在_____,而且各个指数的绝对值_____之间也存在着一定的_____关系。12.在平均指标指数两因素分析中,三个指数间的关系是_____。(二)判断题1.数量指数与质量指数划分的依据是:所采用编制综合指数的方法不同。( )2.加权算术平均指数要成为综合指数的变形,其权数须用。( )3.综合指数是平均指数的变形形式。( )4.计算指数时,报告期与基期的间隔不宜过长,否则会降低指数的代表性。( )5.平均指数是根据非全面资料计算的,故只能反映现象变动的近似值;综合指数则需要根据全面资料计算,故它能反映现象变动产生的实际效果。( )6.如果生活费指数上涨20%,则现在的1元钱只值原来的0.8元钱。( )7.已知某企业生产三种产品,在掌握其基期、报告期生产费用和个体产量指数时,计算三种产品的综合产量指数,应是利用个体指数和报告期生产费用计算的加权调和平均指数。( )8.指数因素分析法既可用于个体指数分析,又可用于总指数分析;既可用于动态分析,也可用于静态分析。( )9.在各组单位数的变动按等比例变化时,结构影响指数等于100%。( )10.2003年与2002年相比,同样多的货币只能购买90%的商品,说明物价指数上升10%。( )(三)单项选择题1.拉氏数量指数公式的同度量因素采用( ) A.基期的质量指标 B.报告期的质量指标 C.基期的数量指标 D.报告期的数量指标2.帕氏质量指数公式的同度量因素采用( )A.基期的质量指标 B.报告期的质量指标 C.基期的数量指标 D.报告期的数量指标3.在由三个指数构成的指数体系中,两个因素指数的同度量因素通常( )A.都固定在基期B.都固定在报告期C.采用基期和报告期的平均数D.一个固定在基期,另一个固定在报告期4.若销售量增加,而销售额不变,则商品的销售价格指数( ) A.增加 B.减少 C.不变 D.无法判断5\n.已知某企业生产两种产品,在掌握其基期和报告期的生产费用及个体产量指数时,这两种产品的综合产量指数应是( ) A.两种产品个体指数的几何平均数 B.利用个体指数和固定权数计算的加权算术平均数 C.利用个体指数和基期生产费用计算的加权算术平均数 D.利用个体指数和报告期生产费用计算的加权调和平均数6.综合指数与平均指数的联系在于( ) A.在一定权数条件下,两类指数之间有变形关系 B.在一般条件下,两类指数之间有变形关系 C.在权数固定条件下,两类指数之间有变形关系 D.在一定的同度量因素下,两类指数之间有变形关系7.公式的经济意义为( ) A.反映价格综合变动的绝对额 B.反映销售量综合变动的绝对额 C.反映由于价格变化引起销售额的增减额 D.反映由于销售量变化引起销售额的增减额8.在平均指标指数体系中的式表示( ) A.综合指数 B.结构影响指数 C.可变构成指数 D.固定构成指数9.某企业利润总额与上年相比增长了10%,职工人数增长了5%,则该企业工人劳动生产率增长了( ) A.15.5% B.5% C.4.76% D.15%10.平均指标指数是( ) A.两个总量指标对比形成的指数B.两个相对指标对比形成的指数 C.两个平均指标对比形成的指数 D.两个个体指数对比形成的指数(四)多项选择题按指数所反映的范围不同划分的种类有( )A.个体指数 B.平均指数 C.简单指数D.加权指数 E.总指数 总指数中包括( )A.质量指数 B.数量指数 C.算术平均指数D.调和平均指数 E.综合指数3.设q为销售量,p为价格,则总指数的意义是( ) A.综合反映商品销售额的变动程度 B.综合反映商品价格和销售量的变动程度 C.综合反映多种商品的销售量的变动程度 D.综合反映多种商品价格的变动程度 E.反映商品销售量变动时销售额变动的影响程度4.广义的指数包括( ) A.发展速度 B.平均发展速度 C.计划完成相对数 D.个体指数 E.动态相对数5.下列属于质量指数的有( ) A.工资水平指数 B.价格指数 C.职工人数指数 D.单位成本指数 E.商品销售额指数\n6.某企业2002年各种不同产品的实际产量为计划产量的110%,这个指数是( ) A.个体指数 B.总指数 C.静态指数 D.动态指数 E.综合指数7.在总量指标两因素指数分析法中,两个因素指数的特点( ) A.都是两个总量指标对比的动态相对数 B.子项和母项是两个因素乘积之和 C.综合反映多种事物的平均变动程度 D.固定一个因素,观察另一个因素的变动 E.子项与母项中必有一个假定指标8.同度量因素在指数运算分析中所起的作用是( ) A.比较的作用 B.权数的作用 C.平衡的作用 D.稳定的作用 E.同度量作用9.下列指数中反映平均指标变动的有( ) A.可变构成指数 B.平均指数 C.固定构成指数 D.综合指数 E.结构影响指数10.加权算术平均指数是一种( ) A.平均指标指数 B.总指数 C.个体指数平均数 D.平均指数 E.综合指数(五)简答题1.指数具有哪些性质和作用?2.编制综合指数有哪些要点和原则?3.综合指数与平均指数有何区别和联系?4.在计算加权综合指数时,指数中的分子和分母必须是同一时期的吗?为什么?5.指数体系具有哪些作用?6.可变构成指数可以分解为哪两个因素?各自的含义和作用是什么?(六)计算题1.某企业生产三种产品的单位成本与产量资料如下:产 品名 称计 量单 位 产品产量单位成本(元)基 期报告期基 期报告期 甲 乙 丙万件万只万盒 80 60 50 120 60 30 24 18 15 20 18 19(1)计算各种产品的单位成本个体指数;(2)计算各种产品的产量个体指数;(3)计算三种产品总成本指数及增加额;(4)计算三种产品单位成本总指数及单位成本变动对总成本的影响额;(5)计算三种产品产量总指数及产量变动对总成本的影响额;(6)用上述(3)~(5)的结果验证指数体系。 2.某商店三种商品的销售量与销售额资料如下:商 品名 称计 量单 位 销 售 量基期销售额(万元) 基 期 报告期 甲 打 250 290 180 乙 只 180 160 220 丙 盒 500 540 150试计算三种商品销售量总指数和销售量变动对销售额的影响额。 3\n.手机、空调、电脑和彩电的销售价格下调。某家电公司这四种商品价格下调幅度及调价后一个月的销售额资料如下:商品名称调价幅度(%)销售额(万元)手机空调电脑彩电-11.5-10.0-8.0-13.55210335025与本次调价前一个月的价格水平相比,上述四种商品价格平均下调了百分之几?由于价格下调使该商品在销售中少收入多少万元? 4.根据指数之间的关系计算回答下列问题: (1)某企业2002年产品产量比2001年增长了14%,生产费用增长了10.8%,问2002年产品单位成本变动如何? (2)某公司职工人数增加7%,工资水平提高了8.4%,工资总额增长多少? (3)商品销售额计划增长10%,而销售价格却要求下降10%,则销售量如何变化? (4)价格调整后,同样多的货币少购买商品10%,问物价指数是多少? 5.某公司职工按年薪分为四个档次,其年薪与工人数资料如下:年 薪等 级 年薪(万元)工人数(人)2001年2002年2001年2002年 1 2 34 4.05.06.07.04.65.46.88.02003001608040038018040计算该公司职工平均年薪指数,并从相对数和绝对数两方面分析各等级年薪和工人结构变动对平均年薪变动的影响。 四、参考答案(一)填空题1.任何两个数值 综合变动2.相对性 综合性3.数量指数 质量指数 时间性指数 区域性指数4.充分性 代表性 可比性5.总指数 总量指标6.基期的质量指标 报告期的数量指标7.个体指数 加权算术平均指数 加权调和平均指数8.各因素指数 代数和9.102.9%10.拉氏帕氏11.对等关系 变动 数量对等12.(二)判断题1.(×) 2.(√) 3.(×) 4.(√) 5.(√)6.(×) 7.(×) 8.(√) 9.(√) 10.(×)(三)单项选择题1.(A) 2.(D) 3.(D) 4.(B) 5.(C)6.(A) 7.(D) 8.(D) 9.(C) 10.(C)(四)多项选择题1.(A)(E) 2.(A)(B)(C)(D)(E)\n3.(C)(E) 4.(A)(C)(D)(E)5.(A)(B)(D) 6.(A)(C)(E)7.(A)(B)(C)(D)(E)8.(B)(E)9.(A)(C)(E) 10.(B)(C)(D)(五)简答题1.指数的性质可概括为:(1)相对性,即指数是总体各变量在不同场合下对比形成的相对数,反映事物在时间或空间上的相对变化;(2)综合性,即指数反映的是一组变量在不同场合下的综合变动水平;(3)平均性,即指数是总体水平的一个代表性量,它所反映的事物的对变动水平是平均意义上的相对变动。指数在经济分析中的作用可以概括为两个方面:(1)分析复杂经济现象总体的变动方向和程度;(2)分析经济发展变化中各种因素影响的大小。2.编制综合指数应掌握两个要点:一是要引入同度量因素对复杂总体进行综合;二是要将同度量因素固定,以消除同度量因素变动的影响。编制综合指数的一般原则是:在编制数量综合指数时,一般采用基期的质量指标做同度量因素;在编制质量综合指数时,一般采用报告期的数量指标做同度量因素。3.区别:(1)解决复杂总体不能直接同度量问题的思想不同。综合指数的特点是先综合后对比;平均指数的特点是先对比后综合。(2)运用资料的条件不同。计算综合指数要求掌握总体的全面资料;平均指数既适用于全面资料,也适用于非全面资料。联系:在一定的权数条件下,平均指数可作为综合指数的变形加以使用,而且两者的经济意义和结果相同。4.在计算综合指数时,无论是数量指数还是质量指数,指数中分子分母的权数必须是同一时期的,因为只有将权数固定在同一时期(同是基期或报告期),权数保持相对不变,才能具体考察另一个因素的变动水平及其总量指标变动的影响。5.指数体系的作用有:(1)对现象进行因素分析;(2)对单个综合指数的编制有指导意义;(3)可用于对指数进行推算。6.可变构成指数可以分解为结构影响指数和固定构成指数。前者是将各部分(组)水平固定在基期条件下计算的总平均指标指数,用以反映总体结构变动对总体平均指标变动的影响;后者是将总体构成(即各部分比重)固定在报告期计算的总平均指标指数,该指数消除了总体结构变动的影响,专门用以综合反映各部分(组)水平变动对总体平均指标变动的影响。(六)计算题1.(1)~(2)答案见下表:产品名称单位成本个体指数(%)产品产量个体指数(%)总成本(万元)基期报告期假定期甲乙丙83.33100.00126.67150.00100.0060.00192010807502400108057028801080450合计--375040504410(3)总成本指数:\n(4)单位成本总指数:(5)产量总指数:(6)指数体系:108%=91.84%×117.6%300元=(-360元)+660元 2.商 品名 称 销 售 量基期销售额(万元)基 期 报告期个体指数 甲 250 290 1.16 180 乙 180 160 0.89 220 丙 500 540 1.08 150 3.四种商品价格平均下调了9.02%,少收入52.54万元。 4.基本公式如下:\n(1),单位成本下降2.81%;(2),工资总额增长15.99%;(3),销售量应增长22.22%;(4),物价指数为111.11%。 5.年薪等级年薪(万元)工人数(人)工人年薪总额(万元) 1 2 344.05.06.07.04.65.46.88.020030016080400380180408001500960560 1840 2052 1224 320 1600 1900 1080 280合计--74010003820 5436 4860\n第九章相关与回归分析一、本章的重点与难点(一)本章重点相关关系的概念;相关关系的分类;相关表和相关图;相关系数的概念、计算、特点;回归分析的概念;回归分析与相关分析的关系;一元回归模型的概念、建立;一元线性回归方程的预测;Excel中的线性回归分析。(二)本章难点相关系数的计算、特点;回归分析与相关分析的关系。二、内容提要(一)变量间的相关关系与相关系数从数量分析的角度来看,社会经济现象之间的关系有两种类型:(1)变量之间可以用数学形式表达的函数关系;(2)变量之间有着密切的联系,但密切的程度还没有达到由一个可以完全确定另一个的程度,这种非确定性的数量对应关系称为相关关系。简单线性相关图表清楚地反映两个变量之间的相互关系及相关方向,但要确切地表明两个变量之间的线性相关程度,则需要计算线性相关系数r。其基本公式为:(9-1)相关系数的取值范围在-1至1之间。>0,是正相关,<0,是负相关。||<0.3,为微弱相关,0.3≤||<0.5,为低度相关,0.5≤||<0.8,为中度相关,0.8≤||<1称高度相关。(二)一元线性回归一元线性回归是描述两个变量之间线性相关关系的最简单的回归模型。线性回归方程式为:。方程式中的与为回归参数,可通过最小二乘法来估计其值。参数公式为:(9-2)(三)回归方程的显著性检验只有通过显著性检验的回归方程才能用来进行经济分析与预测。1.检验如果原假设成立,即表示回归方程,与自变量无关,则意味着所选定的自变量对因变量无影响,故研究与之间的关系也就没有意义;如果不成立,即,回归方程才有意义。通过对总离差平方和的分解可知:由此可知,值的变化是由两个原因造成的,一个是的变化引起\n的变化,另一个是不可控制的随机因素对的影响。当与有线性关系时,我们可以有统计量来检验假设:(9-3)在给定的显著性水平下,如果,则称变量与没有明显的线性关系,接受,说明回归方程不显著;反之则说明回归方程显著,变量与有明显的线性关系。2.样本决定系数由回归平方和与残差平方和的意义可知,在总的离差平方和中回归平方和所占的比重越大,则线性回归效果越好,也就说明回归直线与样本观测值拟合优度就越好;如果残差平方和所占的比重大,则回归直线与样本观测值拟合的就不理想。把回归平方和与总离差平方和之比定义为样本决定系数,即(9-4)决定系数是一个回归直线与样本观测值拟合优度的指标,其取值范围在0到1之间。决定系数越接近1,拟合优度就越好;反之,若样本决定系数不大,则说明模型中给出的与的信息还不充分,应进行修改,使与的信息得到充分利用。(四)预测与应用建立回归模型的目的是为了应用,预测是回归模型最重要的应用。在预测时,除了知道预测值外,还希望知道预测的精度。在样本量n较大时,对给定的显著性水平,我们可用近似的预测区间:(9-5)三、标准化试题 (一)填空题1.社会经济现象间的关系分为两种类型:一种是,另一种是。2.在相关关系中,当给定一个值时,值不是唯一确定的,而可能同时出现几个不同的数值并在一定范围内围绕其_____上下波动。3.按相关的程度可分为、和______。4.相关系数的取值在之间,其绝对值在之间属于中度相关。5.回归分析就是根据变量与之间的关系,建立两个变量之间的直线关系近似表达式进行和的。6.直线回归中总变差等于和之和。7.回归系数与相关系数的符号应,当大于0时,表明两变量是。8.在相关分析中,要求两个变量都是随机的,而在回归分析中,要求自变量是,因变量是。9.设变量与之间的相关系数=-0.92,这说明这两个变量之间存在着相关。10.在直线回归方程中,若已知:,,,,则\n_______。11.在线性回归分析中,只涉及一个自变量的回归称为_;涉及多个自变量的回归称为_。 (二)判断题1.如果变量与之间的相关系数=0,表明这两个变量之间不存在任何相关关系。()2.设两个变量的一元线性回归方程为,由此可以判定这两个变量之间存在着负相关关系。()3.在其他条件不变的情况下,估计标准误差的值越小,决定系数的值越大,回归直线的拟合程度越高。4.如果回归系数为零,则相关系数必为零。()5.对相关系数进行显著性检验,即检验总体相关系数ρ是否为零。若ρ=0,表示变量与间存在线性相关关系。()6.回归变差反映的是由于与之间的线性关系而引起的的变差。()7.相关系数与决定系数的取值范围是一致的。()8.相关关系侧重于考察变量之间的关系密切程度,回归分析则侧重于考察变量之间的数量变化规律。()9.我国的GDP与印度的人口之间的相关系数大于0.8,因此两者具有高度正相关关系。()10.拟合回归直线的目的在于用直线上的点来代表所有的相关点。() (三)单项选择题1.变量与之间的负相关是指()A.数值增大时也随之增大B.数值减少时也随之减少C.数值增大(或减少)时随之减少(或增大)D.的取值几乎不受取值的影响2.下列各直线回归方程中,哪一个是不正确的()A.,B.,C.,D.,3.在回归直线中,回归系数表示()A.当时,y的期望值B.变动一个单位时的变动总额C.变动一个单位时的平均变动量D.变动一个单位时的平均变动量4.说明回归直线拟合程度的统计量主要是()A.相关系数B.回归系数C.决定系数D.估计标准误差5.若已知是的两倍,是的1.2倍,则相关系数=()A.B.C.0.92D.0.656.计算估计标准误差的依据是因变量的()A.数列B.总变差C.回归变差D.剩余变差7.如果变量与之间的相关系数为1,则说明两个变量之间是()A.完全不相关B.高度相关关系C.完全相关关系D.中度相关关系\n8.各实际观测值与回归值的离差平方和称为()A.总变差B.剩余变差C.回归变差D.决定系数9.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本为6000元。则总生产成本对产量的一元线性回归方程为()A.B.C.D.10.在直线回归方程中,若回归系数,则表示()A.对的影响是显著的B.对的影响是不显著的C.对的影响是显著的D.对的影响是不显著的(四)多项选择题1.设单位产品成本(元)对产量(千件)的一元线性回归方程为,这意味着()A.单位成本与产量之间存在着负相关B.单位成本与产量之间是正相关C.产量为1000件时单位成本为79.4元D.产量每增加1千件单位成本平均增加5.6元E.产量每增加1千件单位成本平均减少5.6元2.如果两个变量之间的线性相关程度很高,则其相关系数应接近于()A.0.5B.-0.5C.0D.1E.-13.变量分析中的回归变差是指()A.实际值与平均值的离差平方和B.估计值与平均值的离差平方和C.受自变量变动影响所引起的变差D.受随机变量变动影响所产生的误差E.总变差与残差之差4.估计标准误差主要用于()A. 区间估计B.说明回归直线的代表性C.说明回归方程拟合优度D.测定变量间关系的密切程度E.说明估计值对回归直线的离散程度5.如果变量与之间没有线性相关关系,则()A.相关系数为0B.回归系数为0C.可决系数为0D.估计标准误差为0E.估计标准误差为16.如果两个变量之间完全相关,则以下结论中正确的有()A.相关系数B.决定系数C.估计标准误差D.估计标准误差E.回归系数 (五)简答题1.什么是相关关系?相关关系与函数关系有何区别?2.什么是相关系数?它是如何判断两个变量相关的密切程度的?3.什么是回归分析?什么是相关分析?二者之间有何联系与区别?4.什么是样本的决定系数?它的取值范围是多少?5.简述显著性水平与预测精度之间的关系。 (六)计算题1.对10户居民家庭的月可支配收入和消费支出进行调查,得到资料如下:(单位:百元)编号12345678910消费支出20154030426065705378\n可支配收入25186045628892997598要求:(1)画出相关图并判断消费支出与可支配收入之间的相关方向;(2)计算消费支出与可支配收入的相关系数并说明其相关程度。 2.某公司8个所属企业的产品销售资料如下:企业编号产品销售额(万元)销售利润(万元)1234567817022039043048065085010008.112.518.022.026.540.064.069.0要求:(1)计算相关系数,测定产品销售额和利润之间的相关方向和相关程度;(2)确定自变量和因变量,并求出直线回归方程;(3)计算估计标准误差;(4)根据回归方程,指出当销售额每增加1万元,利润额平均增加多少?(5)在95%的概率保证下,当销售额为1200万元时利润额的置信区间。 3.对某一资料进行一元线性回归,已知样本容量为20,因变量的估计值与其平均数的离差平方和为585,因变量的方差为35,试求:(1)变量间的相关指数R;(2)该方程的估计标准误差。 4.已知:试求:(1)相关系数;(2)回归系数;(3)估计标准误差。 5.设有资料如下表所示:甲、乙两位评酒员对10种品牌白酒的主观排序品牌12345678910甲71568943102乙63249108571试问两位评酒员的评审顺序是否具有一定的相关?(按5%的显著水平检验) 四、参考答案 (一)填空题1.确定性(函数)关系非确定性(相关)关系2.平均值全相关不完全相关不相关5.参数估计预测分析\n6.回归变差剩余变差7.一致正相关8.给定值随机变量9.高度负10.24011.一元线性回归多元线性回归(二)判断题1.(×)2.(×)3.(√)4.(√)5.(×)6.(√)7.(×)8.(√)9.(×)10.(√)(三)单选题1.(C)2.(B)3.(D)4.(C)5.(B)6.(D)7.(C)8.(B)9.(B)10.(D)(四)多选题1.(A)(C)(E)2.(D)(E)3.(B)(C)(E)4.(A)(B)(C)5.(A)(B)(C)6.(A)(B)(D)(五)简答题略(六)计算题1.,为高度正相关.2.(1),呈高度正相关;(2)自变量为产品销售额,(3)4.2(4)0.078(5)77.03~93.493.(1)=0.91(2)2.534.(1)=0.95(2)=1.08(3)3.455.=0.7拒绝原假设,说明两位评酒员的评审顺序显著相关。 \n 模拟试卷(一)一、填空(10分)1.统计整理阶段的主要任务是___________。2.统计调查误差有______,_____。二者主要区别是__________________。3.指数按其所反映的对象范围的不同,分为指数和指数。 4.当变量x值增加,变量y值也增加,这是相关关系;当变量x值减少,变量y值也减少,这是相关关系。 5.总体参数区间估计必须具备的三个要素是:估计值、、。 二、判断(10分)1.对任何数据资料,一旦给出其频数分布,便可以计算其算术平均数了。() 2.对分组数据,其算术平均数、众数均为近似值。()3.抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。()4.施肥量与收获率是正相关关系。()5.发展速度是以相对数形式表示的速度分析指标,增长量是以绝对数形式表示的速度分析指标。()三、简答题(25分)1.什么是参数和统计量?各有何特点? 2.什么是抽样推断?抽样推断都有哪些特点? 3.当市场调查者在全国范围内调查消费者对一件新产品的看法时,他们往往不用总体数据而用抽样数据进行研究,请指出他们这么做的三个理由。 4.什么是统计分布?它包括哪两个要素?5.相关分析与回归分析有何区别与联系?四、计算(55分,第一题10分,后三题每题15分) 1.美国大公司的执行总裁的年薪平均有多少?一项含有8个大公司的抽样数据如下表1,请计算:(1)当α=0.05时,总体均值的区间估计。(2)美国大公司执行总裁平均年薪与标准差的点估计。表18个大公司的总裁年薪数据单位:$100公司GeneralMotorsCoca-ColaIntelMotorolaReadersDigestSearsSprintWellFargo年薪137536542184173617083095169221252.已知如下表2资料,计算中位数与众数。 \n表2工人完成生产情况表按工人完成生产定额百分比分组各组工人数90以下90-100100-110110-120120以上101545255合计1003.近年来,某大型建筑公司承揽的国外工程项目已成为其核心业务。面对日益激烈的竞争,为巩固与扩大公司在国外的市场份额,董事会提出了新的发展目标:拟在五年后使公司海外的年营业额达到五亿美元。该公司海外业务统计资料如下表3:表3公司海外业务情况表指标名称年度营业额(万美元)利润(万美元)年末在外人数199252603588751993573618390819954677480895199813993811173619992354550219422001250245241804试分析:(1)该公司近10年(1992—2001)的年均营业额和年均利润水平;(2)该公司近10年海外业务的平均增长速度;要实现新的发展目标,未来5年该公司需达到的增长速度。4.某企业2000和1995年总产值和职工人数资料如下表4:表41995和2000年企业总产值和职工人数资料年份总产值(万元)职工人数(人)总人数其中:生产人数19952000450650800840640714试分析该企业2000年与1995年总产值增长中各个因素变动的影响作用,要求按生产工人数及工人劳动生产率两个因素进行分析。附:=1.96,=1.64,=2.31,=2.26,=2.36,=1.89,\n=5.32模拟试卷(二)一、填空(10分)1.某企业职工人数为2200人,这里“职工人数2200人”是___________。2.统计调查方案的核心是____________________________________。3.Excel中求平均数的函数是____________________________。4.泊松分布的数学期望和方差,E(X)和D(X)分别是________________,_____________________________。5.常用的几种随机抽样方式有_________________、____________、__________________、_________________、__________________。二、判断(10分,每题2分)1.统计分组的关键在于确定组数的多少。()2.统计中的数据可以分为刻度级数据、顺序型数据和名义型数据三类。()3.广义上讲任何两个绝对数之比,均可称为指数。()4.条形图是用直方形的高度和宽度来表示次数分布的图形。()5.如果价格上涨后,同样多的钱少购商品量20%,则价格指数是80%。()三、简答题(20分,每题5分)1.社会经济统计的特点是什么?2.什么是统计分组?作用是什么?3.写出几种平均数的求法,并说明它们的特点和应用条件。4.什么是重复抽样和不重复抽样?不同的抽样方法是如何影响抽样推断结果的?四、计算(60分,每题15分)1.今有甲、乙两企业职工人数及工资资料如下:表1甲乙两企业职工人数及工资表甲企业乙企业工资组(元)职工人数工资组(元)职工人数550660086509700127501482018950189701610507100021250312001根据上述资料:(1)比较一下哪个企业职工的平均工资高?(2)哪个企业具的平均工资更有代表性?\n2.某厂三个车间一季度生产情况如下:第一车间实际产量为198件,完成计划90%,第二车间实际产量为315件,超过计划5%,第三车间实际产量为220件,完成计划110%,另外三个车间平均单位成本分别为15元、10元、8元。计算一季度三个车间平均单位产品成本。3.在某次人口调查中发现,某地区的人活到60岁以上的概率为0.8活到70岁以上的概率为0.3,试求一位60岁的人能活到70岁以上的概率。4.在概率保证程度为95.45%的条件下,采用简单随机重复抽样,总体平均数的区间为(998~1002),总体方差为25,试问:(1)样本平均数和抽样平均误差。(2)抽取的样本单位数。\n模拟试卷(三)一、判断题(10分)1.数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。()2.制订调查方案的首要问题是确定调查目的。()3.在确定组限时,最大组的上限应大于最大变量值。()4.相关系数测定变量之间相关密切程度的唯一方法。()5.根据指数化指标的性质来看,劳动生产率指数是数量指标指数。()6.社会经济统计工作的研究对象是社会经济现象总体的数量方面。()7.在实际调查中,调查对象中的每个单位必然是调查单位。()8.在计算综合指数时,指数中分子和分母的同度量因素必须是同一时期的。()9.时间数列中各个环比增长速度的连乘积等于总的定基增长速度。()10.全面调查就是对调查对象的各方面都进行调查。()二、单项选择题(30分)1.对某地区商业网点的从业人员状况进行调查,调查对象是()A.所有商业网点B.每一个商业网点C.所有从业人员D.每一个从业人员2.下列分组哪个是按品质标志分组()A.学生按成绩分组B.人口按文化的程度分组C.家庭按收入水平分组D.企业按职工人数分组3.平均差与标准差的主要区别在于()A.意义不同B.计算条件不同C.计算结果不同D.数学处理方法不同4.抽样平均误差是()A.全及总体的标准差B.差本的标准差C.抽样指标的标准差D.抽样误差的标准差5.在相关分析中,变量x与y之间的负相关是指()A.x数值增大时,y也随之增大B.x数值减少时,y也随之减少\nC.x数值增大(或减少)时,y也随之减少(或增大)D.y的取值几乎不受x取值的影响6.某种产品产量1995年比1994年增长了10%,1996年比1994年增长了15%,1996年与1995年相比增长了()A.15%÷10%B.115%÷110%C.(115%×110%)-1D.(115%÷110%)-17.下列指标中属于质量指标的是()A.产量B.人口数C.销售额D.出勤率8.人口普查规定标准时间是为了()A.避免登记的重复和遗漏B.确定调查对象的范围C.确定调查单位D.确定调查时限9.某企业对其所属车间的生产计划完成百分比采用如下分组,请指出哪项是正确的()A.80~89%90~99%100~109%110%以上B.80%以下80.1~90%90.1~100%100.1~110%C.90%以下90~100%100~110%110%以上D.85%以下85~95%95~105%105~115%10.总量指标按其反映的内容不同可以分为()A.时期指标和时点指标B.数量指标和质量指标C.总体单位总量和标志总量D.实物指标和价值指标11.总体参数的区间估计必须同时具备估计值、抽样误差范围和概率保证程度三个要素,其中抽样误差范围决定估计的()A.可靠性B.准确性C.精确性D.显著性12.要了解某校学生的学习情况,总体单位是()A.该校全部学生B.该校全部学生的学习成绩C.该校每一位学生的学习成绩D.该校每一位学生13.数量指标是用()A.相对数形式表示的B.绝对数形式表示的C.平均数形式表示的D.以上三种形式均可以表示14.已知某种商品的价格为25元,这里的“商品价格”是()\nA.指标B.变量C.品质标志D.数量标志15.普查和大多数统计报表,都属于()A.专门调查B.全面调查C.重点调查D.抽样调查三、多项选择题(30分)1.国家统计系统的功能或统计的职能有()A.信息职能B.咨询职能C.协调职能D.决策职能E.监督职能2.下列属于平均指标的有()A.某市人均住房面积B.每平方公里所住的人口数C.某产品的平均等级D.某企业的工人劳动生产率E.某企业的各车间的平均产品合格率3.总体参数的区间估计必须同时具备的三个要素是()A.样本单位数B.估计值C.抽样误差范围D.概率保证程度E.抽样平均误差4.进行平均指标变动因素分析应编制的指数有()A.算术平均数指数B.调和平均数指数C.可变构成指数D.固定构成指数E.结构变动影响指数5.下列哪些是统计指标()A.我国1997年国民生产总值B.某同学该学期平均成绩C.某地区出生人口总数D.某市工业劳动生产率E.某企业全部工人生产某种产品的人均产量6.下列指标属于相对指标的有()A.某地区平均每人生活费345元B.某地区人口出生率1.2%C.某地区粮食总产量5000万斤D.某产品产量计划完成程度为115%\nE.某地区每千人拥有的零售商业机构个数7.计算平均发展速度的方法有()A.算术平均法B.几何平均法C.方程式法D.调和平均法E.加权平均法8.设p为价格,q为销售量,则指数的意义是()A.综合反映商品销售额的变动程度B.综合反映商品销售量的变动程度C.综合反映商品价格的变动程度D.综合反映商品价格变动对销售额的影响程度E.综合反映商品价格和销售量变动对销售额的影响程度9.次数分配数列()A.是由组距和组数、组限和组中值组成的B.是由总体分成的各个组和各组相应的分配次数组成的C.包括品质分配数列和变量数列两种D.可以用图表形式表示E.可以表明总体结构和分布特征10.总体参数的区间估计必须同时具备的三个要素是()A.样本单位数B.估计值C.抽样误差范围D.概率保证程度E.抽样平均误差四、计算题分析题(40分)1.某地区销售某种商品的价格和销售量资料如下:商品规格销售价格(元)各组商品销售量占总销售量的比重(%)甲乙丙20-3030-4040-50205030\n根据资料计算三种规格商品的平均销售价格。2.有两个班参加统计学考试,甲班的平均分数75分,标准差11.5分,乙班的考试成绩资料如下:按成绩分组(分)学生人数(人)60以下260-70570-80880-90690-1004合 计25要求:(1)计算乙班的平均分数和标准差;(2)比较哪个班的平均分数更有代表性。3.从一批产品中按简单随机重复抽样方式抽取50包检查,结果如下:每包重量(克)包 数90-95295-1003100-10535105-11010要求:以95.45%的概率估计该批产品平均每包重量的范围。4.某工厂生产一种新型灯泡5000只,随机抽取100只做耐用时间试验。测试结果,平均寿命为4500小时,标准差300小时,试在90%概率保证下,估计该新式灯泡平均寿命区间;假定概率保证程度提高到95%,允许误差缩小一半,试问应抽取多少只灯泡进行测试?查看更多