南航九院统计学刘思峰应用统计学电子教案
第一章绪论第一节统计的产生与发展第二节统计研究的特点、方法和作用本章小节主要内容\n第一节统计的产生与发展一、统计与统计学统计学是研究如何对社会总体的数量特征和规律进行描述、推断、认识的一门学科。从字面上直观理解,“统计”是指对大量事物进行汇总计数,因此可以简单地说统计就是总起来计量,即统而计之。例如计算全国的总人口数、国内生产总值,计算某个企业的职工人数、产品产量,甚至是计算某个家庭每月的收入和支出等等都是统计。\n一、统计与统计学统计活动一般按照统计设计、统计调查、统计整理、统计分析和统计资料的开发利用这几个阶段依次进行。如图1.1.1所示。\n二、统计的产生与发展统计产生原始社会后期:统计萌芽于计数活动;奴隶制国家产生:使统计日显重要;封建社会时期:统计已具规模;资本主义的兴起:统计扩展到社会经济各方面。统计学作为一门系统的科学,距今已有300多年的历史。\n二、统计的产生与发展统计发展按照统计学的发展历程,我们可以把统计学划分为古典统计学、近代统计学和现代统计学三个时期,如图1.1.2所示。\n(一)统计学学派1.德国的记述学派(国势学派〕康令(1606-1681)阿痕瓦尔(1719-1772:1764年首创统计学一词)他们在大学中开设“国势学”采用记述性材料,讲述国家“显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。三、统计学学派与统计学学科体系\n(二)统计学的近代期(18世纪末-19世纪末)2.政治算术学派代表人物:英国的威廉·配第、约翰·格朗特等。威廉·配第的代表著《政治算术》对当时的英、荷、法等国的“国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社会经济现象的先例。三、统计学学派与统计学学科体系\n三、统计学学派与统计学学科体系3.数理统计学派代表人物:法国的拉普拉斯,比利时的凯特勒。拉普拉斯把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论加以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“统计学之父”之称。\n4.社会统计学派代表人物:德国的克尼斯、恩格尔、梅尔等。他们强调统计学是研究社会现象的科学,包括统计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系。三、统计学学派与统计学学科体系\n(二) 统计学学科体系三、统计学学派与统计学学科体系统计学学科体系如图1.1.3所示。\n(二) 统计学学科体系理论统计学指统计学的数学原理,它根植于纯数学的一个领域—概率论。应用统计学将统计学的基本原理应用于各个领域就形成各种各样的应用统计学。它包括一整套统计分析方法,有的是适用于各个领域的一般性的统计方法,如数据收集与整理、参数估计、假设检验、方差分析、相关与回归等。有的则是某一专业领域中特有的分析方法,例如经济统计学中的指数分析法、统计决策及产品质量统计管理等。\n理论统计学数理统计学数理统计学是应用数学的一个分支,在这里作为统计学的一个分支,它以概率论等数学理论为基础,研究随机现象的数量规律,是一门纯方法论的科学,为其它学科提供数学分析和推断的方法与技术。统计学原理统计学原理是在统计实践的基础上,对统计理论方法的最一般概括,内容包括统计的对象和任务,统计的理论基础和方法论基础,以及关于统计活动各个环节的理论和方法。统计学原理中结合了数学、概率论和数理统计学的知识,又是统计实践经验的高度总结,是指导统计实践活动的科学依据。一般所说的统计学就是指统计学原理。\n社会经济统计学社会经济统计学是将理论统计学应用于社会经济领域,以社会、经济、人口、科技和文化等人类自身及其活动为对象的统计方法论,为对社会经济现象数量特征进行的调查研究提供原理、原则和方式方法。自然统计学自然统计学是将理论统计学应用于自然现象领域,是探索地理、地质、气候、天文、生物等非人类现象的数量关系和数量规律的统计方法论。其中较为重要的分支有生物统计学、气象统计学、天文统计学等。应用统计学\n(三)统计学与其他学科的关系统计学和数学的关系统计学中具有方法论性质的数理统计学是应用数学的一个分支,因此统计学与数学的关系十分密切,且与其他的应用数学有一定的共性。如和数学中的有关定理一样,统计中的一些分布也是客观现象数量特征的一种抽象。统计学与其他的数学分支相比又有其特殊性。(1)处理的数据不同。(2)处理的方法不同。\n(三)统计学与其他学科的关系统计学与其他专门学科的关系统计方法一般的数据分析方法适用于其他任何科学中的偶然现象,因此它与很多专门学科都有关系。但是统计方法只是从事物的外在数量表现去推断该事物可能的规律性,它本身不能说明何以会有这个规律性,这是各专门学科的任务。\n第二节统计研究的特点、方法和作用统计研究的特点\n第二节统计研究的特点、方法和作用数量性“数字是统计的语言”,数量性是统计研究的基本特点,统计研究系统如图1.2.1所示.\n统计研究的特点总体性统计研究就是总的、综合的数量研究。一般理解的总体是指统计总体,是由同类个体组成的集合体,如人口总体、企业总体、商品总体等等,这时统计研究的目的不是计量个体的特征表现,而是对个体的特征表现进行统计整理和统计分析,得到总体的综合的数量特征。\n具体性具体性即客观性。统计对象是具体的,是客观存在的事物或现象。统计数据包括原始数据和计算结果,都是客观现象在一定时间、地点、条件下的数量表现,是具体的数据。统计研究的特点\n统计研究的方法按照统计工作的不同阶段和作用列出的常用统计方法如图1.2.2所示。\n大量观测法所谓大量观测法就是对所研究的客观现象总体中的全部或者足够多的个体进行观测以达到正确认识总体的目的。大量观测法不是一种具体的应用方法,而是研究客观现象总体数量特征的重要思想方法和原则,是统计研究的指导原则。统计实验法和统计调查法统计实验法是按照一个设定的实验程序,观测现象开始实验以后的数量特征,根据实验收集的资料进行整理、分析,得到对现象总的认识。统计调查法指主要依靠调查人员,通过各种途径收集所研究现象的数据资料,包括历史资料和现实资料。统计研究的方法\n统计描述法和统计推断法统计描述法是综合描述的方法,是通过对所收集的数据进行加工处理,计算综合性的统计指标,描述所研究现象总体数量特征和数量关系的方法。根据所描述问题的特点,可以具体使用综合指标法和数学模型法。统计推断法是在对已知事物进行描述的基础上,对未知事物进行推断的方法。根据推断的内容不同可分为抽样估计法以及假设检验法等。统计研究的方法\n统计具有以下三个方面的作用:提供信息服务提供统计信息是统计的信息职能,是统计的首要职能。提供咨询服务提供咨询服务是统计的咨询职能。统计工作的任务不仅要完成提供信息的基本任务,还要进一步利用已经掌握的各种统计信息资料,为政府、企业以及个人等提供各种咨询建议和对策方案。提供监督服务提供监督服务是统计的监督职能。监督职能是指根据长期的大量的统计信息,按照标准监督客观现象发展变化状况,确定其是否正常,有无警情。统计研究的作用\n本章小节统计是对变量观测值产生的变异性的研究;统计学(statistics)是收集、描述和解释数据的科学,是科学的一种普遍性语言。统计方法包括:收集资料方法;整理资料方法;统计分析方法等。统计分析方法是统计方法的核心,统计分析方法可以分为两部分:描述性统计和推断性统计。描述性统计是通过对所收集的数据进行加工处理,计算综合性的统计指标,描述所研究现象总体数量特征和数量关系的方法;推断性统计阐明如何利用样本数据来推断被抽样总体的性质,并按规定的置信度来实现这种推断。统计过程的一个非常重要的部分是研究统计的结果和给出恰当的结论,这些结论必须正确地被表达,不能随意添加,除非还有其他的信息。\n第二章统计数据的收集与整理第一节统计调查方案设计第二节统计数据收集第三节统计数据整理第四节统计数据表现形式第五节统计数据特征描述本章小节主要内容\n第一节统计调查方案设计一、明确调查目的和任务明确调查目的和任务是设计统计调查方案最根本的问题,它决定着调查工作的内容、范围、方法和组织。二、确定调查对象和调查单位确定调查对象调查对象是指根据调查目的、任务确定的由那些性质上相同的众许多调查单位所组成的总体。即统计总体。确定调查单位调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。\n第一节统计调查方案设计三、确定调查项目、设计调查表或问卷确定调查项目调查项目是指对调查单位所要调查的具体内容属性,这些属性在统计上又称标志。它是由调查对象的性质、调查目的和任务所决定的,包括一系列品质属性和数量属性。设计调查表或问卷调查项目一般采用调查表或调查问卷的形式。将调查项目科学地分类、排列,就构成调查表或调查问卷。\n第一节统计调查方案设计四、确定调查时间、调查地点和调查方式方法调查时间调查时间是指调查资料所属的时点或时期。调查时间包括三方面内容:调查资料所属的时间、调查期限和调查工作进行的时间。调查地点调查地点是指调查单位的空间位置。确定调查地点,就是规定在什么地方进行调查。调查方式方法调查方式方法是指调查工作的组织方式方法,这主要取决于调查的目的、内容和调查的对象。统计调查的方式多种多样。按其组织形式不同,可分为统计报表制度和专门组织的统计调查;专门组织的调查有普查、重点调查、典型调查和抽样调查等方式。统计调查的方法有直接观测法、实验法、报告法、采访法和网上调查法等。\n五、制定调查的组织实施计划调查的组织计划,是指为确保实施调查的具体工作计划。调查的组织实施计划应包括以下内容:建立调查工作的组织领导机构,做好人员的配备与分工;做好调查前的准备工作。如宣传教育、人员培训、文件资料的印发、方案的传达布置、经费的筹措等;制定调查工作的检查、监督方法;调查成果的公布及工作后的总结等。第一节统计调查方案设计\n第二节统计数据收集一、收集资科的方式取得统计数据有多种途径,但概括起来不外乎是直接方式和间接方式。(一)统计资料的直接收集直接获取第一手统计资料的主要方法包括:统计调查和试验设计。统计调查的方式主要有普查抽样调查重点调查统计报表制度。\n普查普查是专门组织的一次性的全面调查,用来调查属于—定时点上或时期内的社会经济现象的总量。抽样调查抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。重点调查重点调查的组织方式有两种:一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。统计报表制度统计报表制度是根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。(一)统计资料的直接收集\n试验设计科学试验是进行科学研究的重要手段,在许多学科中几乎都起着积极的作用。统计中的试验设计是科学试验研究的组成部分之一。试验设计,包括五个相互关联的环节,分别是:方案设计方案实施数据采集数据分析优化生产(一)统计资料的直接收集\n凡不是通过直接的统计调查和试验,而是从其他各种渠道搜集的第二手资料,我们把它总称为统计资料的间接收集。间接资料的来源大体包括:统计年鉴、统计摘要、统计资料汇编、统计台账、统计公告、报纸、杂志、网上资料等。(一)统计资料的间接收集\n二、收集资料的方法数据资料的收集方法可以分为初级资料收集方法和次级资料收集方法或称文案资料。初级资料收集方法访问法访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。按访问内容的传递方式不同,可分为:面谈调查、电话调查、邮寄调查、留置调查、日记调查和网上调查等方法。\n二、收集资料的方法观测法观测法是指调查者通过直接观测、跟踪和记录被调查者的情况来收集资料的—种调查方法。报告法报告法是由报告单位根据原始记录和核算资料,按照统计机关颁发的统—的表格和要求,按—定的报送程序提供资料的方法。次级资料收集方法次级资料又称二手资料,是指他人为了他自己的研究目的而调查、整理的资科。\n统计的整个工作过程就是对数据的加工过程,从原始数据的收集开始,经过整理、显示、样本信息的获取到总体数量规律性的科学推断,都有一个减少误差、提高数据质量的问题。也就是说,统计数据的质量控制问题是贯穿于统计全过程的重要问题,因此,加强统计数据质量的管理要体现在统计研究的全过程。三、统计数据的质量问题\n主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图第三节统计数据整理\n一、统计分组统计分组是根据统计研究目的,将总体按一定标志区分为不同类型或不同性质的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。(一)统计分组原则根据统计研究的目的选择分组标志选择能够反映现象总体本质特征的标志考虑现象所处的具体时间、地点、条件来分组满足完备性、互斥性及一致性第三节统计数据整理\n(二)统计分组的方法按标志的特征分组总体单位的各个标志按分组标志的特征分组区分为品质标志和数量标志。按分组标志数量分组统计分组按分组标志多少不同,可分为简单分组和复合分组。第三节统计数据整理\n第三节统计数据整理简单分组简单分组是对研究对象按照一个标志进行的分组。例如某高校职工按照性别或者职称进行的分组,如表2.3.1、2.3.2所示。\n第三节统计数据整理复合分组复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组内划分成若干个小组。例如企业职工按性别分组后,在每组内再按年龄分组,如表2.3.3所示。\n第三节统计数据整理(三)统计分组体系统计分组体系有两种:平行分组体系和复合分组体系,如图2.3.1、2.3.2所示。\n(三)统计分组体系\n二、分布数列将统计总体按某一标志分组后,用来反映总体单位在各组中分配情况的数列叫分布数列。分配在各组的总体单位数叫次数或频数。各组次数与总次数的比值称为频率。(一)分布数列的分类根据分组标志的不同,分布数列可以分为品质分布数列和变量分布数列两种。\n(一)分布数列的分类品质数列按品质标志分组所形成的分布数列称品质分布数列或属性分布数列,简称品质数列。它是由总体各组名称及各组总体单位数(次数)组成,如表2.3.4所示。\n(一)分布数列的分类变量数列按数量标志分组形成的分布数列,称为变量分布数列,简称变量数列。它由各组变量值及各组总体单位数(次数)组成。变量数列按照用以分组的变量的表现形式,可分为单项数列和组距数列两种。单项数列就是指以一个变量值代表一组而编制的变量数列,如表2.3.5所示。\n组距数列的分类组距数列可分为等距分组和异距分组。等距分组即各组组距相等的分组。异距分组即各组组距不相等的分组。在标志值变动比较均匀的条件下,可采用等距分组。当标志值变动很不均匀,如急剧的增大、下降,变动幅度大时,可采用异距分组。组数的确定组距数列中组距的大小与组数的多少成反比。组限和组中值当组距、组数确定后,只需划分各组数量界限便可编制组距数列。(二)分布数列的编制\n(二)分布数列的编制组限和组中值由于变量有离散型与连续型两种,因此,其组限的划分也有所不同。离散变量其变量值可以依次列举,而相邻组两个变量值之间没有中间数值,因此,分组时相邻组的组限必须间断。连续变量由于其变量值不能依次列举,而且相邻两个变量值之间可以存在无限多的中间数值,因此,相邻组的上限和下限无法用两个确定的数值分别表示,这时相邻的上、下限采用重叠的方法分组界定。在统计工作中,为保证变量的分组不发生混乱,习惯上规定各组一般均只包括本组下限变量值的单位,而不包括上限变量值的单位,这就是“上限不在内”原则。\n(二)分布数列的编制若按照间断式组限分组时,则需要转换成连续式组限后再计算组中值,闭口组时采用上(2.3.1)式计算。若按照间断式组限分组时,则需要转换成连续式组限后再计算组中值,闭口组时采用上(2.3.1)式计算,开口组时需要采用(2.3.2)式、(2.3.3)式以下近似算:第一组为××以下,缺少下限,则组中值=组上限-下一组组距/2(2.3.2)最末组为××以上,缺少上限,则组中值=组下限+上一组组距/2(2.3.3)\n(二)分布数列的编制间断式组中值的计算事例如表2.3.6所示。\n第四节统计数据表现形式一、统计表(一)统计表的结构从形式上看,统计表的结构是由表题、横行标题、纵栏标题和指标数值等要素构成,统计表结构的一般形式如图2.4.1所示。\n(一)统计表的结构例:2001年我国工业增加值的一个统计表示如表2.4.1所示。\n按照统计表的主词是否分组和分组的程度,分为简单表,分组表和复合表三种。简单表简单表是统计表的主词未经任何分组的统计表。分组表分组表指统计表的主词按某一标志进行分组。复合表复合表指统计表的主词按两个或两个以上标志进行复合分组(二)统计表的种类\n二、统计图条形图(Barchart)条形图常用于描述离散型数据的情况,是我们经常见到的一种图形,它是用宽度相等而高度为频数(率)来表示各类数据的大小。例2.4.1某高校2005年各院教师在国内核心杂志上发表论文情况,如表2.4.2所示\n条形图(Barchart)解:由表2.4.2中的数据应用Excel软件中的“插入”功能中的“图表”功能绘成的条形图如图2.4.2所示。\n直方图(Histogram)直方图表征数据的频数分布特征,它与条形图在形式上有类似之处,都是用条形来表示数据特征,但直方图中的条形之间是没有间隔的。例2.4.2某连锁企业2005年度各分公司完成销售计划如表2.4.3所示,试绘制直方图。\n直方图(Histogram)解:应用Spss软件中的“Gragh”功能绘制的直方图,如图2.4.3所示。\n饼分图(Piechart)饼分图经常用来表示各成分在总体中所占的百分比。例2.4.3 某课题组为了科学评价某高校学科建设项目的绩效,对构建的学科建设绩效评估指标权重进行了问卷调查,累计发放问卷调查表243份,回收有效问卷223份,其中,教授占65%,研究员占1%,副教授占12%,副研究员占1%,讲师占20%,助教占1%,则样本职称分布如图2.4.4所示。\n洛伦茨曲线是20世纪初美国经济学家、统计学家洛伦兹(M.E.Lorentz)绘制成的描述收入和财富分配性质的曲线,洛伦兹曲线如图2.4.5所示。洛伦茨曲线\n洛伦茨曲线为了更准确地反映收入分配的变化程度,20世纪初意大利经济学家基尼(Gini)根据洛伦茨曲线,提出了计算收入分配公平程度的统计指标,称为基尼系数。其公式为:联合国有关组织规定:G小于0.2表示收入绝对平均,在0.2~0.3之间表示比较平均,在0.3~0.4之间表示相对合理,在0.4~0.5之间表示收入差距较大,大于0.6表示收入差距悬殊。基尼系数0.4为国际警戒线,超过了0.4则应采取措施缩小收入差距。\n箱形图也称箱线图,是由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制的一个箱子和两条线段的图形。如图2.4.6所示。箱形图(Boxplot)\n箱形图(Boxplot)不同箱形形状可反映出不同的分布特征,如图2.4.7所示。\n箱形图(Boxplot)例2.4.42005年度某高校经济管理学科共有10篇博士学位论文需要评审,分别请该领域8位专家进行审稿,论文得分数据如表2.4.4所示。\n解:应用Spss软件中的“Gragh”功能绘制的各博士学位论文得分情况的箱形图,如图2.4.8所示。箱形图(Boxplot)图2.4.810篇博士学位论文得分的箱形图\n第五节统计数据特征描述一、总量指标总量指标是反映社会经济现象在一定时间、地点、条件下的总规模或总水平的统计指标。总量指标也称为绝对指标或绝对数。(一)社会总产品社会总产品也称总产出。它是指一个国家或地区在一定时期(如一年)内全部生产活动的总成果,当以货币表现时,即为全部生产活动成果的价值总量。(二)增加值增加值是企业或部门在一定时期(如一年)内从事生产经营活动所增加的价值。它是总产出减去中间投入后的余额,因此,从价值构成看,它包括全部新创造的价值和物质消耗中本期固定资产折旧。\n一、总量指标(三)国内生产总值(GDP)国内生产总值是按市场价格计算的国内生产总值的简称。它是一个同家(或地区)所有常住单位在一定时期内生产活动的最终成果。国内生产总值有三种表现形态,即价值形态、收入形态和产品形态。在实际核算中,国内生产总值的三种表现形态表现为三种计算方法,即生产法、收入法和支出法。生产法国内生产总值=各部门增加值之和(2.5.1)增加值=总产出一中间投入(2.5.2)收入法增加值=固定资产折旧+劳动者报酬+生产税净额+营业盈余(2.5.3)支出法国内生产总值=最终消费十资本形成总额十净出口(2.5.4)国民总收入=国内生产总值十国外要素收人净额(2.5.5)国外要素收入净额=来自国外的劳动者报酬和财产收入-国外从本国获得的劳动者报酬和财产收入 (2.5.6)\n一、总量指标例2.5.1如表2.5.1所示的《国内生产总值及其使用表》是国民经济核算体系中再生产核算表的重要组成部分,是—张平衡表。该表从生产、分配、使用三个不同角度充分揭示了国内生产总值是衡量社会生产与使用的核心指标;它将国内生产总值的三种计算方法集中体现在一张表中,既可以从不同角度对国内生产总值指标进行观测分析,又保证了指标概念的完整性、逻辑关系的清晰性和技术方法的统一性。\n二、相对指标相对指标又称相对数,它是两个有联系的指标数值对比的结果。用来对比的两个数,既可以是绝对数,也可以是平均数和相对数。(一)计划完成相对指标1.根据总量指标计算计划完成相对指标例2.5.2设某工厂某年计划工业增加值为600万元,实际完成660万元,求增加值计划完成相对数。\n二、相对指标2.根据平均指标计算计划完成相对指标根据平均指标计算计划完成相对数的计算公式为:\n二、相对指标例2.5.3某企业生产某产品,本年度计划单位成本降低9%,实际降低12%,求成本降低率计划完成相对数。例2.5.4某企业某月生产某产品,计划每人每日平均产量为36件,实际每人每日平均产量为39件,求劳动生产率计划完成相对数。\n(二) 结构相对指标总体是在同一性质基础上由各种有差异的部分所组成的。结构相对指标就是利用分组法,将总体区分为不同性质(即差异)的各部分,以部分数值与总体数值对比而得出比重或比率,来反映总体内部组成状况的综合指标。其计算公式为例2.5.5 某公司男职工为员工总数的60%,女职工为员工总数的40%,它反映了该公司在男女性别上的构成情况。\n(三)比较相对指标比较相对致也称类比相对数,是将两个同类指标做静态对比得出的综合指标,表明同类现象在不同条件(如在各国、各地、各单位)下的数量对比关系。其计算公式为:例2.5.6某年有甲、乙两企业同时生产一种性能相同的产品,甲企业工人劳动生产率为21776元,乙企业为30994元,求两企业劳动生产率比较相对数。解:两企业劳动生产率比较相对指标=\n(四)比例相对指标比例相对指标是将总体内某一部分数值与另一部分数值对比所得到的相对数,常用系数或倍数表示。计算公式为例2.5.7我国2003年国内生产总值为116898.4亿元,其中第—产业为17092.1亿元,第二产业为61131.3亿元,第三产业为38675.0亿元,则第—产业生产总值:第二产业生产总值:第三产业生产总值=1:3.6:2.3\n(五)强度相对指标强度相对指标是两个性质不同,但有一定联系的总量指标对比的结果,用来表明现象的强度、密度和普通程度的综合指标。强度相对指标的计算\n(五)强度相对指标例2.5.8某地区占地10.2万平方公里,据统计2005年初和2005年底的人口分别为4216万人和4372万人,2005年国民收入总额为9768亿元,求2005年的人口密度、平均人口数、人均国民收入。\n(五)强度相对指标强度相对指标的正逆指标强度相对数是两个有联系的不同事物的总量指标数值的对比,因此,分子和分母可以互换,这就产生了有些强度相对数有正指标和逆指标两种例2.5.9某城市人口620万人,有大学66所,求大学密度正指标与大学密度负指标。\n动态相对指标是同类指标在不同时期上的对比,其计算公式为(五)动态相对指标式(2.5.16)中,作为对比标准的时期叫做基期,而同基期比较的时期叫做报告期,有时也称为计算期。动态相对数的计算结果用百分数或倍数表示。\n三、平均指标(一)算术平均数简单算术平均数\n(一)算术平均数加权算术平均数加权算术平均数的简略形式为:\n(一) 算术平均数例2.5.12表2.5.2为某企业职工月平均工资的分组数据,试计算职工的月平均工资。\n(二) 调和平均数调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到的平均数\n(三)几何平均数简单几何平均数例2.5.14某高校自2001-2005年学生人数如表2.5.3所示,求该校平均发展速度。\n解:\n(三)几何平均数加权几何平均数\n(三)几何平均数例2.5.15某银行在过去15年中的年利率资料如表2.5.4所示,求15年的平均年利率。解:用几何平均法求15年平均利率\n(四)中位数中位数是将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数,用表示。未分组资料中位数的确定\n例2.5.167名工人的日产量依次从小到大排列为16件、18件、22件、23件、26件、29件、31件;8名工人的日产量依次从小到大排列为16件、18件、22件、24件、26件、29件、31件、33件,分别求其中位数。解:7名工人的日产量的中位数位次(用)为(四)中位数8名工人的日产量的中位数位次为\n分组资料中位数的确定下限公式(向上累计时)为(四)中位数上限公式(向下累计时)\n(四)中位数例2.5.17某车间共有工人130名,生产某种产品按日产量分组资料如表2.5.5所示,试确定该车间工人日产量的中位数。\n例2.5.18某高校某学院学生体重的数据资料如表2.5.6所示,计算该学院学生体重的中位数。(四)中位数\n按下限公式计算:按上限公式计算:例2.5.18 计算\n(五)众数众数是指总体中出现次数最多的标志值,它能够直观地说明客观现象分配中的集中趋势。按单项数列确定众数只须观测标志值出现的次数,把次数最多的组定为众数组,该组的标志值即为众数。按组距数列确定众数的方法下限公式:上限公式:\n(五)众数\n(六)各种平均数的适用范围及其相互关系不同平均指标的适用范围算术平均数易受极端变量值影响,使的代表性变小;当组距数列为开口组时,由于组中值不易确定,使的代表性变得不可靠。几何平均数适用于各个变量值的连乘积等于其发展总速度时,求算其平均数;求等比数列的平均数。众数适用于总体的单位数较多,各标志值的次数分配又有明显的集中趋势的的情况。中位数属于位置平均数,它与众数一样,都是从数据位置的角度来反映数据的代表水平,中位数不受极端值的影响,各个变量值相对其中位数的绝对离差之和为最小。\n(六)各种平均数的适用范围及其相互关系算术平均数、中位数和众数三者的关系\n四、变异指标标志变异指标是评价平均数代表性的依据,标志变异指标愈大,平均数代表性愈小;标志变异指标愈小,则平均数代表性愈大。极差(range)极差也称全距,是指总体分布中最大标志值与最小标志值之差,用以说明标志值变动范围的大小,通常用来表示,其计算公式为\n极差(range)例2.5.20某商场连续11天销售某品牌手机的数量分别为:22、36、43、12、31、52、42、20、35、26、33,求极差。解:将销售数量由大到小排序为:12、20、22、26、31、33、35、36、42、43、52,则极差为:\n标准差(standarddeviation)和方差(variance)由未分组数据资料计算标准差是总体各单位标志值与平均数离差平方平均数的平方根,标准差的平方即为方差。设从某个总体中抽取的数据为,则称为样本标准差为样本方差\n标准差(standarddeviation)和方差(variance)若某总体的全部元素就是,则称为该总体的标准差为该总体的方差\n标准差(standarddeviation)和方差(variance)由分组资料计算例2.5.22以例2.5.18中学生体重的样本资料,计算学生体重的方差与平均差。\n例2.5.23某高校经济管理学院中的0401和0402两个班各有9名学生选修了管理预测与决策方法课程,考试成绩如表2.5.7所示,试计算各班管理预测与决策方法成绩的平均值和标准差。\n解:根据表2.5.7的数据资料计算得\n变异系数(coefficientofvariation)离散系数是消除平均数影响后的标志变异指标,用来对两组数据的差异程度进行相对比较,其形式为相对数,因此,也称为标志变异相对数指标。常见的离散系数是标准差系数。\n变异系数(coefficientofvariation)例2.5.24某电器公司中的两个车间生产不同的产品,其中一车间生产手机,二车间生产MP3,某月两个车间产量的平均数和标准差资料如表2.5.8所示,试分析两者标志的变异程度。解:\n五、偏度与峰度偏度(Skewness)偏度是用于衡量分布的不对称程度或偏斜程度的指标\n峰度(Kurtosis)\n五、偏度与峰度举例例2.5.26根据例2.5.18中学生体重的样本资料,计算学生体重的峰度。\n本章小节统计资料的收集与整理是对数据的直接处理与分析,目的是计算数据的特征值、发现其数量规律性,进而用样本数据的特征值推断未知总体的参数。统计调查方案的设计与统计资料的收集主要介绍如何用数据对客观事物进行计量,如何获得数据,以及对数据质量的评价。统计整理是根据统计研究的目的,将调查所得到的资料进行科学地分组、汇总、表现并对总体的数量特征加以描述,为统计分析准备系统的、条理化的综合资料的工作过程。统计资料整理的结果可以用不同的形式表现,其中统计表和统计图是表现统计资料的常用形式。最重要的数字描述性指标有两类,一类测量数据集的集中趋势(平均值、中位数和众数),另一类测量数据的变异性(极差和标准差)。\n第三章抽样分布第一节随机样本第二节抽样分布本章小节主要内容\n第一节随机样本对一个总体而言,个体的取值是按一定的规律分布的。一个总体就是一个具有确定概率分布的随机变量。一般来说,总体的分布是未知的,或分布形式中含有未知参数。在统计学中,人们总是通过从总体中抽取一部分个体,根据获得的样本数据对总体分布进行推断,而被抽出的部分个体叫做总体的一个样本。从总体中抽取有限个个体对总体进行观察的过程叫做抽样。\n在相同的条件下我们对总体进行次重复的、独立的观察,将次观察结果按试验的次序记为,由于是对随机变量观察的结果,且每次观察是在相同的条件下独立进行的,故可以认为它们相互独立,且都是与总体具有相同分布的随机变量。这样得到的随机变量称为来自总体的一个简单随机样本,称为这个样本的容量。当次观察结束后,我们就得到一组实数,它们依此是随机变量的观察值,称为样本值。\n第二节抽样分布一、统计量定义不含有任何未知参数的样本的函数,称为统计量。显然,统计量为随机变量。几个常用统计量样本矩(样本均值;样本方差;原点矩,中心矩等)\n二、几个常用的抽样分布抽样分布的定义统计量的分布称为抽样分布。来自正态总体的几个常用统计量的分布,已有一些重要的结果(人们已经获得这些统计量的具体的分布密度函数)。下面介绍来自正态总体的几个常用统计量的分布。第二节抽样分布\n(一)分布设是来自总体的样本,则称统计量为服从自由度为的分布,记为的一个重要性质:可加性\n(二)分布设,,且设与独立,则称统计量为服从自由度为的分布,记为。可以证明,当充分大时,分布趋向于标准正态分布。二、几个常用的抽样分布\n(三)分布设,且设独立,则称随机变量为服从自由度为的分布,记为。分布的上分位点满足下列关系:\n(四)基于正态总体样本的均值与方差的分布设来自正态总体的样本,分别为样本的均值和方差。则\n设为来自正态总体的样本,为来自正态总体的样本,分别为两个样本的均值和方差。则当时,则\n三、样本比例的抽样分布(一)重复抽样下样本比例的抽样分布可以证明,(二)不重复抽样下样本比例的抽样分布可以证明,\n本章小结统计量是统计推断的基本变量。统计量是不含有任何未知参数的样本的函数。统计量的分布称为抽样分布。对于正态总体,我们给出了几个常用的统计量的分布。对于实际应用中的比率问题,给出了大样本下的抽样分布。\n第四章统计推断第一节参数估计第二节假设检验第三节假设检验中的两个问题本章小节主要内容\n第一节参数估计一、点估计设总体的分布函数的形式已知,但它含有一个或多个未知参数,借助于总体的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。常用的构造估计量的方法:矩估计法和最大似然估计法。\n(一)矩估计法英国统计学家K.Pearson提出的矩估计法,其主要思想是:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总体矩的函数的估计。这里,表示总体的矩,它是总体分布参数的函数,而是样本的函数。由上述个方程组成的方程组,可以解出总体分布中的个未知参数。\n例1设总体的均值及方差(不为零)都存在,且均未知。又设是来自总体的一个样本,试求的矩估计量。解由,得再以代替,即得的矩估计量分别为\n(二)最大似然估计法由R.A.Fisher引进的最大似然估计法,无论从理论上还是从应用上,至今仍然是一种重要且普遍适用的方法。估计过程:由所谓的似然函数(它是参数和样本的函数)\n若则称为参数的最大似然估计值,为的似然估计量。一般情况下,可由方程求得。\n例2设,为未知参数,是来自此总体的一个样本的观测值,试求这两个未知参数的最大似然估计量。解容易得到样本的对数似然函数求此二元函数的最大值,得到两参数的最大似然估计值分别为即两参数的最大似然估计量分别为\n二、估计量的评选标准(一)无偏性设为参数的点估计量,若则称为参数的无偏估计量。\n(二)有效性设和是的无偏估计量,若对于的变化范围内的任意一个值,都有且至少有一个使得不等号成立,则称较有效。\n(三)相合性无偏性与有效性都是基于样本容量n固定的前提下提出的,我们希望随着样本容量的增大,一个估计量的值趋向于待估参数的真值。设为参数的一个估计量,若对于其变化范围内的任意一个,当时,依概率收敛于,则称为的相合估计量。\n三、区间估计定义设总体的分布函数中含有未知参数对于给定的,有两个样本统计量,使得则称随机区间是的置信度为的置信区间,分别称为置信度为的双侧置信区间的置信下限和置信上限。\n确定未知参数置信区间的一般步骤(1)构造一个样本的函数W它包含待估未知参数,而不含其它未知参数,并且W的分布已知且不依赖于任何未知参数;(2)对于给定的置信度,定出两个常数a,b,使得(3)若能由上式得到等价的不等式,其中,都是统计量,那么就是的一个置信度为的置信区间\n正态总体参数的置信区间1.单个正态总体的情况(1)的置信区间①已知时,②未知时,(2)方差的置信区间(仅以未知为例)\n例3现从某天生产的洗衣粉中随机地取16袋,称得重量(以克计)如下表所示。设洗衣粉的重量近似地服从正态分布,试求总体均值的置信度为0.95的置信区间。解这里,总体的方差未知,故总体均值的置信区间为:而,经过计算得,又查表得,故所求的置信区间为(500.4,507.1)。506508499503504510497512514505493496506502509496\n2.两个正态总体的情况实际中存在这样的问题:已知产品的某一指标服从正态分布,但由于原料、设备条件、操作人员不同,或工艺过程的改变等因素的影响,而引起总体均值、方差的改变。我们要考察这些变化的大小,这就涉及两个正态总体均值差或方差比的估计问题。设有两个正态总体,样本均值和方差分别为\n(1)两个总体均值差的置信区间①均已知,的置信区间未知但相等,的置信区间\n例4为提高某一化学生产过程的得率,拟采用一种新的催化剂。为此,先进行试验。设采用原来的催化剂进行了次试验,得到得率的平均值和样本方差分别为;又采用新的催化剂进行了次试验,得到得率的均值和样本方差分别为。假设两总体都服从正态分布,方差相等,两样本独立。试求两总体均值差的置信度为0.95的置信区间。解由题意,可得,则的置信度为0.95的置信区间为即(-4.15,0.11)\n(2)两个总体方差比的置信区间这里仅讨论未知的情形对于给定的置信度,的置信区间为\n四、大样本下总体均值、比率的区间估计(一)总体均值的区间估计这里的大样本,是指样本的容量不小于301.总体方差已知时总体均值的置信区间2.总体方差未知时总体均值的置信区间\n例5某保险公司有36个投保人的年龄资料如表表所示所示。试求投保人平均年龄的置信度为95%的置信区间。233642343934354253284939394645393845274354363438363147444845443324405032\n解这里总体的方差未知,但为大样本情形。查标准正态分布表得,再由上表数据,得,由此,可以得到投保人平均年龄的置信度为95%的置信区间为,即(39.96,42.04)\n(二)总体比率的区间估计由样本比率的抽样分布可以知,当样本容量足够大时(一般指不小于30,且都大于5),样本比率的抽样分布近似正态分布。设总体比率为,则有对于置信度,P的置信区间为\n例6某公司要估计某天生产的某型号的全部产品的合格率。为此随机抽取了100件产品,经检验其中有94件为合格品。对于置信度95%,试求该天此型号产品合格率的区间估计。解由题意,易得样本合格率,从而得全部产品合格率置信度为95%的置信区间为即(89.35%,98.65%)\n(三)两个总体均值差的区间估计对于给定的置信度,的置信区间这里,为来自与两个总体的样本均值;为样本的方差。\n例7为了评估甲乙两种方法包装某产品所需要的时间,在不同的方法下独立地抽取两个随机样本,经整理计算得到下列资料。试在置信度95%下,给出这两种方法下包装某产品平均时间之差的置信区间。解由公式得到这两种方法下包装某产品平均时间之差的置信度为95%的置信区间为(3.86,10.14)甲方法乙方法\n第二节假设检验一、参数假设检验在总体的分布函数已知,但参数未知时,如对总体分布中的未知参数提出假设,则如何利用样本提供的信息来检验这个假设,即接受此假设还是拒绝此假设。这类统计问题我们称之为参数的假设检验问题。参数估计和参数检验是利用样本对总体的统计特性提供的信息,建立样本的函数,即估计量或检验统计量,是从不同角度处理总体未知参数的两种统计方法。\n(一)假设检验的基本思想设总体为,建立假设这里表示原假设,表示备择假设。假设检验问题,就是要建立一个合理的法则,根据这一法则,利用已知样本作出接受原假设(即拒绝备择假设),还是拒绝原假设(即接受备择假设)的决策。\n(二)判断“假设”的依据实际推断原理:概率很小的事件在一次试验中几乎是不会发生的。如果原假设为真,则由一次抽样计算而得的样本观测值,满足不等式此事件几乎是不会发生的。现在在一次观测中竟然出现了满足上述不等式的样本均值,则我们有理由怀疑原来的假设的正确性,因而拒绝原假设。若出现的观测值不满足上述不等式,此时没有足够的理由拒绝,因此只能接受原假设。\n(三)两类错误在使用任何一个检验法(相当于确定一个拒绝域)时,由于抽样的随机性,作出的判断总可能会犯两类错误:一是假设实际上为真时,我们却作出拒绝的错误决策,称这类“弃真”的错误为第一类错误;二是当实际上不真时,我们却接受了,称这类“取伪”的错误为第二类错误。我们这里讨论的检验问题中的显著性水平控制了犯第一类错误的概率。这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的检验问题,称为显著性检验问题。\n参数假设检验问题的步骤:第一步:根据实际问题的要求,提出原假设和备择假设;第二步:给定显著性水平以及样本容量;第三步:确定检验统计量及其分布,并由原假设的内容确定拒绝域的形式;第四步:由{拒绝|为真}≤求出拒绝域;第五步;根据样本观测值计算检验统计量的具体值;第六步;作出拒绝还是接受原假设的统计判断。\n(四)单个总体参数的假设检验1.单个正态总体下参数的假设检验(1)单个正态总体均值的检验①已知,关于的检验(Z检验)检验统计量:可以根据假设检验的不同类型,确定检验问题的拒绝域。\n例8某厂生产某种型号的内胎,从长期的生产经验知道其扯断强力服从均值=1380(N/㎝),标准差=50(N/㎝)的正态分布。该厂为提高产品的质量,改变了原来的配方进行现场生产试验。设新配方生产的内胎其扯断强力仍服从正态分布。由于在试验中除配方外,其他条件都保持不变,因此可以认为新配方未改变此型号内胎扯断强力的方差。采用新配方的5次试验,测得内胎扯断强力为(单位:N/㎝):1450,1460,1360,1430,1420,试问采用新配方,是否能提高内胎的扯断强力?\n解对这个假设检验问题,需要检验假设形如这样的假设检验,称为右边检验(类似也有左边检验)。此检验问题的拒绝域的形式为查表得,而经计算得,,从而有,即,据此,拒绝原假设。\n②未知,关于的检验(t检验)检验统计量:可以根据假设检验的不同类型,确定此检验问题的拒绝域\n例8某种元件,按照标准其使用寿命不低于1000(小时),现从生产出的一批元件中随机抽取25件,测得其平均寿命为950(小时),样本标准差为100(小时)。假设该种元件寿命服从正态分布,对于置信度95%,试问这批元件是否可以认为合格?解此问题即要检验拒绝域的形式为而由已知可得,,,又,即。故接受原假设。\n(2)单个正态总体的方差检验设未知,建立假设:;:检验统计量:拒绝域:或\n2.非正态总体参数的假设检验这里讨论的是在大样本(样本容量)情形下总体均值和总体比率的假设检验。总体均值和总体比率的假设检验这里利用中心极限定理,在样本容量充分大时,样本均值近似服从正态分布,从而可以构造相应的检验统计量和确定出检验问题的拒绝域。对于总体比率的检验,在样本容量充分大时,样本比率近似服从正态分布,也可以类似构造检验统计量及确定出拒绝域。\n(五)两个正态总体下参数的假设检验1.有关平均值的假设检验设分别表示来自两个具有相同方差的正态总体的样本均值,则对于两个总体均值的假设检验问题,可以通过构造检验统计量来确定拒绝域的形式。\n2.方差的假设检验设分别表示来自两个具有不同方差的正态总体的样本方差,则对于两个总体方差的假设检验问题,可以通过构造检验统计量(在原假设为真的情形下)根据备择假设的不同类型可以确定出检验问题的拒绝域。\n二、非参数假设检验前一节所讨论的假设检验问题,只是对服从正态分布的总体中的某些未知参数进行假设检验。但在实际问题中,总体的分布函数的形式往往未知;或者知道的很少,甚至只知道是离散型或连续型。本节讨论总体分布函数的拟合问题,即研究检验总体分布函数的非参数假设检验问题。\n(一)符号检验法这里只介绍检验两个总体分布函数是否相同的符号检验法设有两个总体,要检验假设设有来自两个总体的样本将它们所对应的样本观察值进行比较,可以得到对应值差的符号,以记正、负号的个数,则它们为随机变量。构造检验统计量就可以确定出检验问题的拒绝域。\n例9甲、乙两分析人员分析同一物体中的某成分含量,测得数据如下表(单位:%)。问两人的分析结果有无显著差异(对于显著性水平0.1)甲14.914.815.114.815.514.614.814.815.114.5乙14.314.915.214.715.214.714.714.615.214.5符号+––++–++–0甲15.014.914.715.015.114.915.214.715.415.3乙14.914.714.815.314.914.614.814.915.215.0符号++––+++–++\n解:由上表,可以得到数据间比较的符号,若对比的数据相等,符号以0表示,结果见上表。再根据数据计算得=12,=7,所以=19,且=7。由显著性水平=0.10及=19,由附表查得。因=7>5,于是接受原假设,即认为两人的分析结果无显著差异。由上面的分析可以看到,符号检验法简单、直观,且无须知道被检验量的分布形式,但其精度较差,而且要求数据成对出现。\n(二)秩和检验法设从总体中分别抽取容量为的独立样本。要检验假设为讨论方便,不妨设。把两个样本的观测数据合在一起按从小到大的次序排列,定义每个数据在排列中所对应的序号为该数的秩,对于相同的数据则利用他们序数的平均值来做秩。将容量较少的样本的各观测值的秩之和记为,以作为检验统计量。然后确定出相应的拒绝域。\n例10某厂用两种材料制造灯泡,现有分别随机抽取若干个进行寿命试验的数据如下:问两种材料对灯泡寿命的影响有无显著的差异(取=0.20)。甲1598169816801650174017901720乙16981640157616401590\n解:将全部数据按从小到大的次序排列,结果如下表所示。将数据少的乙组的数据个数用表示,另一组用表示。由此算得,即=1+2+4+5+8.5=20.5因=5,=7,=0.20,由附表查得=22,=43。由于,故认为两种材料对灯泡寿命的影响有显著差异。秩12345678.5101112甲1598165016801698172017401790乙15761590164016401698\n(三)拟合优度检验法实际上,有时连总体服从什么类型的分布都不知道,这就需要根据样本来检验总体分布的假设。设是未知的总体分布函数;又设是类型已知的分布函数,但其中可能有未知的参数。要检验假设:构造统计量由此确定出相应检验问题的拒绝域。\n例11一颗骰子掷了120次,得到下列结果试在=0.05下检验这颗骰子是否均匀、对称。解:掷一颗骰子出现的点数是一个离散型的随机变量X。这里要检验假设由于已知的分布中不含未知参数,又=20,则由而,故接受原假设。出现点数123456出现次数232621201515\n第三节假设检验中的两个问题一、置信区间与假设检验的关系二、假设检验中的值在原假设为真的假设下,值就是所获得的样本结果比实测结果更为极端的概率,一般也称值为实测显著性水平。值是关于数据的概率,即它表明在某个总体的许多样本中,某一类数据出现的经常程度。或者说,值是当原假设成立时,得到所观测数据的概率。即若原假设成立,值表明得到这样的观测数据的可能性是多么的小。不太可能得到的数据,是我们判断原假设不真的有力依据。\n本章小结统计推断中的两个基本问题是估计问题和假设检验问题。估计问题可以分为参数的点估计和区间估计。点估计方法常用的一般有矩估计法和最大似然估计法。置信区间是一个随机区间,它覆盖未知参数具有预先给定的高概率(即置信度)。在参数假设检验问题的研究中,主要是如何构造出检验统计问题的拒绝域。对于非参数假设检验问题,我们给出了3种常用的检验方法,即符号检验法、秩和检验法和拟合优度检验法。\n第五章方差分析第一节单因素试验的方差分析第二节双因素试验的方差分析本章小结主要内容\n第一节单因素试验的方差分析我们把要考察的指标称为试验指标。如果在一个问题中有几项试验指标,我们将分别对每一项试验指标进行分析。影响试验指标的条件称为因素,一般用大写字母等表示。如果一项试验中只有一个因素在改变我们就称为单因素试验;因素所处的状态称为水平。\n设因素A有t个水平,在第i个水平下进行了ni次相互独立的试验,结果如下:\n方差分析的基本任务就是要检验假设(1)(2)参数的检验\n方差分析的基本思想:若被考察的因素对试验结果没有显著的影响,即所讨论的各正态总体的均值相等,则试验数据的波动完全由随机误差引起;如果各正态总体均值不全相等,则表明试验数据的波动除了随机误差的影响外,还包含被考察因素效应的影响。为此,需要构造一个适当的统计量,来描述数据的波动程度。将这个统计量分解为两部分,一部分是纯随机误差造成的影响,另一部分是除随机误差的影响外来自于因素效应的影响。然后将这两部分进行比较,如果后者明显比前者大,就说明因素的效应是显著的。\n单因素试验方差分析表方差来源平方和自由度均方F比因素A误差总和\n由此得到检验问题的拒绝域的形式:该检验法的直观意义是:当组间差异相对于组内差异较大时就拒绝原假设。在计算时,我们只要算出F值,然后与F分布的临界值比较即可;也可运用Excel计算分析。\n例1采用四种不同产地的原料萘,按同样的工艺条件合成—萘酚,测定所得产品的熔点如下表所示,问原料萘的产地是否显著影响产品的熔点产地1产地2产地3产地4124.0123.0123.5123.0123.0123.0121.5121.0123.0123.5121.0\n解:经过计算得到下列方差分析表由上表可知,接受原假设,即原料萘的产地对萘酚熔点无显著影响。方差来源平方和自由度均方F比F临界值原料产地误差总和4.65725.979210.636437101.55240.85421.81743.07\n第二节双因素试验的方差分析一、双因素等重复试验的方差分析在实际中,影响一事物的因素有两个或更多。下面我们讨论双因素的方差分析问题。双因素方差分析的基本思路:若某一因素的几个水平会引起事物很不同的结果,则这个因素就是重要的;若某一因素的几个水平仅是导致事物相近的结果,则这个因素就是不重要的。\n设因素A有r个水平,因素B有s个水平。试验结果因素B因素AB1B2BsA1A2Ar\n此假设检验问题为\n方差分析表方差来源平方和自由度均方F比因素A因素B交互作用误差总和\n此假设检验的拒绝域分别为:在显著性水平下,假设的拒绝域的形式为:假设的拒绝域的形式为:假设的拒绝域的形式为:\n例2某种火箭使用4种燃料(A),3种推进器(B)进行射程试验。在每种燃料与每种推进器的组合下火箭各发射两次,射程数据见下表。试在显著性水平下,检验不同燃料(因素A)、不同推进器(因素B)下射程是否有显著差异?交互作用是否显著?B1B2B3A1A2A3A458.2,52.649.1,42.860.1,58.375.8,71.556.2,41.254.1,50.570.9,73.258.2,51.065.3,60.851.6,48.439.2,40.748.7,41.4\n解经过计算得到方差分析表由于3个假设检验中的F值都大于其临界值,故可以认为燃料和推进器这两个因素对射程的影响是显著的,且交互作用是显著的。方差来源平方和自由度均方F比F临界值因素A因素A交互作用A×B误差总和261.675370.9811768.693236.9502638.298326122387.225185.490294.78219.746FA=4.42FB=9.39FA×B=14.93.493.893.00\n二、双因素无重复试验的方差分析在上面的分析中,我们考虑了双因素间有交互作用的情况。为了检验因素之间的交互作用是否显著,对于两个因素水平的每一组合至少要试验两次。如在实际中已知因素之间无交互作用,或交互作用对试验指标的影响很弱,则可以忽略交互作用。此时我们上面讨论的模型得到了简化,同时试验的次数(对因素水平的每一组合)也可以是一次。\n试验结果因素B因素AB1B2BsA1X11X12X1sA2X21X22X2sArXr1Xr2Xrs\n此假设检验问题为\n方差分析表方差来源平方和自由度均方F比因素A因素B误差总和\n此假设检验问题的拒绝域的形式为:在显著性水平下,检验问题的拒绝域分别为假设的拒绝域为假设的拒绝域为\n例3为了研究4种水稻品种对产量有无显著影响,分别在5块面积相同的试验地上种上同一品种的水稻,总共种了20块地。虽然每块地的面积是相同的,但各块地的土质可能有较大的差异。为获得试验结果的正确性,把20个试验单位按土质分为5类,每个组内有4个试验单位,它们的基本条件认为是相同的。在每一个组中,4种品种的水稻种子随机地播种在其中的一个试验单位上。下表是将4个品种的水稻播种在5个组上测得收获量的数据(单位:公斤)。在每一试验单位上水稻的播种量及其它条件可以认为都相同。设品种和地块的各水平搭配下收获量的总体都服从正态分布且方差相同。问在水平下,品种对水稻收成有无显著影响。\n试验数据B1B2B3B4B5A1A2A3A432.333.230.829.534.033.634.426.234.736.832.328.136.034.335.828.535.536.132.829.4\n解经过计算得到方差分析表由此可知,不同的水稻品种对水稻收成有显著的影响,不同的地块对水稻的收成无显著影响。方差来源平方和自由度均方F比F临界值品种A块地B误差总和3412193.493.26\n本章小结单因素方差的基本思想是,通过将观察数据的总偏差平方和进行分解,利用假设检验理论和方法,检验因素的各个水平所对应的试验结果有无显著差异,从而拒绝或接受因素各水平对应的正态总体的均值相等这一原假设。双因素方差分析的基本思想与单因素方差的基本思想类似。只是双因素方差分析更为复杂一些.特别是因素之间有交互作用时的方差分析。方差分析事实上非真正的对方差的分析,而是分析用偏差平方和度量数据的变异。正如Snedecor所言:“它是从可比组的数据中分解出可追溯到某些指定来源的变异的一种技巧”。\n第六章回归分析第一节引言第二节一元线性回归模型第三节多元线性回归模型第四节虚拟变量回归模型第五节非线性回归模型本章小节主要内容\n回归是研究自变量与因变量之间的关系形式的分析方法。一、回归分析的提出回归分析起源于生物学研究,是由英国生物学家兼统计学家高尔登(FrancisGalton1822-1911)在19世纪末叶研究遗传学特性时首先提出来的。高尔登在1889年发表的著作《自然的遗传》中,提出了回归分析方法以后,很快就应用到经济领域中来,而且这一名词也一直为生物学和统计学所沿用。回归的现代涵义与过去大不相同。一般说来,回归是研究因变量随自变量变化的关系形式的分析方法。其目的在于根据已知自变量来估计和预测因变量的总平均值。第一节引言\n二、回归分析和相关分析函数关系函数关系反映客观事物之间存在着严格的依存关系。在这种关系中,当一个或几个变量取值一定时,另一个变量有确定的值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。一般把作为影响因素的变量称为自变量,把发生对应变化的变量称为因变量。第一节引言\n相关关系相关关系反映的是客观事物之间的非严格、不确定的线性依存关系。这种线性依存关系有两个显著的特点:①客观事物之间在数量上确实存在一定的内在联系。表现在一个变量发生数量上的变化,要影响另一个变量也相应地发生数量上的变化。②客观事物之间的数量依存关系不是确定的,具有一定的随机性。表现在当一个或几个相互联系的变量取一定数值时,与之对应的另一个变量可以取若干个不同的数值。这种关系虽然不确定,但因变量总是遵循一定规律围绕这些数值的平均数上下波动。二、回归分析和相关分析\n图国内生产总值y与固定资产投资完成额x间关系的散点图\n二、回归分析和相关分析回归分析与相关分析的关系相关分析相关分析是研究两个或两个以上随机变量之间线性依存关系的紧密程度。通常用相关系数表示,多元相关时用复相关系数表示。回归分析回归分析是研究某一随机变量(因变量)与另外一个或几个普通变量(自变量)之间的数量变动的关系。由回归分析求出的关系式,称为回归模型。\n联系由相关系数的大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,以便进行推算、预测,同时相关系数还是检验回归分析效果的标准。区别相关分析研究的变量都是随机变量,并且不分自变量与因变量;回归分析研究的变量要首先明确那些是自变量,那些是因变量?并且自变量是确定的普通变量,因变量是随机变量。二、回归分析和相关分析\n根据自变量的多少回归模型可以分为一元回归模型和多元回归模型。根据回归模型的形式线性与否回归模型可以分为一元回归模型和多元回归模型。根据回归模型是否带有虚拟变量回归模型可以分为普通回归模型和带虚拟变量的回归模型。此外,根据回归模型是否用滞后的因变量作自变量,回归模型又可分为无自回归现象的回归模型和自回归模型。三、回归模型的种类\n第二节一元线性回归模型设x为自变量,y为因变量,y与x之间存在某种线性关系,即一元线性回归模型为(6.2.1)给定x,y的n对观测值xi,yi,,代入式(6.2.1)得(6.2.1’)当b>0时,x与y为正相关,当b<0时,x与y为负相关。、一元线性回归模型\n二、OLS(OrdinaryLeastSquare)估计OLS的中心思想最小二乘法的中心思想,是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列两点要求:(1)原数列的观测值与模型估计值的离差平方和为最小;(2)原数列的观测值与模型估计值的离差总和为0。第二节一元线性回归模型\n二、OLS(OrdinaryLeastSquare)估计\n二、OLS(OrdinaryLeastSquare)估计\n二、OLS(OrdinaryLeastSquare)估计\nOLS的特性最小二乘估计量具有线性、无偏性和最小方差性等良好的性质。线性、无偏性和最小方差性统称BLUE性质。满足BLUE性质的估计量称为BLUE估计量。二、OLS(OrdinaryLeastSquare)估计\n回归方程的检验在一元线性回归模型中最常用的显著性检验方法有:相关系数检验法F检验法t检验法3.2一元线性回归预测法\n三、离差平方和的分解与可决系数在一元线性回归模型中,观测值的数值会发生波动,这种波动称为变差。变差产生的原因如下:①受自变量变动的影响,即x取值不同时的影响;②受其他因素(包括观测和实验中产生的误差)的影响。为了分析这两方面的影响,需要对总变差进行分解。3.2一元线性回归预测法\n三、相关系数离差平方和的分解\n三、相关系数可决系数\n三、相关系数相关系数的取值范围为当R=0时,说明回归变差为0,自变量x的变动对总变差毫无影响,这种情况称y与x不相关。当|R|=1时,说明回归变差等于总变差,总变差的变化完全由自变量x的变化所引起,这种情况成为完全相关。这时因变量y是自变量x的线性函数,二者之间呈函数关系。当0<|R|<1时,说明自变量x的变动对总变差有部分影响,这种情况成为普通相关。\n三、相关系数\n四、显著性检验相关系数检验法第一步,计算相关系数R;第二步,根据回归模型的自由度(n-2)和给定的显著性水平值α,从相关系数临界值表中查出临界值;第三步,判别。若|R|≥Rα(n-2),表明两变量之间线性相关关系显著,检验通过,这时回归模型可以用来预测;若|R|
30,式(6.2.31)可简化为(6.2.31)\n六、应用举例例6.2.1某省1978-1989年国内生产总值和固定资产投资完成额资料如表6.2.1所示。\n六、应用举例试配合适当的回归模型并进行显著性检验;若1999年该省固定资产投资完成额为249亿元,当显著性水平=0.05时,试估计1990年国内生产总值的预测区间。解:1.绘制散点图\n六、应用举例2.设一元线性回归模型为3.计算回归系数\n六、应用举例4.检验线性关系的显著性\n六、应用举例\n六、应用举例5.预测(2)当显著性水平,自由度=n-m=12-2=10时,查t分布表得(1)计算估计值的标准误差\n六、应用举例\n六、应用举例(excel计算)在excel的工作表中输入如表6.2.1所示的样本数据;点击“工具”-“数据分析”-“回归”,在出现的数据分析对话框中选择,如图6.2.2所示。图6.2.2a)应用excel软件求回归分析相关参数\n点击图6.2.2a)所示对话框中的确定,弹出“回归”对话框,在Y值输入区域,拖动鼠标选择Y样本值B2:B13,在X值输入区域,拖动鼠标选择X样本值A2:A13,如图6.2.2b)所示。六、应用举例(excel计算)图6.2.2b)应用excel软件求回归分析相关参数\n点击图6.2.2b)所示中的确定,弹出回归分析有关参数的窗口,如图6.2.2c)所示。六、应用举例(excel计算)图6.2.2c)应用excel软件求回归分析相关参数\n七、几个应当注意的问题1.重视数据的收集和甄别在收集数据的过程中可能会遇到以下困难:(1)一些变量无法直接观测。(2)数据缺失或出现异常数据。(3)数据量不够。(4)数据不准确、不一致、有矛盾。2.合理确定数据的单位在建立回归方程时,如果不同变量的单位选取不适当,导致模型中各变量的数量级差异悬殊,往往会给建模和模型解释带来诸多不便。比如模型中有的变量用小数位表示,有的变量用百位或千位数表示,可能会因舍入误差使模型计算的准确性受到影响。因此,适当选取变量的单位,使模型中各变量的数量级大体一致是一种明智的做法。\n一元线性回归模型研究的是某一因变量与一个自变量之间的关系问题。但是,客观现象之间的联系是复杂的,许多现象的变动都涉及到多个变量之间的数量关系。研究某一因变量与多个自变量之间的相互关系的理论和方法就是多元线性回归模型。第三节多元线性回归预测法\n第三节多元线性回归预测法\n一、多元线性回归模型及其假设条件多元线性回归模型\n一、多元线性回归模型及其假设条件\n一、多元线性回归模型及其假设条件\n一、多元线性回归模型及其假设条件\n一、多元线性回归模型及其假设条件\n二、模型参数OSL的估计与性质模型参数的OSL估计\n二、模型参数OSL的估计与性质回归系数向量估计值的统计性质\n回归系数向量估计值的统计性质\n三、多元线性回归模型的检验常用的检验方法有R检验法F检验法t检验法DW检验法在建立多元线性回归模型的过程中,为进一步分析回归模型所反映的变量之间的关系是否符合客观实际,引入的影响因素是否有效,同样需要对回归模型进行检验。\n1.R检验法\n与相关系数检验法一样,复相关系数检验法的步骤为:(1)计算复相关系数;(2)查相关系数临界值表;根据回归模型的自由度n-m和给定的显著性水平α值,查相关系数临界值表(3)判别。1.R检验法\n1.R检验法\n1.R检验法\n2.F检验法\n2.F检验法\n3.T检验法\n3.T检验法\n4.DW检验法\n4.DW检验法在序列相关中,最常见的是一阶自相关,最常用的检验方法是DW检验法(Durbin-Watson准则)。定义DW统计量为:\n4.DW检验法\n4.DW检验法\n表DW检验判别表4.DW检验法\n4.DW检验法将上面DW检验判别表绘成图形如下图:\n4.DW检验法\n5.预测区间\n5.预测区间\n四、应用举例某省1978~1989年消费基金、国民收入使用额和平均人口资料如表6.3.3所示。试配合适当的回归模型并进行各种检验;若1990年该省国民收入使用额为67十亿元,平均人口为58百万人,当显著性水平=0.05时,试估计1990年消费基金的预测区间。\n四、应用举例\n四、应用举例\n四、应用举例\n四、应用举例\n四、应用举例\n四、应用举例\n四、应用举例\n四、应用举例(excel计算)图6.3.1a)应用excel“数据分析”功能求多元线性回归的有关参数\n点击图6.3.1a)所示中的确定,弹出多元回归分析有关参数的窗口,如图6.3.1b)所示。四、应用举例(excel计算)图6.3.1b)应用excel“数据分析”功能求多元线性回归的有关参数\n四、应用举例7.DW检验\n四、应用举例\n四、应用举例\n第四节虚拟变量回归预测1.虚拟变量品质变量不像数量变量那样表现为具体的数值。它只能以品质、属性、种类等形式来表现。要在回归模型中引入此类品质变量,必须首先将具有属性性质的品质变量数量化。通常的做法是令某种属性出现对应于1,不出现对应于0。这种以出现为1,未出现为0形式表现的品质变量,就称为虚拟变量。2.带虚拟变量的回归模型常见的带虚拟变量的回归模型有以下三种形式:\n2.带虚拟变量的回归模型第四节虚拟变量回归预测\n其中的趋势变化如右图所示第四节虚拟变量回归预测\n第四节虚拟变量回归预测\n第四节虚拟变量回归预测\n虚拟变量的回归模型应用举例例某省农业生产资料购买力和农民货币收入统计数据,根据上述统计数据,试建立一元线性回归模型和带虚拟变量的回归模型,并将两模型对比分析\n虚拟变量回归模型的应用举例\n虚拟变量回归模型的应用举例\n非线性回归模型按变量个数也可以分为一元非线性回归模型和多元非线性回归模型;曲线的形式也因实际情况不同而有多种形式,如指数曲线、双曲线、S形曲线等。第五节 非线性回归模型\n非线性回归模型的形式第五节 非线性回归模型\n第五节 非线性回归模型\n根据非线性回归模型线性化的不同性质,上述模型一般可以分成三种类型:第一类:直接换元型这类非线性回归模型通过简单的变量换元可直接化为线性回归模型,如式(1)、式(2)、式(3)、式(4)。第二类:间接代换型这类非线性回归模型经常通过对数变形代换间接地化为线性回归模型,如:式(5)、式(6)、式(7)。第三类:非线性型这类非线性回归模型属于不可线性化的非线性回归模型,如式(8)和式(9)。第五节 非线性回归模型非线性回归模型的分类\n直接换元法\n对于式(5)、式(6)和式(7)所示的非线性回归模型,因变量与待估计参数之间的关系也是非线性的。因此不能通过直接换元化为线性模型。对此类模型,通常可通过对回归方程两边取对数将其化为可以直接换元的形式。这种先取对数再进行变量代换的方法称为间接换元法。间接换元法\n间接换元法\n例6.5.1例6.5.2 直接换元法计算表\n例6.5.1\n例6.5.1\n例6.5.1\n例6.5.1由于商品零售额增加,流通费用率呈下降趋势,二者之间为负相关关系,故相关系数取负值为:-0.9898。说明两者高度相关,用双曲线回归模型配合进行预测是可靠的。\n例6.5.1\n本章小节回归分析和相关分析的目的不同在回归分析中,寻找的是变量之间的关系,代表这种关系的方程可能就是所期望的结果,也可能是所期望预测的均值。在相关分析中,需要度量的是两个或两个以上随机变量之间线性关系的强度。当二维数据显示在散点图上落在一条直线附近时,它们支持一个线性关系,但是这并不能证明这是必然的和有因果关系的。\n本章小节线性回归模型的一般形式为\n本章小节\n对于非线性回归模型,一般可以分成三种类型:直接换元型即通过简单的变量换元可直接化为线性回归模型;间接代换型通常通过对数变换的代换间接地化为线性回归模型;非线性型指不能线性化的非线性回归模型。对于可线性化的非线性回归模型可以转化为线性模型后进行求解,并应用可决系数R2或相关系数R度量非线性相关程度。本章小节\n第七章时间序列分析第一节时间序列的种类和编制第二节时间序列的基本分析指标第三节时间序列变动趋势分析主要内容\n第七章时间序列分析第一节时间序列的种类和编制一、时间序列及其作用时间序列时间序列是指某一统计指标数值按时间先后顺序排列而形成的数列。例如:国内生产总值(GDP)按年度顺序排列起来的数列;某种商品销售量按季度或月度排列起来的数列等等都是时间序列。时间序列一般用y1,y2,…,yt,…表示,t为时间。\n时间序列的作用在社会经济统计中,编制和分析时间序列具有重要的作用:它为分析研究社会经济现象的发展速度、发展趋势及变化规律,提供基本统计数据。通过计算分析指标,研究社会经济现象的变化方向、速度及结果。将不同的时间序列同时进行分析研究,可以揭示现象之间的联系程度及动态演变关系。建立数学模型,揭示现象的变化规律并对未来进行预测。第一节时间序列的种类和编制\n第一节时间序列的种类和编制二、时间序列的种类时间序列按其所排列指标的表现形式不同,可分为绝对指标时间序列、相对指标时间序列和平均指标时间序列。(一)绝对指标的时间序列按时间顺序将一系列绝对指标排列起来所形成的序列称为绝对指标时间序列。用来反映被研究现象在各个时期(时点)达到的绝对水平及其发展变化情况。绝对指标时间序列按其所反映资料的性质不同,又可分为时点序列和时期序列。\n二、时间序列的种类时期序列当绝对指标时间序列中每一指标数值反映的是某种现象在一段时期内发展过程的结果或总量时,这种序列称为时期序列。其主要特点是:时期序列的各指标具有可加性;时期序列中各指标数值大小与其所属时期长短有直接联系;时期序列中的各指标是连续登记取得的。\n二、时间序列的种类时点序列当绝对指标时间序列中每一指标数值反映的是某种现象在某一时点达到的水平时,这种序列称为时点序列。如人口数、土地面积、商品库存在某一时点的数值组成的序列等皆为时点序列。其主要特点是:时点序列的各个指标不具有可加性;时点序列中各指标数值大小与时间间隔长短没有直接联系;时点序列中各指标是采用间隔登记方式取得的。\n二、时间序列的种类(二)相对指标时间序列相对指标时间序列是按时间顺序,把不同时期的相对指标排列起来所形成的序列。它反映社会现象之间相互关系的发展过程。在相对指标时间序列中,由于各个指标数值的基数不同,因此不具有可加性。(三)平均指标时间序列平均指标时间序列是按时间顺序,把各个时期的平均指标排列起来所形成的序列。它反映社会经济现象一般水平的发展过程和发展趋势。平均指标时间序列中各个指标数值也不具有可加性。\n编制时间序列的目的就是要通过对序列中的各个指标值进行分析,来研究社会经济现象的发展变化及其规律。因此保证时间序列中各个不同时间上的统计指标具有可比性,是编制时间序列的基本原则。可比性原则具体体现在以下几个方面:时间序列中各指标所属时间长短应前后一致;时间序列中各指标所反映现象的总体范围应一致;时间序列中各指标的经济内容应一致;时间序列中各指标的计算方法应相同;时间序列中各指标的计算价格和计量单位要一致三、时间序列的编制原则\n第二节时间序列的基本分析指标一、时间序列的水平分析指标(一)发展水平发展水平即时间序列中每一具体指标数值,反映的是经济现象在各个时期内实际达到的规模或水平。发展水平可以是绝对数、相对数或平均数。通常时间序列用表示。我们把称为最初水平,称为最末水平,处于二者之间的各时期的指标值称为中间水平。\n一、时间序列的水平分析指标(二)平均发展水平平均发展水平又称为时序平均数或动态平均数,是将时间序列中不同时期的发展水平加以平均,从动态上说明现象在某一时期内发展的一般水平。1.绝对数时间序列时序平均数的计算绝对数时间序列又分为时期序列和时点序列,二者计算时序平均数的方法有所不同。\n一、时间序列的水平分析指标时期序列时序平均数的计算时点序列时序平均数的计算①连续时点序列时序平均数的计算第一种情况:对逐日登记排列的时点序列资料(连续时点序列),可视为时期序列,其时序平均数的计算采用简单算术平均法。即\n一、时间序列的水平分析指标第二种情况:当资料不是逐日登记,而只在数值发生变动时才登记的时点序列资料(连续时点序列)时,其时序平均数的计算以变量值的持续时间为权数进行加权平均,即\n一、时间序列的水平分析指标例7.2.1某企业人事部门对职工人数的记录如表7.2.1所示,计算该月分日平均职工人数。表7.2.1某企业8月份职工人数资料\n一、时间序列的水平分析指标②间断时点序列时序平均数的计算例7.2.2某企业人事部门对上半年职工人数的记录如表7.2.2所示,计算该企业上半年的月平均职工人数。\n一、时间序列的水平分析指标当间断登记时点序列资料,且间隔不等,其时序平均数的计算是以间隔为权数,对各间隔的平均水平进行加权平均。\n一、时间序列的水平分析指标例7.2.3某企业某年库存钢材如表7.2.3所示,求该企业年平均钢材库存量。\n一、时间序列的水平分析指标2.相对数或平均数时间序列时序平均数的计算计算公式表示为\n一、时间序列的水平分析指标例7.2.4某企业2005年各季度产值计划完成情况如表7.2.4所示,计算该企业2005年产值平均计划完成程度。\n一、时间序列的水平分析指标(三)增长量增长量是时间序列中两个不同时期发展水平之差,又称为增长水平。表明现象在一定时期内增长的绝对数量。增长量=报告期水平-基期水平增长量由于基期水平选择不同,可分为累积增长量和逐期增长量。逐期增长量是报告期水平与前一期水平之差,用公式表示为累积增长量是报告期水平与某一固定期水平之差,用公式表示为\n一、时间序列的水平分析指标(四)平均增长量平均增长量是时间序列中各逐期增长量的时序平均数,也称为平均增长水平,表明现象在一定时期内平均每期增长的绝对数量,也属于时序(动态)平均数范畴,可以用简单算术平均法计算。\n一、时间序列的水平分析指标例7.2.5我国1991~1997年普通高校各年的在校学生人数如表7.2.5所示,计算逐年增长量、累计增长量和年平均增长量。\n二、时间序列的速度分析指标反映现象发展变化的速度指标主要有发展速度、增长速度、平均发展速度和平均增长速度四种,它们之间具有密切的关系,其中发展速度是最基本的速度指标。1.发展速度环比发展速度和定基发展速度的关系\n2.增长速度增长速度是增长量与基期水平之比,用公式可以表示为二、时间序列的速度分析指标增长速度按基期水平选择的不同分为定基增长速度和环比增长速度。环比增长速度(环比增长率)是逐期增长量与其基期水平之比\n二、时间序列的速度分析指标定基增长速度(定基增长率)是累积增长量与其基期水平之比增长1%的绝对值它是逐期增长量除以环比增长速度,也可以表示为增长1%的绝对值=基期水平(或前一期水平)×1%\n二、时间序列的速度分析指标例7.2.6我国1991~1997年能源生产量如表7.2.6所示,根据这些资料计算发展速度、增长速度及增长1%的绝对值。\n二、时间序列的速度分析指标3.平均发展速度与平均增长速度平均发展速度与平均增长速度通称为平均速度。平均增长速度=平均发展速度-1几何平均法(水平法)\n二、时间序列的速度分析指标方程法(总和法)若关心末期发展水平时,宜采用几何平均法计算平均发展速度,例如产量、产值、人口数等流量指标;若关心各期累计水平时,宜采用方程法计算平均发展速度,例如基本建设投资、植树造林面积等存量指标。\n一、时间序列的影响因素及分析模型(一)时间序列的影响因素时间序列分析是一种动态的数列分析,其目的在于掌握统计数据随时间变化的规律。时间序列中每一时期的数值都是由许多不同的因素同时发生作用后的综合结果。在进行时间序列分析时,人们通常将各种可能发生影响的因素按其性质不同分成四大类:长期趋势、季节变动、循环变动和不规则变动。第三节时间序列变动趋势分析\n1.长期趋势长期趋势是指由于某种根本性因素的影响,时间序列在较长时间内朝着一定的方向持续上升或下降,以及停留在某一水平上的倾向。它反映了事物的主要变化趋势。2.季节变动季节变动是指由于受自然条件和社会条件的影响,时间序列在一年内随着季节的转变而引起的周期性变动。经济现象的季节变动是季节性的固有规律作用于经济活动的结果。(一)时间序列的影响因素\n3.循环变动循环变动一般是指周期不固定的波动变化,有时是以数年为周期变动,有时是以几个月为周期变化,并且每次周期一般不完全相同。循环变动与长期趋势不同,它不是朝单一方向持续发展,而是涨落相间的波浪式起伏变动。与季节变动也不同,它的波动时间较长,变动周期长短不一。4.不规则变动不规则变动是指由各种偶然性因素引起的无周期变动。不规则变动又可分为突然变动和随机变动。所谓突然变动,是指诸如战争、自然灾害、地震、意外事故、方针、政策的改变所引起的变动;随机变动是指由于大量的随机因素所产生的影响。不规则变动的变动规律不易掌握,很难预测。(一)时间序列的影响因素\n时间序列由长期趋势、季节变动、循环变动和不规则变动四类因素组成。四类因素的组合形式,常见的有以下几种类型:1.加法型yt=Tt+St+Ct+It2.乘法型yt=Tt·St·Ct·It3.混合型yt=Tt·St+Ct+Ityt=St+Tt·Ct·It其中:yt为时间序列的全变动;Tt为长期趋势;St为季节变动;Ct为循环变动;It为不规则变动。二、长期趋势分析\n二、长期趋势分析(一)移动平均法移动平均法也称为时间序列修匀。移动平均法是根据时间序列资料逐项推移,依次计算包含一定项数的时序平均数,以反映长期趋势的方法。当时间序列的数值由于受周期变动和不规则变动的影响,起伏较大,不易显示出发展趋势时,可用移动平均法,消除这些因素的影响,分析、预测序列的长期趋势。移动平均项数为偶数时,需要进行两次移动平均。第2次移动平均的项数为2项。二项移正动平均数就是时间序列某些时期的长期趋势值。\n二、长期趋势分析\n二、长期趋势分析例7.3.1用移动平均法测定我国茶叶产量的长期趋势,数据如表7.3.2所示。\n二、长期趋势分析(二)趋势方程趋势方程法也称为数学模型法或时间序列的回归分析法。根据长期趋势是直线还是曲线(二次抛物线、指数曲线等),建立的长期趋势方程分别为:直线:二次抛物线:指数曲线:\n二、长期趋势分析1.直线趋势\n二、长期趋势分析例7.3.2用最小二乘法测定我国茶叶产量的长期趋势,数据如表7.3.3所示。\n二、长期趋势分析\n二、长期趋势分析\n二、长期趋势分析2.曲线趋势\n三、季节因素(theseasonalfactors)分析1.简单平均法简单平均法也称为同期平均法,就是根据多年的月(季)资料,算出该月(季)平均数,然后将各月(季)平均数与总月(季)平均数对比,从而得到季节比率,用它来说明季节变动情况。\n三、季节因素(theseasonalfactors)分析简单平均法计算简单,但没有考虑长期趋势的影响,当时间数量存在明显上升趋势时,年末季节比率就会偏高;当时间数量存在明显下降趋势时,年末季节比率就会偏低。只有当时间序列没有明显的长期趋势时,这种方法才比较适宜。\n三、季节因素(theseasonalfactors)分析例7.3.3某商场某种商品的销售量资料如表7.3.4所示,用简单平均法求它的季节趋势变动。解:首先计算四年同季平均数。如第一季度四年的平均销售量为\n三、季节因素(theseasonalfactors)分析2.趋势剔除法趋势剔除法适用于存在明显的长期趋势的时间序列。它的思路是:先测定时间序列的长期趋势,将趋势值从时间序列中剔除,然后再测定季节变动。加法模型中季节因子的确定由于季节因子是作为一年(季)中指标上下浮动的平均效果,因此它们的和应该为零。如果它们的和不等于零,就需要对季节因子进行修正。\n三、季节因素(theseasonalfactors)分析乘法模型中季节因子的确定y=T×S×RS=y/T其中,T可以由前面得出,设R=1,则由于季节因子是由算术平均求得的,因此它们的百分比数的和应该为400(按季度),如果它们的和不等于400,就需要对季节因子作修正,因而对于乘法模型的因子修正为\n四、时间序列的季节调整根据长期数据计算出季节因子,然后从数据中剔除季节影响,以显示在没有季节变化条件下将来的趋势会如何变动。这称为时间序列的季节调整。模型好坏取决于:(1)季节因子S的精确识别——基本假定是由历史数据能识别出季节因子;(2)在上式的右边还有循环因子和随机因子,基本假定是对它们的取值规律有较多的了解;\n四、时间序列的季节调整例7.3.4 对例7.3.3中的某商场某种商品销售量资料利用乘法模型确定季节变动趋势因子。解:计算结果如表7.3.5和表7.3.6所示。(1)四项移动平均法测长期趋势。由移动平均数形成的序列的主要成分为TC,就是说通过移动平均基本上消除了SR。(2)剔除长期趋势。方法是用原时间序列Y去除测定出的长期趋势值TC,即Y/(TC)=SR,它包含了不规则变动影响的季节比率的估计值。\n例7.3.4\n例7.3.4(3)消除不规则变动的影响,求季节比率。将剔除了长期趋势的四季各资料重新排列,用简单平均法计算季节比率。如1998年至2000年第一季度的季节比率分别为80.65%,88.89%,84.71%,三者的差异主要是不规则变动引起的,经过简单算术平均得84.75%,将其与总季节平均数对比,得季节比率S。(4)季节比率之和应等于400%或1200%,若不等,需要对季节比率进行修正。计算结果如表7.3.6所示。\n例7.3.4最后根据消除了季节变动的时间序列测定长期趋势值,然后利用季节比率调整原时间序列各期的预测值,计算结果如表7.3.7所示。\n例7.3.4\n例7.3.4\n例7.3.42001年各季销售量预测值,如表7.3.8所示。\n五、循环因子分析循环因子分析的意义在于探索现象变化的规律性。分析现象之间循环因子的内在联系,为微观和宏观决策提供数据支持。在社会生活中已知的一些循环有Kuznet长波各国的国民生产总值和人口迁移大体有20年的循环。商业循环在贸易等流通领域,通常有1—12年的循环。剩余法首先假定影响时间序列变动的各因素是乘积关系,即以乘法模型为基础,Y=T·S·C·R;然后从时间序列中剔除长期趋势和季节变动,即Y/T·S=C·R;最后在此基础上,通过移动平均剔除不规则变动R,剩余的即为循环因子值C。\n六、随机因素和残差加法模型中随机因子的计算在不计循环因子的前提下,加法模型中随机因子(也称为残差)可由下式算出:其中,为修正后的加法模型季节因子。乘法模型中随机因子的计算残差为其中为修正后的乘法模型季节因子。,\n七、预测(predictions)在时间序列分析中,何时用加法模型?何时用乘法模型?常用的方法是看残差平方和或残差平方和的平均值,在加法模型中残差即为随机因子,在乘法模型中残差等于y-TS。残差平方和或残差平方和的平均值小的那种模型较好。在识别出趋势和季节因子后,就可以进行预测。预测的准确性由趋势、季节因子和误差所决定。\n第八章统计指数第一节统计指数的概念第二节综合指数的编制方法第三节指数体系及其因素分析第四节几种常用的经济指数本章小节主要内容\n第一节统计指数的概念英国百科全书对指数的定义:“指数是用来测定一个变量对一个特定变量值大小的相对数”。具体而言,根据不同的分析角度,指数的概念有广义和狭义之分。广义的指数是指由两个数值对比而得到的相对数。狭义的指数是指用于测定总体各变量在不同场合下综合变动的一种相对数。指数可以分为个体指数和综合指数。\n一、个体指数个体指数是度量某一社会经济现象总体中的个体数量变动的相对数。一般地,将作为基准而比较的那个时期称为基期,而与基期相比较的其它时期称为报告期。个体指数=\n二、综合指数综合指数是综合反映某一社会经济现象总体所含全部个体的数量变动的相对数。综合指数根据其所表现的经济指标的性质和特点,可以分为质量指标指数和数量指标指数。质量指标指数是反映生产经营活动质量、性质变动的综合指数,如商品价格指数、产品单位成本指数、劳动生产率指数等;数量指标指数是反映经济活动的数量、规模变动的综合指数,如产品产量指数、商品销售量指数等。\n第二节综合指数的编制方法一、质量指标指数的编制(一)拉氏指数取基期的销售量作为同度量因素,得到综合物价指数的计算公式\n这个公式由德国学者拉斯贝尔(E.Laspeyres)在1864年提出。由此式计算的指数称为拉氏指数,简记为L,此式也称为拉氏公式。拉氏公式的特点是将同度量因素固定在基期水平上。例1对于教材中表8.2.1的资料,利用拉氏公式计算3种商品的综合物价指数。解:利用表8.2.1的数据,由(8.2.1)式,得到计算结果表明3种商品报告期的价格与基期相比总体上上涨了17.53%。\n(二)帕氏指数取报告期的销售量作为同度量因素,得到综合物价指数的计算公式这个公式由德国学者帕舍(H.Pasche)在1874年提出。由此式计算的指数称为帕氏指数,简记为P,此式也称为帕氏公式。帕氏公式的特点是将同度量因素固定在报告期水平上。\n例2对于表8.2.1的资料,利用帕氏公式计算3种商品的综合物价指数。解:利用表8.2.1的数据,由(8.2.2)式,得到即这3种商品报告期的价格与基期相比总体上上涨了18.97%。\n二、数量指标指数的编制方法(一)拉氏指数取基期的销售价格作为同度量因素,得到综合物量指数的计算公式此式也称为拉氏公式。\n例3对于表8.2.1的资料,计算3种商品的综合物量指数。解:由表8.2.1及(8.2.3)式,得这表明,报告期3种商品的销售量与基期相比总体上上升了23.19%。\n(二)帕氏指数取报告期的销售价格作为同度量因素,得到综合物量指数的计算公式此式也称为帕氏公式。\n例4对于表8.2.1的资料及帕氏公式,计算3种商品的综合物量指数。解:利用表8.2.1的数据及(8.2.4)式,得这表明,报告期3种商品的销售量与基期相比总体上上升了24.69%。\n三、平均指数平均指数编制的基本原理:先计算出个别现象的个体指数,然后将个体指数平均而得到综合指数。由于总体中的不同个体其重要程度不一,因此,在平均指数的编制中需要对个体指数进行加权。平均指数一般有算术平均指数和调和平均指数。\n(一)加权算术平均指数一般以基期总值加权的算术平均指数最为常用,计算公式为:这里,\n例5对于表8.2.1的资料,计算3种商品的加权算术平均物价指数和销售量指数。解:由(8.2.5)和(8.2.6)式,分别得\n(二)加权调和平均一般以报告期的总值加权的调和平均指数最为常用,计算公式为\n例6对于表8.2.1的资料,计算3种商品的加权调和平均物价指数和销售量指数。解:由(8.2.7)和(8.2.8)式,分别得\n第三节指数体系及其因素分析一、指数体系的概念及其作用指数之间的联系是社会经济现象联系的反映,可以表现为指标之间的数量关系。指数体系广义上是指若干个有相互联系的统计指数所形成的体系;狭义上是指若干个有联系的指数之间存在的某一数量关系。一般来说,一个总值指数等于若干个(两个或以上)因素指数的乘积。常见的有\n总产值指数=产品产量指数×产品价格指数商品销售额指数=商品销售量指数×商品销售价格指数总成本指数=产品产量指数×产品单位成本指数\n二、总量变动的因素分析利用指数体系分析的一般模型为(以两因素分析为例)\n第四节几种常用的经济指数一、工业产量指数二、居民消费价格指数和商品零售价格指数三、农副产品收购价格指数四、产品成本指数五、股票价格指数\n本章小结指数是一种重要的统计方法,主要用以综合反映复杂现象总体的变动状况。指数有广义和狭义之分,一般我们研究狭义的指数。综合指数的编制中要注意同度量因素的选择。指数分析方法是利用指数体系分析各因素对现象变动影响的一种统计分析方法。\n第九章统计决策第一节统计决策概述第二节不确定型决策第三节风险型决策第四节贝叶斯决策第五节效用决策主要内容\n第一节统计决策概述一、统计决策的涵义统计学家瓦尔德(A.Wald)把关于假设检验和参数估计的经典统计理论加以概括,将不确定意义下的决策科学也包括在统计学范围之内,于1939年创立了统计决策理论,该理论弥补了过去统计理论的缺陷。统计决策的显著特点是:统计决策建立在统计分折和统计预测的基础上,是一种定量决策。统计决策是在不确定情况下,应用概率来进行决策的计算和分析,是一种概率决策。\n二、统计决策的基本要素完整的统计决策问题,通常包含三个基本要素:决策目标、自然状态、备选方案。决策目标决策目标是决策者要达到的目标,是统计决策的出发点和归宿。自然状态自然状态是指不依赖决策者主观意志而转移的客观条件或外部环境,也是影响决策的因素。备选方案在决策过程中,可供选择的行动方案总是有两种或两种以上。\n三、统计决策的分类(一)按照决策目标数量分类单目标决策单目标决策是指围绕单一目标而进行的决策。如是否经销彩电的决策,就只需要考虑是否获利和获利是否达到一定的目标来进行。多目标决策多目标决策是指需要同时考虑两个或两个以上目标的决策。如某企业要在几种产品中选择一种产品生产,就既要考虑获利大小,又要考虑现有设备能否生产以及原材料供应是否充足等因素来选择其中一种。\n三、统计决策的分类(二)根据自然状态类型分类根据决策的自然状态是否完全确定,统计决策可划分为确定型决策、风险型决策和不确定型决策三种类型。确定型决策确定型决策是指决策的自然状态完全确定,即在未来情况已知的条件下,按照既定目标和决策准则选定方案的决策。风险型决策某事件中存在着两个以上的不以决策者主观意志为转移的自然状态,在几种不同的自然状态中未来会出现哪一种状态,决策者不能肯定,但各种状态出现的可能性即概率,可由决策者预先估计或计算出来。不确定型决策不确定型决策是指决策者在对未来情况未知,对各种自然状态及其概率也一无所知的情况下所进行的决策。\n四、统计决策的过程明确目标统计决策过程一般包括以下基本步骤:拟定行动方案探讨并列出未来可能的状态统计决策中的可能状态是指那些对实施行动方案有影响而决策者又无法控制和改变的因素所处的状况。估计各可能状态出现的概率在实际工作中,决策者通常通过计算历史资料或类似资料的频率直接估算可能状态的概率。估算各个行动方案在不同可能状况下的损益值。运用统计知识进行定量的决策分析,应用给定的决策标准作出决策。\n第二节不确定型决策一、极端准则决策乐观准则决策在决策时,决策者对客观情况持有一种乐观态度的准则,也称之为最大收益准则。它假定决策对象未来的情形是最理想的状态占优势,其决策步骤为:先选出在未来各种自然状态下每种方案的最大收益;再从这些最大收益值中选出最大者;与这个最后选中的最大值相对应的方案就是决策者选定的方案。\n一、极端准则决策悲观准则决策悲观准则是决策者在决策时对未来状况持悲观态度时的决策准则,这种决策的主要特点是对现实方案的选择持保守原则。其决策步骤是:首先在各种自然状态下选出每种方案的最小收益值;然后再从这些最小收益值中选出最大者;与这个最后选出的最大收益值相对应的方案就是决策者选定的方案。\n第二节不确定型决策例9.2.1某公司拟对是否研究开发—种新产品进行决策。根据新产品价格可能发生的波动情况把自然状态划分为四类:P1:低于现价,P2:与现价相同,P3:高于现价,P4:价格大涨。该公司可能采取的行动方案有三种:A1:以抓新产品研究开发为主,并维持现有产品生产,A2:一方面抓新产品研究开发,另一方面扩大现有产品产量和提高质量,保证占有市场一定份额,A3:不搞新产品研究开发,全力扩大现有产品产量和提高产品质量,扩大市场占有份额。不同方案在不同价格状态下所产生的收益或损失也称益损值(万元),如表9.2.1所示,那么采取哪种方案后收益最大。\n第二节不确定型决策(例9.2.1)根据乐观准则进行决策,该公司应一面抓新产品研究开发,一面扩大现有产品产量和提高质量,保证占有一定市场份额。\n第二节不确定型决策(例9.2.1)2.按悲观准则决策(1)先选出各种自然状态下每个方案的最小收益值(2)选出最小值中最大值根据悲观准则进行决策,该公司应全力扩大和提高现有产品产量和提高产品质量,不搞新产品研究开发。\n二、折中准则决策折中决策法步骤为:首先确定乐观系数;接下来选出每一方案的最大收益值和最小收益值;然后按求出折中收益值;最后选出折中收益值中的最大值;这个最大值所对应的方案即为最优方案。\n二、折中准则决策(例9.2.2)例9.2.2在例9.2.1中,若取=0.6,采用折中的办法,该公司决策者应采取何种方案?根据折中准则法,选出每一方案的最大值与最小值。因此该公司应选择行动方案。。\n三、等可能性准则决策等可能性准则决策是指决策者在决策时对客观情况持同等态度的一种准则。这个方法是19世纪数学家拉普拉斯提出来的,故亦称拉普拉斯决策法。计算公式为比较各种方案的平均收益值,选择与最大收益值对应的方案为决策方案。\n三、等可能性准则决策(例9.2.3)例9.2.3用表9.2.1中的资料,按等可能性准则,求该公司应选择哪种方案。\n四、后悔准则决策后悔准则是指通过计算各种方案的后悔值来选择决策方案的一种决策准则。后悔准则的决策步骤为:决策者先将每种自然状态下最高收益值定为该状态的理想目标值;再将该状态下的其它收益值与之比较,计算其差值作为达到理想目标的后悔值;从各种自然状态下的各种方案的后悔值中找出最大后悔值,再从中选出最小者;与这个最小者相对应的方案就是所选择的决策方案。\n四、后悔准则决策(例9.2.4)例9.2.4利用表9.2.1中的资料,依据后悔准则,该公司应如何决策。\n四、后悔准则决策(例9.2.4)从以上所举的例子可以看出,在不确定型决策中,对于同一个决策问题,由于采用的决策准则不同,获得的决策方案往往会不一样,因此选择一个合适的准则是非常重要的。\n第三节风险型决策风险型决策是指在进行决策时未来各种状态的发生具有不确定性,可以视为随机事件,但根据以往的经验又有若干信息可以用来确定这些状态可能发生的概率,决策者可根据各个状态发生的概率进行决策。由于决策者不论选择哪个方案都要承担一定的风险,所以这种决策称为风险型决策。风险型决策就是利用不同方案在不同可能状态下的概率值,乘上相应的方案和可能状态下的损益值,算出不同的期望效益值,然后进行比较,即可选出最优方案。风险型决策与不确定型决策不同之处在于:风险型决策是在估计出状态空间的概率分布的基础上进行决策。一般风险型决策中,所利用的概率包括客观概率与主观概率。\n第三节风险型决策进行风险型决策一般应具备以下条件:具有明确的目标;两个或两个以上的可能状态及不同可能状态出现的概率;两个或两个以上的行动方案以及不同方案在不同可能状态下的损益值。\n一、最大可能性准则决策在决策中选择概率最大的自然状态,将其它概率较小的自然状态予以忽略,然后比较各备选方案在这种概率最大的自然状态下的收益或损失值,选取收益最大或损失最小的方案作为行动方案。例9.3.1某企业在下一年拟生产某种产品,需要确定产品批量,根据预测估计,这种产品市场可能状况的概率:畅销为0.3,一般为0.5,滞销为0.2。产品生产采取大、中、小三种批量的生产方案,其有关数据如表9.3.1所示。按最大可能性准则方法,该企业应选择何种生产方案。\n一、最大可能性准则决策(例9.3.1)如果在一组自然状态中,某一自然状态出现的概率比其它自然状态显著地大,而益损值差别又不很大时,采用最大可能性准则的决策效果较好。\n二、期望值准则决策期望值准则决策,就是在考虑各种结果对决策带来综合影响的情况下,选择其中期望值最大的方案作为最优方案的一种决策方法。其决策步骤是:首先列出决策收益表;以决策收益表为基础,根据各种自然状态的概率计算出不同方案的期望损益值;然后从期望损益值中选择最大的值所对应的方案作为最优方案。各种方案的期望损益计算公式为\n二、期望值准则决策(例9.3.2)例9.3.2利用表9.3.1中的资料,按期望值准则方法,求该企业应选择何种生产方案。解:由表9.3.1和期望值准则决策计算公式得\n三、决策树法决策树法是通过把决策过程用图解方式显示出来,从而使决策问题显得更为形象、直观,便于管理人员审度决策局面,分析决策过程。决策树法不仅适用于单阶段决策问题,而且可以处理多阶段决策中用图表法无法表达的问题。决策树的一般模型决策点剪枝方案枝概率枝决策点结果点状态结点图9.3.1决策树的一般模型\n三、决策树法决策树法的程序单阶段决策树法单阶段决策树法的程序可分为:从左到右的建树过程和从右到左的计算过程两个阶段。从左到右的建树过程;从右到左的计算过程。\n单阶段决策树法(例9.3.3)例9.3.3试利用例9.3.1中给出的某企业产品批量生产的收益矩阵表资料,根据决策树法选择最佳的生产方案。解:根据表9.3.1中的资料,求得各种方案的期望值,如表9.3.2所示。\n单阶段决策树法(例9.3.3)根据决策表中的有关数据和计算的期望值绘制的决策图如图9.3.2所示。由决策图可以看出,中批量生产的效益期望值最大(168万元)。所以,应该采取中批量生产这个行动方案。\n三、决策树法多阶段决策树法有些问题的统计决策带有阶段性,选择某种行动方案会出现不同的状态,按照不同的状态,又需要作下一步行动方案的决策,以及更多的状态和决策,这些问题表现在决策树上为多个决策点,可以用多阶段决策树的方法进行决策。例9.3.4某高新技术集团企业拟生产某种新产品,该企业有两个方案可供选择,方案一是建设大厂,需投资3200万元,建成后,若销路好,可得利润1200万元,若销路差,则亏损400万元;另一个方案是建设小厂,需投资2000万元,如销路好,每年可得利润600万元,销路差,每年可得利润500万元。两个工厂的使用期限都是10年。根据市场预测,这种产品在今后10年内销路好的概率是0.7,销路差的概率为0.3,该集团企业计划先建小厂,试销3年,若销路好再投资1000万元,加以扩建。扩建后可使用7年,后7年中每年盈利增至970万元,应如何决策。\n多阶段决策树法(例9.3.4)解:这个问题属于多级决策问题,可以分为前三年和后7年两个阶段考虑各种情况下的损益值,相应的决策树如图9.3.3所示。\n多阶段决策树法(例9.3.4)由图9.3.3所列资料,可计算各点效益期望值如下:计算决策点2的期望值在决策点2处有两个方案分枝,即③、④,一个是扩建,另一个是不扩建。由于这个决策点2是从状态点②中的“销路好”概率分枝延伸出来的,所以不论扩建也好,不扩建也好,它们的前提条件都是“销路好”,故状态点③、④的概率都是1.0。这时③、④状态点的期望值为:状态点③:1.0×970×7-1000=5790(万元)状态点④:1.00×600×7=4200(万元)比较点③与点④,可剪去点④,留下点③。即点③代表决策点2的期望值。\n多阶段决策树法(例9.3.4)状态点②的期望值计算前三年建小厂销路好时的期望值为0.7×600×3,后七年扩建后的期望值为0.7×5790,七年后若不扩建,销路差时的期望值为0.3×500×10。再考虑收回建小厂的投资,则状态点②的期望值(0.7×600×3十0.7×5790十0.3×500×10)-2000=4813(万元)状态点①的期望值(0.7×1200×10十0.3×(-400)×10)-3200=4000(万元)对比点①与点②的期望值可以知道,应采取的决策是先建小厂,试销三年后,如果销路好时再扩建。\n第四节贝叶斯决策贝叶斯决策则是利用贝叶斯概率公式解决进行决策的方法。一、先验概率、后验概率与贝叶斯准则先验概率先验概率指根据历史资料或主观判断所确定的,没有经过试验证实的概率。其中,利用过去历史资料计算得到的先验概率,称为客观先验概率;当历史资料无从取得或资料不完全时,凭人们的主观经验来判断而得到的先验概率,称为主观先验概率。\n一、先验概率、后验概率与贝叶斯准则后验概率后验概率是指通过调查或其它方式获取新的附加信息,利用贝叶斯公式对先验概率进行修正,而后得到的概率。先验概率与后验概率的实质区别是:先验概率不是根据有关自然状态的全部资料测定的,而只是利用现有的材料(主要是历史资料)计算的;后验概率使用了有关自然状态更加全面的资料,既有先验概率资料,也有补充资料;先验概率的计算比较简单,没有使用贝叶斯公式;而后验概率的计算,要使用贝叶斯公式,而且在利用样本资料计算逻辑概率时,还要使用理论概率分布,需要更多的数理统计知识。\n第四节贝叶斯决策贝叶斯(Bayes)准则\n例9.4.1一台微机的一个重要组成部分是主板。已知某地区销售的计算机主板有20%来自供应商,50%来自供应商,30%来自供商。假定这三个供应商所生产的主板的不合格率已知,分别为0.01、0.004和0.008,若发现某一台计算机的主板发生故障,试问哪个供应商应承担责任的可能性最大?\n二、补充样本价值信息的贝叶斯决策补充样本价值信息的贝叶斯决策决策过程是:首先利用抽样或试验所得到的样本资料,依据贝叶斯公式对先验概率进行修正,得到后验概率;接下来再由后验概率求得各种方案预期的损益期望值,最后通过比较各种方案的数值选择与最大收益或最小损失相对应的方案作为决策方案。例9.4.2某公司拟对今后生产作出规划,有三种决策方案可供管理层选择:A1:大力开发新产品并压缩现有产品生产;A2:在维持现有产品生产基础上,加紧开发新产品;A3:提高现有产品质量,扩大现有产品的生产。决策前,管理层首先对可能出现的市场状况和盈利作了一些调查和分析,不同方案在不同市场状态下的收益,如表9.4.1所示。\n二、补充样本价值信息的贝叶斯决策\n二、补充样本价值信息的贝叶斯决策解:通过考虑样本信息来调整先验概率,计算求得联合概率和边际概率,如表9.4.3所示。表9.4.3联合概率与边际概率统计表P(Cj),P(Bi/Cj)实际销售市场状态P(Bi)C1C2C3调查估计市场状态B10.140.1750.0150.33B20.040.420.020.48B30.020.1050.0650.19P(Cj)0.20.70.11.00\n二、补充样本价值信息的贝叶斯决策\n二、补充样本价值信息的贝叶斯决策\n二、补充样本价值信息的贝叶斯决策\n第五节效用决策在实际工作中,有许多重要的决策问题是不能仅用损益值来衡量的,而在很大程度上取决于决策者个人对一定损益得失的主观估计,这就是所谓效用。例9.5.1某顾客空运一件价值10万元的艺术品,如果飞机发生失事,艺术品就会损坏,顾客自己承担全部损失。但顾客可以花150元去保险,在有保险的情况下,假如发生了事故,保险公司会赔偿全部损失。现在已知飞机失事的概率为0.0005,问在这种情况下,该顾客应不应该去保险。\n第五节效用决策如果从损失期望值考虑,应选取不去保险这一方案,因为支付的费用已超出了期望亏损达100元(150-50=100元)。但是想到一旦失事,将会损失10万元艺术品,很少有人愿意为节省150元而冒损失10万元的风险,这就是效用的作用。由以上例子可知,在某些情况下,用损益期望值作为决策唯一依据的方法是不合理的,它不能很好地反映决策者对损益的偏好,此时需运用效用决策。效用是决策者对损益的看法和偏好的一种相对数量表示,决策问题的每一策略对决策者都有一定的效用,这反映了在风险情况下决策者对某种结果的偏好程度。\n第五节效用决策二、效用函数曲线决策分析以损益值为横坐标,以效用为纵坐标,为方便起见,通常将决策者可能遇到的最低收益(或最大损失)所对应的效用指定为零,而将他的最高可能收益对应的效用值指定为1或100。可画出不同类型决策者的效用函数曲线,常见的3种不同类型风险偏好决策者的效用函数曲线如图9.5.1所示。曲线A为风险回避者效用曲线;直线B是风险不关心者效用曲线;曲线C是风险偏好者的效用曲线,这种类型的人对待风险的态度与风险回避者正好相反。这三条曲线有两个共同的交点。0和S,这样便于进行相互比较。\n第五节效用决策(例9.5.2)例9.5.2设有甲、乙二人,分别给他们一个同样的机会:A1是肯定得到300元,A2是赢600元或输150元的机会各为50%,甲选择A2而乙选择A1,能否说明甲是风险追求者而乙是风险回避者。解:首先计算甲的期望收益:E(A2)=0.5×600+0.5×(-150)=225由于甲的期望收益225低于肯定收益300元,所以,甲无疑是风险偏好者,但乙还不能肯定是风险回避者,因为,不管他是风险回避者还是风险不关心者,都会选择300元,这样做既没有风险也高于期望收益225元。\n第五节效用决策由于效用曲线考虑了决策者对损益值的偏好,除用于一般的决策分析外,还可用于决定意愿水准。方法是:从效用曲线上寻找拐点,拐点所在的付酬就是意愿水准。意愿水准效用曲线是有拐点的混合型,如图9.5.2所示。\n三、效用期望值决策分析(例9.5.3)决策者对损益值的偏好也可应用效用期望值进行决策分折。例9.5.3买财产保险是否合算,一直是一个有争论的问题。反对保险的论点是买保险是在打赌,用一小笔钱(保险费)和一个可能的巨大损失打赌。然而,保险公司的一切开销都是从客户缴纳的保险费中开支的,还要有盈利,分析结果,只有对保险公司有利,对保险者不利。赞成保险的理由是:我花点钱买保险,投资不多,对生活没有什么影响,但却能使我无后顾之忧,安心工作。否则,万一出事,则后果不堪设想。双方的观点似均有理,试用效用决策分析加以说明设某投保人对他拥有的一项价值30000元的财产进行保险,保险费为300元,根据以往经验,保险公司赔偿的概率为0.005。由损益期望值决策分析,保险公司是有利可图的,其期望收益为150元,如表9.5.2所示;而购买保险单的投保者则是亏损的,期望收益为-150元,如表9.5.3所示。\n三、效用期望值决策分析(例9.5.3)\n三、效用期望值决策分析(例9.5.3)由损益期望值分析,反对保险的观点是正确的。然而实际上许多决策者并不是损益期望值的忠实执行者,只有那种对待风险漠不关心的决策者,才毫无保留地接受损益期望值。一般决策者多是风险回避者,他们所考虑的是效用的大小,即效用递减原则在起作用。如将投保者的损益期望值收益换算成效用收益,设U(300)=0.11,U(30000)=25,再作决策分析,如表9.5.4所示。\n三、效用期望值决策分析(例9.5.3)由表9.5.4可以看出,保险的期望效用收益-0.11比不保险的期望效用收益-0.125为优。显然,保险公司出售大量保险单,可获得损益期望值收益,而投保者可获得效用收益。这是一项双赢利的事业。关于保险问题还可从另外一个角度分析:为了保证安全(效用)而保险时,对可能遭受的损失价值加以估计。\n三、效用期望值决策分析(例9.5.4),例9.5.4某经理面临两种状态,一种状态是年利润6万元,概率为0.95;另一种状态是失火或其他灾难造成巨大损失,甚至破产,概率为0.05,该经理可以选择为他的财产保险,以便把风险转嫁给保险公司,保险费为1万元/年,该经理是否应该投保。\n本章小节统计决策是在不确定情况下,应用数理统计进行决策的通用性的方法论科学。完整的统计决策问题,通常包含三个基本要素:决策目标、自然状态、备选方案。不确定型决策是指决策者在对未来情况未知,对各种自然状态出现的概率也无法预测的条件下所作的决策,其决策准则有极端准则决策、折衷准则决策、等可能性准则决策、后悔准则决策等。\n本章小节风险型决策是指在进行决策时未来的状态是不确定的,它们都是随机变量,风险型决策所依据的准则主要是期望损益准则,期望损益准则(或期望机会损失准则)利用对自然状态指定的概率来选择具有最大期望收益(或最小机会损失)的方案。期望损益既可用自然状态的先验概率来计算,也可用后验概率来计算。后验概率可通过利用样本信息和贝叶斯规则对先验概率进行修正后得出。但是这些决策规则不能表达决策者对待风险的态度。效用决策可反映在风险情况下决策者对某种结果的偏好程度,效用是决策者对损益的看法和偏好的一种相对数量表示,决策问题的每一策略对决策者都有一定的效用。\n第十章产品质量的统计管理第一节产品质量的特性、标准和分级第二节产品质量的统计指标第三节产品质量的变异与数据特征第四节产品质量的过程控制第五节产品质量控制图第六节产品质量管理常用的工具本章小节主要内容\n第一节产品质量的特性、标准和分级产品质量的统计管理也称为产品质量控制,就是运用统计理论,控制产品在生产过程中质量的稳定性,以保证生产出的产品符合质量标准的一种管理方法。一、工业产品质量的特性产品的内在质量性能时间性可信性安全性经济性适应性\n一、工业产品质量的特性产品的外观质量产品的外观质量是指产品的外部属性。如产品的造型、色泽、光洁度、包装等。二、工业产品质量标准国际标准国家标准(GB)部颁标准部颁标准\n一、工业产品质量的特性三、工业产品质量分级中华人民共和国国家标准《工业产品质量分等导则》(GB/T12707—91)。该导则规定,对于在中华人民共和国境内生产和销售的工业产品(包括技术引进产品,由独资、合资、合作生产的在中华人民共和国境内销售的产品),产品质量水平原则上划分为三个等级,即优等品、一等品、合格品。优等品指其产品质量标准达到国际先进水平,且实物质量水平与国外同类产品相比达到近5年内的先进水平。一等品指其产品质量标准达到国际一般水平,且实物质量水平达到国际同类产品的一般水平。合格品指按我国—般水平标准(国家标准、行业标准、地方标准或企业标准)组织生产,实物质量水平达到相应标准的要求。\n第二节产品质量的统计指标一、反映产品本身质量的统计指标产品平均技术性能指标产品质量等级指标产品质量等级指标包括产品质量等级率和产品平均等级两种。\n第二节产品质量的统计指标产品质量等级率产品平均等级\n第二节产品质量的统计指标直接以产品等级表示产品质量根据一系列质量标准和技术条件,将工业产品按其质量高低,可划分为优等品、一等品和合格品三级。入库产品抽查合格率\n第二节产品质量的统计指标综合质量分当产品的质量是由多项技术特性和参数决定时,需要对其质量给以综合的评价,实践中通常采用计算综合质量分的办法来解决。综合质量分是指根据产品的质量标准规定一定数量的抽查项目,按照百分制,根据每个项目在整个产品中的重要程度,确定—定的质量分数,各项总和为100分。经过对各项技术性能的检验,得到各个项目的分数,然后将各个项目的分数汇总为产品质量分。根据这个分数就可以对产品质量的高低作出综合评价和比较。\n二、反映企业生产作业质量的统计指标产品合格率废品率返修率(返工率)\n二、反映企业生产作业质量的统计指标质量损失率内部损失成本外部损失成本是指产品交货前因未满足规定的质量要求所损失的费用。其统计范围具体包括报废损失费、返修费、降级损失费、停工损失费和产品质量事故处理费等。是指产品交货后因未满足规定的质量要求,导致索赔、修理、更换或信誉损失等所损失的费用,其统计范围包括索赔费、退货损失费、折价损失费、保修费等。\n第三节产品质量的变异与数据特征一、工业产品质量的变异因素现代工业产品的质量一般都是通过规格和标准反映出来的,如灯泡、电池要有一定的使用寿命,钢丝绳、化学纤维要有一定的抗拉强度,电器元件要有一定的稳定性等。但是无论在任何情况下,按一定的标淮(包括设计标准、材料标准、工艺标准、工作标准等)制造的大量同类产品间总是存在着差别,称之为变异。即同类产品的质量总是不会一模一样绝对相同,而是存在着差异或分散的情况。\n第三节产品质量的变异与数据特征根据产品质量变异的来源分类根据质量变异的来源,可以把产品质量因素划分为一般因素和特殊因素。产品质量的一般因素包括:人员(man)、机器(machine)、原材料(material)、加工方法(method)、测量工具(measure)和环境(environment),简记为5M1E。根据产品质量变异的原因分类根据产品质量变异的原因可以分为三大类:随机因素、系统因素、异常的特殊因素。\n第三节产品质量的变异与数据特征随机因素又称偶然因素,是一些随机的、偶然性因素所产生的产品质量的变化,随机因素对质量影响比较小,不易识别,能够加以控制或减少,但技术上难以消除,或经济上不值得消除。例如原材料的化学成分、热处理结果、机床的振动、刀具的硬度、室温的变化及环境的文明状况等。系统因素又称为非偶然因素,是一些不经常发生的、对产品质量影响比较大而又前后呈现一定规律的因素,容易识别,也能消除。如刀具的磨损、原材料不合格、机器设备故障、操作方法不当等。异常的特殊因素是在特殊情况下产生的,如电力供应混乱、机器失灵、操作人员思想不集中等随机因素是不可避免的,系统因素是可以避免的;产品质量控制就是要对系统性因素造成的产品质量差异加以控制,以保证生产出来的产品质量符合标准。\n第三节产品质量的变异与数据特征按质量因素对质量作用的强弱分类按质量因素对质量作用的强弱程度可以划分为主要因素与次要因素。影响产品质量的因素非常多,然而并非所有的因素都同样重要,其中有一些因素,虽然数量不多,但一旦出现显著的变动,便会产生重大的、系统的影响,而另一类因素尽管数目很多,可是影响甚微,不会造成大范围的质量问题。\n第三节产品质量的变异与数据特征二、产品质量统计管理中数据的特征产品质量统计管理中的数据可以分成两大类:计量值数据和计数值数据。计量值数据是指可以用仪器测量的连续性数据,如长度、强度、温度、硬度、重量、压力、时间、成分等。计数值数据是指只能用自然数表示的数据,如合格品件数、废品数、疵点数等。计数值数据还可进一步细分为计件值数据和计点值数据。计件值数据是按产品个数计数的数据,如合格品件数、废品件数等;计点值数据是按点计数的数据,如缺陷、气孔数等。\n第四节产品质量的过程控制一、过程能力产品工序是指一个(或一组)工人在一个工作场地上(如一台机床或一个装配工位等)对一个(或若干个)工作对象连续完成的各项操作的总和,它是构成生产过程的基本单位,也是形成产品质量的基本单元。过程能力也称为工序能力,是指工序处于控制状态下的实际加工能力,即在影响过程质量的所有因素都充分规范化和标准化后,工序处于稳定状态下所表现出来的保证过程质量的能力。\n第四节产品质量的过程控制工序处于控制状态下,过程质量的变异通常是由正常波动引起的,质量特性一般呈正态分布,质量特性值的分布与质量标准(用公差表示)之间的关系,如图10.4.1所示。\n第四节产品质量的过程控制由于标准差能反映过程能力的强弱,所以实践中人们常用作为基础来表征过程能力。为了经济性地实现过程质量控制,在实践中通常使用 来描述过程能力,这是由于当生产过程处于受控状态时,在距平均值范围内的产品占整个产品的99.73%,废品率仅为0.27%。显然,以即6为标准来衡量过程能力是具有足够的精确度和良好的经济性的。因此,过程能力为6。\n第四节产品质量的过程控制二、过程能力指数过程能力指数一般表达式为若 用抽取样本的实测值计算出的样本标准偏差s来估计,则过程能力指数为\n三、过程能力指数的计算(一)计量值为双侧公差情况下的过程能力指数的计算工序分布中心与公差带中心重合\n三、过程能力指数的计算解:\n三、过程能力指数的计算工序分布中心与公差带中心不重合工序分布中心与公差带中心不重合的情况,如图10.4.3所示,图中\n三、过程能力指数的计算工序分布中心与公差带中心不重合\n三、过程能力指数的计算(例10.4.2)\n三、过程能力指数的计算质量标准、过程能力和过程能力指数之间的关系,如图10.4.4所示。\n三、过程能力指数的计算\n三、过程能力指数的计算\n三、过程能力指数的计算(二)单侧公差情况下的过程能力指数计算计量值情况下的过程能力指数计算当设计标准规格要求为单侧公差的情况,即只给出规格上限或下限,如图10.4.5所示。\n(二)单侧公差情况下的过程能力指数计算式(10.4.6)为只给出上限单侧标准的情况,即只给出上限要求,而对下限没有要求,例如机械产品的圆度、平行度等,只希望上限愈小愈好;式(10.4.7)为只给出下限单侧标准的情况,如产品的机械强度、寿命、可靠性等要求不低于某个下限值,且希望愈大愈好。\n(二)单侧公差情况下的过程能力指数计算计件值情况下的过程能力指数计算式(10.4.8)中样本大小,一般为定值,以减小误差。(10.4.8)\n计件值情况下的过程能力指数计算以不合格品率p作为检验产品质量指标,并以pu作为标准要求时,CP值的计算。\n计件值情况下的过程能力指数计算(例10.4.3)例10.4.3由某批零件随机抽取大小为的样本20个,其中不合格品数分别为:2,1,3,5,2,4,1,0,3,2,6,4,9,3,7,1,8,3,5,0,当允许样本不合格品数(np)u为10时,求过程能力指数。\n计点值情况下的过程能力指数计算\n计点值过程能力指数计算(例10.4.4)例10.4.4由某批产品中抽取大小为n=100的样本20个,其中疵点数分别为:0,3,1,2,3,1,2,3,2,1,2,4,2,3,5,3,4,2,3,2当允许样本疵点数为8时,求过程能力指数。解:\n四、过程能力的分析与提高途径过程能力分析\n四、过程能力的分析与提高途径\n四、过程能力的分析与提高途径对于属于特级能力的过程,允许有较大的波动,这时可考虑降低成本措施,适当放宽控制和检验;对于属于1级能力的过程,允许有一定程度的波动,如果不是重要的工件,可适当放宽控制和检验;对于二级能力的过程,需严格控制,检验不可放宽,否则易产生较多的不合格品;对于属于三级能力的过程,应采取措施提高过程能力,如已出现一些不合格品,则需严格检验,必要时进行全检;对于属于四级能力的过程,必须追查原因,采取果断措施,并对产品进行全检。通过对过程能力进行分析,可以对过程进行诊断,对设计合理性进行验证并为技术经济分析提供可靠的资料和依据。\n四、过程能力的分析与提高途径提高过程能力指数的措施调整工序加工的分布中心,减少偏移量;提高过程能力,减少工序加工的标准偏差;调整质量标准。在保证产品质量前提下,适当放宽公差以降低生产成本。\n第五节产品质量控制图控制图是于1962年由美国贝尔电话实验室休哈特(W.A.Shewart)博士首先提出,现已成为生产中控制过程质量的主要方法。一、产品质量控制图的分类产品质量控制图是用来分析和判断工序是否处于稳定状态的一种图形工具。\n一、产品质量控制图的分类(一)根据控制界限的计算方法分类根据控制界限的计算方法可分为3σ方式控制图和概率界限方式控制图。3σ控制图3σ控制图就是在控制图上标点的统计量于处建立控制线。美国、日本、我国及世界上许多国家都采用三倍标准差()来确定控制界限。\n一、产品质量控制图的分类在生产过程稳定的状态下,以标点的统计量越出控制界限的概率所取定的值来确定控制界限,其取值如0.05,0.025,0.001等,以此来确定控制界限。英国、北欧等采用这种控制图。概率界限控制图\n一、产品质量控制图的分类(二)根据所采用的统计量分类根据所采用的统计量不同,可分为计量数据控制图和计件数据控制图。计量数据控制图计量数据控制图适用于产品质量数据为连续变量,可以用某一区间的任何数值来表示产品质量特性。\n(二)根据所采用的统计量分类计数数据控制图计数数据控制图适用于产品的质量数据为不连续变量,只能以正整数来表示的产品质量特性。如不合格品数、废品数、疵点数等都是不连续变量。\n二、单值控制图的制作(控制图)单值控制图属于计量值控制图,常应用于从工序中只能获得一个测定值的情况。具体作图步骤如下:确定中心线CL(CentralLine);确定控制上限UCL(UpperControlLimit)和控制下限LCL(LowerControlLimit);绘制单值控制图\n二、单值控制图的制作(例10.5.1)\n三、平均值与级差控制图\n三、平均值与级差控制图\n三、平均值与级差控制图\n三、平均值与级差控制图R控制图\n三、平均值与级差控制图\n三、平均值与级差控制图控制图的制作步骤数据的选取与分组选取一定数量的数据,一般为50-200个,至少取25组数据,过少影响精度,过多烦琐。制作控制图\n三、平均值与级差控制图(例10.5.2)例10.5.2某种零件的质量特性值是零件的外径,为了控制产品的质量,从连续生产工序中每隔半小时抽检制品一次,每次抽捡5件,共抽25次,测得数据如表10.5.2所示,试制作控制图。\n三、平均值与级差控制图(例10.5.2)\n三、平均值与级差控制图(例10.5.2)\n三、平均值与级差控制图(例10.5.2)\n四、平均值与标准差控制图平均值与标准差控制图是均值控制图和标准差控制图一起使用的一种控制图,它通过直接判断质量特性的平均值和标准差是否处于或保持在所要求的水平,进而判断生产过程是否处于稳定状态。\n四、平均值与标准差控制图\n四、平均值与标准差控制图\n四、平均值与标准差控制图\n四、平均值与标准差控制图\n四、平均值与标准差控制图(例10.5.3)在Excel工作表中输入如表10.5.2所示的样本数据,点击主菜单中的“工具”菜单,在弹出的子菜单中点击“数据分析”,出现数据分析对话框,如图10.5.4a)所示。\n四、平均值与标准差控制图(例10.5.3)\n四、平均值与标准差控制图(例10.5.3)选择“描述统计”,点击确定,弹出描述统计对话框,在“输入区域”选项的矩形框中,拖动鼠标选取B3:F27,分组方式选择“逐行”,并根据需要选择其它参数,如图10.5.4b)所示。\n四、平均值与标准差控制图(例10.5.3)点击确定,弹出的输出结果窗口如图10.5.4c)所示。\n\n四、平均值与标准差控制图(例10.5.3)\n四、平均值与标准差控制图(例10.5.3)计算控制界限\n制作图\n五、其他计量控制图\n五、其他计量控制图\n六、计件控制图计件控制图与计点控制图都属于计数数据控制图,计件值控制图又可分为不合格品数控制图(pn控制图)与不合格品率控制图(p控制图)。控制图与控制图本质上没有差别。因此,在样本n不变的情况下,可用不合格品数pn代替不合格品率p。不合格品数控制图(pn控制图)\n六、计件控制图应用pn控制图有以下要求:(1)要求样本值n较大,否则不能按正态分布作近似计算;(2)要求n值要固定,否则,控制图的中心线、上、下限将随值的变化而变化,使用起来不方便。\n六、计件控制图不合格品率控制图(p控制图)\n六、计件控制图(例10.5.3)例10.5.3连续25个工作日抽取某零件的不合格品数的统计资料如表10.5.4所示,试制作控制图监控生产过程。\n六、计件控制图(例10.5.3)\n六、计件控制图(例10.5.3)\n七、计点数控制图计点控制图是通过控制产品上疵点或缺陷的数目,来控制产品的质量。计点控制图可分为缺陷数控制图(c控制图)与单位缺陷数控制图(u控制图)。c控制图仅限于各组样本量相等时使用,无论样本组的样本量相等或不相等均可应用u控制图。\n七、计点数控制图缺陷数控制图(c控制图)当样本容量n相同时,可用c控制图来控制产品的缺陷数。\n七、计点数控制图缺陷数控制图(c控制图)计点控制图的样本量没有统一的规定,只要使样本上总有缺陷出现即可。对容易发生缺陷的产品,样本量可以取小些,而对缺陷出现较为稀少的产品,其样本量取大些。\n七、计点数控制图缺陷数控制图(c控制图)控制图的绘制过程概括如下:第一步收集数据,一般取20—25个样本容量相同的产品,如果较小时,可将几个样本编为一组,使每组缺陷数=0的点尽量减少,否则用来作控制图是不适宜的;第二步检查每个样本的缺陷数;第三步计算控制界限;第四步绘制图。\n单位缺陷数控制图(控制图)u控制图主要用于对单位缺陷数控制的场合,是通过测定样本上单位数量(如面积、长度、时间、重量、容积等)上的缺陷数来控制产品质量的。另外,也用于控制事故、故障、灾害等的发生次数。u控制图与c控制图具有相同的原理。u控制图与c控制图不同之处在于,u控制图的样本容量n可以是不固定的,只要能求出每单位缺陷数即可。因此,常常用于控制纺织品的疵痕数、涂漆表面的疵点数、印刷排字中的错字数、车间事故发生的次数等。u控制图的绘制程序与c控制图的绘制程序基本相同,只需要利用公式u=c/n,把缺陷数c换算成标准单位缺陷数u。七、计点数控制图\n七、计点数控制图u控制图的控制限为\n七、计点数控制图(例10.5.4)例10.5.4某种类型纺织品出厂时抽检22组,发现的疵点数如表10.5.5所示,试制作u控制图控制产品质量。\n七、计点数控制图(例10.5.4)\n七、计点数控制图(例10.5.4)\n七、计点数控制图(例10.5.4)(4)制作控制图\n八、产品质量控制图的统计分析应用产品质量统计图的条件由于只有在大批量生产的条件下,产品的质量分布才符合正态分布曲线。因此,利用正态分布曲线的性质控制产品质量必须具备以下条件:必须是成批生产的产品或零部件;必须具备相对稳定的生产过程;的控制界限必须小于公差范围;必须具备统一的测量仪器。\n八、产品质量控制图的统计分析控制图中质量特性的选择选定质量特性需要从以下几个方面考虑:为了使控制最终取得最佳效果,应尽量采取影响产品质量特性的根本原因有关的特性或接近根本原因的特性作为控制项目;有些虽然不是最终产品质量的特性,但为了达到最终产品的质量目标,生产过程中所要求的质量特性也应列为控制项目;在同样能够满足对产品质量控制的情况下,应该选择容易测定的控制项目;在同样能够满足产品质量控制的情况下,应该选择对生产过程容易采取措施的控制项目;产品的质量特性有时不止一个,则应同时采取几个特性作为控制项目。\n八、产品质量控制图的统计分析计量控制图与计数控制图的选择由于大多数工序输出的质量特性具有可计量特性,计量值因包含更多的信息而具有较高的灵敏度,容易检查出现异常波动的原因。计量控制图所需要的数据比计数控制图的数据少得多,且更为有效,有助于减少检验费用,以及缩短生产与采取纠正措施之间的时间间隔。有些质量特性,如酒的口感、毛皮的手感,现在还无法定量,只能用计数控制图;用多种指标来衡量的场合,只要其中一项指标不达到要求,就认为产品不合格,此时应用计数控制图就比较简单。计数控制图最大的缺陷是:当样本量n变化时,p图与u图的UCL、LCL随样本量n变化而变,呈凹凸状,不但作图不方便,而且无法对界内点判异与判稳。\n八、产品质量控制图的统计分析数据处理数据分组尽量使组内的变异较小和较为均匀。在数据分组过程中,尽量将大致相同条件下所收集的质量特性值分在一组,组中不应有不同本质的数据,以保证组内仅有偶然因素的影响。数据分层可按不同条件对质量特性值进行分层控制,作分层控制图控制界限的重新计算控制图经过使用一定时期后,生产过程有了变化,例如加工工艺改变、刀具改变、设备改变以及进行了某种技术改革和管理改革措施后,应重新收集最近期间的数据,以重新计算控制界限并作出新的控制图。\n八、产品质量控制图的统计分析生产异常的判断点越出控制界限是最重要的讯号,若是出现这种情况,就要研究出现这种状况时所用的原材料、生产工艺、机器或其他因素有无发生变化,从中找出点失去控制的原因。此外,当所有的点均在控制界限内,它们的排列方向和位置呈现某种特殊状态时,例如,若干点连续在中心线一侧、若干点连续上升或下降、若干点接近控制界限、点出现周期性变化等情况,也意味着生产过程中有异常情况,需要及时采取措施。\n第六节产品质量管理常用的工具a)标准型,数据总体呈正态分布,据此可判定过程处于稳定状态;b)与c)为偏态型,也称陡壁型,通常是由于习惯性加工、返修或剔除废品后造成的分布形状d)平项型,直方图上没有突出的顶峰,这主要是生产过程中有某种缓慢变化的因素造成的;e)孤岛型,在直方图的左边或右边有孤立的小岛出现,这种图形通常是由于工艺条件发生突变造成的;d)双峰型,直方图上出现两个顶峰,其原因是将来自两种不同生产条件的数据混在一起整理而造成的。e)锯齿型,它通常是由于分组过多或测量数据不准等原因造成的。一、直方图的形状分析\n第六节产品质量管理常用的工具当过程处于稳定状态后,直方图还需要进一步与质量标准(通常是公差)进行比较,以便判断过程能力能否满足质量标准的要求。直方图与质量标准的相互关系参见10.4节图10.4.4。二、帕累托图(Pareto)帕累托图建立在帕累托“关键的少数和次要的多数”结论的基础上,应用这一原理,就意味看在质量改进的项目中,少数的项目往往产生主要的、决定性的影响。通过区分最重要和最次要的项目,就可以用最少的努力获得最大的改进。帕累托图在形式上是条形图和线形图的组合,其中,直条的长短表示各组绝对数的多少,同时用线段的逐渐上升趋势表示各组百分比接近100%的过程。\n二、帕累托图(Pareto)在帕累托图上,对结果有较大影响的只是“柱高”的前两、三项,而后面的项目对改善效果影响不大。因此,可以根据重要程度把影响因素分为A、B、C三类。A类因素在排列图上所占比重大,约占全部因素的70%—80%,这是影响产品质量的主要因素所在。B类因素在排列图中所占比重较小,约占全部因素的15%一25%(减去A类因素所占的百分比),这类因素是影响产品质量的次主要因素。C类因素在排列图中所占比重较小,是除去A、B两类因素所剩余的因素。这类因素是次要因素。经验表明,解决A类因素,即解决“柱高的”项目比解决“柱低的”项目要容易的多,“柱低的”因素一般很难控制。\n二、帕累托图(Pareto)(例10.6.1)例10.6.1某种产品一次交验的合格率低,产生不合格品的因素经调查所得统计数据如表10.6.1所示,试用帕累托图对问题进行分析。\n二、帕累托图(Pareto)(例10.6.1)由图10.6.2可以看出,造成不合格品因素的前三项即加工方法、工艺和原材料所占的比例超过了80%,如能针对这三项进一步分析,并采取对策即可解决大部分问题。对影响产品质量的主要因素,可继续画出第二张、第三张巴累托图。对影响产品质量的主要因素分析得愈具体,所能采取的措施针对性也就愈强。制作帕累托图的资料,一般取1—3个月的资料较好。时间太长,生产过程变化较大,时间太短,资料不能反映实际情况。\n三、分层法和调查表分层法分层法也称分类法或分组法,它把“类”或“组”称为层。它在分层时要求同一层内的数据波动尽可能小,而层与层之间的波动尽可能大。一般可按以下几种特征进行分层:按日期、季节、班次等时间因素分层;按操作人员的性别、年龄、技术等级等因素分层;按机器设备的种类、型号、精度等级等因素分层;按工艺规程、操作条件(如速度、温度、压力)等分层;按原材料的成分、生产厂家、规格、批号等分层;按测量方法、测量仪器等分层;按噪声、清洁程度、采光、运输形式等操作环境因素分层;按使用单位、使用条件等分层。\n三、分层法和调查表调查表调查表也称检查表,它是收集和整理质量原始数据的一种表格。因产品对象、工艺特点、调查目的和分析对象等的不同,其调查表的格式也不同。常用的调查表有:不良项目调查表查表、缺陷位置调查表、不良原因调查表、工序分布调查表等。\n四、因果图因果图(causeandeffectdiagram)也称为石川图或鱼刺图,是由日本学者石川馨博士(KaoruIshikawa)于1972年在他的《质量控制指南》一书中首次应用。它是以结果为特性,以原因为因素,在它们之间用箭头联系起来,表示因果关系的图形。因果图的主要内容有:结果(问题或特性)。指工作和生产过程出现的结果,例如尺寸、重量、纯度及强度等质量特性;工时、产量、不合格品率、缺陷率、事故率、成本、噪声等工作结果。这些特性或结果是期望进行改善和控制的对象。原因指对结果能够产生影响的因素。枝干表示结果与原因之间的关系,及原因与原因之间的关系称为枝干。最中央的干为主干,用双箭头表示;从主干下两边依次展开的称为大枝、中枝、小支和细枝,用单线箭头表示。\n四、因果图因果图是从实际经验中编辑而成的一种方法,通过对问题(即结果)有影响的一些较重要的因素加以分析和分类,并在同一张图上把它们的关系用箭头表示出来,来对因果作明确系统的整理。\n五、其它质量管理新工具简介1977年底日本人正式开始推广能应用于全面质量管理的新7种工具。这7种工具是以分析文字资料(非数据)为主的质量管理方法,包括关联图法、KJ法、系统图法、矩阵图法、矩阵数据分析法、网络图法和PDPC法,主要应用于PDCA(PlanDoCheckAction)循环的计划(P)阶段。\n五、其它质量管理新工具简介关联图关联图是用带箭头的连线把表示事物因果关系的因素联系起来的图。KJ法KJ法是由日本人川喜田二郎在质量管理实践中总结、归纳的一种新方法,用来将一大堆杂乱无章的语言文字资料,按其内在相互关系(亲和性)加以整理,从而理出思路,抓住问题的本质,找出解决问题的新途径和方法。系统图法系统图法是把用于功能分析的功能系统图和方法应用到全面质量管理中的一种方法。\n五、其它质量管理新工具简介矩阵图法矩阵图法是借助数学上的矩阵形式,把与问题有对应关系的各个因素排列成一个矩阵图,然后对矩阵图进行分析找到关键点,进而使问题得到解决的方法。矩阵数据分析法在矩阵图中,如果“关键点”不用符号表示,而用数据表示,这样就可以对这些数据进行解析运算,得到所需的结果。这种方法称为“矩阵数据分析法”。箭头图法箭头图法即网络分析技术,又称矢绘图法,它是计划评审法在质量管理中的应用,用来制定质量管理日程计划,明确管理的关键,进行质量管理进度控制等。过程决策程序图法(Processdecisionprogramchart)过程决策程序图法简称为PDPC法,它通过对事态发展过程中可能出现的各种问题,拟订多种对策方案,并运用程序图来确定一条获得最佳结果的途径。\n六、提高产品质量的经济效益分析图提高产品质量,一方面通常需要使用更精密的设备,改用更新的工艺,增加检测的工序和工具,进行科学试验和研究等,这些都会引起生产成本相应的增加,另一方面,产品质量提高后都会减少废次品和返工费用,节约原材料和其他费用。由图10.6.4可以看出,当质量水平低于A点或高于C点时,企业将会亏损,当质量水平高于A而低于B时,企业能盈利。a、c两点即为企业盈亏平衡的分界点。当质量水平处于B点时,其价格曲线与成本曲线的距离最大,说明此时企业可获得单位产品的最高利润,对企业而言,B点的质量水平就是最佳质量水平。\n六、提高产品质量的经济效益分析图对于一些耐用产品,用户不仅在购买时支付购买费用,而在使用期间也要支付一定的使用费,如能源消耗、维修、保养等费用。对用户来说,购买和使用的总费用为最小,而在使用中又能满足需要的产品才是最受欢迎的。质量水平与购买费用、使用费用的关系如图10.6.5所示。\n本章小结工业产品的质量可分为内在质量和外观质量;目前我国产品质量标准有四种:国际标准、国家标准、部颁标准和企业标准;目前我国产品质量标准有四种:国际标准、国家标准、部颁标准和企业标准根据质量变异的来源,可以把产品质量因素划分为一般因素和特殊因素。一般因素包括:人员(man)、机器(machine)、原材料(material)、加工方法(method)、测量工具(measure)和环境(environment),简记为5M1E,产品质量变异的特殊因素指偶尔发生且能辨认出来的因素,它们要么能被消除,要么至少可以被解释\n本章小结产品质量特性值的变异体现在反映质量特性数据的波动上,质量数据的变异一般表现为分散性和集中性两种基本特性。过程能力又称工序能力表示了工序固有的实际加工能力,过程能力指数又称工序能力指数或工程能力指数,是指加工质量标准与过程能力的比值。根据工序能力指数,可以对过程能力进行分析和判定,如当时CP>1.33,过程能力充分满足;当1≤Cp≤1.33时,过程能力尚可;当CP<1时,过程能力不足。产品质量控制图可以通过监视生产过程的质量波动情况,分析工艺过程中出现的异常因素,并采取相应的控制措施,使过程质量状态得到良好的控制。\n本章小结产品质量控制图可分为两大类:计量数据控制图和计件数据控制图;计量数据控制图适用于产品质量数据为连续变量;计数数据控制图适用于产品的质量数据为不连续变量,只能以正整数来表示的产品的质量特性;在控制图中按照区分偶然因素和系统因素的数理统计的典型分布规律及公差要求,于处定出两条平行的上下控制界限和中心线;产品质量控制是统计学与数据分析方法在制造业和服务业中比较重要的应用领域。产品质量控制在服务业中也很重要,它确保客户得到准确无误、前后一致的服务。