- 2022-08-13 发布 |
- 37.5 KB |
- 233页



申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
《应用统计学》课件
应用统计学\n任务一认知统计\n任务一认知统计统计是一门与数据打交道的学问,研究怎样搜集、整理、计算和分析数据,然后从中找出某些规律.统计与实际生活息息相关,在生活实践中有着广泛的应用,比如人口增长情况的研究,粮食生产情况的研究,交通状况的研究,体育项目成绩的研究,学生体能测试情况等等,各个部门都离不开统计.\n任务一认知统计在更加注重应用性数学的今天,能用数学的眼光认识世界,并能用数学知识和数学方法处理周围的问题,是每个人应具有的基本素养.而且中考也更加注重了对应用能力的考查,所以我们应该学好统计的知识.\n统计学的分类及其与其他学科的关系一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。统计学的分支学科有:统计学史理论统计学统计调查分析理论统计核算理论统计监督理论\n统计预测理论统计逻辑学统计法学描述统计学推断统计学经济统计学宏观经济统计学微观经济统计学管理统计学科学技术统计学农村经济调查社会统计学教育统计学文化与体育统计学\n卫生统计学司法统计学社会福利与社会保障统计学生活质量统计学人口统计学环境与生态统计学自然资源统计学环境统计学生态平衡统计学国际统计学国际标准分类统计学国际核算体系与方法论体系国际比较统计学\n其他生物统计学商务统计学工程统计学心理统计学化学统计学档案统计学社会经济统计学水文统计学数理统计学统计语言学统计物理学化学统计学\n统计物理学人口统计心理统计学教育统计学社会统计(包括所有的社会科学﹚文献统计分析化学与程序分析(所有有关化学的资料分析与化工科学)运动统计学,特别是棒球以及曲棍球\n延伸学科有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:农业科学生物统计商用统计资料采矿(应用统计学以及图形从资料中获取知识)经济统计学电机统计\n任务描述与分析A市自来水公司承担着为A市城镇居民、农村居民和企业用户提供自来水的业务,为进一步提高服务质量,了解自来水公司服务水平和存在的问题,公司拟对本市城镇居民进行一次客户满意度调查。如果由你承担该调查项目,你该如何开展这项工作呢?\n思考问题(1)你应向谁调查?(2)调查时应从哪些方面了解客户的满意度?(3)如何从总体上评价客户的满意度?(4)应如何着手进行这项工作?\n相关知识知识一、统计的研究对象知识二、统计的工作方法知识三、统计的基本概念认识统计\n统计的研究对象案例1-1请思考:下列资料中“统计”的含义是什么?(1)小王是某市统计局的公务员,他的日常工作就是完成各项统计任务。(2)小王经常打电话与有关企事业单位联系,要求他们及时上报统计数据。(3)小王是某大学经济管理系统计专业的毕业生。统计工作统计资料统计学工作与工作成果关系实践与理论关系\n统计的研究对象案例1-2根据国家统计局2010年2月11日发布的调查结果,2010年1月份,全国70个大中城市房屋销售价格同比上涨9.5%,环比上涨1.3%。上述统计数据一经公布,在社会上引起了广泛反响,由于2009年下半年以来各地房地产价格都有明显增长,各界人士对国家统计局的房屋销售价格增长幅度数据提出了质疑。那么我们应该怎样来看待这起事件呢?让我们先从统计的研究对象的角度去认识这个问题。统计的研究对象是客观现象的总体数量特征和数量关系。数量性总体性客观性\n统计的工作方法案例1-3:如果老师要求你组织一次班级联谊活动,你会如何开展工作呢?统计工作过程\n统计的工作方法统计分组法指:根据事物的内在性质和统计研究任务的要求,将总体单位按照某种标志划分为若干组成部分的研究方法。例如:人口按年龄分组、企业按经济类型分类、国民经济按部门分类等。大量观察法指:统计研究社会经济现象和过程,要从总体上加以考察,就总体中的全部和足够多的单位进行调查观察并加以综合研究。四、统计学的研究方法大量观察法统计分组法综合指标法归纳推断法综合指标法是指:运用各种统计综合指标来反映和研究社会经济现象总体的一般数量特征和数量关系的研究方法。归纳是一种从个别到一般,从事实到概括的一种推理方法,推断是通过对样本数据的观察,推断出总体的数量特征的研究方法。从某种意义上说,统计工作搜集的资料都是样本资料,样本资料分散、零碎,必须经过整理归纳才能据此推断总体的数量特征。所以归纳推断法在统计分析中得到广泛应用。\n统计的基本概念统计总体是指根据一定的目的要求所确定的研究事物的全体、它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。总体单位是构成统计总体的个别事物。统计总体与总体单位总体的分类:有限总体和无限总体总体的特征:同质性大量性变异性总体单位构成了统计总体,总体是由总体单位构成的,没有总体单位,就没有统计总体。案例1-4:在开展A市自来水公司客户满意度调查前,请思考一下,你的研究对象包括哪些?\n案例1-4解析A市自来水公司开展客户满意度调查的统计总体是A市使用自来水的所有客户,包括城镇居民、农村居民和企业。A市自来水公司的客户满意度调查的总体单位是A市每个自来水用户,具体可分解为每一个城镇或农村居民、每一个企业。现在你已经明确了A市自来水公司的客户满意度调查这个统计项目的统计总体和总体单位,那么请你思考下一个问题,你该从哪些方面了解客户对自来水公司的评价呢?案例1-5\n单位标志性别年龄民族宗教信仰政治倾向身高体重男汉族佛教无党派43岁182cm75公斤标志表现品质标志文字表述数量标志数据表述标志值可变的数量标志称为变量,变量的数值表现就是变量值\n标志与标志表现标志:简称标志,指说明总体单位属性或特征的名称。标志表现:标志的具体表现形式。品质标志数量标志不变标志——各单位具体表现相同可变标志——各单位具体表现不同标志不变标志可变标志常量或参数变量离散变量连续变量变量值(标志值)\n统计指标与指标体系指标:反映总体数量特征的范畴。如工业总产值、商品销售额等。指标构成:指标名称、数值、计量单位、时间、空间2005年我国国内生产总值182321亿元例如:我班同学入学的平均成绩300分按反映的数量特点不同分类数量指标质量指标\n标志是表征个体特征的量。指标是反映总体数量特征的概念和数值。标志与指标的区别与联系联系:(1)一些数量标志汇总可以得到指标的数值;(2)数量标志与指标之间存在变换关系。区别:(1)标志是说明总体单位特征的,而指标是统计总体数量特征的;(2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。\n统计指标体系:是各种相互联系的指标构成的整体,用以说明所研究现象各方面相互依存和相互制约的关系。\n任务二统计设计与统计调查\n任务描述与分析通过前面的学习,你对统计工作的内容和方法有了初步了解。现在,你要开始着手进行这次A市自来水公司客户满意度的调查工作了。你应该已经知道,统计分为统计设计、统计调查、统计整理和统计分析4个阶段,现在你首先要对整个调查工作进行整体设计,然后根据设计方案有计划地开展调查活动,在规定的时间内从A市自来水公司的客户那里获得准确可靠的原始统计资料,为下一阶段的统计整理分析提供基础资料。\n思考问题在统计设计阶段你需要解决以下问题。(1)统计设计的内容包括哪些方面?(2)在进行统计设计时应注意哪些问题?在调查阶段你还要解决以下问题。(1)统计调查阶段需要考虑哪些方面的问题?(2)用什么样的方法可以获得调查资料?(3)如何确保这些资料的质量?\n统计设计是统计工作的第一阶段,是根据统计研究对象的性质和研究目的,对统计工作的各个方面和各个环节所做的总体考虑和安排。统计设计的内容明确统计的研究目的设计统计对象设计统计内容设计统计调查方法设计统计工作任务分工设计统计工作进度组织和协调统计工作\n设计统计内容①明确并统一指标概念。统计指标是反映总体某一特征的概念范畴,使用指标反映总体特征时,必须对统计指标的概念作出明确的规定,杜绝别名等不规范名称的使用,以保证汇总等统计工作的顺利进行。②确定统计指标口径范围。这是指确定所要调查的总体的时空范围。③规定统计指标的分类方法、计算和计量方法及某些假定前提等重要问题。④选择合适的调查方式和搜集资料的渠道。⑤进行可行性研究。即进行试点工作,评估基层的承受力,发现和研究解决初步设计中未考虑的问题。⑥制定统计制度。即制定统计指标和指标体系有关的表式、说明、实施办法,并履行法定的审批手续,才能付诸实施。单位标志的设计总体指标的设计\n某企业生产经营状况的指标体系图\n案例2-1解析之一:现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你如何设计统计指标体系?\n统计设计是统计工作的第一阶段,是根据统计研究对象的性质和研究目的,对统计工作的各个方面和各个环节所做的总体考虑和安排。统计设计的内容明确统计的研究目的设计统计对象设计统计内容设计统计调查方法设计统计工作任务分工设计统计工作进度组织和协调统计工作\n案例2-1解析之二:现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你如何设计工作任务的分工呢?\n统计调查统计调查的基本要求准确性及时性完整性要求采集的数据要准确无误地反映事物的本来面目,不得伪造、篡改、虚报、瞒报调查数据。按照调查方案中的时间要求,及时地将采集到的数据上报,不得拖延。要求调查单位要全面、调查资料要全面。\n统计调查的种类根据被研究总体的范围划分全面调查非全面调查按调查登记的时间是否连续划分经常性调查一次性调查根据调查组织方式统计报表专门调查总体现象一定时期内的数量变化总体现象在一定点上的状态\n按调查目的和调查对象的不同直接观察法报告法采访法问卷法\n统计调查方法抽样调查普查统计报表重点调查典型调查\n普查涵义普查是专门组织的,一般用来调查属于一定时点上社会经济现象数量的全面调查。特点普查是专门调查普查是全面调查普查是一种不连续调查普查通常是一次性的或周期性的普查必须规定标准调查时间作用普查主要用来搜集那些反映国情国力方面的基本统计资料。例如:人口普查、工业普查、物资库存普查、乡镇企业普查、商业饮食业普查等等。\n现代普查的特点:①法制化。如:逢0人口普查、逢3第三产业普查、逢5工业普查、逢7农业普查、逢1、6基本统计单位普查等。②周期化。如每5年或10年进行一次。③内容多样化。如我国第一次人口普查6个普查项目,第五次则为49项;美国则为70项。④安排协调化。⑤手段现代化。▼\n普查应注意的问题⑴规定标准时点。例如:我国第五次人口普查标准时点是2000年11月1日零时。按照标准时点登记,以免重复和遗漏,保证普查资料的准确性。⑵规定普查登记的统一程序和期限。包括普查工作进行的起止时间;每一步骤所用的时间。⑶规定普查项目。普查的项目必须统一规定,不能任意改变或增减;力求前后次同类性质普查的基本项目的连续性和相对稳定。⑷做好充分准备。做好人、财、物、培训等各项准备工作,包括组织准备、方案设计、试点工作等。▼\n抽样调查抽样调查是一种非全面调查,它是按照随机原则从总体中抽取部分单位进行观察,用以推断总体数量特征的一种调查方式。是一种非全面调查,但是又要达到对总体数量特征的认识。按照随机原则抽选调查单位。经济性、时效性、准确性、灵活性能够解决全面调查无法或难以解决的问题。可以补充和订正全面调查的结果。可以用于对总体的某种假设进行检验。作用特点涵义优点\n重点调查与典型调查都属于非全面调查二者共同点根据客观标准选择重点单位在对现象分析的基础上有意识地选择典型单位调查目的不同选择调查单位的方法不同重点调查典型调查重点调查的目的是反映总体的基本情况典型调查的目的是推算总体的数量特征二者区别\n统计调查方案确定调查的时间、空间和方法确定调查项目制定调查工作的组织实施计划调查表格和问卷的设计确定调查对象和调查单位确定调查目的和任务\n调查对象是根据调查目的确定的调查研究的总体或调查范围。调查单位是构成调查对象的每一个单位,是搜集数据资料的基本单位。调查对象和调查单位所解决的问题是:——向谁调查?——由谁来提供所需资料?例如:人口普查的调查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人。人口普查的调查单位是每一个人。注意:调查单位与报告单位的区别。调查对象和调查单位报告单位也称填报单位,负责提交统计资料的单位。下列问题的调查单位和报告单位分别是什么?1、工业普查2、工业企业设备状况普查\n它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;调查表是用于登记调查数据的一种表格调查项目是调查的具体内容也可以是调查单位的某种属性特征,如一个人的性别、职业,一个企业的经济类型等。某企业基本情况报表(表头)制表机关:调查项目项目代码计量单位实际数值甲1人乙2台丙3人…………表体调查项目和调查表调查表两种形式:1、单一表2、一览表\n为确保调查资料的准确性,统计调查必须规定这两种时间是调查资料所属的时间。即规定所调查的是哪个时期或时点的资料。是进行调查工作的期限。即从调查工作开始到结束的时间长度。例如:第六次人口普查规定的标准时间是“2010年11月1日0时”,并要求在“2010年11月1日至10日完成普查的登记工作”。2010年11月1日0时就是调查时间,2010年11月1日至10日就是调查时限。调查时间:调查期限:调查时间和时限调查的组织工作这项内容包括的比较多,如调查机构的确定,调查人员的选择、培训,调查经费的来源和支出预算,以及其它一些调查工作的准备等。\n调查资料的质量控制准确性完整性及时性登记性误差代表性误差由于各个环节工作的不准确而发生的误差。这种误差可以避免根据样本单位的数量特征推断总体数量特征时产生的误差。这种误差不可避免登记性误差:逻辑检查、计算检查代表性误差:可计算出误差,并通过调整一些条件控制误差的大小。检查方法\n任务三统计整理\n任务描述与分析经过前期艰苦的统计调查,你已经从A市自来水公司的客户那里获得了原始的调查资料,统计调查阶段结束。现在你的统计工作开始进入统计资料整理阶段,这一阶段你的任务是将收集来的零散的、不系统的、甚至是存在虚假差错的统计资料进行整理,为下一阶段的统计分析创造良好的条件。\n思考问题(1)资料的整理大致分为哪些工作环节?(2)使用什么方法能够使零散的原始调查资料条理化?(3)在汇总调查资料时,使用手工汇总还是计算机汇总?(4)使用什么方法把整理好的调查资料表现出来?\n统计资料整理是统计工作的第三个阶段,是统计人员根据统计研究的目的,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化,从而得到表现总体特征的综合统计资料的工作过程。统计整理的步骤设计统计整理方案对原始资料进行审核录入数据数据排序与分组绘制统计表和统计图\n统计分组案例3-1:某班级共50位学生,以下是某次统计考试的卷面成绩,请对该班的学习成绩进行具体分析。8975604895887890669374715885806979779270615581836662517290866573836186678271519269778782797275807658\n表3-1某班学生统计考试成绩分组表按成绩分组学生人数(人)60分以下0660~70分1070~80分1580~90分1390~100分06合计50从表3-1中可以看到,某班学生的统计考试成绩经过分组整理后,能够比较直观地反映该班的总体成绩情况了。\n表3-2某市100个商店流通费用率情况按销售额分组(万元)商店数(个)流通费用率(%)100以下1011.8100~2002011.2200~3003010.5300~4002509.7400以上1508.9由表3-2的分组资料可见,销售额与流通费用之间具有明显的依存关系,即销售额越大,每百元销售额中的流通费用越小。\n统计分组的步骤一、选择分组标志二、确定分组界限三、编制分配数列\n正确地选择分组标志是统计分组的关键。分组标志一旦选定,就突出了总体在该项标志下的性质差别,而掩盖了总体在其他标志下的不同。对同一总体按不同标志进行分组会得到不同的分组结果甚至相反的结论。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质。一、选择分组标志根据统计研究的目的和任务选择分组标志要选择最能够反映现象本质的标志作为分组标志要考虑现象所处的历史条件和经济状况及标志内涵的变化来选择分组标志\n二、确定分组界限在学习确定分组界限之前,我们先来了解一些分组中用到的概念。根据分组标志的不同,统计总体可以按品质标志分组,也可以按数量标志分组。按品质标志分组按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志是指选择反映现象属性特征的品质标志作为分组标志例如:学生按性别分组统计学生的考试成绩,按成绩分组统计分组应达到的要求同一组内的单位性质相同,不同组所包括的单位性质相异。穷举性、互斥性\n简单分组对总体只按一个标志进行分组复合分组对同一总体,先按一个主要标志分成若干组,再按其他辅助标志在对各组细分,形成多层次分组组合。国民收入累积额生产性非生产性固定资产流动资产固定资产流动资产国民收入累计额:平行分组体系:对同一总体,分别按几个标志进行简单分组按用途分生产性非生产性按性质分固定资产流动资产\n案例3-2解析提示:其实在设计调查问卷时就已经涉及分组概念了,调查问卷上的每一个调查项目(标志)都已进行了分组。例如,问卷中的问题D1,“对于A市自来水有限公司提供的自来水的质量,您的满意度如何?”,这个调查分为“无特殊气味”、“无杂质”、“无色”、“无特殊味道”等4个项目,分别按“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”进行了分组。案例3-2:现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你觉得会使用哪些分组方法?\n二、编制分配数列分配数列又称分布数列、次数分布,是指在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布。分布数列是统计整理结果的一种重要表现形式,也是统计分析的一种重要方法。它表明了总体单位分布的特征和结构状况,为进一步研究总体的构成、计算统计指标提供了方便。品质分配数列变量分配数列单项数列(P43表3-6)组距数列等距数列不等距数列分配数列\n在进行组距分组时,会涉及到一些问题,包括:等距分组和不等距分组、组限、组距、组中值等。\n组限组限就是每一组两端的数值。10—2020—3030—40下限上限职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90衔接式确定组限适用于离散变量重叠式确定组限适用于连续变量衔接式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。重叠式确定组限:汇总各组单位数时,按照“上限不在本组内”的原则汇总。\n组距变量值在各组变动的最大范围。组距计算方法:重叠式组限的组距=上限-下限职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90衔接式组限的组距=大邻组的下限-本组下限\n等距分组各组组距均相等。如:10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。不等距分组各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。\n组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2=下限+组距/2=上限-组距/2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75闭口组:上限、下限都具备开口组:只有上限或下限的组······以上·······以下\n其基本步骤为:第一步:将原始资料按数值大小依次排列,计算全距。第二步:确定变量数列形式(确定编制单项式数列还是组距式数列)。第三步:确定组距和组数。全距=最大变量值-最小变量值组数=全距÷组距组距应尽可能取5或10的倍数变量取值不多且变量值的变动范围不大时,适宜编制单项数列。当变量值取值较多或变量值差异很大时,适宜编制组距数列。\n第四步:确定组限。注意1、组限最好用整数表示,如果组距是5或10等,则每组的组限最好是他的倍数2、第一组下限略小于资料中的最小变量值,最末组上限略大于资料中的最大变量值;3、无极大或极小的极端数值时,则采用闭口组;如果变量值相对比较分散,为了不出现空白组,跟好地反映总体的分布情况,则应采用开口组。3、对于连续型变量,应采用重叠式组限,而对于离散型变量,二种方法都可以采用。第五步:汇总出各组的单位数,计算频率,并编制统计表。\n序计划完成工人数频率向上累计向下累计号程度(%)(人)(%)人数频率人数频率160—7021.0270—8052.5380—90147.0490—1003115.55100—1106532.56110—1205226.07120—1302311.58130—14084.0合计2001002721521171691922001.03.510.526.058.584.596.0100831831481791931982004.015.541.574.089.596.599.0100\n案例3-3:现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你该怎样编制分配数列?下面以编号为D1的问卷处理为例,说明其编制分配数列的方法。按客户对自来水质量满意度分组无特殊气味无杂质无色无特殊味道客户数(人)比率(%)客户数(人)比率(%)客户数(人)比率(%)客户数(人)比率(%)非常不满意51.2571.7592.2530.75不满意287.004611.505413.50246.00一般12832.0012230.5010526.2511629.00满意17142.7517243.0017343.2519548.75非常满意6817.005313.255914.756215.50合计400100.00400100.00400100.00400100.00\n统计表和统计图统计表——数据代替文字描述,便于统计结果的精确、简洁的表达和对比分析统计图——用图形代替数据,获得直观、形象的效果\n统计表的结构\n简单表:指未经任何分组的统计表又称一览表年份销售额(万元)2006年51582007年56492008年66872009年7103\n简单分组表:指只用一个标志分组形成的统计表简称分组表\n复合分组表:指按两个或两个以上标志进行分组简称复合表按各城市自来水用户性质分组自来水用水量(亿立方米)A市4.5企业用户2.4居民用户2.1B市6.5企业用户3.8居民用户2.7C市4.3企业用户2.5居民用户1.8……各城市某年自来水用水量统计\n(1)统计表的各种标题,特别是总标题的表达,应该十分简明、确切,能够概括地反映出统计表的基本内容。总标题还应该标明资料所属的时间和空间。(2)统计表的左右两端习惯上均不画线,采用开口式。表的上下横线最好用粗线,纵栏之间用细线分开,横行之间可以不加线。(3)如果统计表的栏数较多,通常要加以编号,主词和计量单位等栏用(甲)、(乙)、(丙)等文字标明;宾词指标各栏用(1)、(2)、(3)等数字编号。各栏之间若有计算关系,可以用数字符号表示。如(3)=(2)×(1),表示第(3)栏等于第(2)栏乘以第(1)栏。(4)表中数字应该填写整齐,对准位数,同类数字要保持有效的统一位数。当数字为0或因数小可忽略不计时,要写上0;当缺乏某项资料时,用符号“…”表示;不应有数字时用符号“—”表示。表内如有相同的数字时,应全部重写一遍,不能用“同上”、“同左”等字样表示。(5)表中的横行“合计”,一般列在最后一栏(或最前一栏),表中纵栏的“合计”一般列在最后一行。(6)统计表中必须注明数字资料的计量单位,当表中只有一种计量单位时,可以把它写在表头的右上方。如果表中需要分别注明不同的单位,横行标题的计量单位可以专设一栏,纵栏标题的计量单位,要与纵栏标题写在一起,用小字标写。(7)必要时,统计表应加注说明或注解。例如,某些数字是由估算来插补的,某些资料只包括一部分地区,这些都需要加以说明。设计规则\nExcel直方图折线图曲线图饼图统计图\n直方图是用宽度相等、高度或长短不同的柱形来表示现象之间对比关系的统计图,故又被称为柱形图直方图\n折线图是在直方图的基础上,将每个长方形的顶端中点用折线连接而成,或用组中值和频数相应的坐标点连接而成折线,来绘制折线图。描述某种现象随时间变化而变化的趋势,通过分析其规律,来预测未来发展变化。折线图\n曲线图是将纵横坐标相交的实心点以光滑的曲线相连接而形成的图形。曲线是表现连续型变量数列次数分布的常用形式,适用于变量值非常多或变量数列的组数非常多的情况。曲线图\n饼图又称圆形图,是以圆形面积或以圆内各扇形面积的大小来表示指标数值大小的图形,它常用于反映总体的内部结构。饼图\n任务四总量分析和相对分析\n任务描述与分析通过对统计资料的整理,统计数据现在呈现出有序的状态。从现在开始,你要学习如何利用这些收集的数据资料对调查对象的内在特点和相互关系进行定量分析,实现对事物从现象认识到本质认识的飞跃。从A市自来水公司的客户满意度调查项目来看,我们已经获得了客户对自来水公司经营的多个方面的评价资料,现在你需要思考的是:你应该如何概括这些数据?应该从哪些方面去概括这些数据呢?\n任务分析经过统计整理后的调查资料虽然已经较为系统有序了,但大量的原始数据还不能被用来概括说明问题,在向公众或公司管理层说明企业的客户满意度情况时,我们必须使用概括性的数据来说明调查总体的情况,在分析A市自来水公司的客户满意度时,我们还需要从多个角度,通过对比分析的方式来认识企业目前的客户满意度水平。\n概念:总量指标是反映社会经济现象总规模、总水平的综合指标。(1)总量指标是认识社会经济现象的起点。表明社会的基本情况。比如:我国2007年,国内生产总值246619亿元,粮食产量50150万吨,工业增加值107367亿元。年末人口132129人,表明了我国经济及社会的基本情况。(2)总量指标是编制计划、实行经济管理的主要依据。有时总量指标也可以表现为同一总体在不同的时间、空间条件下的差数。意义和作用:例:2010年9月1日A市自来水用水量为90万立方米,这一统计数字可以概括地说明特定时间段内A市自来水的用水量总水平。问题:要了解我们学校的情况,我们需要了解哪些总量指标?总量指标(3)总量指标是计算相对指标和平均指标的基础。例如:人口性别比是男性人口与女性人口之比,单位面积产量是总产量与播种面积之比。\n总量指标的种类总量指标的分类按反映时间状况按所采用的计量单位按反映的内容总体单位总量总体标志总量时期指标时点指标价值指标实物指标劳动量指标说明现象在一段时间内发展过程的总数量的指标,如工业总产值、人口出生数。现象在某一时刻上总数量的指标。如人口数\n1.总体单位总量。即构成总体的单位数之和。2.总体标志总量。即总体中各单位某一标志值(或变量值)的总和。年份企业数工人总数工业总产值利税总额年末固定资产总额(万元)(万元)(万元)(万元)199716473900204510638502237519981607580019758559780223931999161756702013486237522516(单位总量)(标志总量)\n思考题:要调查某市所有学校的教学环境,调查得知全市学校的学校总数、教师总数、在校学生总数、固定资产总额、教育经费、教职工工资总额等总量指标,你能判断出它们属于总量指标中哪种具体种类吗?\n相对指标概念:它是两个有联系的统计指标数值的比值。意义:通过相对指标的计算,反映现象的发展速度、结构、强度、密度、普及程度、计划完成程度或比例关系。例如:2005年全年农村居民人均纯收入3255年,将它与2004年农村居民人均纯收入作比较,则农村居民人均纯收入增长6.2%作用:1.反映社会经济现象之间的相对水平和联系程度。如:人们常用计划完成相对指标判断一个企业计划任务的完成情况,用人均国民收入衡量一个国家的经济实力,用耐用消费品的平均拥有量评估一个地方的生活状况。某企业去年实现利润50万元,今年实现55万元,则今年利润增长10%.2.提供了现象之间的比较基础。相对指标把总量指标之间的具体差异抽象化了,使不可比的现象转化为可比现象。3.是国家进行宏观管理和考核评价企业经济活动效果的重要工具。例如:在宏观经济管理中,广泛的运用各种相对指标进行检查、监督和分析国民经济的发展速度、比例、效益。\n相对指标的表现形式无名数:常用倍数或系数、成数、百分数和千分数来表示。例如:我国2003年人口的男女性别比例为1.04:1.00成数:将对比基数抽象化为10来计算的相对数,如粮食产量增加一成,表明粮食产量增长1/10。有名数:以双重计量单位表示。如:人均粮食产量用克/人表示,人口密度用人/平方公里表示\n相对指标的种类及计算方法结构相对数。是以总体总量为比较指标,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。它是总体单位和总体标志值的结构。结构相对指标=(各组比重总和=1)根据对比的基础不同,相对指标可以分为计划完成相对指标、结构相对指标、比较相对指标、比例相对指标、强度相对指标和动态相对指标6种。\n32轻工业产值占比重(%)=X100%=64%50计算结果表示该组在总体中的地位和作用。(1)结构相对数是在统计分组的基础上进行的计算;(2)一般用百分数或成数表示;(3)分子、分母不能调换;(4)各组的比重之和为100%或1。例1,某地区2003年工业总产值为50亿元,其中轻工业总产值为32亿元,则轻工业产值占比重:\n2.比例相对数。是总体不同部分数量对比的相对数,接以分析总体范围内各个组成局部之间比例关系和协调平衡状况。通常以总体各组总量指标对比,也可运用总体各部分的平均数或相对数对比。比例相对指标=\n519性别比例(%)==1.063:1488(1)可运用现象各部分的相对数或平均数进行对比;(2)强调的是同一总体内的部分与部分数值的比较;(3)分子、分母可以调换;(4)对比的结果表示所研究总体中的一部分与另一部分的比例关系,用以研究现象的比例是否合理、协调。例2,某地区第四次人口普查结果为,男性为519万人,女性为488万人,则:性别比为:\n3.比较相对数。是不同单位的同类指标对比而确定的相对数,借以说明同类现象在同一时期内各单位发展的不平衡性。其不同空间可以指不同国家、不同地区、不同部门、不同单位。一般用系数、倍数、百分数形式表示。其计算公式为:比较相对指标=2008年甲商业企业人均销售额为2020万元,乙商业企业人均销售额为1590万元,则:\n960我国为日本==25.4(倍)37.8(1)比较相对数强调的是不同总体(或不同空间)同类现象数值的比较;(2)分子、分母可以调换;(3)计算结果可说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类事物在不同条件下的数量对比关系。例3,我国面积为960万平方公里,日本为37.8万平方公里,则我国面积与日本比较:\n4.强度相对数。是两种性质不同而又有联系的属于不同总体的总量指标之间的对比,用以表明某现象在另一现象中发展的强度、密度和普遍程度。其计算公式为:强度相对指标=某城市2008年有商业零售机构5000个,人口为100万人,则该市零售商业网密度指标为:\n5485人均国民收入==532.3(元/人)103049.5(1)是不同类现象的对比;(2)对比的结果表示现象的强度、密度或普遍程度,可以说明一个国家、地区或部门的经济实力或为社会服务的能力,同时,借助于该指标进行国家、地区之间的比较,确定发展不平衡和发展的差距;(3)有正指标和逆指标之分,一般来说,正指标越大越好,逆指标则越小越好;例4,某年我国国民收入为5485亿元,年平均人口为103049.5万人,则人均国民收入:\n例如,某市商业网点情况:商业网机构数(个)每千人拥有的机构数==个/千人该市人口数(千人)该市人口数(人)每个机构服务的人数==人/个商业网机构数(个)(4)该指标的数值一般用复合计量单位表示。\n第一,有些指标数值是用有名数表示的,一般用双重计量单位,如上例中的“人/个”;也有些指标数值是无名数表示的,如流通费用率、资金利稅率等就是用百分数表示的。第二,强度相对指标具有平均之意,如按全国人口分摊的人均国民收入、人均钢产量、人均粮食产量、人均煤产量。\n5.动态相对数。一般指发展速度指标。是同类指标在不同时间上的对比,借以反映同一现象在不同时间上的发展变化情况。其计算公式为:动态相对指标=\n5002003年为2002年(%)=*100%=111%450(1)动态是时间上的发展,动态相对数是同一企业不同时间同一指标的对比,又称发展速度;(2)计算结果表示同类事物的水平报告期为基期的发展变化程度。例5,某企业2003年产值为500万元,2002年为450万元,以2002年为基期,则2003年是基期的:\n6.计划完成程度相对数。是现象在某一段时间内的实际完成数与计划任务数对比,借以检查计划完成的程度。其基本计算公式为:计划完成程度相对指标=(1)该指标的计算其分子、分母的数据,可以为绝对数,也可以是相对数;(2)对于短期计划完成情况的检查,其具体形式有以下几种:本期实际完成数计划完成程度=本期计划数\n4200甲产品计划完成(%)=*100%=105%4000第二种情况:计划数为相对数时:当实际数和计划数均为相对数时,应根据以下两种情况处理:*以提高率相对数形式规定,其计划完成程度指标的计算为:1+实际提高率计划完成程度=1+计划提高率例6,某工业企业2003年计划生产甲产品4000件,实际生产了4200件,则:\n100%+15%劳动生产率计划完成程度==104.5%100%+10%*以降低率相对数形式出现时,计划完成程度指标的计算。则:1—实际提高率计划完成程度=1—计划提高率例7,某工业企业2003年度计划劳动生产率比上年提高10%,实际提高了15%,则:\n产品成本100%—8%计划完成程度=*100%=96.8%100%—5%例8,某工业企业2003年度计划甲产品成本降低5%,实际降低了8%,则:\n注意:在对长期计划完成情况进行检查时,需要运用以下方法:1.计划数按计划期内应完成的总数规定的,在这种情况下,计算计划完成程度指标时,可运用“累计法”进行,即:计划期内实际完成的累计数计划完成程度=计划期内计划完成的累计数\n例9,某地区某五年计划规定的固定资产投资额为3850万元,各年实际完成情况如下表:年份19961997199819992000固定资产投资80090095010101025额(万元)4685则五年计划完成情况=*100%=121.70%3850\n\n任务五总体分布分析\n任务描述与分析通过前期的总量分析和相对分析,我们对A市自来水公司客户的情况有了一些了解,但我们目前还没有一个指标能够从总体上概括所有客户的满意程度。我们知道有些客户对自来水公司很满意,有些客户不满意,如何消除这些个体之间存在的明显差异,从中反映出A市自来水公司客户满意度的一般水平呢?现在你的统计工作开始进入总体分布统计分析阶段,这一阶段你的任务就是要从总体上用综合性的数据来概括所有客户的满意度,这个分析过程必须抽象化资料的个体差异,反映出总体的集中趋势(一般水平),并且要评价这个数据的代表性,从而帮助我们认清总体的分布特征。\n任务分析(1)有哪些指标可以反映总体某一数量特征的一般水平?(2)这些指标的计算方法是什么?(3)我们计算出来的一般水平代表性有多大?(4)哪些指标可以反映这些代表性,如何计算?\n总体分布离中趋势总体分布集中趋势标志变异指标平均指标\n一、平均指标的意义标指均平反映总体数量特征的一般水平把总体各单位标志值的差异抽象化了平均指标是个代表值,代表总体各单位标志值的一般水平。它反映了总体分布的集中趋势平均指标的特点平均指标\n概括说明总体的一般水平用来比较不同单位的同类指标在相同时期的发展状况用来比较同一单位的同类指标在不同时期的发展状况还可以用来分析现象之间的依存关系等平均指标的作用\n数值平均数位置平均数按计算方法分平均指标的分类算术平均数调和平均数中位数众数几何平均数\n平均指标的计算与分析(一)算术平均数=总体标志总量总体单位总量简单算术平均数未分组数列例5-1:某生产班组10工人日产量分别是:17、18、18、19、19、19、19、20、20、20,则该班组的平均日产量为:\n加权算术平均数分组数列\n某生产班组工人日产量资料如表5-1所示,计算该生产班组的平均日产量。表5-1某生产班组工人日产量分组表按日产量分组(件)x工人数(人)f各组总产量(件)xf17117182361947620360合计1001890根据上述资料,计算该生产班组平均日产量为:18.9(件/人)\n例5-3某车间工人日产量资料如表5-2所示,计算该车间工人的平均日产量。表5-2某车间工人日产量分组表按日产量分组(件)工人数(人)各组总产量(件)4~8080488~121010012~163042016~202443220~2408176合计8011760\n按日产量分组(件)组中值(件)x工人数(人)f各组总产量(件)xf4~806080488~12101010012~16143042016~20182443220~242208176合计—801176014.7(件/人)\n算术平均数的局限性(1)算术平均数容易受极端数值的影响。(2)当组距数列存在开口组时,组中值根据邻组组距来计算,假定性很大,平均数的代表性也会受到比较大的影响。\n几何平均数n个变量值连乘积的n次方根简单几何平均数加权几何平均数未分组数列分组数列\n例5-4某机械厂生产机器,设有毛坯、粗加工、精加工、装配4个连续作业的车间,各车间某批产品的合格率分别为96%、93%、95%、97%,求各车间制品平均合格率。车间毛坯粗加工精加工装配合计合格品数量全部产品数量合格率1009696%968993%898595%858297%1008282%全厂产品的合格率并不等于各车间制品的合格率总和总合格率=96%×93%×95%×97%=82%\n例5-4将一笔钱存入银行,存款期为15年,按复利计算利息,其15年利率的分布情况是:有2年为5%,有3年为8%,有5年为10%,有4年为12%,有1年为15%。现要求计算各年的平均年利率。表5-5平均利率计算表年利率(%)年数f年本利率(%)x年本利率加权xf521051.10831081.261041101.461251121.761511151.15合计15——平均年利率\n几何平均数的局限性(1)几何平均数易受极端值的影响。如果被平均的变量值中某一变量值为0就不能计算几何平均数。(2)几何平均数应用范围较小。主要用以反映成几何级数特点的变量的集中趋势,常用来计算平均比率或平均速度。\n中位数中位数:居中间位置的标志值未分组资料的确定方法当n为奇数时:Me=当n为偶数时:Me=分组资料的确定方法a、单项式数列的确定方法:中位数位置中位数b、组距式数列确定方法:中位数位置中位数组计算下限公式:\n例5-5现有某任务组7名工人生产某产品,其日产量(件)分别为10、6、10、7、8、5、11,求中位数。首先,将标志值按从小到大的顺序排列为:5、6、7、8、10、10、11;其次,按公式确定中位数的位次:最后,得出居于第四位的标志值8就是中位数。例5-6按上例,如果有8个工人,其日产量(件)为10、6、10、7、8、5、11、12,求中位数。首先,将标志值按从小到大的顺序排列为:5、6、7、8、10、10、11、12。其次,按公式确定中位数的位次:可知,中位数位次在第四位与第五位之间,第四位标志值为8,第五位标志值为10。最后,确定中位数的值:中位数。\n奖学金x人数(人)向上累计次数s300500800100015003687639172430合计30-中位数位置为:30/2=15,第15人在第三组,则奖学金800元为中位数f例题5-7\n按收入分组(元)x城市数f向上累计次数s5000以下5000-1500015000-2500025000-3500035000以上49854413212630合计30-中位数位置为30/2=15,则第三组为中位数组例题5-7\n单项式数列确定众数:最大的次数该组标志值组距式数列确定众数:最大的次数---众数组众数众数:总体中出现次数最多的标志值\n不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值在所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo=可口可乐例题5-8\n人均月收入(元)x家庭户数f300以下300-400400-500500-600600-700700-800800-900900-10001000以上2606601800320020001000800600400合计10720最大次数是3200,则第四组为众数组例题5-9\n应用平均指标应注意的问题1.平均指标必须应用于同质总体2.平均指标应与分配数列相结合3.平均指标要与统计分组相结合4.注意极端数值的影响\n任务解析:现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你如何判断自来水用户的满意度水平?表5-11A市自来水公司客户对自来水产品的满意度资料按客户对自来水产品满意度分组城镇居民农村居民客户数(人)人数累计客户数(人)人数累计向上(人)向下(人)向上(人)向下(人)非常不满意008008400002002200不满意027035392011013198一般116151365082095187满意183334249092187105非常满意066400066013200013合计400——200——\n标志变异指标请思考你会选择哪个供货商?Y18、19、20、21、22X20、20、20、20、20Z10、15、20、15、25\n一、标志变异指标的意义标指异变志标反映总体各单位标志值的差异程度说明平均指标的代表性说明现象变动的稳定性和均衡性标志变异指标的作用主要指标:全距、平均差、标准差、变异系数\n标志变异指标计算与分析全距平均差标准差分组数列未分组数列比较平均水平相同的总体\n女学生组x68707276808285888990-12-10-8-402589101210840258910144100641604256481100合计-68598\n变异系数比较平均水平不同的总体当两组数据不是同类经济现象,或计量单位不同或均值不同时,需要用标志变异相对指标来比较平均指标的代表性。全距系数平均差系数标准差系数\n某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0例:某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度\n计算结果结论:计算结果表明,v1查看更多
相关文章
- 当前文档收益归属上传用户