- 2022-08-13 发布 |
- 37.5 KB |
- 51页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学chap03
东南大学远程教育统计学第七讲主讲教师:黄晓红1\n统计学东南大学远程教育statistics第三章统计整理2\n第一节.统计整理概述一.统计整理的概念是根据统计工作任务的要求,对统计调查所得到的原始资料进行科学的分组、汇总,以得出反映现象总体特征的综合资料,或对已整理过的资料进行再加工的工作过程。3\n第一节统计整理概述二.统计整理的步骤1设计整理方案2对调查资料进行审核3进行分组和汇总4对分组和汇总资料进行审核5编制统计表4\n第二节统计分组一.统计分组的意义1.统计分组就是根据现象总体内在特点和统计工作任务的要求,按照某一标志,把总体划分为不同类型或者性质不同的几部分。使组与组之间具有差别性而同一组内的单位具有相对的同质性。例如:居民按居住地区可以分为城市和乡村两组;学生按性别可以分为男女两组。5\n第二节统计分组一.统计分组的意义2对总体进行统计分组的优点:A可区别不同情况的总体单位,针对各自的特点进行研究分析B可以分析总体的结构按性别分组人数所占(%)男性职工女性职工6004006040合计10001006\n第二节统计分组一.统计分组的意义C可以揭示有些组之间的依存关系人均生活费与户就业人口数依存关系按人均月生活费收入分组(元)平均每户就业人口数(人)200及以下200-250250-350350-500500-600600以上1.781.962.122.332.592.827\n第二节统计分组二.统计分组的方法1.统计分组的关键是选择分组标志,一旦确定某个标志进行分组,往往就会突出现象这一方面的差异,同时掩盖其它方面的差异。2.选择分组标志最重要的是围绕统计研究的目的和任务3.统计分组的常用方法:A.按品质标志分组B.按数量标志分组8\n第二节统计分组二.统计分组的方法A.按品质标志分组(品质标志是以事物的性质属性来表现的标志)是指选择反映事物性质属性的品质标志,在品质标志的变异范围内,划定各组的性质界限,将总体区分为若干个性质不同的部分或组别。9\n第二节统计分组二.统计分组的方法B.按数量标志分组(数量标志是指以数量的多少来表现的标志)是指选择反映事物数量多少的数量标志,在数量标志值的变异范围内,划定各组的性质界限,将总体区分为若干个性质不同的部分或组别。10\n第二节统计分组三.统计分组体系1.所谓统计分组体系,就是对总体按照两个以上的标志进行分组形成的体系。相对而言,对总体按一个标志进行分组称为简单分组。2.统计分组体系有两种:A平行分组体系B复合分组体系11\n第二节统计分组三.统计分组体系2.统计分组体系有两种:A平行分组体系:对总体按两个以上标志,分别进行简单分组形成的体系。特点:对总体的不同分组是相互独立、互不干涉的,彼此之间没有交叉,是平行的。如对企业200名职工按性别、岗位、学历进行分组:按性别分为:男职工170人,女职工30人按岗位分为:技术职工60人,管理人员140人按学历分为:大专以上职工90人,中专以上职工50人,高中以下学历职工60人12\n第二节统计分组三.统计分组体系2.统计分组体系有两种:B复合分组体系:是对总体按照两个以上标志层叠进行分组。特点是对总体的不同分组,不是独立的,彼此之间存在着交叉,是分层次的。企业职工200人男职工170人女职工30人技术职工53人管理人员117人技术职工7人管理人员23人13\n东南大学远程教育统计学第九讲主讲教师:黄晓红14\n第三节次数分布一.次数分布的概念1.次数分布,也称分布数列,是在统计分组基础上,将总体中的所有单位按组归类整理,形成总体中各单位数在各组间的分布。2.单位个数称为频数(次数);各组次数与总次数之比称为频率,3.按品质标志分组形成的次数分布,称为品质数列;按数量标志分组形成的次数分布,称为变量数列。15\n第三节次数分布按性别分组人数所占(%)男性女性6004006040合计1000100品质标志示例各组名称次数(频数)比率(频率)16\n第三节次数分布按月工资收入分组人数(人)所占(%)1000元以下1000-15001500-20002000-25002500-30003000元以上80150230340150508152334155合计1000100数量标志示例各组名称次数(频数)比率(频率)17\n二.变量次数分布的编制假设某企业30个非熟练工人的周工资额(元)如下:10699851218494106105110119101959187105106109118961289197105111111107103101107106根据上面的资料编制工资的次数分布。18\n第一步,将原始资料顺序排列。即将上述未经整理的周工资额的原始数据按从小到大的顺序排列,可以得到以下数列:84858791919495969799101101103105105105106106106106107107109110111111118119121128观察数列,可看到30个工人工资水平是有波动的,波动幅度在84到128之间,并且多数工人的工资额是105元和106元。19\n第二步,将各个数据按其数值大小归人相应的组内,形成单项数列。即把相同的数据归人同一组,并汇总各组数值的个数,得到表2—3。第三步,确定组数、组距与组限,整理成组距数列。20\n非熟练工人周工资额的次数分布周工资额(元)人数(个)各组人数占总人数百分比%(1)(2)(3)80-9031090-100723100-1101343110-120517120-13027合计3010021\n分析:1.组距:每组区间的宽度,也就是上下组限之间的距离。2.组限:区间的界限,小的界限称为下组限,大的界限值为上组限。3.开口组(即缺上限或下限的组)22\n分析:4.组中值计算采用公式:组中值:(下限+上限)/25.开口式组限,需要借用邻近组的组距,即假定组距内数值变化范围与相邻组是一样的。其组中值的计算公式为:6.等距分组与异距分组。23\n三.次数分布的表示方法1.列表法某企业职工工资累积频数表月工资收入(元)频数较小制累计较大制累计人数比率(%)人数比率(%)人数比率(%)1000元以下1000-15001500-20002000-25002500-30003000元以上80150230340150508152334155802304608009501000823468095100100092077054020050100927754205合计1000100-------------24\n2.图示法折线图8090100110120130每周工资工人人数4812425\n2.图示法8090100110130每周工资工人人数48124直方图26\n2.图示法直方图和折线图是根据次数分布图绘制的,而累计次数分布图是根据累计次数或累计频率分布表绘制的。其方法是:1.用纵轴表示累计次数或累计频率;2.用横轴表示较小制累计次数或较大制累计次数。绘制较小制累计次数时,横轴表示各组的上限;绘制绘制较大制累计次数时,横轴表示各组的下限。累计次数分布图27\n第四节统计表一、统计表的概念统计表是用规范的表格来表现统计资料的一种形式。1.它是由纵横线交叉组成的一种表格,表格内所列的是整理后系统的统计资料。2.统计表一般采用开口式,即表的左右两条线不画。3.用统计表来显示统计资料,具有条理清晰、简明扼要的特点,便于从各方面进行比较、分析所表现的现象。28\n第四节统计表二.统计表的形式1.总标题(也称统计表的名称),它用概括性的文字简单明了地说明统计资料的时间、基本内容和范围。一般写在表的上部中端。2.横行标题反映统计表的主要项目,写在表的左方。3.纵栏标题是统计指标的名称,说明纵栏所列各项资料的内容,写在表内右上方。29\n第四节统计表二.统计表的形式4.数字资料也称指标数值,它是统计表的具体内容,列在各横行标题和各纵栏标题的交叉处。任何一个具体数值都由横行标题和纵栏标题所限定。5.有些统计表还需要在下端增加注解,以说明资料的来源、某些指标数值的计算方法、填表单位和其他需要说明问题。30\n某市1991年工业总产值(总标题)按企业规模分组工业总产值(亿元)比重(‰)甲(1)(2)大型企业中型企业小型企业901.51300.67547.7950.3716.9232.35合计1776.97100.00第四节统计表31\n第四节统计表三.统计表的内容1.主词栏:主词是统计表所要说明的对象。它可以是各个总体单位的名称、总体各个组或全部,一般列在表的左端。2.宾词栏宾词是说明主词的各种指标,包括指标名称和指标数值,一般列在表的右端。32\n第四节统计表三.统计表的种类1.简单表:表的主词未经任何分组,仅列出总体各单位的名称或按时间顺序简单排列的统计表。城市名称人口数其中:市辖县的人口数北京市天津市上海市10819407878740213341896345698229303345127460第四次人口普查我国三个直辖市的人口33\n第四节统计表三.统计表的种类年份黄金储备(万盎司)国家外汇(亿美元)19931994199519961267126712671267211.99516.2735.971050.29黄金和外汇储备34\n第四节统计表三.统计表的种类2.分组表:指表的主词按某一标志进行简单分组的统计表。分组表的主词可以按数量标志分组,也可以按品质标志分组。按性别分组人数所占(%)男性女性6004006040合计1000100按品质标志分组示例35\n第四节统计表三.统计表的种类:分组表-按数量标志分组示例周工资额(元)人数(个)各组人数占总人数百分比%(1)(2)(3)80-9031090-100723100-1101343110-120517120-13027合计3010036\n第四节统计表三.统计表的种类3.复合表:指表的主词按两个以上的标志进行分组的统计表。项目投资额(亿元)比重(%)一.全民所有制单位基本建设更新改造及其它措施二.集体所有制单位城镇农村三.个人建房投资城镇农村952594358156451112611724469.543.426.111.43.38.119.11.317.8合计136910037\n第四节统计表五.编制统计报表时应注意的问题:1.统计表的栏数如果过多,要加以编号各栏用甲、乙、丙等文字编写;宾词指标各栏则用(1)、(2)、(3)等数字编号。2.表中数字要填写整齐,位数对准。当不存在某项数字时,用符号“一”表示;当缺少某项数字时,用符“...”表示。3.数字资料要注明计量单位。当全表只有一种计量单位时,可把它写在表头的右上方。如果表中需要分别注明不同单位时,横行的计量单位可专设“计量单位”一栏,纵栏的计量单位可与纵栏标题写在一起用小字标明。38\n第四节统计表4.统计表的文字、数字要书写工整、清晰,数位要对齐。5.某些需要说明的特殊资料,应在表的下方加以注解;数字资料要在表下说明来源,以备查考。6.统计表编制完毕并经审核后,制表人和主管部门负责人要签字,并加盖公章以示负责。39\n第五节统计图一.统计图的概念指将说明社会经济现象的统计资料,借助于几何图形或具体事物形象来表示现象数量关系的图形。二.统计图的种类1.几何图:利用几何的形和线来显示统计资料的图形。主要有条形图、线形图、平面图等。2.像形图:利用图示现象本身的形象画来显示统计资料的图形。3.统计地图:在地图上利用线、色、点、形等显示统计资料在地区上分布状况的图形40\n第五节统计图三统计图的应用1.条形图:利用等宽度的长条图形的高低来表现统计资料数值大小及总体结构的统计图。41\n第五节统计图2.线形图:将每一指标值在直角坐标所决定的平面上点出位置并连接各点成为线形。42\n第五节统计图3.平面图:利用图形面积的大小来表现统计资料的统计图43\n第五节统计图4.立体图:利用图形的体积大小来表现统计资料的一种统计图。44\n东南大学远程教育统计学第十讲主讲教师:黄晓红45\n本章的重点和难点本章的重点在于:统计分组的意义、作用和方法;分配数列的编制和统计表的编制。难点在于:分组标志的选择和根据实际资料编制统计表。掌握上述重点、难点问题必须在熟悉教材的基础上多做练习,特别是由原始资料到编制统计表这样过程的训练是十分有意义的。46\n习题讲解一.判断题1.统计整理的目的是为了取得等距数列。()2.变量数列一般都是连续型变量。()3.统计分组的目的是为了取得整齐的资料。()4.统计分组对整体而言是“分”,故分组数愈少愈能保持总体的集中趋势。()5.按数量标志分组一般都是按不变的数量标志分组。()6.人口按性别和年龄分组属复合分组。()47\n习题讲解二.单项选择题1.对总体进行定性分析,就是()进行分组A.数量标志B.按品质标志C.按不变标志D.按连续型变量2.在编制组距数列时,当资料中存在少数特大和特小的变量值时,易采用()形式处理。A.开口组B.等距C.闭口组D.不等距3.统计表从形式上看,主要由()构成。A.主词和宾词B.各标题和数字C.总体及分组D.标志和指标48\n习题讲解三多项选择题1.统计整理的对象是()A连续型变量B.原始资料C.次级资料D.离散型变量2.对离散型变量分组()。A.可按每个变量值分别列组B.可采用组距分组C相邻组的组限要相互衔接D.各组组距可相等也可不等3.下列次数分布中,属于连续型变量次数分布的是()A.工人技术等级和工人数B.在校学生数和学校数C.营业额和营业员人数D.基本建设投资额和项目数49\n习题讲解四.某地城市人均居住面积1996年为7.2平方米/人,1997年为8.0平方米/人,1998年为8.1平方米/人,1999年为8.3平方米/人,2000年为8.6平方米/人;我国农村人均居住面积1996年为14.7平方米/人,1997年为15.3平方米/人,1998年为16.0平方米/人,1999年为16.6平方米/人,2000年为17.2平方米/人。试根据统计表的编制原则,设计一张反映1996-2000年间我国城乡居民居住情况的统计表。50\n六.根据下表资料,绘制直方图和次数分布曲线图。工人按完成生产定额百分比分组工人数(人)比率(%)80-9033.7590-1001518.75100-1103645.00110-1202025.00120-13067.50合计80100.0051查看更多