管理统计学-统计整理

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

管理统计学-统计整理

第三章统计资料的整理一、统计资料整理的一般问题二、统计分组三、分配数列四、统计表主要内容\n学习目标1.了解统计整理的一般问题2.理解统计分组的方法3.理解统计分配数列的的编制4.了解统计表的结构\n第一节统计资料整理的一般问题一.统计资料整理的意义二.统计资料整理的步骤三.统计资料的审核方法四.统计资料整理的组织形式和技术\n统计资料整理的意义\n概念:根据统计研究的目的,把统计调查搜集的大量反映个体特征的原始资料,用科学的方法进行分类和汇总,使之系统化、条理化,成为能够反映总体特征的综合资料的工作过程。包括资料审核、分组、汇总、计算、制表、制图等。地位和作用:统计整理是统计分析的前提,统计整理的质量直接影响统计分析的质量。统计整理是统计调查的继续,在整个统计研究过程中起着承前启后的作用。整理的原则:抓住最基本的、最能说明问题本质特征的统计分组和统计指标,对统计资料进行加工整理。\n统计资料整理的步骤\n整理的基本步骤设计方案审核订正分组汇总编制统计图表\n统计资料的审核方法\n数据完整性审核准确性审核单位缺失项目缺失口径、方法、计量单位等等审核种类审核内容审核方法与调查方案比较逻辑审核平衡校验经验判断全员劳动生产率<工人劳动生产率销售收入-销售成本费用=利润某指标是否符合正常水平\n统计资料整理的组织形式和技术\n整理的组织形式逐级汇总手工汇总汇总的技术集中汇总电子计算机汇总\n第二节统计分组一.统计分组的意义二.统计分组的原则统计分组的方法统计分组体系\n统计分组的意义\n根据统计研究的需要和总体内在特征,按照一定标志,将总体区分为若干个部分或若干个组的一种统计方法。分组前分组后25%33%42%1·区分事物的类型作用:例:按所有制性质划分,我国现有8种经济类:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济\n2·研究总体的内部结构例某市按国内生产毛额计算的三次产业结构(%)1980年1990年1996年1997年国内生产毛额100100100100第一产业3.24.32.52.3第二产业75.763.854.552.2第三产业21.131.943.045.53·分析现象间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年按收入分组(元)<200<300<400<500<600<800<1000恩格尔系数(%)64.960.256.754.450.549.943.6\n统计分组的原则\n统计分组的程序与原则选择分组标志确定分组体系总体单位归类科学性:组间差异大,组内差异小。完备性和互斥性:每个单位均能且只能归到某个组中。对大学生月生活费支出情况进行分组研究:按家庭收入水平分组;      按城乡分组;  按性别分组;  按年龄分组。?\n统计分组的程序与原则选择分组标志确定分组体系总体单位归类科学性:组间差异大,组内差异小。完备性和互斥性:每个单位均能且只能归到某个组中。父母亲下岗情况:单亲下岗;双亲下岗;双亲在岗。城乡区别离退休 是否健在\n统计分组的方法\n分组标志的选择关键:服从研究任务需要,反映总体本质特征(1)要根据研究目的选择(2)要反映现象的本质特征(3)要因时、因地制宜统计分组方法按品质标志分组按数量标志分组按主要标志和辅助标志分组\n统计分组体系分组体系指同时使用两个以上标志分组时,分组标志的组合形式。具体形式有:平行分组体系和交叉分组体系。\n平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2\n复合分组体系对教师的分类按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2\n第三节分配数列一.分配数列二.变量数列的编制变量数列的表示方法次数分布的主要类型\n分配数列\n分布数列及其构成要素是一种重要的分组资料,反映总体单位在各组的分布状态。基本形式:分组单位数频率合计………100频数分布频率分布\n分类品质数列变量数列单项数列(单变量值分组)组距数列等距数列异距数列分配数列的种类\n品质数裂(实例)【例3.1】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。表3-1某城市居民关注广告类型的频数分布广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100\n品质数列(实例)【例3.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————\n单项数列(实例)表3-4某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112\n组距数列表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100\n分配数列的编制\n品质数列的编制\n射击 射击 体操 体操 乒乓球 举重乒乓球 羽毛球 举重 乒乓球 羽毛球举重 举重 跳水 跳水 跳水 乒乓球跳水 射击 体操 羽毛球 柔道 柔道举重 田径 羽毛球 跆拳道中国体育代表团在悉尼奥运会上获金牌的项目\n获金牌项目  金牌数占总数比例跳水    5枚0.1786举重    5枚0.1786乒乓球   4枚0.1429羽毛球   4枚0.1429体操    3枚0.1071射击    3枚0.1071柔道    2枚0.0714田径    1枚0.0357跆拳道   1枚0.0357品质数列\n获金牌项目  金牌数占总数比例跳水    5枚0.1786举重    5枚0.1786乒乓球   4枚0.1429羽毛球   4枚0.1429体操    3枚0.1071射击    3枚0.1071柔道    2枚0.0714田径    1枚0.0357跆拳道   1枚0.0357变量值x次数f频率f/∑f\n变量数列的编制\n频数分布表的编制步骤(一)排序例:某车间50名工人日加工零件数(单位:个)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121\n排序结果107108108110112112113114115117117117118118118119120120121122122122122123123123123124124124125125126126127127127128128129130131133133134134135137139139\n频数分布表的编制步骤(二)分组分组方法等距分组异距分组单变量值分组组距分组\n单变量值分组(要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况\n单变量值数列(实例)表3-4某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112\n组距分组(要点)将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组~~~~~\n组距分组(几个概念)1.下限:一个组的最小值2.上限:一个组的最大值3.组距:上限与下限之差4.组中值:下限与上限之间的中点值下限值+上限值2组中值=组限\n组距分组(步骤)1.确定组数K:组数的确定应以能够显示数据的分布特征和规律为目的。一般5~15组确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数一般以5和10的倍数为宜确定组限,计数频次,整理成频数分布表\n等距分组表(上下组限重叠)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100\n等距分组表(上下组限间断)表3-6某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计50100\n等距分组表(使用开口组)表3-7某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合计50100\n组距分组与不等距分组(在表现频数分布上的差异)等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况\n数值型数据分布的累计向上累计——累计方向按照分组数值大小由小到大累加向下累计——累计方向按照分组数值大小由大到小累加\n表3-5某车间50名工人日加工零件数分组表按零件数分组(个)频数(人)频率(%)向上累计频数(人)向下累计频数(人)向上累计频率(%)向下累计频数(人)105~110110~115115~120120~125125~130130~135135~14035814106461016282012838163040465050474234201046163260809210010094846840208合计50100————————\n第四节统计表\n统计表的作用(1)能使统计资料条理化;(2)比用叙述的方式表现统计资料更简明易懂,节省篇幅;(3)便于比较各项目之间的关系,便于计算;(4)便于检查统计数字的完整性和正确性。\n统计表的结构1997~1998年城镇居民家庭抽样调查资料项目单位1997年1998年一、调查户数二、平均每户家庭人口数三、平均每户就业人口数四、平均每人全部收入五、平均每人实际支出#消费性支出非消费性支出六、平均每人居住面积户人人元元元元平方米378903.191.835188.544945.874185.64755.9411.90390803.161.805458.345322.954331.61987.1712.40资料来源:《中国统计摘要1999》,中国统计出版社,1999,第79页。注:1.本表为城市和县城的城镇居民家庭抽样调查材料。2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。行标题表头列标题数字资料附加\n1.要合理安排统计表的结构2.数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明3.表中的上下两条横线一般用粗线,其他线用细线4.通常情况下,统计表的左右两边不封口5.表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一6.对于没有数字的表格单元,一般用“—”表示7.必要时可在表的下方加上注释编制统计表的规则\n数值型数据的图示\n分组数据—直方图(直方图的制作)直方图是用矩形的宽度和高度来表示频数分布的图形。在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram),宽度是组距,高度是频次\n分组数据—直方图(直方图的绘制)频数(人)1512963105110115120125130135140日加工零件数(个)直方图下的面积之和等于1图3-5某车间工人日加工零件数的直方图我一眼就看出来了,大多数人的日加工零件数在120~125之间!\n分组数据—直方图(直方图与条形图的区别)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列\n分组数据—折线图(折线图的制作)折线图也称频数多边形图(Frequencypolygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的\n1512963105110115120125130135140日加工零件数(个)频数(人)折线图下的面积与直方图的面积相等!分组数据—折线图(折线图的绘制)图3-6某车间工人日加工零件数的折线图\n某百货公司40天商品销售额分组表按销售额分组(万元)频数(天)频率(%)向上累计频数(天)向下累计频数(天)向上累计频率(%)组中值(万元)\n练习P582.3排序25262829303032333434353536363636373737373738383839404142424343444444454546464749\n某百货公司40天商品销售额分组表按销售额分组(万元)频数(天)频率(%)向上累计频数(天)向下累计频数(天)向上累计频率(%)组中值(万元)25~3030~3535~4040~4545~5046159610.015.037.522.515.041025344040363015610.025.062.585.0100.027.532.537.542.547.5合计40100.0————————
查看更多

相关文章

您可能关注的文档