应用统计学教案-统计整理

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

应用统计学教案-统计整理

第二节统计整理一、统计整理的意义统计整理:根据统计研究目的和任务,对调查阶段收集到的大量资料(原始或加工)进行科学分类汇总,为统计分析提供能描述现象总体数量特征资料的工作过程。意义:中间环节起承前启后的作用统计调查的继续统计分析的前提\n二、统计整理的基本步骤制定统计整理方案对调查资料进行审核订正数据处理编制统计表绘制统计图\n统计整理主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图\n三、统计整理的基本方法—统计分组统计分组:根据统计研究需要,将所有总体单位按一定统计标志分为若干个性质不同但有联系的部分。相对总体是“分”→组间差异相对个体是“合”→组内同质★作用:划分社会经济现象类型反映社会经济现象内部结构和比例关系揭示社会经济现象间相互依存关系★特点:\n★原则:科学性原则:从研究目的出发,正确选择最能说明现象本质特征的分组标志,正确划定分组界限,保证组间差异、组内同质。完备性原则:任何一个总体单位或原始数据都能归属于某一个组,而不会遗漏在外。互斥性原则:任何一个总体单位或原始数据在一种统计分组中只能归属于某一个组,而不能归属于两个或两个以上的组。\n★方法:简单分组按一个标志分组。如:工业企业按经济类型分组可分为国有、集体、私营、其他企业。国有企业集体企业复合分组按两个或以上标志多层次分组。如:按经济类型分:按规模分:大型企业中型企业小型企业大型企业中型企业小型企业………………\n分组标志的选择与分组形式关键:服从研究任务需要,反映总体本质特征形式按分组标志性质分品质标志分组数量标志分组按分组标志个数分简单分组复合分组分组体系\n四、统计整理结果的表现形式(1234)分布数列将总体各单位按一定标志分成若干组,列出各组总体单位数(次数/频数)或各组总体单位数在总体中所占的比重(频率),排列而成的数列称为分布数列(分配数列、次数分布、频数分布)。意义反映总体单位在各组间分布状况。表明总体内部构成、平均水平及变异程度。\n频数分布(分布数列)是一种重要的分组资料,反映总体单位在各组的分布状态。基本形式:分组单位数频率合计………100频数分布频率分布\n分类品质数列变量数列单项数列组距数列等距数列异距数列例例例例变量数列的编制1·计算极差2·确定形式单项数列:离散型且取值不多。组距数列:离散型且取值多或连续型。3·组距数列:组距;组数;4·计算各组频数,频率,累计频数,累计频率等。5·组中值的计算:闭口组;开口组\n统计表构成总表题横行标题:统计研究的对象。也称主词。纵栏标题:说明主词的指标名。也称宾词。数字资料分类主词简单表分组表复合表宾词平行形式交叉形式编制规则:\n★分布数列基本要素标志及标志表现各组频数或频率按标志性质分类:品质分布数列(表1)变量分布数列(表2)表1某市2000年工业企业构成表经济类型单位数(个)比重(%)国有企业集体企业其他企业942489213215.7982.002.21合计5966100.00★分类\n表2某企业三月份工人日产量表日产量(件)工人人数(人)比重(%)3456710153040208.713.026.134.817.4合计115100.0\n变量分布数列按各组变量值多少及取值范围:单项数列(表2)组距数列(表3)表3某县2001年家庭平均收入表家庭年收入(元)户数(户)比重(%)6000元以下6000~70007000~80008000~90009000~1500015000元以上341043602890144065063025.532.621.610.84.84.7合计13380100.0\n组距数列按各组组据是否相等:等距数列(表4)异距数列(表3)表4某班第二学期《统计学》成绩表成绩(分)人数(人)比重(%)50~6060~7070~8080~9090~1002491146.713.330.036.713.3合计30100.0\n★组距数列基本概念组限各组两端变量值上限各组最大值下限各组最小值组距各组上下限之差全距数列中最大变量值与最小变量值之差组中值各组上下限和的一半\n开口数列闭口数列开口组开口组组距开口组组中值首末两组上下限齐全的数列首组缺下限或末组缺上限上限或下限不齐的组以相邻组距近似代替上限-邻组组距/2(缺下限)下限+邻组组距/2(缺上限)\n★组距数列的编制1、按数值大小顺序排列2、确定组数、组限和组距组数不宜过多也不宜过少组限和组距确定要体现组与组间质的区别,要体现组内同质组间差异3、连续型变量,邻组上下限必须重叠离散型变量,邻组上下限可重叠也可不重叠组限重叠时,按“上组限不在内”原则达到上限值的单位数计入下一组4、可等距、可异距\n累计分布数列各组频数或频率逐组累计相加,表明总体在某一标志值的水平上总共包含的频数或频率。如:表4中,成绩不到80分的有多少?80分以上的有多少?向上累计变量值小的组向变量值大的组逐组累计,表明各组上限以下总共包含的频数或频率向下累计变量值大的组向变量值小的组逐组累计,表明各组下限以上总共包含的频数或频率(见表5)\n表5某班第二学期《统计学》成绩表成绩人数比重(%)人数比重(%)50~6060~7070~8080~9090~100261526306.720.050.086.7100.0302824154100.093.380.050.013.3合计————向上累计向下累计\n统计表将统计调查得来的数据资料经过整理汇总,按一定结构顺序系统排列在一定表格内,此表格即统计表。分类:按用途不同调查表整理表分析表(原始数据)(分布数列)(指标分析)按分组情况简单表(表6、7)简单分组表(表8)复合分组表(表9)\n表6某公司所属企业2000年产值表企业名称产值(万元)甲乙:10001300:合计:表7我国近年地方财政收入统计表年份财政收入(万元)19951996:2985.63746.9:合计:\n表8某班学生按性别分组统计表性别人数(人)男女3028合计58表92000年某市工业企业总产值工业企业总产值(万元)一、国有企业大型小型二、集体企业大型小型:9500835085906570:合计:\n★统计表的结构表101997年我国三大产业总产值产业总产值(亿元)比重(%)第一第二第三13969367702403318.749.232.1合计74772100.0总标题横行标题纵栏标题数字资料主词宾词\n★统计表编制规则1、标题应简明确切,总标题应注明具体时间空间;2、必须注明计量单位,全表只有一种计量单位时在表的右上方;需分别注明计量单位时,横行的专设“计量单位”一栏,纵栏的与纵栏标题在一起;3、数字为0或忽略不计的要以“0”表示;无数字的要以“—”表示;缺乏资料的以“…”表示;4、表式一般是开口式\n统计图用统计图形表示分布数列。分类:按形状直方图:折线图:曲线图:钟型分布U型分布J型分布横轴为组限,纵轴为频数直方图各长方形顶端中点连线向上累计从首组下限起,各组累计频数落在各组上限向下累计从末组上限起,各组累计频数落在各组下限极限描绘曲线\n统计图直方图等距数列:(变量,频数)异距数列:(变量,频数密度)折线图曲线图等距数列:(组中值,频数)异距数列:(组中值,频数密度)单项数列:(变量,频数)向上累计分布:(变量上限,累计频数)向下累计分布:(变量下限,累计频数)变量的组数无限增多时,折线便趋于一条光滑的曲线。\n\n\n五、统计误差统计误差:统计数据与客观事物实际数值之间的差距。★分类:按误差来源登记性误差代表性误差按误差性质偶然性误差系统性误差按产生原因无意误差有意误差统计误差大部分由主观因素造成,可通过主观努力控制并消除;抽样误差是代表性误差中的偶然误差或称随机误差,不能消除,但可事先计算并控制。
查看更多

相关文章

您可能关注的文档