- 2022-09-01 发布 |
- 37.5 KB |
- 38页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学》上机实验例题(一)
《统计学》上机实验(一)教材中的例题部分\n第2章数据的图表展示2.1数据的预处理2.2品质数据的整理与显示2.3数值型数据的整理与显示2.4合理使用图表\n2.1数据的预处理2.1.1数据审核2.1.2数据筛选2.1.3数据排序2.1.4数据透视表\n8名学生的考试成绩数据一、数据的筛选、排序【例2.1】(见教材20~25页)用Excel进行数据筛选与排序\n二、数据透视表【例2.2】(见教材25~29页)第1步:在Excel工作表中建立数据清单第2步:选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】第3步:确定数据源区域第4步:在【向导—3步骤之3】中选择数据透视表的输出位置,然后选择【布局】第5步:在【向导—布局】对话框中,依次将“分类变量”拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量”拖至“数据区域”第6步:然后单击【确定】,自动返回【向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表用Excel创建数据透视表\n2.2品质数据的整理与展示2.2.1分类数据的整理与图示2.2.2顺序数据的整理与图示\n2010年【例2.3】(见教材30~34页)为研究不同类型的软饮料的市场销售情况,一家市场调查公司对随机抽取的一家超市进行调查。下面的表2—1是调查员随机观察的50名顾客购买的饮料类型及购买者性别的记录。生成频数分布表,观察饮料类型和消费者性别的分布状况,并进行描述性分析绿色健康饮品Excel一、分类数据整理:编制频数分布表;绘制条形图;帕累托图;饼图。\n2010年使用Excel数据透视表计数(pivottable)第1步:选择【数据】菜单中的【数据透视表和数据透视图】第2步:确定数据源区域(在操作前将光标放在任意数据内,系统会自动选定数据源区域)第3步:在【向导—3步骤之3】中选择数据透视表的输出位置,然后选择【布局】第4步:在【向导—布局】对话框中,依次将“饮料类型”拖至左边的“行”(或列)区域,将“顾客性别”拖至“列”(或行)区域,将“饮料类型”拖至“数据”区域。第5步:单击【确定】,自动返回【向导—3步骤之3】对话框。单击【完成】Excel\n2010年生成频数分布表(列联表—Excel)不同类型饮料和顾客性别的频数分布绿色健康饮品\n2010年分类数据的图示—条形图(barChart)\n2010年分类数据的图示—复式条形图(barChart)饮料类型和顾客性别的条形图\n2010年分类数据的图示—帕累托图(paretochart)按各类别数据出现的频数多少排序后绘制的柱形图用于展示分类数据的分布\n2010年分类数据的图示—简单饼图(pieChart)用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题制作频数分布图表\n二、顺序数据的累计频数分布图、环形图【例2.4】(见教材35~37页)在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————\n顺序数据的频数分布表和图乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————\n顺序数据的图示—累计频数分布图(例题分析)243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向上累积27616830300750100200300400非常不满意不满意一般满意非常满意累积户数(户)(b)向下累积甲城市家庭对住房状况评价的累积频数分布\n环形图(例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意甲乙两城市家庭对住房状况的评价用Excel制作图形\n2.3数值型数据的整理与展示2.3.1数据分组2.3.2数值型数据的图示\n一、数值型数据:用数据分析中的直方图编制频数分布表;绘制直方图折线图【例2.5】(见教材38~42页)表中是某电脑公司2002年前四个月各天的销售量数据(单位:台)。试对数据进行分组\n等距分组表(上下组限重叠)\n分组数据的图示(直方图的绘制)140150210直方图下的面积之和等于1某电脑公司销售量分布的直方图我一眼就看出来了,销售量在170~180之间的天数最多!190200180160170频数(天)25201510530220230240\n使用Excel函数(FREQUENCY)使用统计函数【FREQUENCY】创建频数分布表和直方图的具体步骤是:选择与接收区域相临近的单元格区域,作为频数分布表输出的区域选择统计函数中的【FREQUENCY】函数在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接收区域同时按下“Ctrl-Shift-Enter”组合键,即得到频数分布统计函数—FREQUENCY\n用Excel数据分析功能将120个销售量的数据输入到Excel工作表中,然后按下列步骤操作第1步:选择【工具】下拉菜单第2步:选择【数据分析】选项第3步:在分析工具中选择【直方图】,然后选择【确定】第4步:当对话框出现时在【输入区域】方框内键入数据区域在【输出选项】中选择输出区域选择【图表输出】选择【确定】用Excel制作频数分布表\n二、时间序列数据—线图【例2.7】(见教材48~49页)我国1991~2003年城乡居民家庭的人均收入数据如右表。试绘制线图¥$1991~2003年城乡居民家庭人均收入年份城镇居民农村居民19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2708.6784.0921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2\n时间序列数据—线图(例题分析)用Excel制作线图\n三、多变量数据:二维散点图、气泡图、雷达图温度/0C降雨量/mm产量/(kg/hm2)62522508403450105845001368575014110580016987500211208250【例2.8】(见教材50~52页)小麦的单位面积产量与降雨量和温度等有一定关系。为了解它们之间的关系形态,收集数据如表。试绘制小麦产量与降雨量的散点图,并分析它们之间的关系。小麦产量与降雨量和温度的数据\n两个变量间的关系—二维散点图(2DScatterplots)\n三个变量间的关系—气泡图(bubblechart)显示三个变量之间的关系图中数据点的大小依赖于第三个变量用Excel制作二维散点图、气泡图\n多变量数据—雷达图【例2.9】(见教材52~53页)2003年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图今天的主食是面包2003年城乡居民家庭平均每人生活消费支出构成(%)项目城镇居民农村居民食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务37.129.796.307.3111.0814.3510.743.3045.595.674.205.968.3612.1315.872.21\n多变量数据—雷达图(例题分析)用Excel制作雷达图\n3.4合理使用图表3.4.1鉴别图形优劣的准则3.4.2统计表的设计\n一张好的图表应包括以下基本特征显示数据让读者把注意力集中在图表的内容上,而不是制作图表的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图表的统计描述和文字说明5种鉴别图表优劣的准则:一张好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间内以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况鉴别图表优劣的准则\n统计表的结构2002~2003年城镇居民家庭抽样调查资料项目单位2002年2003年调查户数平均每户家庭人口平均每户就业人口平均每户就业面平均一名就业者负担人数平均每人全部年收入#可支配收入平均每人消费性支出户人人%元元元元45317.003.041.5851.971.928177.407702.806029.8848028.003.011.5852.491.919061.228472.206510.94资料来源:《中国统计年鉴2004》,中国统计出版社,2004,第359页。注:本表为城市和县城的城镇居民家庭抽样调查资料。行标题列标题数字资料表头附加\n合理安排统计表的结构总标题内容应满足3W要求数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“—”表示必要时可在表的下方加上注释统计表的设计\n统计表的设计(比较与选用)表A某城市居民关注广告类型的频数分布广告类型人数(人)频率(%)商品广告11256.0服务广告5125.5金融广告94.5房地产广告168.0招生招聘广告105.0其他广告21.0合计200100.0\n统计表的设计(比较与选用)表B某城市居民关注广告类型的频数分布广告类型人数(人)频率(%)商品广告11256.0服务广告5125.5金融广告94.5房地产广告168.0招生招聘广告105.0其他广告21.0合计200100.0\n提示:1、完成本《例题部分》的学习后,可继续做《练习题》部分(数据见另一文件夹)。2、课后作业2.1;2.4;2.6;2.12;2.13;2.143、要求:独立完成,下次课上交.\nTHANKS查看更多