2020届二轮复习用样本的频率分布估计总体分布课件(28张)(全国通用)

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

2020届二轮复习用样本的频率分布估计总体分布课件(28张)(全国通用)

统计的基本思想方法: 用样本估计总体,即通常不直接去研究总体, 而是通过从总体中抽取一个样本,根据样本的 情况去估计总体的相应情况. 统计的核心问题: 如何根据样本的情况对总体的情况作出一 种推断. 这里包括两类问题: 一类是如何从总体中抽取样本? 另一类是如何根据对样本的整理、计算、 分析, 对总体的情况作出推断. 用样本的有关情况去估计总体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征。 整体介绍:  将一批数据按要求分为若干个组,各组内 数据的个数,叫做该组的频数。  频率:每组数据的个数除以全体数据个数 的商叫做该组的频率。 v 根据随机抽取样本的大小,分别计算某一 事件出现的频率,这些频率的分布规律 (取值状况),就叫做样本的频率分布。 说明:样本频率分布与总体频率分布   有什么关系? 通过样本的频数分布、频率分布可以 估计总体的频率分布. 如何用样本的频率分布 估计总体分布? 频率分布直方图 我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。 2000年全国主要城市中缺水情况排在前10位的城市 例1:某市政府为了节约生活用水,计划在本市 试行居民生活用水定额管理,即确定一个居民月 用水量标准a , 用水量不超过a的部分按平价收费, 超过a的部分按议价收费。 ①如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢? ②为了较合理地确定这个标准,你认为需要做 哪些工作? 思考:由上表,大家可以得到什么信息? 通过抽样,我们获得了100位居民某年的月平均 用 水量(单位: t) ,如下表: 1.求极差: 步骤: 频率分布直方图 2.决定组距与组数:组数= 4.3 - 0.2 = 4.1 4.1 0.5 = 8.2组距 极差 = 3.将数据分组 [0,0.5 ),[0.5,1 ),…,[4,4.5] 4.列频率分布表 100位居民月平均用水量的频率分布表 频率/组距 月平均用水量/t 0.50 0.40 0.30 0.20 0.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.画频率分布直方图 探究: 同样一组数据,如果组距不同,横轴、纵轴的单位 不同,得到的图的形状也会不同。不同的形状给人以不 同的印象,这种印象有时会影响我们对总体的判断。分 别以1和0.1为组距重新作图,然后谈谈你对图的印象。 一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组距=极差/组数 三、分组,通常对组内数值所在区间,   取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表 画一组数据的频率分布直方图,可以按以 下的步骤进行: 五、画出频率分布直方图(纵轴表示频率/组距) 频率分布直方图如下: 月均用水量/t 频率 组距 0.10 0.20 0.30 0.40 0.50 0.5 1 1.5 2 2.5 3 3.5 4 4.5 连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图 利用样本频分布对总体分布进行相应估计 (3)当样本容量无限增大,组距无限缩小, 那么频率分布直方图就会无限接近于一条光滑 曲线——总体密度曲线。 (2)样本容量越大,这种估计越精确。 (1)上例的样本容量为100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增 至10000呢? 总体密度曲线 频率 组距 月均用 水量/t a b (图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。 总体密度曲线反映了总体在各个范围内取值的 百分比,精确地反映了总体的分布规律。是研究总 体分布的工具. 总体密度曲线 茎叶图 某赛季甲、乙两名篮球运动员每场比赛得分的原 始记录如下: (1)甲运动员得分: 13,51,23,8,26,38,16,33,14,28,39 (2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39 茎叶图 甲 乙 0 1 2 3 4 5 2 5 5 4 1 6 1 6 7 9 4 9 0 8 4 6 3 3 6 8 3 8 9 1 叶就是从茎的旁边 生长出来的数,表示得 分的个位数。 茎是指中间的一列 数,表示得分的十位 数 茎叶图不仅能够保留原始数据,而且能够 展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的 成绩更好;从叶在茎上的分布情况来看,乙运 动员的得分更集中于峰值附近,说明乙运动员 的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的 效果较好。它不但可以保留所有信息,而且可 以随时纪录,这对数据的纪录和表示都能带来 方便。但当样本数据较多时,茎叶图就显得不 太方便。因为每一个数据都要在茎叶图中占据 一个空间,如果数据很多,枝叶就会很长。 练习: 1、对于样本频率分布折线图与总体密度曲线的关系, 下列说法中正确的是( ) A、频率分布折线图与总体密度曲线无关 B、频率分布折线图就是总体密度曲线 C、样本容量很大的频率分布折线图就是总体密度曲线 D、如果样本容量无限增大,分组的组距无限减小,那么频率 分布折线图就会无限接近于总体密度曲线 2、一个容量为20的样本,分组后,组距与频数如下:[10,20], 2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本 在(-∞,50]上的频率为( ) 1 1 1 7. . . .20 4 2 10A B C D 3、对于用样本频率估计总体分布的过程,下列说法中正确的是( ) A.总体容量越大,估计越准确 B.总体容量越小,估计越准确 C.样本容量越大,估计越准确 D.样本容量越小,估计越准确 作业: 1、有一个容量为50的样本数据的分组的频数如下: [12.5, 15.5) 3 [15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4 (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在[15.5, 24.5)的 百分比是多少? 2、71页第三题 解:组距为3 分组 频数 频率 频率/ 组距 [12.5, 15.5) 3 [15.5, 18.5) 8 [18.5, 21.5) 9 [21.5, 24.5) 11 [24.5, 27.5) 10 [27.5, 30.5) 5 [30.5, 33.5) 4 0.06 0.16 0.18 0.22 0.20 0.10 0.08 0.020 0.053 0.060 0.073 0.067 0.033 0.027 频率分布直方图如下: 频率 组距 0.010 0.020 0.030 0.040 0.050 12.5 15.5 0.060 0.070 例2、为了了解一大片经济林的生长情况,随机测量其中的100株的 底部周长,得到如下数据表(长度单位:cm): 135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108 (1)编制频率分布表;(2)绘制频率分布直方图; (3)估计该片经济林中底部周长小于100cm的树木 约占多                少,周长不小于120cm的树木约占多少。 解: (1)从表中可以看出: 这组数据的最大值为135,最小值为80, 故极差为55, 可将其分为11组,组距为5。 从第1组[80,85)开始, 将各组的频数、频率和 频率/组距 填入表中 分组 频数 频率 频数/组距 [80,85) 1 0.01 0.002 [85,90) 2 0.02 0.004 [90,95) 4 0.04 0.008 [95,100) 14 0.14 0.028 [100,105) 24 0.24 0.048 [105,110) 15 0.15 0.03 [110,115) 12 0.12 0.024 [115,120) 9 0.09 0.018 [120,125) 11 0.11 0.022 [125,130) 6 0.06 0.012 [130,135) 2 0.02 0.004 合计 100 1 0.2
查看更多

相关文章

您可能关注的文档