- 2021-06-16 发布 |
- 37.5 KB |
- 40页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2020_2021学年新教材高中数学第六章统计3用样本估计总体分布3
3.1 从频数到频率 3.2 频率分布直方图 激趣诱思 知识点拨 我国是世界上严重缺水的国家之一 , 城市缺水问题较为突出 . 某市政府为了节约生活用水 , 计划在本市试行居民生活用水定额管理 , 即确定一个居民月用水量标准 a , 用水量不超过 a 的部分按平价收费 , 超出 a 的部分按议价收费 . 如果希望 85% 以上的居民的日常生活不受影响 , 那么标准 a 定为多少比较合理 ? 你认为较为合理地确定出这个标准 , 需要做哪些工作 ? 激趣诱思 知识点拨 一、频率分布表与频率分布直方图 1 . 基本 概念 激趣诱思 知识点拨 2 . 频率分布表和频率分布直方图的意义 从一个总体得到一个包含大量数据的样本时 , 我们很难从一个个数据中直接看出样本所含的信息 . 如果把这些数据整理成频率分布表或频率分布直方图 , 就可以比较清楚地看出样本数据的频率分布 , 从而估计总体的分布情况 . 用样本估计总体 , 是研究统计问题的一个基本思想方法 , 而对于总体分布 , 我们总是用样本频率分布对它进行估计 . 3 . 频率分布表与频率分布直方图的制作步骤 (1) 频率分布是指从各个小组数据在样本容量中所占比例大小的角度 , 来表示数据分布的规律 . (2) 一般用频率分布直方图反映样本的频率分布 . 激趣诱思 知识点拨 (3) 画频率分布直方图的一般步骤为 : 第一步 , 求极差 . 第二步 , 确定组距和组数 . 为了方便起见 , 组距的选择应力求 “ 取整 ”, 极差、组距、组数有如下关系 : ([ x ] 表示不大于 x 的最大整数 ) 第三步 , 分组 . 通常对组内数值所在区间取左闭右开区间 , 最后一组取闭区间 . 第四步 , 列频率分布表 . 统计各组数据的 频 数 , 计算频率 , 填入表格中 , 完成频率分布表 . 第五步 , 依据频率分布表画频率分布直方图 . 画图时 , 以横轴表示样本数据 , 纵轴 ( 小长方形的高 ) 表示频率与组距的比值 . 激趣诱思 知识点拨 名师点析 频率分布直方图的特征 总体分布情况可以通过样本频率分布情况来估计 , 样本频率分布是总体分布的一种 近似 表示 , 频率分布表和频率分布直方图有以下特征 :(1) 从频率分布直方图可以清楚地看出数据分布的总体趋势 . (2) 从频率分布直方图得不出原始的数据内容 , 把数据表示成直方图后 , 原有的具体数据信息就被抹掉了 . (3) 频率分布表和频率分布直方图由样本决定 , 因此它们会随样本的变化而变化 . (4) 若固定分组数 , 随着样本容量的增加 , 频率分布表中各个频率会稳定在某一个值的附近 , 从而频率分布直方图中的各个小长方形的高度也会稳定在特定的值上 . 激趣诱思 知识点拨 微拓展 绘制频率分布直方图应注意什么问题 ? 提示 : ① 各组频率的和等于 1, 因此各个小长方形面积的总和等于 1 . ② 频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律 . ③ 在直角坐标平面内画频率分布直方图时 , 横轴上是 样本 激趣诱思 知识点拨 ④ 同样一组数据 , 如果组距不同 , 横轴、纵轴单位长度不同 , 得到的频率分布直方图的形状也会不同 , 不同的形状给人们的印象也不同 , 这种印象有时会影响我们对总体的判断 . ⑤ 同一个总体 , 由于抽样的随机性 , 因此随机抽取另外一个同样容量的样本 , 所形成的样本频率分布直方图一般会与前一个样本频率分布直方图有所不同 , 但它们都可以用来估计总体的分布 . 而随着样本容量的增加 , 频率分布表中各个频率会稳定在某个值的附近 , 从而频率分布直方图中的各个矩形的高度也会稳定在特定的值上 . 激趣诱思 知识点拨 微思考 频率分布表与频率分布直方图各有什么特点 ? 提示 : 频率分布表反映具体数据在各个不同区间的取值频率 , 但不直观 , 数据的总体态势不明显 . 频率分布直方图能直观地表明数据分布的形状态势 , 但失去了原始数据 . 激趣诱思 知识点拨 二、频率折线图 在频率分布直方图中 , 按照分组原则 , 再在左边和右边各加一个区间 , 从所加的左边区间的中点开始 , 用线段依次连接各个矩形的顶端中点 , 直至右边所加区间的中点 , 就可以得到一条折线 , 我们称之为频率折线图 . 名师点析 频率折线图的优点是它反映了数据的变化趋势 , 随着样本容量的不断增加 , 分组的不断加密 , 频率折线就会越来越光滑 , 最终形成一条光滑的曲线 . 激趣诱思 知识点拨 微拓展 总体密度曲线的特征 . 提示 : (1) 在样本频率分布直方图中 , 随着样本容量的增加 , 作图时所分的组数增加 , 组距减小 , 相应的频率折线图会越来越接近于一条光滑曲线 , 统计学中称这条光滑曲线为总体密度曲线 , 如图所示 . (2) 总体密度曲线反映了总体在各个范围内取值的百分比 , 它能给我们提供更加精细的信息 , 图中阴影部分的面积 , 就是总体在区间 ( a , b ) 内取值的百分比 . 探究一 探究二 探究三 素养形成 当堂检测 频数与频率的有关计算 例 1 已知一个容量是 40 的样本 , 把它分成六组 , 第一组到第四组的频数分别是 5,6,7,10, 第五组的频率是 0 . 2, 那么第六组的频数是 , 频率是 . 答案 : 4 0 . 1 探究一 探究二 探究三 素养形成 当堂检测 反思感悟 频数与频率的求解策略 对于频数与频率的问题 , 首先要明确几个等量关系 , 即各组的频数之和等于样本容量 , 各组的频率之和为 1, 频率 = . 在解题过程中 , 要明确频数、频率以及样本容量之间的关系 , 弄清已知、未知 , 选择合适的公式进行解题 . 探究一 探究二 探究三 素养形成 当堂检测 变式训练 1 一个容量为 20 的样本数据 , 分组后组距与频数如下表 : 则样本数据在区间 (0,50) 上的频率为 . 答案 : 0 . 7 解析 : 区间 (0,50) 包括四部分的数据 , 在这四部分上的数据的频数和是 2 + 3 + 4 + 5 = 14, 样本容量为 20, 所以样本数据在区间 (0,50) 上的频 探究一 探究二 探究三 素养形成 当堂检测 画频率分布直方图、折线图 例 2 某省为了了解和掌握 2020 年高考考生的实际答卷情况 , 随机地取出了 100 名考生的数学成绩 , 数据如下 :( 单位 : 分 ) 135981021109912111096100103 1259711711311092102109104112 1051248713197102123104104128 10912311110310592114108104102 12912697100115111106117104109 1118911012180120121104108118 12999909912112310711191100 991011169710210810195107101 1021081179911810611997126108 12311998121101113102103104108 探究一 探究二 探究三 素养形成 当堂检测 (1) 列出频率分布表 ; (2) 画出频率分布直方图和折线图 ; (3) 估计该省考生数学成绩在 [100,120) 分之间的比例 . 分析 先求极差 . 根据极差与数据个数确定组距、组数 , 然后按频率分布直方图的画法绘制图形 . (1) 频率分布表如下 : 探究一 探究二 探究三 素养形成 当堂检测 探究一 探究二 探究三 素养形成 当堂检测 (2) 根据频率分布表中的有关信息画出频率分布直方图及折线图 , 如图所示 . (3) 从频率分布表中可知 , 这 100 名考生的数学成绩在 [100,120) 分之间的频率为 0 . 24 + 0 . 15 + 0 . 12 + 0 . 09 = 0 . 60, 据此估计该省考生数学成绩在 [100,120) 分之间的比例为 60% . (0 . 60 = 60%) 探究一 探究二 探究三 素养形成 当堂检测 反思感悟 组距和组数的确定没有固定的标准 , 将数据分组时 , 组数力求合适 , 使数据的分布规律能较清楚地呈现出来 , 组数太多或太少都会影响对数据分布情况的了解 , 若样本容量不超过 120 个时 , 按照数据的多少常分为 5 组 ~ 12 组 , 一般样本容量越大 , 所分组数越多 . 探究一 探究二 探究三 素养形成 当堂检测 延伸探究 本例条件不变 , 制成 频率分布直方图时分组如下 ,[80,85),[85,90),[90,95),[95,100),[100,105),[105,110),[110,115),[115,120),[120,125),[125,130),[130,135 ] . 若 90 分或 90 分以上为及格 , 请 计算该省考生数学成绩的及格率 . 探究一 探究二 探究三 素养形成 当堂检测 解 : 列出频率分布表 如下 由表可得 , 及格 ( 即 90 分 或 90 分以上 ) 的频率为 0 . 04 + 0 . 14 + 0 . 24 + 0 . 15 + 0 . 12 + 0 . 09 + 0 . 11 + 0 . 06 + 0 . 02 = 0 . 97 . 故 及格率为 97% . 探究一 探究二 探究三 素养形成 当堂检测 频率分布直方图的应用 例 3 某校在 5 月份开展了科技月活动 . 在活动中某班举行了小制作评比 , 规定作品上交的时间为 5 月 1 日到 31 日 , 逾期不得参加评比 . 评委会把同学们上交作品的件数按 5 天一组分组统计 , 绘制了频率分布直方图 ( 如图 ) . 已知从左到右各长方形的高的比为 2 ∶ 3 ∶ 4 ∶ 6 ∶ 4 ∶ 1, 第三组的频数为 12, 请解答下列问题 : (1) 本次活动共有多少件作品参加评比 ? (2) 哪组上交的作品数最多 , 有多少件 ? (3) 经过评比 , 第四组和第六组分别有 10 件 、 2 件作品获奖 , 问这两组哪组获奖 率 较高 ? 探究一 探究二 探究三 素养形成 当堂检测 分析 (1) 根据条件 : 从左到右各长方形的高的比为 2 ∶ 3 ∶ 4 ∶ 6 ∶ 4 ∶ 1, 第三组的频数为 12, 计算参加评比的作品总数 ;(2) 根据频率分布直方图判断哪组上交的作品最多 , 再由本组的频率计算频数 ;(3) 先分别由第四组和第六组的频率计算该组的频数 , 再计算获奖率 . 探究一 探究二 探究三 素养形成 当堂检测 解 : (1) 设从左到右各长方形的高分别为 2 x ,3 x ,4 x ,6 x ,4 x , x. 设参加评比的作品总数为 a 件 , 满足 (2 x+ 3 x+ 4 x+ 6 x+ 4 x+x ) × 5 = 1 . 解得 a= 60( 件 ) . (2) 由频率分布直方图可以看出第四组上交的作品数量最多 , 共有 6 ×x× 5 ×a= 18( 件 ) . (3) 第四组和第六组上交的作品数分别为 :18 件 , x× 5 ×a= 3( 件 ), 则它 探究一 探究二 探究三 素养形成 当堂检测 反思感悟 1 . 频率分布直方图的 性质 相应各组的频率 . 这样 , 频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小 ; (2) 在频率分布直方图中 , 各小矩形的面积之和等于 1; 2 . 频率分布直方图反映了样本在各个范围内取值的可能性 , 由抽样的代表性利用样本在某一范围内的频率 , 可近似地估计总体在这一范围 内 取值 的 可能性 . 探究一 探究二 探究三 素养形成 当堂检测 变式训练 2 为了了解高一学生的体能情况 , 某校抽取部分学生进行一分钟跳绳次数测试 , 将所得数据整理后 , 画出频率分布直方图如图所示 , 图中从左到右各小长方形面积之比为 2 ∶ 4 ∶ 17 ∶ 15 ∶ 9 ∶ 3, 第二小组频数为 12 . (1) 第二小组的频率是多少 ? 样本容量是多少 ? (2) 若次数在 110 或 110 以上为 达标 , 试估计该校全体高一学生的达标率是多少 ? 探究一 探究二 探究三 素养形成 当堂检测 解 : (1) 由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小 , 因此第二小组的频率为 探究一 探究二 探究三 素养形成 当堂检测 利用频率分布直方图进行 计算 典例 某 班 50 名学生在一次百米测试中 , 成绩全部介于 13 秒与 19 秒之间 , 将测试结果按如下方式分成六组 :[13,14),[14,15),[15,16 ), [ 16,17),[17,18),[18,19] . 如图所示的是按上述分组方法得到的频率分布直方图 . 设成绩小于 17 秒的学生人数占全班总人数的百分比为 x , 成绩大于等于 15 秒且小于 17 秒的学生人数为 y , 则 x 和 y 分别为 ( ) A.0 . 9,35 B.0 . 9,45 C.0 . 1,35 D.0 . 1,45 探究一 探究二 探究三 素养形成 当堂检测 答案 : A 解析 : 从频率分布直方图可以 看出 x= 1 - (0 . 06 + 0 . 04) = 0 . 9, y= 50 × (0 . 36 + 0 . 34) = 35 . 探究一 探究二 探究三 素养形成 当堂检测 1 . 一个容量为 20 的样本数据 , 分组及各组的频数如下 则样本在区间 [20,60) 上的频率是 ( ) A.0 . 5 B.0 . 6 C. 0 . 7 D. 0 . 8 答案 : D 探究一 探究二 探究三 素养形成 当堂检测 2 . 一个容量为 32 的样本 , 已知某 组 数据 的 频率为 0 . 125, 则该 组 数据 的 频数为 ( ) A.2 B. 4 C. 6 D. 8 答案 : B 解析 : 0 . 125 × 32 = 4 . 探究一 探究二 探究三 素养形成 当堂检测 3 . 如图所示是一容量为 100 的样本的频率分布直方图 , 则由图中的数据可知 , 样本落在 [15,20] 内的频数为 ( ) A.20 B. 30 C . 40 D. 50 答案 : B 解析 : 样本数据落在 [15,20] 内的频数为 :100 × [1 - 5 × (0 . 04 + 0 . 10 )] = 30 . 探究一 探究二 探究三 素养形成 当堂检测 4 . 从某小学随机抽取 100 名同学 , 将他们的身高 ( 单位 :cm) 数据绘制成频率分布直方图如图所示 . 由图中数据可知 a= . 若要从身高在 [120,130),[130,140),[140,150] 三组内的学生中 , 用 分层 随机 抽样 的方法选取 18 人参加一项活动 , 则从身高在 [140,150] 内的学生中选取的 人数为 . 探究一 探究二 探究三 素养形成 当堂检测 答案 : 0 . 030 3 解析 : ∵ 0 . 005 × 10 + 0 . 035 × 10 +a× 10 + 0 . 020 × 10 + 0 . 010 × 10 = 1, ∴ a= 0 . 030, 设身高在 [120,130),[130,140),[140,150] 三组的分别有 x , y , z 人 . 探究一 探究二 探究三 素养形成 当堂检测 5 . 公交车的数量太多容易造成资源的浪费 , 太少又难以满足乘客的需求 . 为此 , 公交公司在某站台随机调查了 80 名乘客 , 他们的候车时间如下所示 ( 单位 :min): 探究一 探究二 探究三 素养形成 当堂检测 (1) 将数据进行适当的分组 , 并画出相应的频率分布直方图和频率折线图 ; (2) 候车 时间 不低于 15 分钟比例 是多少 ? 你能为公交公司提出什么建议 ? 探究一 探究二 探究三 素养形成 当堂检测 解 : (1) 该数据中最大值为 34, 最小值为 1, 两者之差为 33, 故取组距为 5, 分为 7 组 . 探究一 探究二 探究三 素养形成 当堂检测 频率分布直方图如下图所示 : 频率折线图如下图所示 : 探究一 探究二 探究三 素养形成 当堂检测 (2) 候车时间不低于 15 分钟的百分比为 0 . 275 + 0 . 125 + 0 . 100 + 0 . 037 5 = 0 . 537 5 = 53 . 75%, 公交公司可以适当增加公交车的数量 .查看更多