2020届二轮复习统计图表数据的数字特征用样本估计总体课件(41张)(全国通用)

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

2020届二轮复习统计图表数据的数字特征用样本估计总体课件(41张)(全国通用)

知 识 梳 理 1. 频率分布直方图 (1) 频率分布表的画法: 极差 分组 (2) 频率分布直方图:反映样本频率分布的直方图 ( 如图 ) 频率 2. 茎叶图 统计中一种被用来表示数据的图叫 作 茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数 . 3. 样本的数字特征 最中间 平均数 最多 [ 微点提醒 ] 1. 频率分布直方图与众数、中位数与平均数的关系 (1) 最高的小长方形底边中点的横坐标即是众数 . (2) 中位数左边和右边的小长方形的面积和是相等的 . (3) 平均数是频率分布直方图的 “ 重心 ” ,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和 . 基 础 自 测 1. 判断下列结论正误 ( 在括号内打 “√” 或 “×” ) (1) 平均数、众数与中位数从不同的角度描述了一组数据的集中趋势 .(    ) (2) 一组数据的方差越大,说明这组数据越集中 .(    ) (3) 频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大 .(    ) (4) 茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次 .(    ) 解析   (1) 正确 . 平均数、众数与中位数都在一定程度上反映了数据的集中趋势 . (2) 错误 . 方差越大,这组数据越离散 . (4) 错误 . 茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故 (4) 错误 . 答案   (1) √   (2) ×   (3) √   (4) × 2. ( 必修 3P33 讲解引申 改编 ) 一个容量为 32 的样本,已知某组样本的频率为 0.25 ,则该组样本的频数为 (    ) A.4 B.8 C.12 D.16 答案  B 3. ( 必修 3P20 示例改编 ) 若某校高一年级 8 个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是 (    ) A.91.5 和 91.5 B.91.5 和 92 C.91 和 91.5 D.92 和 92 解析  这组数据由小到大排列为 87 , 89 , 90 , 91 , 92 , 93 , 94 , 96 , 答案  A 4. (2018· 全国 Ⅰ 卷 ) 某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番 . 为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图: 则下面结论中不正确的是 (    ) A. 新农村建设后,种植收入减少 B. 新农村建设后,其他收入增加了一倍以上 C. 新农村建设后,养殖收入增加了一倍 D. 新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解析 法一  设新农村建设前经济收入为 a ,则新农村建设后经济收入为 2 a ,则由饼图可得新农村建设前种植收入为 0.6 a ,其他收入为 0.04 a ,养殖收入为 0.3 a . 新农村建设后种植收入为 0.74 a ,其他收入为 0.1 a ,养殖收入为 0.6 a ,养殖收入与第三产业收入的总和为 1.16 a ,所以新农村建设后,种植收入减少是错误的 . 法二  因为 0.6<0.37 × 2 ,所以新农村建设后,种植收入增加,而不是减少,所以 A 是错误的 . 答案  A 5. (2019· 新余二模 ) 为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为 100 的样本,其中城镇户籍与农村户籍各 50 人;男性 60 人,女性 40 人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图 ( 如图所示 ) ,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是 (    ) A. 是否倾向选择生育二胎与户籍有关 B. 是否倾向选择生育二胎与性别无关 C. 倾向选择生育二胎的人员中,男性人数与女性人数相同 D. 倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 解析  由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为 60 × 60% = 36 ,女性人数为 40 × 60% = 24 ,不相同 . 故选 C. 答案  C 答案  50 考点一 茎叶图及其应用 【例 1 】 (1) (2018· 济南模拟 ) 中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里 40 名学生得分数据的茎叶图如图所示 . 若规定得分不小于 85 分的学生得到 “ 诗词达人 ” 的称号,小于 85 分且不小于 70 分的学生得到 “ 诗词能手 ” 的称号,其他学生得到 “ 诗词爱好者 ” 的称号,根据该次比赛的成就按照称号的不同进行分层抽样抽选 10 名学生,则抽选的学生中获得 “ 诗词达人 ” 称号的人数为 (    ) A.2 B.4 C.5 D.6 (2) (2019· 长沙质检 ) 为比较甲乙两地某月 11 时的气温情况,随机选取该月 5 天 11 时的气温数据 ( 单位: ℃ ) 制成如图所示的茎叶图,已知甲地该月 11 时的平均气温比乙地该月 11 时的平均气温高 1 ℃ ,则甲地该月 11 时的平均气温的标准差为 (    ) (2) 甲地该月 5 天 11 时的气温数据 ( 单位: ℃ ) 为 28 , 29 , 30 , 30 + m , 32 ; 乙地该月 5 天 11 时的气温数据 ( 单位: ℃ ) 为 26 , 28 , 29 , 31 , 31 , 则乙地该月 11 时的平均气温为 (26 + 28 + 29 + 31 + 31)÷5 = 29( ℃ ) , 所以甲地该月 11 时的平均气温为 30 ℃ , 故 (28 + 29 + 30 + 30 + m + 32)÷5 = 30 ,解得 m = 1. 则甲地该月 11 时的平均气温的标准差为 答案  (1)A   (2)B 规律方法   1. 茎叶图的三个关注点 (1) “ 叶 ” 的位置只有一个数字,而 “ 茎 ” 的位置的数字位数一般不需要统一 . (2) 重复出现的数据要重复记录,不能遗漏 . (3) 给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般 “ 重心 ” 下移者平均数较大,数据集中者方差较小 . 2. 利用茎叶图解题的关键是抓住 “ 叶 ” 的分布特征,准确从中提炼信息 . 【训练 1 】 空气质量指数 (Air Quality Index ,简称 AQI) 是定量描述空气质量状况的指数,空气质量按照 AQI 大小分为六级, 0 ~ 50 为优; 51 ~ 100 为良; 101 ~ 150 为轻度污染; 151 ~ 200 为中度污染; 201 ~ 300 为重度污染;大于 300 为严重污染 . 从某地一环保人士某年的 AQI 记录数据中,随机抽取 10 个,用茎叶图记录如下 . 根据该统计数据,估计此地该年 AQI 大于 100 的天数约为 ________( 该年为 365 天 ). 答案  146 考点二 频率分布直方图 【例 2 】 (2019· 石家庄模拟 ) “ 一带一路 ” 是 “ 丝绸之路经济带 ” 和 “ 21 世纪海上丝绸之路 ” 的简称 . 某市为了了解人们对 “ 一带一路 ” 的认知程度,对不同年龄和不同职业的人举办了一次 “ 一带一路 ” 知识竞赛,满分为 100 分 (90 分及以上为认知程度高 ). 现从参赛者中抽取了 x 人,按年龄分成 5 组,第一组: [20 , 25) ,第二组: [25 , 30) ,第三组: [30 , 35) ,第四组: [35 , 40) ,第五组: [40 , 45] ,得到如图所示的频率分布直方图,已知第一组有 6 人 . (1) 求 x ; (2) 求抽取的 x 人的年龄的中位数 ( 结果保留整数 ) ; (3) 从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取 6 人, 42 人, 36 人, 24 人, 12 人,分别记为 1 ~ 5 组,从这 5 个按年龄分的组和 5 个按职业分的组中每组各选派 1 人参加知识竞赛,分别代表相应组的成绩,年龄组中 1 ~ 5 组的成绩分别为 93 , 96 , 97 , 94 , 90 ,职业组中 1 ~ 5 组的成绩分别为 93 , 98 , 94 , 95 , 90. ( ⅰ ) 分别求 5 个年龄组和 5 个职业组成绩的平均数和方差; ( ⅱ ) 以上述数据为依据,评价 5 个年龄组和 5 个职业组对 “ 一带一路 ” 的认知程度,并谈谈你的感想 . (2) 设中位数为 a ,则 0.01 × 5 + 0.07 × 5 + ( a - 30) × 0.06 = 0.5 , ( ⅱ ) 从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定 ( 感想合理即可 ). 【训练 2 】 某公司为了解用户对其产品的满意度,从 A , B 两地区分别随机调查了 40 个用户,根据用户对产品的满意评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度评分的频率分布表 . A 地区用户满意度评分的频率分布直方图 图 ① B 地区用户满意度评分的频率分布表 满意度评分分组 [50 , 60) [60 , 70) [70 , 80) [80 , 90) [90 , 100] 频数 2 8 14 10 6 (1) 在图 ② 中作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度 ( 不要求计算出具体值,给出结论即可 ) ; B 地区用户满意度评分的频率分布直方图 图 ② (2) 根据用户满意度评分,将用户和满意度分为三个等级: 满意度评分 低于 70 分 70 分到 89 分 不低于 90 分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的概率大?说明理由 . 解  (1) 作出频率分布直方图如图: 通过两地区用户满意度评分的频率分布直方图可以看出, B 地区用户满意度评分的平均值高于 A 地区用户满意度评分的平均值; B 地区用户满意度评分比较集中,而 A 地区用户满意度评分比较分散 . (2) A 地区用户的满意度等级为不满意的概率大 . 记 C A 表示事件: “ A 地区用户的满意度等级为不满意 ” ; C B 表示事件: “ B 地区用户的满意度等级为不满意 ”. 由直方图得 P ( C A ) 的估计值为 (0.01 + 0.02 + 0.03) × 10 = 0.6 , P ( C B ) 的估计值为 (0.005 + 0.02) × 10 = 0.25. 所以 A 地区用户的满意度等级为不满意的概率大 . 考点三 样本的数字特征 【例 3 】 (1) (2017· 全国 Ⅰ 卷 ) 为评估一种农作物的种植效果,选了 n 块地作试验田 . 这 n 块地的亩产量 ( 单位: kg) 分别为 x 1 , x 2 , … , x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 (    ) A. x 1 , x 2 , … , x n 的平均数 B. x 1 , x 2 , … , x n 的标准差 C. x 1 , x 2 , … , x n 的最大值 D. x 1 , x 2 , … , x n 的中位数 (2) (2019· 济南模拟 ) 已知某 7 个数的平均数为 4 ,方差为 2 ,现加入一个新数据 4 ,此时这 8 个数的平均数为,方差为 s 2 ,则 (    ) 解析  (1) 刻画评估这种农作物亩产量稳定程度的指标是标准差 . 答案  (1)B   (2)A 规律方法   1. 平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定 . 2. 用样本估计总体就是利用样本的数字特征来描述总体的数字特征 . 【训练 3 】 (1) 抽样统计甲、乙两位射击运动员的 5 次训练成绩 ( 单位:环 ) ,结果如下: 运动员 第 1 次 第 2 次 第 3 次 第 4 次 第 5 次 甲 87 91 90 89 93 乙 89 90 91 88 92 则成绩较为稳定 ( 方差较小 ) 的那位运动员成绩的方差为 ________. (2) (2018· 北京东城质检 ) 某班男女生各 10 名同学最近一周平均每天的锻炼时间 ( 单位:分钟 ) 用茎叶图记录如下: 假设每名同学最近一周平均每天的锻炼时间是互相独立的 . ① 男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; ② 从平均值分析,男生每天锻炼的时间比女生多; ③ 男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差; ④ 从 10 个男生中任选一人,平均每天的锻炼时间超过 65 分钟的概率比同样条件下女生锻炼时间超过 65 分钟的概率大 . 其中符合茎叶图所给数据的结论是 (    ) A. ①②③ B. ②③④ C. ①②④ D. ①③④ (2) 由茎叶图知,男生每天锻炼时间差别小,女生差别大, ① 正确 . 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, ∴ s 甲 < s 乙 , ③ 错误, 因此符合茎叶图所给数据的结论是 ①②④ . 答案  (1)2   (2)C [ 思维升华 ] 1 . 用样本估计总体是统计的基本思想 . 用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用 . 2.(1) 众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质 . (2) 标准差、方差描述了一组数据围绕平均数波动的大小 . 标准差、方差越大,数据的离散程度就越大 . 3. 茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律 .
查看更多

相关文章

您可能关注的文档