- 2021-06-24 发布 |
- 37.5 KB |
- 35页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
高考文科数学复习备课课件:第四节 用样本估计总体
文数 课标版 第四节 用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(一组数据中① 最大值 与② 最小值 的差). (2)决定③ 组距 与④ 组数 . (3)将数据⑤ 分组 . (4)列⑥ 频率分布表 . 教材研读 (5)画⑦ 频率分布直方图 . 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的 ⑧ 中点 ,就得到频率分布折线图. (2)总体密度曲线:一般地,随着样本容量的增加,作频率分布直方图时 ⑨ 所分组数 增加,⑩ 组距 减小,相应的频率分布折线图就会越 来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图的优点 茎叶图的优点是可以 保留 原始数据,而且可以 随时 记录. 4.样本的数字特征 (1)众数、中位数、平均数 . (ii)方差:标准差的平方 s 2 . s 2 = [( x 1 - ) 2 +( x 2 - ) 2 + … +( x n - ) 2 ] . (2)标准差、方差 (i)标准差:表示样本数据到平均数的一种平均距离.一般用 s 表示, s = 判断下列结论的正误(正确的打“√”,错误的打“ × ”) (1)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. ( × ) (2)频率分布直方图中,小矩形的高表示频率. ( × ) (3)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等 的. ( × ) (4)一组数据的方差越大,说明这组数据的波动越大. (√) 1.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图 所示,则该校女教师的人数为 ( ) A.93 B.123 C.137 D.167 答案 C 初中部女教师人数为110 × 70%=77, 高中部女教师人数为150 × (1-60%)=60, 所以该校女教师的人数为77+60=137.故选C. 2.10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17, 17,16,14,12,设其平均数为 a ,中位数为 b ,众数为 c ,则有 ( ) A. a > b > c B. b > c > a C. c > a > b D. c > b > a 答案 D a = =14.7,因为这组数据 中,17出现的次数最多,故 c =17.这些数据由小到大排列依次是10,12,14, 14,15,15,16,17,17,17,因此 b =15,所以 c > b > a . 3.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3; [30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率 是 ( ) A.0.05 B.0.25 C.0.5 D.0.7 答案 D 由题意知,在区间[10,50)上的数据的频数是2+3+4+5=14,故 其频率为 =0.7. 4.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”, 并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检 测后所作的频率分布直方图,则从图中可以看出被处罚的汽车大约有 ( ) A.30辆 B.40辆 C.60辆 D.80辆 答案 B 从频率分布直方图可知,车速大于或等于70 km/h的频率为 0.02 × 10=0.2,而样本容量为200,所以被处罚的汽车约有200 × 0.2=40辆. 5.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差 是 . 答案 0.1 解析 = =5.1, 则该组数据的方差 s 2 = =0.1. 考点一 频率分布直方图 典例1 (2016北京,17,13分)某市居民用水拟实行阶梯水价.每人月用水 量中不超过 w 立方米的部分按4元/立方米收费,超出 w 立方米的部分按1 0元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用 水量数据,整理得到如下频率分布直方图: 考点突破 (1)如果 w 为整数,那么根据此次调查,为使80%以上居民在该月的用 水价格为4元/立方米, w 至少定为多少? (2)假设同组中的每个数据用该组区间的右端点值代替.当 w =3时,估计 该市居民该月的人均水费. 解析 (1)由用水量的频率分布直方图知, 该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频 率依次为0.1,0.15,0.2,0.25,0.15. 所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的 居民占45%. 依题意, w 至少定为3. (2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分 组与频率分布表如下: 根据题意,该市居民该月的人均水费估计为: 4 × 0.1+6 × 0.15+8 × 0.2+10 × 0.25+12 × 0.15+17 × 0.05+22 × 0.05+27 × 0.05= 10.5(元). 组号 1 2 3 4 5 6 7 8 分组 [2,4] (4,6] (6,8] (8,10] (10,12] (12,17] (17,22] (22,27] 频率 0.1 0.15 0.2 0.25 0.15 0.05 0.05 0.05 方法技巧 1.绘制频率分布直方图时需注意: (1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表 是否正确; (2)频率分布直方图的纵坐标是 ,而不是频率. 2.由频率分布直方图进行相关计算时,需掌握下列关系式: (1) × 组距=频率; (2) =频率,此关系式的变形为 =样本容量,样本容量 × 频率= 频数. 1-1 (2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位: 小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5, 30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据 直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) A.56 B.60 C.120 D.140 答案 D 由频率分布直方图知200名学生每周的自习时间不少于22.5 小时的频率为1-(0.02+0.10) × 2.5=0.7,则这200名学生中每周的自习时间 不少于22.5小时的人数为200 × 0.7=140,故选D. 1-2 (2015湖北,14,5分)某电子商务公司对10 000名网络购物者2014年 度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内, 其频率分布直方图如图所示. (1)直方图中的 a = ; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 . 答案 (1)3 (2)6 000 解析 (1)由频率分布直方图可知: 0.1 × (0.2+0.8+1.5+2.0+2.5+ a )=1,解得 a =3. (2)消费金额在区间[0.5,0.9]内的购物者的频率为0.1 × (3.0+2.0+0.8+0.2) =0.6,所以所求购物者的人数为0.6 × 10 000=6 000. 考点二 茎叶图 典例2 (1)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示, 则这组数据的中位数和平均数分别是 ( ) A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92 (2)(2014课标Ⅱ,19,12分)某市为了考核甲、乙两部门的工作情况,随机 访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市 民的评价越高),绘制茎叶图如下: 甲部门 乙部门 4 97 97665332110 98877766555554443332100 6655200 632220 3 4 5 6 7 8 9 10 59 0448 122456677789 011234688 00113449 123345 011456 000 ①分别估计该市的市民对甲、乙两部门评分的中位数; ②分别估计该市的市民对甲、乙两部门的评分高于90的概率; ③根据茎叶图分析该市的市民对甲、乙两部门的评价. 答案 (1)A 解析 (1)将这组数据从小到大排列为87,89,90,91,92,93,94,96. 故中位数为 =91.5. 平均数为91+ =91.5. (2)①由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第 25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的 中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第 25,26位的是66,68,故样本中位数为 =67,所以该市的市民对乙部门 评分的中位数的估计值是67. ②由所给茎叶图知,50位市民对甲、乙两部门的评分高于90的比率分别 为 =0.1, =0.16,故该市的市民对甲、乙两部门的评分高于90的概率 的估计值分别为0.1,0.16. ③由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分 的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于 对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较 为一致,对乙部门的评价较低、评价差异较大. 规律总结 (1)茎叶图的绘制需注意:①“叶”的每个位置上只有一个数字,而 “茎”的每个位置上的数的位数一般不需要统一;②重复出现的数据要 重复记录,不能遗漏. (2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以 用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中 在哪块茎,数据分布是否均匀等. 2-1 为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地 选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间 后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下: 服用A药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 解析 (1)设A药观测数据的平均数为 ,B药观测数据的平均数为 ,由 观测结果可得 = × (0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+ 2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, = × (0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1 +2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得 > ,因此可看出A药的疗效更好. (2)由观测结果可绘制如下茎叶图: 从以上茎叶图可以看出,A药疗效的试验结果有 的叶集中在茎2,3上, 而B药疗效的试验结果有 的叶集中在茎0,1上,由此可看出A药的疗效 更好. 考点三 样本的数字特征 典例3 (2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制 定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年1 00位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1), …… , [4,4.5]分成9组,制成了如图所示的频率分布直方图. (1)求直方图中 a 的值; (2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说 明理由; (3)估计居民月均用水量的中位数. 解析 (1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08 × 0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08, 0.21,0.25,0.06,0.04,0.02. 由 1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5 × a +0.5 × a , 解得 a =0.30. (2) 由 (1) 知 ,100 位居民月均用水量不低于 3 吨的频率为 0.06+0.04+0.02 =0.12, 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的 人数为300 000 × 0.12=36 000. (3)设中位数为 x 吨. 因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5, 所以2 ≤ x <2.5. 由0.50 × ( x -2)=0.5-0.48, 解得 x =2.04. 故可估计居民月均用水量的中位数为2.04吨. 规律总结 频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个 小长方形的面积乘以小长方形底边中点的横坐标之和. 3-1 (2015山东,6,5分)为比较甲、乙两地某月14时的气温状况,随机选 取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎 叶图. 考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为 ( ) A.①③ B.①④ C.②③ D.②④ 答案 B 由茎叶图中的数据通过计算求得 =29, =30, s 甲 = , s 乙 = ,∴ < , s 甲 > s 乙 ,故①④正确.选B. 3-2 (2015广东,17,12分)某工厂36名工人的年龄数据如下表. (1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段 里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值 和方差 s 2 ; (3)36名工人中年龄在 - s 与 + s 之间有多少人?所占的百分比是多少(精 确到0.01%)? 解析 (1)由系统抽样,将36名工人分为9组(4人一组),每组抽取一名工 人. 因为在第一分段里抽到的是年龄为44的工人,即编号为2的工人,故所抽 样本的年龄数据为44,40,36,43,36,37,44,43,37. (2)均值 = =40; 方差 s 2 = × [(44-40) 2 +(40-40) 2 +(36-40) 2 +(43-40) 2 +(36-40) 2 +(37-40) 2 +(44-40) 2 +(43-40) 2 +(37-40) 2 ]= . (3)由(2)可知 s = .由题意,年龄在 内的工人共有23人,所 占的百分比为 × 100% ≈ 63.89%.查看更多