2018届高三数学一轮复习: 第9章 第3节 用样本估计总体

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

2018届高三数学一轮复习: 第9章 第3节 用样本估计总体

第三节 用样本估计总体 [考纲传真] 1.了解分布的意义与作用,能根据概率分布表画频率分布直方 图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和 作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标 准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基 本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估 计总体的思想解决一些简单的实际问题. 1.频率分布直方图 (1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距=极差 组数; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区 间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图 9­3­1). 图 9­3­1 横轴表示样本数据,纵轴表示频率 组距,每个小矩形的面积表示样本落在该组内 的频率. 2.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶 是从茎的旁边生长出来的数. 3.样本的数字特征 数字特征 定义 众数 在一组数据中,出现次数最多的数据叫做这组数据的众数 中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中 间两个数据的平均数)叫做这组数据的中位数. 在频率分布直方图中,中位数左边和右边的直方图的面积相等 平均数 样本数据的算术平均数,即x=x1+x2+…+xn n 方差 s2=1 n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中 s 为标准差 1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(  ) (2)一组数据的方差越大,说明这组数据越集中. (  ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频 率越高.(  ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序 写,相同的数据可以只记一次.(  ) [解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中 趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积=组距×频率 组距=频率. (4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要 重复记录,故(4)错误. [答案] (1)√ (2)× (3)√ (4)× 2.(教材改编)若某校高一年级 8 个班参加合唱比赛的得分如茎叶图 9­3­2 所 示,则这组数据的中位数和平均数分别是(  ) 图 9­3­2 A.91.5 和 91.5    B.91.5 和 92 C.91 和 91.5 D.92 和 92 A [这组数据由小到大排列为 87,89,90,91,92,93,94,96. ∴中位数是91+92 2 =91.5, 平均数x=87+89+90+91+92+93+94+96 8 =91.5.] 3.(2017·南昌二模)如图 9­3­3 所示是一样本的频率分布直方图.若样本容 量为 100,则样本数据在[15,20)内的频数是(  ) 图 9­3­3 A.50 B.40 C.30 D.14 C [因为[15,20]对应的小矩形的面积为 1-0.04×5-0.1×5=0.3,所以样本 落在[15,20]的频数为 0.3×100=30,故选 C.] 4.(2016·江苏高考)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 ________. 0.1 [5 个数的平均数x=4.7+4.8+5.1+5.4+5.5 5 =5.1, 所以它们的方差 s2=1 5[(4.7-5.1)2+(4.8-5.1) 2+(5.1-5.1) 2+(5.4-5.1) 2+ (5.5-5.1)2]=0.1.] 5.(2017·山东淄博模拟)某校女子篮球队 7 名运动员身高(单位:cm)分布的 茎叶图如图 9­3­4,已知记录的平均身高为 175 cm,但记录中有一名运动员身高 的末位数字不清晰,如果把其末位数字记为 x,那么 x 的值为________. 图 9­3­4 2 [170+1 7 ×(1+2+x+4+5+10+11)=175, 则1 7 ×(33+x)=5,即 33+x=35,解得 x=2.] 样本的数字特征  (1)(2015·广东高考)已知样本数据 x 1,x2,…,xn 的均值x=5,则样 本数据 2x1+1,2x2+1,…,2xn+1 的均值为________. (2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取 这两个小组往年研发新产品的结果如下:(a,b),(a,b),(a,b),(a,b),(a, b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b), (a,b).其中 a,a分别表示甲组研发成功和失败;b,b分别表示乙组研发成功和 失败. ①若某组成功研发一种新产品,则给该组记 1 分,否则记 0 分.试计算甲、 乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平; ②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功 的概率. (1)11   [ 由 条 件 知 x= x1+x2+…+xn n = 5 , 则 所 求 均 值 x0 = 2x1+1+2x2+1+…+2xn+1 n = 2(x1+x2+…+xn)+n n =2x+1=2×5+1=11.] (2)①甲组研发新产品的成绩为 1,1,1,0,0,1,1,1,0,1,0,1,1,0,1, 其平均数为x甲=10 15 =2 3.3 分 方差 s 2甲= 1 15[(1-2 3)2 × 10+(0-2 3)2 × 5]=2 9. 乙组研发新产品的成绩为 1,0,1,1,0,1,1,0,1,0,0,1,0,1,1, 其平均数为x乙= 9 15 =3 5. 方差 s 2乙= 1 15[(1-3 5)2 × 9+(0-3 5)2 × 6]= 6 25. 因为x甲>x乙,s 2甲<s 2乙, 所以甲组的研发水平优于乙组.6 分 ②记 E={恰有一组研发成功}. 在所抽得的 15 个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a, b),(a,b),(a,b),(a,b),(a,b),共 7 个. 因此事件 E 发生的概率为 7 15. 用频率估计概率,即得所求概率为 P(E)= 7 15.12 分 [规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反 映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公 式. 2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两 品种做出评价或选择. [变式训练 1] (2017·郑州模拟)为比较甲、乙两地某月 14 时的气温状况,随 机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如图 9­3­5 所 示的茎叶图.考虑以下结论: 图 9­3­5 ①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温; ②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温; ③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差; ④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差. 其中根据茎叶图能得到的统计结论的序号为 (  ) A.①③   B.①④  C.②③   D.②④ B [甲地 5 天的气温为:26,28,29,31,31, 其平均数为x甲=26+28+29+31+31 5 =29; 方差为 s 2甲=1 5[(26-29)2+(28-29) 2+(29-29) 2+(31-29) 2+(31-29) 2]= 3.6; 标准差为 s 甲= 3.6. 乙地 5 天的气温为:28,29,30,31,32, 其平均数为x乙=28+29+30+31+32 5 =30; 方差为 s 2乙=1 5[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2; 标准差为 s 乙= 2.∴x甲<x乙,s 甲>s 乙.] 茎叶图及其应用  (2014·全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问 了 50 位市民.根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越 高),绘制茎叶图如下: (1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价. [解] (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位 数的估计值是 75.3 分 50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样 本中位数为66+68 2 =67,所以该市的市民对乙部门评分的中位数的估计值是 67.5 分 (2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为5 50 =0.1, 8 50 =0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分 别为 0.1,0.16.8 分 (3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的 中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的 评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的 评价较低、评价差异较大.12 分 [规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映 数据在各段上的分布情况. 2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作 “叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处 理. (2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理 能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息. [变式训练 2] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图 9­3­6 所示, 若两组数据的中位数相同,平均数也相同,那么 m+n=________. 【导学号:01772364】 图 9­3­6 11 [∵两组数据的中位数相同, ∴m=2+4 2 =3. 又∵两组数据的平均数也相同, ∴27+33+39 3 =20+n+32+34+38 4 ,∴n=8, 因此 m+n=11.] 频率分布直方图 ☞角度 1 利用分布直方图求频率、频数  (2016·山东高考)某高校调查了 200 名学生每周的自习时间(单位: 小时),制成了如图 9­3­7 所示的频率分布直方图,其中自习时间的范围是 [17.5,30] , 样 本 数 据 分 组 为 [17.5,20) , [20,22.5) , [22.5,25) , [25,27.5) , [27.5,30].根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数 是(  ) 图 9­3­7 A.56 B.60 C.120 D.140 D [由直方图可知每周自习时间不少于 22.5 小时的频率为(0.16+0.08+ 0.04)×2.5=0.7,则每周自习时间不少于 22.5 小时的人数为 0.7×200=140.故选 D.] ☞角度 2 用频率分布直方图估计总体  (2016·四川高考)我国是世界上严重缺水的国家,某市政府为了鼓 励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量 标准 x(吨),一位居民的月用水量不超过 x 的部分按平价收费,超出 x 的部分按 议价收费.为了了解居民用水情况,通过抽样,获得了某年 100 位居民每人的月 均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成 9 组,制成了 如图 9­3­8 所示的频率分布直方图. 图 9­3­8 (1)求直方图中 a 的值; (2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,并 说明理由; (3)若该市政府希望使 85%的居民每月的用水量不超过标准 x(吨),估计 x 的 值,并说明理由. [解] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为 0.08×0.5= 0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为 0.08,0.20,0.26,0.06,0.04,0.02.3 分 由 0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1, 解得 a=0.30.5 分 (2)由(1),知 100 位居民每人的月均用水量不低于 3 吨的频率为 0.06+0.04+ 0.02=0.12.由以上样本的频率分布,可以估计全市 30 万居民中月均用水量不低 于 3 吨的人数为 300 000×0.12=36 000.8 分 (3) 因 为 前 6 组 的 频 率 之 和 为 0.04 + 0.08 + 0.15 + 0.20 + 0.26 + 0.15 = 0.88>0.85,而前 5 组的频率之和为 0.04+0.08+0.15+0.20+0.26=0.73<0.85, 所以 2.5≤x<3.由 0.30×(x-2.5)=0.85-0.73,解得 x=2.9. 所以,估计月用水量标准为 2.9 吨时,85%的居民每月的用水量不超过标 准.12 分 [规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵 轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频 率. 2.(1)例 3-2 中抓住频率分布直方图中各小长方形的面积之和为 1,这是解 题的关键.(2)利用样本的频率分布估计总体分布. [思想与方法] 1.用样本估计总体是统计的基本思想. 用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的 绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理 解及应用. 2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最 重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质. (2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越 大,数据的离散程度就越大. (3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的 分布规律的. [易错与防范] 1.使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义. 2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分: (1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3) 平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积 乘以小矩形底边中点的横坐标之和. 3.直方图与条形图不要搞混. 频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个 体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是 常见的错误.
查看更多

相关文章

您可能关注的文档