- 2021-06-24 发布 |
- 37.5 KB |
- 9页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2018届二轮复习用样本估计总体学案(全国通用)
用样本估计总体 【考点梳理】 1.频率分布直方图 (1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距=; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图). 横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率. 2.茎叶图 统计中还有一种被用 表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出 的数. 3.样本的数字特征 数字特征 定义 众数 在一组数据中,出现次数最多的数据叫做这组数据的众数 中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 在频率分布直方图中,中位数左边和右边的直方图的面积相等 平均数 样本数据的算术平均数,即= 方差 s2=[(x1-)2+(x2-)2+…+(xn-)2],其中s为标准差 【考点突破】 考点一、样本的数字特征 【例1】(1)已知样本数据x1,x2,…,xn的均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________. (2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b).其中a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败. ①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平; ②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. [答案] (1)11 [解析] (1)由条件知==5,则所求均值 0===2+1=2×5+1=11. (2)①甲组研发新产品的成绩为 1,1,1,0,0,1,1,1,0,1,0,1,1,0,1, 其平均数为甲==.3分 方差s==. 乙组研发新产品的成绩为 1,0,1,1,0,1,1,0,1,0,0,1,0,1,1, 其平均数为乙==. 方差s==. 因为甲>乙,s<s, 所以甲组的研发水平优于乙组. ②记E={恰有一组研发成功}. 在所抽得的15个结果中,恰有一组研发成功的结果是(a,),(,b),(a,),(,b),(a,),(a,),(,b),共7个. 因此事件E发生的概率为. 用频率估计概率,即得所求概率为P(E)=. 【类题通法】 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式. 2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择. 【对点训练】 1.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( ) A.8 B.15 C.16 D.32 [答案]C [解析]已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16. 2.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的序号为 ( ) A.①③ B.①④ C.②③ D.②④ [答案]B [解析]甲地5天的气温为:26,28,29,31,31, 其平均数为甲==29; 方差为s=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6; 标准差为s甲=. 乙地5天的气温为:28,29,30,31,32, 其平均数为乙==30; 方差为s=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2; 标准差为s乙=.∴甲<乙,s甲>s乙. 考点二、茎叶图及其应用 【例2】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下: 甲部门 乙部门 3 59 4 4 0448 97 5 122456677789 97665332110 6 011234688 98877766555554443332100 7 00113449 6655200 8 123345 632220 9 011456 10 000 (1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价. [解析] (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分 50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分 (2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分 (3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大. 【类题通法】 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况. 2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理. (2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息. 【对点训练】 已知甲、乙两组数据如茎叶图所示,若两组数据的中位数相同,平均数也相同,那么m+n=________. [答案]11 [解析]∵两组数据的中位数相同, ∴m==3. 又∵两组数据的平均数也相同, ∴=,∴n=8, 因此m+n=11. 考点三、频率分布直方图 【例3】某高校调查了200名 生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名 生中每周的自习时间不少于22.5小时的人数是( ) A.56 B.60 C.120 D.140 [答案]D [解析]由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D. 【例4】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图. (1)求直方图中a的值; (2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月均用水量的中位数. [解析] (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02. 由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a, 解得a=0.30. (2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. (3)设中位数为x吨. 因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5, 而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5, 所以2≤x<2.5. 由0.50×(x-2)=0.5-0.48,解得x=2.04. 故可估计居民月均用水量的中位数为2.04吨. 【类题通法】 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率. 2.(1)例4中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布. 【对点训练】 1.某班的全体 生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的 生人数是( ) A.45 B.50 C.55 D.60 [答案]B [解析]由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3. ∴该班 生人数n==50. 2.某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图: (1)如果w为整数,那么根据此次调查,为使80 以上居民在该月的用水价格为4元/立方米,w至少定为多少? (2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费. [解析] (1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15. 所以该月用水量不超过3立方米的居民占85 ,用水量不超过2立方米的居民占45 . 依题意,w至少定为3. (2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下: 组号 1 2 3 4 5 6 7 8 分组 [2,4] (4,6] (6,8] (8,10] (10,12] (12,17] (17,22] (22,27] 频率 0.1 0.15 0.2 0.25 0.15 0.05 0.05 0.05 根据题意,该市居民该月的人均水费估计为 4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).查看更多