【导与练】2017届高三数学(文)二轮复习(全国通用)专题突破 专题七 概率与统计 第2讲 统计及统计案例

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

【导与练】2017届高三数学(文)二轮复习(全国通用)专题突破 专题七 概率与统计 第2讲 统计及统计案例

www.ks5u.com 第2讲 统计及统计案例 ‎(限时:45分钟)‎ ‎【选题明细表】‎ 知识点、方法 题号 抽样方法 ‎1,3,6,10‎ 特征值 ‎2,4‎ 回归分析 ‎7,9,13‎ 独立性检验 ‎5‎ 综合 ‎8,11,12‎ 重点把关 ‎1.(2015·北京卷,文4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( C )‎ 类别 人数 老年教师 ‎900‎ 中年教师 ‎1 800‎ 青年教师 ‎1 600‎ 合计 ‎4 300‎ ‎(A)90 (B)100 (C)180 (D)300‎ 解析:设样本中的老年教师人数为x,则=,解得x=180.故选C.‎ ‎2.(2015·重庆卷,文4)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:‎ 则这组数据的中位数是( B )‎ ‎(A)19 (B)20 ‎ ‎(C)21.5 (D)23‎ 解析:由题中茎叶图可知,该组数据的中位数为=20,故选B.‎ ‎3.(2015·湖南卷,文2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.‎ 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( B )‎ ‎(A)3 (B)4 (C)5 (D)6‎ 解析:第一组(130,130,133,134,135),第二组(136,136,138,138,‎ ‎138),第三组(139,141,141,141,142),第四组(142,142,143,143,‎ ‎144),第五组(144,145,145,145,146),第六组(146,147,148,150,‎ ‎151),第七组(152,152,153,153,153),故成绩在[139,151]上恰有4组,故有4人,选B.‎ ‎4.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,如图是根据哈尔滨三中学生社团某日早6点至晚9点在南岗、群力两个校区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,南岗、群力两个校区浓度的方差较小的是( A )‎ 南岗校区 群力校区 ‎2‎ ‎0.04‎ ‎1 2 3 6‎ ‎9 3‎ ‎0.05‎ ‎9‎ ‎6 2 1‎ ‎0.06‎ ‎2 9‎ ‎3 3 1‎ ‎0.07‎ ‎9‎ ‎6 4‎ ‎0.08‎ ‎7‎ ‎7‎ ‎0.09‎ ‎2 4 6‎ ‎(A)南岗校区 ‎(B)群力校区 ‎(C)南岗、群力两个校区相等 ‎(D)无法确定 解析:方差较小即两者比较时数据比较集中,从茎叶图知,南岗校区数据集中,而群力校区数据分散的很明显.故南岗校区浓度的方差较小.故选A.‎ ‎5.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表 做不到“光盘”‎ 能做到“光盘”‎ 男 ‎45‎ ‎10‎ 女 ‎30‎ ‎15‎ P(K2>k)‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ k ‎2.706‎ ‎3.841‎ ‎5.024‎ 附:K2= 参照附表,得到的正确结论是( C )‎ ‎(A)在犯错误的概率不超过1%的前提下,认为“该市居民能否做到 ‎‘光盘’与性别有关”‎ ‎(B)在犯错误的概率不超过1%的前提下,认为“该市居民能否做到 ‎‘光盘’与性别无关”‎ ‎(C)有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”‎ ‎(D)有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”‎ 解析:由表计算得:K2=≈3.03,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C.‎ ‎6.(2016·湖南岳阳二模)将高三(1)班参加体检的36名学生编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6号、24号、33号的学生,则样本中剩余一名学生的编号是    . ‎ 解析:样本间距为36÷4=9,‎ 则另外一个编号为6+9=15.‎ 答案:15‎ ‎7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:‎ 单价x(元)‎ ‎8‎ ‎8.2‎ ‎8.4‎ ‎8.6‎ ‎8.8‎ ‎9‎ 销量y(件)‎ ‎90‎ ‎84‎ ‎83‎ ‎80‎ ‎75‎ ‎68‎ 由表中数据,求得线性回归方程为=-20x+.若在这些样本点中任取一点,则它在回归直线左下方的概率为    . ‎ 解析:由表中数据求出样本平均数=8.5,=80,代入线性回归方程得,=250,所以线性回归方程为y=-20x+250.经验证,样本点在回归直线左下方的有(8.2,84),(9,68)两个点,由古典概型的概率公式得,P==.‎ 答案: ‎8.(2016·甘肃河西五市部分普通高中第一次联考)为了调查高一新生中女生的体重情况,校卫生室随机选20名女生作为样本,测量她们的体重(单位:kg),获得的所有数据按照区间[40,45],(45,50],(50,‎ ‎55],(55,60]进行分组,得到频率分布直方图如图所示.已知样本中体重在区间(45,50]上的女生数与体重在区间(50,60]上的女生数之比为4∶3.‎ ‎(1)求a,b的值;‎ ‎(2)从样本中体重在区间(50,60]上的女生中随机抽取两人,求体重在区间(55,60]上的女生至少有一人被抽中的概率.‎ 解:(1)样本中体重在区间(45,50]上的女生有a×5×20=100a(人),‎ 样本中体重在区间(50,60]上的女生有(b+0.02)×5×20=100(b+0.02)(人),‎ 依题意,有100a=×100(b+0.02),‎ 即a=×(b+0.02). ①‎ 根据频率分布直方图可知 ‎(0.02+b+0.06+a)×5=1, ②‎ 解①②得a=0.08,b=0.04.‎ ‎(2)样本中体重在区间(50,55]上的女生有0.04×5×20=4人,分别记为A1,A2,A3,A4,‎ 体重在区间(55,60]上的女生有0.02×5×20=2人,分别记为B1,B2.‎ 从这6名女生中随机抽取两人共有15种情况:‎ ‎(A1,A2),(A1,A3),(A1,A4),(A1,B1),(A1,B2),(A2,A3),(A2,A4),(A2,B1),‎ ‎(A2,B2),(A3,A4),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2).‎ 其中体重在(55,60]上的女生至少有一人被抽中共有9种情况:‎ ‎(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2),‎ ‎(B1,B2).‎ 记“从样本中体重在区间(50,60]上的女生中随机抽取两人,体重在区间(55,60]上的女生至少有一人被抽中”为事件M,则P(M)==.‎ 能力提升 ‎9.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:‎ 收入x(万元)‎ ‎8.2‎ ‎8.6‎ ‎10.0‎ ‎11.3‎ ‎11.9‎ 支出y(万元)‎ ‎6.2‎ ‎7.5‎ ‎8.0‎ ‎8.5‎ ‎9.8‎ 根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( B )‎ ‎(A)11.4万元 (B)11.8万元 ‎(C)12.0万元 (D)12.2万元 解析:由统计数据表可得 ==10.0,‎ ==8.0,‎ 则=8.0-0.76×10.0=0.4,所以回归直线方程=0.76x+0.4,当x=15时,=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元,故选B.‎ ‎10.假设要考查某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到第4个样本个体的编号是    .(下面摘取了随机数表第7行至第9行) ‎ ‎84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76‎ ‎63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79‎ ‎33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54‎ 解析:找到第7行第8列的数开始向右读,‎ 第一个符合条件的数是331,‎ 第二个数是572,‎ 第三个数是455,‎ 第四个数是068.‎ 答案:068‎ ‎11.(2016·海南海口调研)某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛.为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计.请根据下面尚未完成并有局部污损的频率分布表和频率分布直方图(如图所示)解答下列问题.‎ 组别 分组 频数 频率 第1组 ‎[50,60)‎ ‎8‎ ‎0.16‎ 第2组 ‎[60,70)‎ a ‎■‎ 第3组 ‎[70,80)‎ ‎20‎ ‎0.40‎ 第4组 ‎[80,90)‎ ‎■‎ ‎0.08‎ 第5组 ‎[90,100]‎ ‎2‎ b 合计 ‎■‎ ‎■‎ ‎(1)写出a,b,x,y的值;‎ ‎(2)在选取的样本中,从竞赛成绩是80分以上(含80分)的同学中随机抽取2名同学到广场参加环保知识的志愿宣传活动.‎ ‎①求所抽取的2名同学中至少有1名同学来自第5组的概率;‎ ‎②求所抽取的2名同学来自同一组的概率.‎ 解:(1)由题意可知,样本总人数为=50,‎ 所以b==0.04,‎ a=16,b=0.04,x=0.032,y=0.004.‎ ‎(2)①由题意可知,第4组共有4人,记为A,B,C,D,第5组共有2人,记为X,Y.‎ 从竞赛成绩是80分以上(含80分)的同学中随机抽取2名同学有AB,AC,AD,BC,BD,CD,AX,AY,BX,BY,CX,CY,DX,DY,XY共15种情况.‎ 设“随机抽取的2名同学中至少有1名同学来自第5组”为事件E,‎ 有AX,AY,BX,BY,CX,CY,DX,DY,XY共9种情况.‎ 所以P(E)==.‎ ‎②设“随机抽取的2名同学来自同一组”为事件F,‎ 有AB,AC,AD,BC,BD,CD,XY共7种情况.‎ 所以P(F)=.‎ ‎12.(2016·湖南常德模拟)某机构为了解某地区中学生在校月消费情况,随机抽取了100名中学生进行调查.如图是根据调查的结果绘制的学生在校月消费金额的频率分布直方图.已知[350,450),[450,‎ ‎550),[550,650)三个金额段的学生人数成等差数列,将月消费金额不低于550元的学生称为“高消费群”.‎ ‎(1)求m,n的值,并求这100名学生月消费金额的样本平均数(同一组中的数据用该组区间的中点值作代表);‎ ‎(2)根据已知条件完成下面2×2列联表,并判断能否有90%的把握认为“高消费群”与性别有关?‎ 高消费群 非高消费群 合计 男 女 ‎10‎ ‎50‎ 合计 ‎(参考公式:K2=,其中n=a+b+c+d)‎ P(K2≥k0)‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ 解:(1)由题意知100(m+n)=0.6且2m=n+0.001 5,‎ 解得m=0.002 5,n=0.003 5,‎ 所求平均数为:‎ =300×0.15+400×0.35+500×0.25+600×0.15+700×0.10=470(元).‎ ‎(2)根据频率分布直方图得到如下2×2列联表:‎ 高消费群 非高消费群 合计 男 ‎15‎ ‎35‎ ‎50‎ 女 ‎10‎ ‎40‎ ‎50‎ 合计 ‎25‎ ‎75‎ ‎100‎ 根据上表数据代入公式可得,‎ K2==≈1.33<2.706,‎ 所以没有90%的把握认为“高消费群”与性别有关.‎ 创新选做 ‎13.(2016·全国Ⅲ卷,文18)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.‎ 注:年份代码1~7分别对应年份2008~2014.‎ ‎(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;‎ ‎(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.‎ 附注:‎ 参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.‎ 参考公式:相关系数r=,‎ 回归方程=+t中斜率和截距的最小二乘估计公式分别为 =,=-.‎ 解:(1)由折线图中数据和附注中参考数据得 =4,(ti-)2=28,‎ =0.55,‎ (ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,‎ r≈≈0.99.‎ 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.‎ ‎(2)由=≈1.331及(1)得 ==≈0.103,‎ =-≈1.331-0.103×4≈0.92.‎ 所以,y关于t的回归方程为=0.92+0.10t.‎ 将2016年对应的t=9代入回归方程得 =0.92+0.10×9=1.82.‎ 所以预测2016年我国生活垃圾无害化处理量为1.82亿吨.‎
查看更多

相关文章

您可能关注的文档