专题17+统计与统计案例(命题猜想)-2017年高考数学(文)命题猜想与仿真押题

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

专题17+统计与统计案例(命题猜想)-2017年高考数学(文)命题猜想与仿真押题

‎【命题热点突破一】抽样方法 某工厂生产的甲、乙、丙、丁四种不同型号的产品分别有150件、120件、180件、150件.为了调查产品的情况,需从这600件产品中抽取一个容量为100的样本,若采用分层抽样法,设甲产品中应抽取的产品件数为x,某件产品A被抽到的概率为y,则x,y的值分别为(  )‎ A.25, B.20, C. 25, D.25, ‎【答案】D ‎ ‎【特别提醒】 三种抽样方法均是等概率抽样,当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.‎ ‎【变式探究】 ‎ 从编号分别为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为10的样本,若编号为58的产品在样本中,则该样本中产品的最大编号为________.‎ ‎【答案】74 ‎ ‎【解析】每8件产品抽取一件,编号为58的产品在样本中,则样本中产品的最大编号为58+16=74.‎ ‎【命题热点突破二】用样本估计总体 ‎【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )‎ ‎(A)56 (B)60 (C)120 (D)140‎ ‎【答案】D ‎ 【变式探究】(1)将某市8所中学参加中学生合唱比赛的得分用茎叶图表示(如图183所示),其中茎为十位数,叶为个位数,则这组数据的中位数和平均数分别是(  )‎ 图183‎ A.91,91.5 B.91,92‎ C.91.5,91.5 D.91.5,92‎ ‎(2)2014年6月,一篇关于“键盘侠”(“键盘侠”一词描述了部分网民在现实生活中胆小怕事自私自利,却习惯在网络上大放厥词的一种现象)的时评引发了大家对“键盘侠”的热议.某地区新闻栏目对该地区群众对“键盘侠”的认可度做出调查:在随机抽取的50人中,有14人持认可态度,其余持反对态度.若该地区有9600人,则估计该地区对“键盘侠”持反对态度的有________人.‎ ‎【答案】(1)C (2)6912 ‎ ‎【解析】(1)中位数为=91.5,平均数为90+=91.5.‎ ‎(2)根据样本估计总体的思想,可知该地区群众对“键盘侠”持反对态度的概率约为 ‎,所以该地区9600人中对“键盘侠”持反对态度的大约有9600×=6912(人).‎ ‎【特别提醒】 统计的基本思想之一就是以样本估计总体.以样本的频率估计总体的概率、以样本的特征数估计总体的特征数.‎ ‎【变式探究】‎ ‎(1)某学校随机抽查了本校20个同学,调查他们平均每天在课外进行体育锻炼的时间(分钟),根据所得数据的茎叶图,以5为组距将数据分为八组,分别是0,5),5,10),…,35,40],作出的频率分布直方图如图184所示,则原始的茎叶图可能是(  )‎ 图184‎ 图185‎ ‎(2)高三年级上学期期末考试中,某班级数学成绩的频率分布直方图如图186所示,数据分组依次如下:‎ ‎70,90),90,110),110,130),130,150].‎ 估计该班数学成绩的平均分数为(  )‎ 图186‎ A.112 ‎ B.114‎ C.116 ‎ D.120‎ ‎【答案】(1)B (2)B ‎ ‎【命题热点突破三】统计案例 ‎ 例3、某高校共有15 000人,其中男生10 500人,女生4500人,为调查该校学生每周平均参加体育运动时间情况,采用分层抽样的方法,收集了300名学生每周平均参加体育运动时间的样本数据(单位:小时).‎ ‎(1)应收集多少名女生的样本数据?‎ ‎(2)根据这300个样本数据,得到学生每周平均参加体育运动时间的频率分布直方图(如图187所示),其中样本数据分组区间为0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均参加体育运动时间超过4个小时的概率.‎ ‎(3)在样本数据中,有60名女生每周平均参加体育运动的时间超过4个小时,请画出每周平均参加体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”.‎ P(K2≥k0)‎ ‎0.10‎ ‎0.05‎ ‎0.010‎ ‎0.005‎ k0‎ ‎2.706‎ ‎3.841‎ ‎6.635‎ ‎7.879‎ 附:K2= ‎【解析】:(1)300×=90,所以应收集90名女生的样本数据.‎ ‎(2)由频率分布直方图得每周平均参加体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均参加体育运动时间超过4小时的概率约为0.75.‎ ‎(3)由(2)知,300名学生中有300×0.75=225(名)学生每周平均参加体育运动的时间超过4小时,其余75名学生每周平均参加体育运动的时间不超过4小时.又因为抽取的300名学生中有210名男生、90名女生,所以每周平均参加体育运动时间与性别的列联表如下:‎ 男生 女生 总计 每周平均参加体育运动 的时间不超过4小时 ‎45‎ ‎30‎ ‎75‎ 每周平均参加体育运动 的时间超过4小时 ‎165‎ ‎60‎ ‎225‎ 总计 ‎210‎ ‎90‎ ‎300‎ 结合列联表可得K2的观测值k==≈4.762>3.841.‎ 所以有95%的把握认为“该校学生每周平均参加体育运动的时间与性别有关”. ‎ ‎【特别提醒】 在计算K2时要注意公式中各个字母的含义,分子上是总量乘2×2列联表中对角线数字乘积之差的平方,分母上是四个分和量的乘积.‎ ‎【变式探究】‎ ‎ 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球的时间x(单位:小时)与当天投篮命中率y之间的关系.‎ 时间x ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ 命中率y ‎0.4‎ ‎0.5‎ ‎0.6‎ ‎0.6‎ ‎0.4‎ ‎(1)求小李这5天的平均投篮命中率;‎ ‎(2)用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率.‎ 设线性回归方程为=x+,则由公式可得==‎ =0.01,‎ 所以=-=0.5-0.01×3=0.47,‎ 所以=x+=0.01x+0.47.‎ 当x=6时,=0.53,故小李该月6号打6小时篮球的投篮命中率约为0.53.‎ ‎【特别提醒】 回归直线一定过样本点的中心(x,y),当已知回归直线方程两个系数中的一个时,可以直接代入样本点中心的坐标求得另一个系数.正相关和负相关是根据回归直线方程的斜率判断的:正相关时回归直线方程的斜率为正值;负相关时回归直线方程的斜率为负值.回归直线方程斜率的符号与相关系数的符号是一致的.‎ ‎【高考真题解读】‎ ‎1.【2016年高考四川】(本小题满分12分)‎ 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),…,4,4.5)分成9组,制成了如图所示的频率分布直方图.‎ ‎(I)求直方图中a的值;‎ ‎(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;‎ ‎(III)若该市政府希望使85%的居民每月的用水量不超过标准(吨),估计的值,并说明理由.‎ ‎【答案】(Ⅰ);(Ⅱ)36000;(Ⅲ)2.9.‎ ‎【解析】‎ ‎(Ⅱ)由(Ⅰ),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.‎ 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为 ‎300 000×0.12=36 000.‎ ‎(Ⅲ)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,‎ 而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,‎ 所以2.5≤x<3.‎ 由0.3×(x–2.5)=0.85–0.73,‎ 解得x=2.9.‎ 所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.‎ ‎2.【2016高考山东】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20), 20,22.5), 22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )‎ ‎(A)56 (B)60 (C)120 (D)140‎ ‎【答案】D ‎【解析】由频率分布直方图知,自习时间不少于22.5小时为后三组,有(人),选D.‎ ‎1.(2015·陕西,2)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为(  )‎ A.167 B.137 C.123 D.93‎ ‎【答案】 B ‎【解析】 由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.故选B.‎ ‎2.(2015·安徽,6)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为(  )‎ A.8 B.15 C.16 D.32‎ ‎【答案】 C ‎ ‎ ‎3.(2015·重庆,3)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:‎ 则这组数据的中位数是(  )‎ ‎0‎ ‎1‎ ‎2‎ ‎2‎ ‎8 9 ‎ ‎2 5 8‎ ‎0 0 0 3 3 8‎ ‎1 2‎ A.19 B.20 C.21.5 D.23‎ ‎【答案】 B ‎【解析】 从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,选B. ‎ ‎4.(2015·新课标全国Ⅱ,31)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是(  )‎ A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 ‎【答案】 D ‎ 5.(2015·福建,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:‎ 收入x(万元)‎ ‎8.2‎ ‎8.6‎ ‎10.0‎ ‎11.3‎ ‎11.9‎ 支出y(万元)‎ ‎6.2‎ ‎7.5‎ ‎8.0‎ ‎8.5‎ ‎9.8‎ 根据上表可得回归直线方程=x+,其中=0.76,=y-x.据此估计,该社区一户年收入为15万元家庭的年支出为(  )‎ A.11.4万元 B.11. 8万元 ‎ C.12.0万元 D.12.2万元 ‎【答案】 B ‎【解析】 回归直线一定过样本点中心(10,8),∵=0.76,∴=0.4,由=0.76x+0.4得当x=15万元时,=11.8万元.故选B. ‎ ‎6.(2014·山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(  )‎ A.6 B.8 C.12 D.18‎ ‎【答案】 C ‎ 7.(2014·陕西,9)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为(  )‎ A.1+a,4 B.1+a,4+a C.1,4 D.1,4+a ‎【答案】 A ‎【解析】‎ ‎8.(2014·湖南,2)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则(  )‎ A.p1=p2
查看更多