- 2021-06-10 发布 |
- 37.5 KB |
- 10页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2017届高考文科数学(全国通用)二轮适考素能特训:专题2-7-2统计与统计案例
一、选择题 1.[2016·兰州双基测试]某乡政府调查A、B、C、D四个村的村民外出打工的情况,拟采用分层抽样的方法从四个村中抽取一个容量为500的样本进行调查.已知A、B、C、D四个村的人数之比为4∶5∶5∶6,则应从C村中抽取的村民人数为( ) A.100 B.125 C.150 D.175 答案 B 解析 由题意可知,应从C村中抽取500×=125名村民. 2.[2016·湖北武汉第二次调研]如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45)的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( ) A.0.04 B.0.06 C.0.2 D.0.3 答案 C 解析 由频率分布直方图的知识得,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07× 5=0.35,设年龄在[30,35),[35,40),[40,45]的频率为x,y,z,又x,y,z成等差数列,所以可得 解得y=0.2, 所以年龄在[35,40)的网民出现的频率为0.2.故选C. 3.[2016·开封一模]下列说法错误的是( ) A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系 B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强 C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好 答案 B 解析 根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好.二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B. 4.[2016·河南郑州二模]某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价(元) 4 5 6 7 8 9 销量(件) 90 84 83 80 75 68 由表中数据,求得线性回归方程=-4x+a,若在这些样本点中任取一点,则它在回归直线左下方的概率为( ) A. B. C. D. 答案 B 解析 由表中数据得=6.5,=80. 由(,)在直线=-4x+a上,得a=106. 即线性回归方程为=-4x+106.经过计算只有(5,84)和(9,68)在直线的下方,故所求概率为=,选B. 5.[2016·湖南永州一模]为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表: 做不到“光盘” 能做到“光盘” 男 45 10 女 30 15 附: P(K2≥k) 0.10 0.05 0.025 k 2.706 3.841 5.024 K2=. 参照附表,得到的正确结论是( ) A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关” B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关” C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关” D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 答案 C 解析 由题设知,a=45,b=10,c=30,d=15, 所以K2=≈3.0303. 2.706<3.0303<3.841. 由附表可知,有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选C. 二、填空题 6.[2016·石家庄质检二]将高三(1)班参加体检的36名学生,编号为:1,2,3,…,36,若采用系统抽样的方法抽取一个容量为4的样本,已知样本中含有编号为6、24、33的学生,则样本中剩余一名学生的编号是________. 答案 15 解析 根据系统抽样的特点可知抽取的4名学生的编号依次成等差数列,故剩余一名学生的编号是15. 7.[2015·豫北十校联考]2015年的NBA全明星赛于北京时间2015年2月14日举行.如图是参加此次比赛的甲、乙两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是________. 答案 64 解析 应用茎叶图的知识得,甲、乙两人这几场比赛得分的中位数分别为28,36,因此甲、乙两人这几场比赛得分的中位数之和是64. 8.[2016·吉林通化月考]某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表: 广告费用x(万元) 3 4 5 6 销售额y(万元) 25 30 40 45 根据上表可得回归方程=x+中的为7.据此模型预测广告费用为10万元时销售额为________万元. 答案 73.5 解析 由题表可知,=4.5,=35,代入回归方程=7x+,得=3.5,所以回归方程为=7x+3.5.所以当x=10时,=7×10+3.5=73.5. 三、解答题 9.[2016·河北三市二联]下表是高三某位文科生连续5次月考的历史、政治的成绩,结果统计如下: 月份 9 10 11 12 1 历史(x分) 79 81 83 85 87 政治(y分) 77 79 79 82 83 (1)求该生5次月考历史成绩的平均分和政治成绩的方差; (2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x、y的线性回归方程=x+. 附:==,=- 解 (1)=×(79+81+83+85+87)=83, ∵=×(77+79+79+82+83)=80, ∴s=×[(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2]=4.8. (2)∵(xi-)(yi-)=30,(xi-)2=40, ∴=0.75,=- =17.75. 则所求的线性回归方程为=0.75x+17.75. 10.[2016·江淮十校一联]某学校在高一、高二两个年级学生中各抽取100人的样本,进行普法知识调查,其结果如下表: 高一 高二 总数 合格人数 70 x 150 不合格人数 y 20 50 总数 100 100 200 (1)求x,y的值; (2)有没有99%的把握认为“高一、高二两个年级这次普法知识调查结果有差异”; (3)用分层抽样的方法从样本的不合格同学中抽取5人的辅导小组,在5人中随机选2人,这2人中,正好高一、高二各1人的概率为多少? 参考公式:χ2= χ2≥ 5.024 6.635 7.879 10.828 97.5% 99% 99.5% 99.9% 解 (1)x=80,y=30. (2)由(1)得χ2=≈2.67<6.635, 所以没有99%的把握认为“高一、高二两个年级这次普法知识调查结果有差异”. (3)由分层抽样得从高一抽取3人,设为A,B,C,从高二抽取2人,设为1,2. 从5人中选2人,有(AB),(AC),(A1),(A2),(BC),(B1),(B 2),(C1),(C2),(12),共10种选法. 其中正好高一、高二各1人,有(A1),(A2),(B1),(B2),(C1),(C2),共6种选法. 所以所求概率为P=. 11.[2016·重庆测试]从甲、乙两部门中各任选10名员工进行职业技能测试,测试成绩(单位:分)数据的茎叶图如图1所示: (1)分别求出甲、乙两组数据的中位数,并比较两组数据的分散程度(只需给出结论); (2)甲组数据频率分布直方图如图2所示,求a、b、c的值; (3)从甲、乙两组数据中各任取一个,求所取两数之差的绝对值大于20的概率. 解 (1)甲组数据的中位数为=78.5,乙组数据的中位数为=78.5. 从茎叶图可以看出,甲组数据比较集中,乙组数据比较分散. (2)由图易知a=0.05,b=0.02,c=0.01. (3)从甲、乙两组数据中各任取一个,得到的所有基本事件共有100个,其中满足“两数之差的绝对值大于20”的基本事件有16个,故所求概率P==. 12.为了调查学生星期天晚上学习时间的利用问题,某校从高二年级1000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查.根据问卷取得了这n名同学星期天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组:①[0,30),②[30,60),③[60,90),④[90,120),⑤[120,150),⑥[150, 180),⑦[180,210),⑧[210, 240),得到频率分布直方图如图,已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人. (1)求n的值并补全频率分布直方图; (2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列2×2列联表: 利用时间充分 利用时间不充分 总计 走读生 住宿生 10 总计 据此资料,是否有95%的把握认为学生“利用时间是否充分”与走读、住宿有关? (3)若在第①组、第②组共抽出2人调查影响有效利用时间的原因,求抽出的2人中第①组、第②组各有1人的概率. 参考数据: P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1)设第i组的频率为Pi(i=1,2,…,8), 由图可知P1=×30=,P2=×30=, ∴学习时间少于60分钟的频率为P1+P2=, 由题意得n×=5,∴n=100. 又P3=×30=,P5=×30=, P6=×30=,P7=×30=, P8=×30=, ∴P4=1-(P1+P2+P3+P5+P6+P7+P8)=, ∴第④组的高度为h=×==, 频率分布直方图如图. (2)由频率分布直方图可知,在抽取的100人中,“住宿生”有55人,“走读生”有45人,利用时间不充分的有100×(P1+P2+P3+P4)=25人,从而2×2列联表如下: 利用时间充分 利用时间不充分 总计 走读生 30 15 45 住宿生 45 10 55 总计 75 25 100 将2×2列联表中的数据代入公式计算, 得K2=== ≈3.030.∵3.030<3.841, ∴没有理由认为学生“利用时间是否充分”与走读、住宿有关. (3)由题可知第①组人数为100×P1=2(人),第②组人数为100×P2=3(人), 记第①组的2人为A1,A2,第②组的3人为B1,B2,B3, 则“从5人中抽取2人”所构成的基本事件有A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3”,共10个基本事件; 记“抽取2人中第①组、第②组各有1人”记作事件A,则事件A所包含的基本事件有A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,共6个基本事件, ∴P(A)==, 即抽出的2人中第①组、第②组各有1人的概率为.查看更多