2021届北师大版高考理科数一轮复习高效演练分层突破:第十一章 第3讲 变量间的相关关系、统计案例

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

2021届北师大版高考理科数一轮复习高效演练分层突破:第十一章 第3讲 变量间的相关关系、统计案例

‎ [基础题组练]‎ ‎1.根据如下样本数据:‎ x ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ y ‎4.0‎ ‎2.5‎ ‎0.5‎ ‎0.5‎ ‎0.4‎ ‎0.1‎ 得到的线性回归方程为y=bx+a,则(  )‎ A.a>0,b>0        B.a>0,b<0‎ C.a<0,b>0 D.a<0,b<0‎ 解析:选B.根据给出的数据可发现:整体上y与x呈现负相关,所以b<0,由样本点(3,4.0)及(4,2.5)可知a>0,故选B.‎ ‎2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(  )‎ A.-1 B.0‎ C. D.1‎ 解析:选D.所有点均在直线上,则样本相关系数最大,即为1,故选D.‎ ‎3.(2020·山东德州模拟)已知某产品连续4个月的广告费xi(千元)与销售额yi(万元)(i=1,2,3,4)满足xi=15, yi=12.若广告费用x和销售额y之间具有线性相关关系,且回归直线方程为y=bx+a,b=0.6,当广告费用为5千元时,可预测销售额为(  ),‎ A.3万元 B.3.15万元 C.3.5万元 D.3.75万元,‎ 解析:选D.由已知xi=15,y i=12,得==3.75,==3,所以3=3.75×0.6+a,解得a=0.75.所以回归直线方程为y=0.6x+0.75.则当x=5时,y=3.75万元.故选D.‎ ‎4.千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计 年份(届)‎ ‎2014‎ ‎2015‎ ‎2016‎ ‎2017‎ 学科竞赛获省级一等奖 及以上的学生人数x ‎51‎ ‎49‎ ‎55‎ ‎57‎ ‎103‎ ‎96‎ ‎108‎ ‎107‎ 被清华、北大等世界名校录取的学生人数y 根据上表可得回归方程y=bx+a中的b为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为(  )‎ A.111 B.117‎ C.118 D.123‎ 解析:选B.因为=53,=103.5,所以a=-=103.5-1.35×53=31.95,所以回归直线方程为y=1.35x+31.95.当x=63时,代入解得y=117,故选B.‎ ‎5.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.‎ 非一线 一线 总计 愿生 ‎45‎ ‎20‎ ‎65‎ 不愿生 ‎13‎ ‎22‎ ‎35‎ 总计 ‎58‎ ‎42‎ ‎100‎ 由χ2=,‎ 得χ2=≈9.616.‎ 参照下表,‎ P(χ2≥k0)‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k0‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ 下列结论正确的是(  )‎ A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”‎ B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”‎ C.有99%以上的把握认为“生育意愿与城市级别有关”‎ D.有99%以上的把握认为“生育意愿与城市级别无关”‎ 解析:选C.因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.‎ ‎6.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为y=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为________.‎ 解析:因为y与x具有线性相关关系,满足回归方程y=0.6x+1.2,该城市居民人均工资为x=5,所以可以估计该城市的职工人均消费水平y=0.6×5+1.2=4.2,‎ 所以可以估计该城市人均消费额占人均工资收入的百分比为=84%.‎ 答案:84%‎ ‎7.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:‎ 学生编号 ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ 数学成绩 ‎60‎ ‎65‎ ‎70‎ ‎75‎ ‎80‎ ‎85‎ ‎90‎ ‎95‎ 物理成绩 ‎72‎ ‎77‎ ‎80‎ ‎84‎ ‎88‎ ‎90‎ ‎93‎ ‎95‎ 给出散点图如下:‎ 根据以上信息,判断下列结论:‎ ‎①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;‎ ‎②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;‎ ‎③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.‎ 其中正确的个数为________.‎ 解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.‎ 答案:1‎ ‎8.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=11,yi=13,x=21,则实数b的值为________.‎ 解析:令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时==,==,代入y=bt-,得=b×-,解得b=.‎ 答案: ‎9.(2020·云南昆明诊断)某公司准备派出选手代表公司参加某职业技能挑战赛.经过层层选拔,最后集中在甲、乙两位选手在一项关键技能的区分上,选手完成该项挑战的时间越少越好.已知这两位选手在15次挑战训练中,完成该项关键技能挑战所用的时间t(单位:秒)及挑战失败(用“×”表示)的情况如表1:‎ 序号x ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ ‎9‎ ‎10‎ ‎11‎ ‎12‎ ‎13‎ ‎14‎ ‎15‎ t甲 ‎×‎ ‎96‎ ‎93‎ ‎×‎ ‎92‎ ‎×‎ ‎90‎ ‎86‎ ‎×‎ ‎×‎ ‎83‎ ‎80‎ ‎78‎ ‎77‎ ‎75‎ t乙 ‎×‎ ‎95‎ ‎×‎ ‎93‎ ‎×‎ ‎92‎ ‎×‎ ‎88‎ ‎83‎ ‎×‎ ‎82‎ ‎80‎ ‎80‎ ‎74‎ ‎73‎ 据表1中的数据,应用统计软件得表2:‎ 均值(单位:秒)‎ 方差 线性回归方程 甲 ‎85‎ ‎50.2‎ t甲=-1.59x+99.31‎ 乙 ‎84‎ ‎54‎ t乙=-1.73x+100.26‎ ‎(1)根据上述回归方程,预测甲、乙分别在下一次完成该项关键技能挑战所用的时间;‎ ‎(2)若该公司只有一个参赛名额,根据以上信息,判断哪位选手代表公司参加职业技能挑战赛更合适?请说明你的理由.‎ 解:(1)当x=16时,t甲=-1.59×16+99.31=73.87(秒),‎ t乙=-1.73×16+100.26=72.58(秒).‎ ‎(2)甲、乙两位选手完成关键技能挑战成功的次数都为10次,失败次数都为5次,所以,只需要比较他们完成关键技能挑战成功的情况即可,根据所给信息,结合(1)中预测结果,综合分析,选手乙代表公司参加技能挑战赛更合适,理由如下:‎ 因为在相同次数的挑战练习中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,x甲>x乙,乙选手用时更短;‎ 由于S6.635,‎ 所以有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.‎ ‎(2)根据频率分布直方图和频数分布表知,设备改造前产品为合格品的概率为=,‎ 设备改造后产品为合格品的概率为=>,‎ 显然设备改造后产品合格率更高,因此设备改造后性能更优.‎ ‎[综合题组练]‎ ‎1.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:‎ 年龄 ‎[15,25)‎ ‎[25,35)‎ ‎[35,45)‎ ‎[45,55)‎ ‎[55,65]‎ 支持“延迟退休”的人数 ‎15‎ ‎5‎ ‎15‎ ‎28‎ ‎17‎ ‎(1)由以上统计数据填写2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;‎ ‎45岁以下 ‎45岁以上 总计 支持 不支持 总计 ‎(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.‎ ‎①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率;‎ ‎②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.‎ 参考数据及公式:‎ P(χ2≥k)‎ ‎0.100‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k ‎2.706‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ χ2= 解:(1)列联表如下:‎ ‎45岁以下 ‎45岁以上 总计 支持 ‎35‎ ‎45‎ ‎80‎ 不支持 ‎15‎ ‎5‎ ‎20‎ 总计 ‎50‎ ‎50‎ ‎100‎ 因为χ2===6.25>3.841,‎ 所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.‎ ‎(2)从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.‎ ‎①抽到1人是45岁以下的概率为=,抽到1人是45岁以下且另一人是45岁以上的概率为=.‎ 故所求概率为=.‎ ‎②X=0,1,2.‎ P(X=0)==,P(X=1)===,‎ P(X=2)==.‎ 可得随机变量X的分布列为 X ‎0‎ ‎1‎ ‎2‎ P 故EX=1×+2×=.‎ ‎2.某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:‎ 月份 ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ 广告投入量/万元 ‎2‎ ‎4‎ ‎6‎ ‎8‎ ‎10‎ ‎12‎ 收益/万元 ‎14.21‎ ‎20.31‎ ‎31.8‎ ‎31.18‎ ‎37.83‎ ‎44.67‎ 他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:‎ ‎(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;‎ ‎(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.‎ ‎(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;‎ ‎(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?‎ 附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=‎ 解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.‎ ‎(2)(ⅰ)剔除异常数据,即3月份的数据后,得=×(7×6-6)=7.2,,‎ =×(30×6-31.8)=29.64.‎ 所以y关于x的回归方程为y=3x+8.04.‎ ‎(ⅱ)把x=18代入(ⅰ)中所求回归方程得y=3×18+8.04=62.04,‎ 故预报值为62.04万元.‎
查看更多

相关文章

您可能关注的文档