- 2021-06-15 发布 |
- 37.5 KB |
- 7页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2020届二轮复习 变量间的相关关系、统计案例学案(全国通用)
2020届二轮复习 变量间的相关关系、统计案例 学案 五年高考 考点 变量的相关性、统计案例 1.(2018山东,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170 答案 C 2.(2018福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元) 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程=x+,其中=0.76,=-. 据此估计,该社区一户年收入为15万元家庭的年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 答案 B 3.(2018湖北,4,5分)根据如下样本数据 x 3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0 得到的回归方程为=bx+a,则( ) A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 答案 B 4.(2018课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi-)2 (wi-)2 (xi-)(yi-) (wi-)(yi-) 46.6 563 6.8 289.8 1.6 1 469 108.8 (1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为 =,=- . 解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分) (2)令w=,先建立y关于w的线性回归方程.由于 ===68, =- =563-68×6.8=100.6, 所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(6分) (3)(i)由(2)知,当x=49时,年销售量y的预报值 =100.6+68=576.6, 年利润z的预报值=576.6×0.2-49=66.32.(9分) (ii)根据(2)的结果知,年利润z的预报值 =0.2(100.6+68)-x=-x+13.6+20.12. 所以当==6.8, 即x=46.24时,取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.(12分) 教师用书专用(5—6) 5.(2018重庆,3,5分)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( ) A.=0.4x+2.3 B.=2x-2.4 C.=-2x+9.5 D.=-0.3x+4.4 答案 A 6.(2018课标Ⅱ,19,12分)某地区2018年至2018年农村居民家庭人均纯收入y(单位:千元)的数据如下表: 年 份 2018 2018 2009 2018 2018 2018 2018 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2018年至2018年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: =,=-. 解析 (1)由所给数据计算得 =×(1+2+3+4+5+6+7)=4, =×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti-)2=9+4+1+0+1+4+9=28, (ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14, ===0.5, =-=4.3-0.5×4=2.3,所求回归方程为=0.5t+2.3. (2)由(1)知,=0.5>0,故2018年至2018年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. 将2018年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8, 故预测该地区2018年农村居民家庭人均纯收入为6.8千元. 三年模拟 A组 2018—2018年模拟·基础题组 考点 变量的相关性、统计案例 1.(2018云南昆明一中第一次摸底,2)当变量x的取值为3,4,5,6,7时,变量y对应的值依次为4.0,2.5,-0.5,-1,-2;当变量u的取值为1,2,3,4时,变量v对应的值依次为2,3,4,6,则变量x和y,变量u和v的相关关系是( ) A.变量x和y是正相关,变量u和v是正相关 B.变量x和y是正相关,变量u和v是负相关 C.变量x和y是负相关,变量u和v是负相关 D.变量x和y是负相关,变量u和v是正相关 答案 D 2.(2018湖南邵阳二模,3)假设有两个分类变量X和Y的2×2列联表: y1 y2 总计 x1 a 10 a+10 x2 c 30 c+30 总计 60 40 100 对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( ) A.a=45,c=15 B.a=40,c=20 C.a=35,c=25 D.a=30,c=30 答案 A 3.(2018湖南益阳调研,4)某公司2018~2018年的年利润(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示: 年份 2018 2018 2018 2018 2018 2018 利润x(百万元) 12.2 14.6 16 18 20.4 22.3 支出y(百万元) 0.62 0.74 0.81 0.89 1.00 1.11 根据统计资料,则( ) A.年利润中位数是16,y与x具有正的线性相关关系 B.年利润中位数是17,y与x具有正的线性相关关系 C.年利润中位数是17,y与x具有负的线性相关关系 D.年利润中位数是18,y与x具有负的线性相关关系 答案 B 4.(2018江西鹰潭一模,3)以下四个命题: ①从匀速传送的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样. ②两个随机变量相关性越强,则相关系数的绝对值越接近于1. ③在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位. ④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大 其中正确的是( ) A.①④ B.②③ C.①③ D.②④ 答案 B 5.(2018广东惠州第三次调研,14)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表): 零件数x(个) 10 20 30 40 50 加工时间y(分钟) 62 68 75 81 89 由最小二乘法求得回归方程为=0.67x+,则的值为 . 答案 54.9 B组 2018—2018年模拟·提升题组 (满分:40分 时间:50分钟) 一、选择题(每小题5分,共15分) 1.(2018山东实验中学上学期第二次诊断,11)某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K2=并参照附表,得到的正确结论是 ( ) 附表: P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关” B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关” C.有99.9%的把握认为“爱好游泳运动与性别有关” D.有99.9%的把握认为“爱好游泳运动与性别无关” 答案 A 2.(2018江西南城一中、高安中学等九校3月联考,7)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表. 非一线 一线 总计 愿生 45 20 65 不愿生 13 22 35 总计 58 42 100 由K2=, 得K2=≈9.616. 参照下表, P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 正确的结论是( ) A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关” B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关” C.有99%以上的把握认为“生育意愿与城市级别有关” D.有99%以上的把握认为“生育意愿与城市级别无关” 答案 C 3.(2018福建福州外国语学校适应性考试(一),5)如下表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归方程为=0.8x-155,后因某未知原因第5组数据的y值模糊不清,此位置数据记为m(如表所示),则利用回归方程可求得实数m的值为( ) x 196 197 200 203 204 y 1 3 6 7 m A.8.3 B.8.2 C.8.1 D.8 答案 D 二、解答题(共25分) 4.(2018广东东莞模拟,19)某城市随机抽取一年(365天)内100天的空气质量指数AQI的监测数据,结果统计如下: AQI [0, 50] (50, 100] (100, 150] (150, 200] (200, 250] (250, 300] >300 空气 质量 优 良 轻微 污染 轻度 污染 中度 污染 中度 重污染 重度 污染 天数 4 13 18 30 9 11 15 记某企业每天由空气污染造成的经济损失为S(单位:元),空气质量指数AQI为ω.在区间[0,100]对企业没有造成经济损失;在区间(100,300]对企业造成经济损失成直线模型(当AQI为150时,造成的经济损失为500元,当AQI为200时,造成的经济损失为700元);当AQI大于300时,造成的经济损失为2 000元. (1)试写出S(ω)的表达式; (2)试估计在本年内随机抽取一天,该天经济损失S大于200元且不超过600元的概率; (3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面2×2列联表,并判断能否有95%的把握认为该城市本年空气重度污染与供暖有关. 非重度污染 重度污染 合计 供暖季 非供暖季 合计 100 附: P(K2≥k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 1.32 2.07 2.70 3.84 8.02 6.63 7.87 10.82 K2=. 解析 (1)由已知可得S(ω)= (2)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为事件A, 由200查看更多