- 2021-06-30 发布 |
- 37.5 KB |
- 15页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
【数学】2019届一轮复习人教A版(理科)第66讲变量间的相关关系、统计案例学案
第66讲 变量间的相关关系、统计案例 考试说明 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆). 3.了解回归的基本思想、方法及其简单应用. 4.了解独立性检验的思想、方法及其初步应用. 考情分析 考点 考查方向 考例 考查热度 变量间的 相关关系 变量间的相关关系判断、相关性强弱判断、散点图 2015全国卷Ⅰ19,2015全国卷Ⅱ3 ★★☆ 回归方程的 求法、回归分析 求回归方程、回归分析 2015全国卷Ⅰ19, 2016全国卷Ⅲ18 ★★☆ 独立性检验 独立性检验 ★★☆ 真题再现 ■ [2017-2013 课标全国真题再现 1.[2015·全国卷Ⅱ 根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是 ( ) A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 [解析 D 由图知,2006年以来我国二氧化硫年排放量与年份负相关,故选D. 2.[2017·全国卷Ⅱ 海水养殖场进行某水产品的新、旧 箱养殖方法的产量对比,收获时各随机抽取了100个 箱,测量各箱水产品的产量(单位: g),其频率分布直方图如图所示: (1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 g,新养殖法的箱产量不低于50 g”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关; 箱产量<50 g 箱产量≥50 g 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:, 2=. 解:(1)记B表示事件“旧养殖法的箱产量低于50 g”,C表示事件“新养殖法的箱产量不低于50 g”. 由题意知P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于50 g的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P(B)的估计值为0.62. 新养殖法的箱产量不低于50 g的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P(C)的估计值为0.66. 因此,事件A的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表: 箱产量<50 g 箱产量≥50 g 旧养殖法 62 38 新养殖法 34 66 2=≈15.705. 由于15.705>6.635,故有99 的把握认为箱产量与养殖方法有关. (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 g的直方图面积为 (0.004+0.020+0.044)×5=0.34<0.5, 箱产量低于55 g的直方图面积为 (0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+≈52.35( g). 3.[2016·全国卷Ⅲ 下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1 7分别对应年份2008 2014. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:yi=9.32,tiyi=40.17, =0.55,≈2.646. 参考公式:相关系数r=, 回归方程=+t中斜率和截距的最小二乘估计公式分别为: =,=-. 解:(1)由折线图中数据和附注中参考数据得 =4,(ti-)2=28,=0.55, (ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,r≈≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系. (2)由=≈1.331及(1)得==≈0.103,=-≈1.331-0.103×4≈0.92. 所以y关于t的回归方程为=0.92+0.10t. 将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82,所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨. 4.[2015·全国卷Ⅰ 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润 (单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi- )2 (wi- )2 (xi-) (yi-) (wi-) (yi-) 46.6 563 6.8 289.8 1.6 1469 108.8 其中wi=,=wi. (1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程. (3)已知这种产品的年利润 与x,y的关系为 =0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为 =,=-. 解:(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型. (2)令w=,先建立y关于w的线性回归方程.由于 ===68, =-=563-68×6.8=100.6, 所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68. (3)(i)由(2)知,当x=49时,年销售量y的预报值 =100.6+68=576.6, 年利润 的预报值 =576.6×0.2-49=66.32. (ii)根据(2)的结果知,年利润 的预报值 =0.2(100.6+68)-x=-x+13.6+20.12, 所以当==6.8,即x=46.24时,取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大. 5.[2014·全国卷Ⅱ 某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: =,=-. 解:(1)由所给数据计算得=×(1+2+3+4+5+6+7)=4,=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,(ti-)2=9+4+1+0+1+4+9=28, (ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,===0.5, =-=4.3-0.5×4=2.3, 所求回归方程为=0.5t+2.3. (2)由(1)知,=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. 将2015年的年份代号t=9,代入(1)中的回归方程,得 =0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元. ■ [2017-2016 其他省份类似高考真题 [2017·山东卷 为了研究某班 生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名 生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+.已知xi=225,yi=1600,=4.该班某 生的脚长为24,据此估计其身高为( ) A.160 B.163 C.166 D.170 [解析 C 易知==22.5,==160.因为=4,所以160=4×22.5+,解得=70,所以回归直线方程为=4x+70,当x=24时,=96+70=166.故选C. 【课前双基巩固】 知识聚焦 1.(1)相关关系 相关关系 (2)正相关 负相关 2.(1)线性相关关系 回归直线 (4)正相关 负相关 几乎不存在线性相关关系 0.75 对点演练 1.② [解析 对于①,正方形的边长与面积之间的关系是函数关系,不是相关关系; 对于②,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系; 对于③,人的身高与眼睛近视的度数之间的关系既不是函数关系也不是相关关系; 对于④,哥哥的数 成绩与弟弟的数 成绩之间既不是函数关系也不是相关关系. 2.负相关 正相关 [解析 由这两个散点图可以判断,变量x与y负相关,u与v正相关. 3.③ [解析 由已知数据可得,有95 的把握认为“患肺病与吸烟有关”. 4.=6.5x+17.5 [解析 由题意可知==5,==50,即样本点的中心为(5,50).设回归直线方程为=6.5x+,∵回归直线过样本点的中心(,),∴50=6.5×5+,即=17.5,∴回归直线方程为=6.5x+17.5. 5.正 小于 [解析 因为散点图呈现上升趋势,所以人体脂肪含量与年龄正相关.因为中间两个数据大约介于15 到20 之间,所以脂肪含量的中位数小于20 . 6.④ [解析 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故①正确.因为回归直线必过样本点的中心(,),所以②正确.由线性回归方程的意义知,某女生的身高每增加1 cm,其体重约增加0.85 g,故③正确.当某女生的身高为170 cm时,其体重的估计值是58.79 g,这不是确定值,因此④不正确. 7.27 [解析 =17.5,=39,所以=39-(-5)×17.5=126.5,因此当x=20时,=-5×20+126.5=26.5≈27. 【课堂考点探究】 例1 [思路点拨 (1)从=-0.1x+1可以判断出x与y负相关,进而判断出x与 负相关. (2)利用有关知识逐一判断. (1)A (2)C [解析 (1)显然x与y负相关.又y与 正相关,所以x与 负相关.故选A. (2)①显然不正确,②不正确,应是函数关系,③④⑤正确. 变式题 A [解析 由相关系数的定义以及散点图所表达的含义可知,r2查看更多