- 2021-06-16 发布 |
- 37.5 KB |
- 13页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
高中数学人教版选修1-2课时提升作业(一)1-1回归分析的基本思想及其初步应用探究导学课型word版含答案
温馨提示: 此套题为 Word 版,请按住 Ctrl,滑动鼠标滚轴,调节合 适的观看比例,答案解析附后。关闭 Word 文档返回原板块。 课时提升作业(一) 回归分析的基本思想及其初步应用 (25 分钟 60 分) 一、选择题(每小题 5分,共 25 分) 1.下列三个说法: (1)残差平方和越小的模型,拟合的效果越好; (2)用 R 2 来刻画回归的效果时,R 2 的值越小,说明模型拟合的效果越 好; (3) 直 线 y = b x+ a 和 各 点 (x1,y1),(x2,y2), … ,(xn,yn) 的 偏 差 [yi-( b xi+ a )]2 是该坐标平面上所有直线中与这些点的偏差最小的 直线. 其中正确的个数为 ( ) A.1 个 B.2 个 C.3 个 D.4 个 【解析】选 B.由 R 2 的定义可知:R 2 越接近于 1,表明两个随机变量线性 相关性越强,所以(2)不正确,其余说法正确. 2.某单位为了了解用电量 y(度)与气温 x(℃)之间的关系,随机统计 了某 4 天的用电量与当天气温,并制作了对照表: 气温 x(℃) 18 13 10 -1 用电量 y(度) 24 34 38 64 由表中数据得回归直线方程 y= b x+a中 b≈-2,预测当气温为-4℃时, 用电量的度数约为 ( ) A.68℃ B.67℃ C.66℃ D.65℃ 【解析】选 A.由表格得( , )为(10,40), 又( , )在回归方程 y= b x+a上且 b≈-2, 所以 40=10×(-2)+ a ,解得: a =60,所以 y=-2x+60. 当 x=-4 时, y=-2×(-4)+60=68. 3.(2014·重庆高考)已知变量 x与 y 正相关,且由观测数据算得样本 平均数 =3, =3.5,则由该观测数据测算的线性回归方程可能是 ( ) A. y=0.4x+2.3 B. y=2x-2.4 C. y=-2x+9.5 D. y=-0.3x+4.4 【解题指南】根据正相关可知斜率为正,再根据线性回归方程经过点 ( , )可求出结果. 【解析】选 A.由正相关可知斜率为正,故可排除 C,D 两项,又因为 y=0.4x+2.3 经过点(3,3.5),故 A项正确. 【补偿训练】(2015·临沂高二检测)某饮料店的日销售收入 y(单位: 百元)与当天平均气温 x(单位:度)之间有下列数据关系: x -2 -1 0 1 2 y 5 4 2 2 1 甲、乙、丙三位同学对上述数据进行了研究,分别得到了 x 与 y 之间 的三个线性回归方程:①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6;其中正 确的是 ( ) A.① B.② C.③ D.①③ 【解析】选 A.回归方程 y = b x+ a表示的直线必过点( , ),即必过点 (0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点 (0,2.8),故正确的是①. 4.(2015·泰安高二检测)在回归分析中,R 2 的值越大,说明残差平方和 ( ) A.越大 B.越小 C.可能大也可能小 D.以上均错 【解析】选 B.因为 R 2 = n 2 i i i 1 n 2 i i 1 (y y ) 1 (y y) , 所以当 R 2 越大时, (yi- iy ) 2 越小,即残差平方和越小. 5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系, 随机调查了该社区 5 户家庭,得到如下统计数据表: 收入 x(万元) 8.2 8.6 10.0 11.3 11.9 支出 y(万元) 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程 y = b x+ a ,其中 b =0.76, a = - b .据此估 计,该社区一户年收入为 15万元家庭的年支出为 ( ) A.11.4 万元 B.11.8 万元 C.12.0 万元 D.12.2 万元 【解题指南】样本中心点( , )一定在回归直线上. 【解析】选 B.由题意得 = =10, = =8, 所以a =8-0.76×10=0.4, 所以 y=0.76x+0.4,把 x=15 代入得到 y=11.8. 二、填空题(每小题 5分,共 15 分) 6.在研究身高和体重的关系时,求得相关指数 R 2 ≈ ,可以叙 述为“身高解释了 64%的体重变化,而随机误差贡献了剩余的 36%”, 所以身高对体重的效应比随机误差的效应大得多. 【解析】结合 R 2 的计算公式 R 2 = n 2 i i i 1 n 2 i i 1 (y y ) 1 (y y) 可知,当 R 2 =0.64 时,身高 解释了 64%的体重变化. 答案:0.64 7.若根据10名儿童的年龄x(岁)和体重y(kg)数据用最小二乘法得到 用年龄预报体重的回归方程是 y=2x+7,已知这 10 名儿童的年龄分别 是 2,3,3,5,2,6,7,3,4,5,则这 10 名儿童的平均体重是 . 【解析】由题意可得 =2 +7,又 =4,所以 =15. 答案:15kg 8.(2015·扬州高二检测)某校高二(8)班学生每周用于数学学习的时 间 x(单位:小时)与数学成绩 y(单位:分)构成如下数据 (15,79),(23,97),(16,64), (24,92),(12,58),求得的回归直线方程为 y=2.5x+a ,则某同学每周 学习 20小时,估计数学成绩约为 分. 【解析】 = ×(15+23+16+24+12)=18, = ×(79+97+64+92+58)=78, 把( , )代入 y=2.5x+a ,可求得 a =33, 把 x=20 代入 y=2.5x+33 得 y=2.5×20+33=83. 答案:83 三、解答题(每小题 10 分,共 20 分) 9.关于 x 与 y 有如下数据关系: x 2 4 5 6 8 y 30 40 60 50 70 为了对 x,y 两个变量进行统计分析,现有以下两种线性模型:甲模型 y=6.5x+17.5,乙模型 y=7x+17,试比较哪一个模型拟合的效果更好. 【解析】 = 5 2 i i i 1 5 2 i i 1 (y y ) 1 (y y) =1- =0.845, = 5 2 i i i 1 5 2 i i 1 (y y ) 1 (y y) =1- =0.82, 84.5%>82%,所以甲模型拟合效果更好. 【拓展延伸】R 2 =1- n 2 i i 1 n 2 i i 1 (y y) 1 (y y) 的意义 R 2 越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归 模型中,R 2 表示解释变量对于预报变量变化的贡献率,R 2 越接近 1,表 示回归的效果越好(因为R 2 越接近1,表示解释变量和预报变量的线性 相关性越强). 10.(2015·深圳高二检测)PM2.5 是指大气中直径小于或等于 2.5 微 米的颗粒物(也称可入肺颗粒物).为了探究车流量与 PM2.5 的浓度是 否相关,现采集到某城市周一至周五某一时间段车流量与 PM2.5 的数 据如表: 时间 周一 周二 周三 周四 周五 车流量 x(万辆) 50 51 54 57 58 PM2.5 的浓度 y(微克/立方米) 69 70 74 78 79 (1)根据上表数据,请在下列坐标系中画出散点图. (2)根据上表数据,用最小二乘法求出 y 关于 x 的线性回归方程 y= b x+a . (3)若周六同一时间段车流量是 25 万辆,试根据(2)求出的线性回归 方程预测,此时 PM2.5 的浓度为多少(保留整数). 【解析】(1)散点图如图所示. (2)因为 = =54, = =74, (xi- )(yi- )=4×5+3×4+3×4+4×5=64, (xi- ) 2 =(-4) 2 +(-3) 2 +3 2 +4 2 =50, b = 5 i i i 1 5 2 i i 1 (x x) y y (x x) ( ) = =1.28, a = - b =74-1.28×54=4.88, 故 y关于 x的线性回归方程是 y=1.28x+4.88. (3)当 x=25 时, y=1.28×25+4.88=36.88≈37, 所以可以预测此时 PM2.5 的浓度约为 37微克/立方米. (20 分钟 40 分) 一、选择题(每小题 5分,共 10 分) 1.(2015·眉山高二检测)已知样本点散落在某一条曲线 y= a bxe 附近, 作变换 z= lny,利用线性回归模型来求其中的参数 a,b,则拟合其变换后的样本 点的直线 方程为 ( ) A.z bx a B.z bx ea C.z bx lna D.z bxln a 【解析】选 A.对方程 y= a bxe 两边取以 e为底的对数即得. 2.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归直线方程为 y=2x+a,若样本点(r,1)与(1,s)的残差相同,则有 ( ) A. r=s B.s=2r C.s=3-2r D.s=2r+1 【解析】选 C.由残差的定义可得, 1-(2r+a)=s-(2+a),化简得 s=3-2r. 【延伸探究】若将题中的“ y=2x+a”改为“ y=bx+a”,同时将“样本 点(r,1)与(1,s)”改为“样本点(1,1)与(2,4)”,则 b= . 【解析】由残差的定义可得 1-(b+a)=4-(2b+a), 化简得 b=3. 答案:3 二、填空题(每小题 5分,共 10 分) 3. 已 知 回 归 方 程 为 y =2x+1, 而 实 验 得 到 的 一 组 数 据 为 (2,4.9),(3,7.1),(4,9.1),则残差平方和为 . 【解析】 (yi- y i) 2 =(4.9-5) 2 +(7.1-7) 2 +(9.1-9) 2 =0.03. 答案:0.03 4.(2015·石家庄高二检测)已知一组具有线性相关关系的数据 (x1,y1),(x2,y2), …,(xn,yn),其样本点的中心为(2,3),若其回归直线的斜率估计值为 -1.2,则该回归直线方程为 . 【解析】由题意可设回归直线为 y=-1.2x+a ,由于回归直线过样本点 的中心(2,3),故有 3=-1.2×2+a ,解得 a =5.4,故回归直线方程为 y=-1.2x+5.4. 答案: y=-1.2x+5.4 【补偿训练】(2014·渭南高二检测)已知 x与 y 之间的几组数据如下 表: x 0 1 3 4 y 1 4 6 9 则 y与 x 的线性回归方程 y= b x+a过点 ( ) A.(0,1) B.(1,4) C.(2,5) D.(5,9) 【解析】选 C.因为 = =2, = =5,所以根据线性回归方程必过 样本中心点,可得 y= b x+a必过(2,5). 三、解答题(每小题 10 分,共 20 分) 5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟 定的价格进行试销,得到如下数据: 单价 x(元) 8 8.2 8.4 8.6 8.8 9 销量 y(件) 90 84 83 80 75 68 (1)求回归直线方程 y= b x+a ,其中 b =-20, a = - b . (2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产 品的成本是 4 元/件,为使工厂获得最大利润,该产品的单价应定为多 少元?(利润=销售收入-成本) 【解题指南】(1)利用线性回归系数公式求出 a , b的值,从而可确定回 归直线方程. (2)利用二次函数求最值. 【解析】(1)由于 = ×(8+8.2+8.4+8.6+8.8+9)=8.5, = ×(90+84+83+80+75+68)=80, 又 b =-20,所以a = - b =80+20×8.5=250,从而回归直线方程为 y=-20x+250. (2)设工厂获得的利润为 L 元,依题意得 L=x(-20x+250)-4(-20x+250) =-20x 2 +330x-1000 =-20(x-8.25) 2 +361.25. 当且仅当 x=8.25 时,L 取得最大值. 故当单价定为 8.25 元时,工厂可获得最大利润. 【拓展延伸】建立回归模型的基本步骤 (1)确定解释变量和预报变量. (2)画散点图,观察是否存在线性相关关系. (3)确定回归方程的类型,如 y= b x+a . (4)按最小二乘法估计回归方程中的参数. (5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误, 或模型是否合适. 6.(2015·重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长. 设某地区城乡居民人民币储蓄存款(年底余额)如下表: 年份 2010 2011 2012 2013 2014 时间代号 t 1 2 3 4 5 储蓄存款 y(千亿元) 5 6 7 8 10 (1)求 y关于 t的回归方程 = t+ . (2)用所求回归方程预测该地区 2015 年(t=6)的人民币储蓄存款. 附:回归方程 = t+ 中, n i i i 1 n 22 i i 1 t y nty b a y bt. t nt , 【解题指南】(1)直接利用回归系数公式求解即可.(2)利用回归方程 代入直接进行计算即可. 【解析】(1)列表计算如下: i ti yi tiyi 1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 4 4 8 16 32 5 5 10 25 50 ∑ 15 36 55 120 n n i i i 1 i 1 n n22 2 tt i ty i i i 1 i 1 ty tt 1 15 1 36n 5, t t 3, y y 7.2. n 5 n 5 t nt 55 5 3 10, t y nty 120 5 3 7.2 12, 12 1.2, 10 a y t 7.2 1.2 3 3.6, 这里 又 从而b -b - l l l l 故所求回归方程为 =1.2t+3.6. (2)将 t=6 代入回归方程可预测该地区 2015 年的人民币储蓄存款为 =1.2×6+3.6=10.8(千亿元). 【补偿训练】(2015·西安高二检测)下表是某年美国旧轿车价格的调 查资料,以x(年)表示轿车的使用年数,y(美元)表示相应的年均价格, 求 y关于 x的非线性回归方程. 使用年数 x 1 2 3 4 5 6 7 8 9 10 平均价格 y 2 651 1 943 1 494 1 087 765 538 484 290 226 204 【解题指南】画出散点图或进行相关性检验,确定两变量 x,y是否线 性相关.由散点图得 x,y 之间的回归模型.然后转化为线性回归模型 进行拟合,预报回归模型,求回归方程. 【解析】画散点图如图 1所示, 看出 y 与 x呈指数关系,于是令 z=lny.变换后得数据: x 1 2 3 4 5 6 7 8 9 10 z 7.88 3 7.57 2 7.30 9 6.99 1 6.64 0 6.28 8 6.18 2 5.67 0 5.42 1 5.31 8 画散点图如图 2 所示,由图可知各点基本处于一条直线, 由于 = =5.5, = =6.5274, 10 i i i 1 10 22 i i 1 x z 10xz b 0.298,a z bx 6.527 4 0.298 5.5 8.166, x 10x 所以由表中数据可得线性回归方程为 z =8.166-0.298x,因此旧轿车的 平均价格对使用年数的非线性回归方程为 y=e8.166-0.298x . 关闭 Word 文档返回原板块查看更多