- 2021-06-16 发布 |
- 37.5 KB |
- 9页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
高中数学人教版选修1-2课时提升作业一1-1回归分析的基本思想及其初步应用习题word版含答案
温馨提示: 此套题为 Word 版,请按住 Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。 关闭 Word 文档返回原板块。 课时提升作业 一 回归分析的基本思想及其初步应用 一、选择题(每小题 5 分,共 25 分) 1.下列四个命题中正确的是( ) ①在线性回归模型中,e 是 b x+a 预报真实值 y 的随机误差,它是一个观测的量;②残差平 方和越小的模型,拟合的效果越好;③用 R2 来刻画回归方程,R2 越小,拟合的效果越好;④ 在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区 域宽度越窄,说明拟合精度越高,回归方程的预报精度越高. A.①③ B.②④ C.①④ D.②③ 【解析】选 B.e 是预报变量 y 的随机误差,故①不正确;R2 越接近 1,拟合的效果越好,故 ③不正确. 2.甲、乙、丙、丁 4 位同学各自对 A,B 两个变量进行回归分析,分别得到散点图与残差平 方和 (yi- iy )2 如表: 甲 乙 丙 丁 散点图 残差 平方和 115 106 124 103 哪位同学的试验结果体现拟合 A,B 两变量关系的模型拟合精度高?( ) A.甲 B.乙 C.丙 D.丁 【解析】选 D.根据线性相关的知识,散点图中各样本点带状分布越均匀,同时保持残差平 方和越小,回归分析建立的线性回归模型的拟合效果越好.由试验结果知,丁拟合效果较好 些. 3.关于残差的叙述正确的是( ) A.残差就是随机误差 B.残差就是方差 C.残差都是正数 D.残差可以用来判断模型拟合的效果 【解析】选 D.根据残差的意义及作用知,D 正确. 4.(2016·大连高二检测)在一次试验中,测得(x,y)的 4 组值分别为 A(1,2),B(2,3), C(3,4),D(4,5),则 y 与 x 之间的回归直线方程为( ) A. y =x+1 B. y =x+2 C. y =2x+1 D. y =x-1 【解析】选 A.由已知条件可知 = , = ,而回归直线必经过样本点的中心 ,故选 项 A 符合题意. 5.(2016·济南高二检测)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相 关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 y =0.85x-85.71,则下列结论中不正确的是( ) A.y 与 x 具有正的线性相关关系 B.回归直线过样本点的中心( , ) C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg 【解题指南】根据线性相关、回归直线、样本点的中心等相关概念判断. 【解析】选 D. 选项 具体分析 结论 A x 的系数大于零,正相关 正确 B 由回归直线方程的计算公式 a = - b 可知直线 l 必过点( , ) 正确 C 由一次函数的单调性知,x 每增加 1cm,体重平均增加 0.85kg,是估 计变量 正确 D 体重应约为 58.79kg,估计变量 不正确 二、填空题(每小题 5 分,共 15 分) 6.对于回归方程 y =257+4.75x,当 x=28 时,y 的估计值是________. 【解析】当 x=28 时, y =257+4.75×28=390, 所以 y 的估计值为 390. 答案:390 7.若对于变量 y 与 x 的 10 组数据的回归模型中,R2=0.95,又知残差平方和为 120.53.那么 (yi- )2=________. 【解析】由公式 R2=1- 得 0.95=1- 得 (yi- )2=2410.6. 答案:2410.6 8.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某 白酒酿造企业市场部对该企业 9 月份的产品销量 x(单位:千箱)与单位成本 y (单位:元) 的资料进行线性回归分析,结果如下: = , =71, =79, xiyi=1481. 则销量每增加 1000 箱,单位成本下降________元. 【解析】由题意知 b = ≈-1.8182, a =71-(-1.8182)× ≈77.36, y =-1.8182x+77.36,销量每增加 1 千箱,则单位成本下降 1.8182 元. 答案:1.8182 三、解答题(每小题 10 分,共 20 分) 9.(2016·武汉高二检测)某公司有 6 名推销员,其工作年限与年推销金额数据如下: 推销员编号 1 2 3 4 5 工作年限 x(年) 3 5 6 7 9 年推销金额 y(万元) 2 3 3 4 5 (1)求年推销金额 y 关于工作年限 x 的线性回归方程. (2)若第 6 名推销员工作年限为 11 年,试估计他的年推销金额. 【解析】(1)设所求的回归方程为 y = b x+ a , 则 b = = =0.5, a = - b =0.4. 所以年推销金额 y 关于工作年限 x 的线性回归方程为 y =0.5x+0.4. (2)当 x=11 时, y =0.5×11+0.4=5.9(万元), 所以可以估计第 6 名推销员的年推销金额为 5.9 万元. 10.已知某校在一次考试中,5 名学生的数学和地理成绩如表: 学生的编号 i 1 2 3 4 5 数学成绩 x 80 75 70 65 60 地理成绩 y 70 66 68 64 62 (1)根据上表,利用最小二乘法,求出 y 关于 x 的线性回归方程 y = b x+ a (其中 b =0.36). (2)利用(1)中的线性回归方程,试估计数学 90 分的同学的地理成绩(四舍五入到整数). (3)若从 5 人中选 2 人参加数学竞赛,其中 1、2 号不同时参加的概率是多少? 【解析】(1) = (80+75+70+65+60)=70, = (70+66+68+64+62)=66, b =0.36,所以 a = - b =40.8, 所以 y 关于 x 的线性回归方程为 y =0.36x+40.8. (2)若 x=90,则 y=0.36×90+40.8≈73, 即数学 90 分的同学的地理成绩估计为 73 分. (3)五人中选两人的不同选法有(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2, 5),(3,4),(3,5),(4,5)共 10 种不同选法.其中 1,2 号不同时参加的有 9 种, 所以 1,2 号不同时参加的概率 P= . 一、选择题(每小题 5 分,共 10 分) 1.(2016·石家庄高二检测)为了研究两个变量 x 和 y 之间的线性相关关系,甲、乙两位同学 分别独立做了 100 次和 150 次试验,并且利用最小二乘法求得回归直线分别为 l1,l2.已知 两人在试验中发现变量 x 的观察数据的平均值都是 s,变量 y 的观察数据的平均值都是 t. 下列说法中正确的是( ) A. l1 和 l2 有交点(s,t) B. l1 与 l2 相交,但交点不一定是(s,t) C. l1 与 l2 必平行 D. l1 与 l2 必重合 【解析】选 A.由题意知,(s,t)是甲、乙两位同学所做试验的样本点的中心,而回归直线 恒过样本点的中心,故 A 正确. 2.在某种新型材料的研制中,试验人员获得了下列一组试验数据,现准备用下列四个函数中 的一个近似地表示这些数据的规律,其中最接近的一个是( ) x 1.95 3.00 3.94 5.10 6.12 y 0.97 1.59 1.98 2.35 2.61 A.y=2x B.y=log2x C.y= (x2-1) D.y=2.61cosx 【解析】选 B.作散点图,从图中观察可知,应为对数函数模型. 二、填空题(每小题 5 分,共 10 分) 3.(2016·福州高二检测)某人收集统计近几年来春节期间的平均气温 x 与某取暖商品销售额 y 的有关数据(如表): 平均气温(℃) -2 -3 -5 -6 销售额(万元) 20 23 27 30 根据上述数据,用线性回归的方法,求得销售额 y 与平均气温 x 之间的线性回归方程为 y = x+ 中系数 =-2.4,预测平均气温为-8℃时,该商品的销售额大约为________万元. 【解析】 =-4, =25,即这组数据的样本点的中心为(-4,25),将 =-2.4 代入回归直线方 程且回归直线过样本点中心得 =15.4.故回归直线方程为 y =-2.4x+15.4.当 x=-8 时, y =-2.4×(-8)+15.4=34.6. 答案:34.6 4.对具有线性相关关系的变量 x 和 y,由测得的一组数据已求得回归直线的斜率为 6.5,且 恒过(2,3)点,则这条回归直线的方程为________. 【解析】由题意知 =2, =3, a =6.5,所以 a = - b =3-6.5×2=-10,即回归直线的方程 为 y =-10+2x. 答案: y =-10+2x 三、解答题 5.(10 分)(2015·全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传 费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8 年的年宣 传费 xi 和年销售量 yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量 的值. (xi- )2 (wi- )2 (xi- )(yi- ) (wi- )(yi- ) 46.6 563 6.8 289.8 1.6 1 469 108.8 表中 wi= , = wi. (1)根据散点图判断,y=a+bx 与 y=c+d 哪一个适宜作为年销售量 y 关于年宣传费 x 的回 归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程. (3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费 x=49 时,年销售量及年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线 v=α+βu 的斜率和截距的 最小二乘估计分别为: = , = - . 【解析】(1)由散点图的变化趋势可以判断,y=c+d 适宜作为年销售量 y 关于年宣传费 x 的回归方程类型. (2)令 w= ,先建立 y 关于 w 的线性回归方程. 由于 = = =68, = - =563-68×6.8=100.6, 所以 y 关于 w 的线性回归方程为 y =100.6+68w,因此 y 关于 x 的回归方程为 y =100.6+68 . (3)①由(2)知,当 x=49 时,年销售量 y 的预报值 y =100.6+68 =576.6, 年利润 z 的预报值 =576.6×0.2-49=66.32. ②根据(2)的结果知,年利润 z 的预报值 =0.2(100.6+68 )-x=-x+13.6 +20.12. 所以当 = =6.8,即 x=46.24 时, 取得最大值. 故年宣传费为 46.24 千元时,年利润的预报值最大. 【补偿训练】(2016·济宁高二检测)假定小麦基本苗数 x 与成熟期有效穗 y 之间存在相关关 系,现测得 5 组数据如下: x 15.0 25.8 30.0 36.6 44.4 y 39.4 42.9 42.9 43.1 49.2 (1)以 x 为解释变量,y 为预报变量作出散点图. (2)求 y 与 x 之间的回归方程,对基本苗数 56.7 预报有效穗. (3)计算各组残差,并计算残差平方和. (4)求 R2,说明回归模型的拟合效果. 【解析】(1)散点图如图所示: (2)由(1)中的图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此 可以用线性回归方程刻画它们之间的关系. 设回归方程为 y = x+ , =30.36, =43.5, =5101.56, =1320.66, 2=921.7296, xiyi=6746.76. 由 = ≈0.29, = - ≈34.70, 故所求的回归直线方程为 y =34.70+0.29x. 当 x=56.7 时, y =34.70+0.29×56.7=51.143. 估计成熟期有效穗为 51.143. (3)由于 iy = xi+ ,可以算得 ie =yi- iy ,分别为 1e =0.35, 2e =0.718, 3e =-0.5, 4e =-2.214, 5e =1.624, 残差平方和: ≈8.43. (4) (yi- )2=50.18, 故 R2=1- ≈0.832. 故回归模型拟合效果较好. 关闭 Word 文档返回原板块查看更多