- 2021-06-24 发布 |
- 37.5 KB |
- 9页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2019-2020学年高中数学课时作业27回归分析北师大版选修2-3
课时作业(二十七) 1.下列两个变量之间的关系是相关关系的是( ) A.正方体的棱长和体积 B.角的弧度数和它的正弦值 C.速度一定时的路程和时间 D.日照时间与水稻的亩产量 答案 D 解析 因为相关关系就是两个变量之间的一种非确定性关系,故可由两个变量之间的关系确定答案.A,B,C均确定性关系,即函数关系,而D中日照时间与亩产量的关系是不确定的.故选D. 2.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( ) A.①② B.①③ C.②③ D.③④ 答案 B 解析 ①③中的点分布在一条直线附近,适合用线性回归模型刻画,②④均不适合. 3.若回归直线方程中的回归系数=0,则相关系数( ) A.r=1 B.r=-1 C.r=0 D.无法确定 答案 C 解析 注意两个系数之间的联系. ,两个式子的分子是一致的,当=0时,r一定为0.故选C. 4.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合效果最好的模型是( ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 9 答案 A 解析 相关指数R2的取值范围为[0,1],若R2=1,即残差平方和为0,此时预测值与观测值相等.y与x是函数关系,也就是说在相关关系中R2越接近于1,说明随机误差的效应越小,y与x相关程度越大,模型的拟合效果越好.R2=0,说明模型中x与y根本无关.故选A. 5.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( ) A.年龄为37岁的人体内脂肪含量都为20.90% B.年龄为37岁的人体内脂肪含量为21.01% C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90% D.年龄为37岁的大部分的人体内脂肪含量为31.5% 答案 C 解析 当x=37时,=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%. 6.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ) A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 答案 C 7.(2013·新课标全国)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( ) A.-1 B.0 C. D.1 答案 D 9 解析 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y=x+1上,样本的相关系数应为1. 8.甲、乙、丙、丁四位同学各自对A、B两变量做回归分析,分别得到散点图与残差平方和(yi-i)2如下表: 甲 乙 丙 丁 散点图 残差 平方和 115 106 124 103 哪位同学的试验结果体现拟合A、B两变量关系的模型拟合精度高? A.甲 B.乙 C.丙 D.丁 答案 D 解析 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2表达式中(yi-)2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些,故选D. 9.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程 是 . 答案 =1.23x+0.08 解析 由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得-5=1.23(x-4),,即=1.23x+0.08. 10.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为 . 答案 1 解析 由ei恒为0知yi=i,即yi-i =0. 9 11.某市居民2010~2014年家庭平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示: 年份 2010 2011 2012 2013 2014 收入x 11.5 12.1 13 13.3 15 支出Y 6.8 8.8 9.8 10 12 12根据统计资料,居民家庭年平均收入的中位数是 ,家庭年平均收入与年平均支出有 线性相关关系.(填“正”或“负”) 答案 13 正 解析 由表中所给的数据知所求的中位数为13,画出x与Y的散点图知它们有较强的线性正相关关系. 12.已知两个变量x与y之间有线性相关性,5次试验的观测数据如下: X 100 120 140 160 180 Y 45 54 62 75 92 那么变量y关于x的回归方程是 W. 答案 =0.575x-14.9 解析 由线性回归的参数公式可求得=0.575,=-14.9,所以回归方程为=0.575x-14.9. 13.一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果: 转速x(转/秒) 16 14 12 8 每小时生产有缺点的零件数y(件) 11 9 8 5 (1)对变量y与x进行相关性检验; (2)如果y与x有线性相关关系,求线性回归方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,则机器的运转速度应控制在什么范围内? 解析 (1)x=12.5,=8.25. 9 ==≈≈0.995. 因为r>0.75,所以y与x有线性相关关系. (2) =0.728 6x-0.857 1. (3)要使≤10,即0.728 6x-0.857 1≤10, 所以x≤14.901 3. 所以机器的转速应控制在14.901 3转/秒以下. 14.(2015·济宁高二检测)已知某校5个学生的数学和物理成绩如下: 学生的编号 1 2 3 4 5 数学成绩x 80 75 70 65 60 物理成绩y 70 66 68 64 62 (1)通过大量事实证明发现,一个学生的数学成绩和物理成绩是具有很强的线性相关关系的,在上述表格中,用x表示数学成绩,用y表示物理成绩,求y关于x的回归方程; (2)利用残差分析回归方程的拟合效果,若残差和在(-0.1,0.1)范围内,则称回归方程为“优拟方程”,问:该回归方程是否为“优拟方程”. 解析 (1)由已知数据得,x=70,y=66,=0.36,=40.8,故回归直线方程为=0.36x+40.8. (2)由=0.36x+40.8,可知1=0.36×80+40.8=69.6,同理可得2=67.8,3=66,4=64.2,5=62.4,所以 (yi-i)=0∈(-0.1,0.1).故该回归方程是“优拟方程”. 15.为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如下表所示: x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8 (1)作出散点图并求线性回归方程; (2)求出R2; (3)进行残差分析. 解析 (1)作出散点图如图所示: 9 x=×(5+10+15+20+25+30)=17.5, y=×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487, xi2=2 275,xiyi=1 076.2, 计算得,≈0.183,≈6.285, 所求回归直线方程为=6.285+0.183x. (2)列表如下: yi-i 0.05 0.005 -0.08 -0.045 0.04 0.025 yi-y -2.24 -1.37 -0.54 0.41 1.41 2.31 所以 (yi-i)2≈0.013 18, (yi-y)2=14.678 4. 所以R2=1-≈0.999 1. (3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量具有线性关系. 1.若某函数型相对一组数据的残差平方和为89,其相关指数为0.95,则总偏差平方和为________,回归平方和为________. 答案 1 780 1 691 解析 R2=1-,0.95=1-, ∴总偏差平方和为1 780. 回归平方和=总偏差平方和-残差平方和=1 780-89=1 691. 2.对于x与y有如下观测数据: x 18 25 30 39 41 42 49 52 y 3 5 6 7 8 8 9 10 (1)作出散点图; (2)对x与y作回归分析; (3)求出y与x的回归直线方程; (4)根据回归直线方程,预测y=20时x的值. 9 答案 (1)作出散点图,如图. (2)作相关性检验. x=×(18+25+30+39+41+42+49+52)==37, y=×(3+5+6+7+8+8+9+10)=7, xi2=182+252+302+392+412+422+492+522=11 920, yi2=32+52+62+72+82+82+92+102=428, xiyi=18×3+25×5+30×6+39×7+41×8+42×8+49×9+52×10=2 257, xiyi-8=2 257-8×37×7=185, xi2-8x2=11 920-8×372=968, yi2-8y2=428-8×72=36, 由于r=0.991>0.75,因此,认为两个变量有很强的相关关系. (3)回归系数==≈0.191, =y-x=7-0.191×37=-0.067, 所以y对x的回归直线方程为=0.191x-0.067. (4)当y=20时,有20=0.191x-0.067,得x≈105.因此在y的值为20时,x的值约为105. 3.以下是收集到的房屋的销售价格y与房屋的大小x的有关数据. x(m2) 115 110 80 135 105 y(万元) 24.8 21.6 18.4 29.2 22 若y与x呈线性相关关系,求回归直线方程. 9 解析 作出散点图. 由图可知房屋的销售价格与房屋的大小线性相关. y=(24.8+21.6+18.4+29.2+22)=23.2, x=(115+110+80+135+105)=109, xi2=1152+1102+802+1352+1052=60 975, xiyi=24.8×115+21.6×110+18.4×80+29.2×135+105×22=12 952. =y-x=23.2-0.196 2×109=1.814 2, 所以y对x的回归直线方程为=0.196 2x+1.814 2. 4.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下: 零件数x(个) 10 20 30 40 50 60 70 80 90 100 加工时间y(分) 62 68 75 81 89 95 102 108 115 122 (1)计算总偏差平方和,残差及残差平方和; (2)求出相关指数R2; (3)进行残差分析. 解析 (1)列出残差表(=0.668x+54.960,y=91.7) i 62 68 75 81 89 95 102 108 115 122 61.6 68.3 75.0 81.7 88.4 95.0 101.7 108.4 115.1 121.8 yi- -29.7 -23.7 -16.7 -10.7 -2.7 3.3 10.3 16.3 23.3 30.3 9 yi -i 0.4 -0.3 0 -0.7 0.6 0 0.3 -0.4 -0.1 0.2 所以(yi-)2=(-29.7)2+(-23.7)2+…+30.32=3 688.1. ( yi-i)2=0.42+(-0.3)2+…+0.22=1.4. 即总偏差平方和为3 688.1,残差平方和为1.4,残差值如表中第四行的值. (2)R2=1-≈1-0.000 38=0.999 62,相关指数R2非常接近于1,回归直线模型拟合效果较好. (3)作出残差图甲 图甲:横坐标为零件个数,纵坐标为残差. 残差分析:由散点图乙和r的值(知识点二的例题,r=0.999 8)可以说明x与y有很强的相关性,由R2的值可以看出回归直线模型的拟合效果很好.由残差图可以观察到,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的失误,如果有则需要纠正数据,重新利用线性回归模型拟合数据;由残差图中的残差点比较均匀地落在水平的带状区域中(在两条直线y=-0.65和y=0.67之间),也说明选用的线性回归模型较为合适,带状区域的宽度仅为1.32,比较狭窄,说明模型拟合精度较高! 9查看更多