- 2021-05-14 发布 |
- 37.5 KB |
- 12页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
全国高考数学试题分类汇编114变量间的相关关系与统计案例
11.4变量间的相关关系与统计案例 考点一 变量间的相关关系 1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关 答案 C 8.(2015课标Ⅰ,19,12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi-)2 (wi-)2 (xi-)(yi-) (wi-)(yi-) 46.6 563 6.8 289.8 1.6 1 469 108.8 表中wi=,=wi. (1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程; (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为 =,=- . 解析 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分) (2)令w=,先建立y关于w的线性回归方程. 由于===68, =- =563-68×6.8=100.6, 所以y关于w的线性回归方程为=100.6+68w, 因此y关于x的回归方程为=100.6+68.(6分) (3)(i)由(2)知,当x=49时,年销售量y的预报值 =100.6+68=576.6, 年利润z的预报值 =576.6×0.2-49=66.32.(9分) (ii)根据(2)的结果知,年利润z的预报值 =0.2(100.6+68)-x=-x+13.6+20.12. 所以当==6.8,即x=46.24时,取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.(12分) 9.(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表: 年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y(千亿元) 5 6 7 8 10 (1)求y关于t的回归方程=t+; (2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款. 附:回归方程=t+中, ==-. 解析 (1)列表计算如下: i ti yi tiyi 1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 4 4 8 16 32 5 5 10 25 50 15 36 55 120 这里n=5,=ti==3,=yi==7.2. 又ltt=-n=55-5×32=10,lty=tiyi-n =120-5×3×7.2=12, 从而===1.2,=-=7.2-1.2×3=3.6, 故所求回归方程为=1.2t+3.6. (2) 将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元). 2017高考理科数学《变量间的相关关系、统计案例》练习题 [A组 基础演练·能力提升] 一、选择题 1.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是( ) A.三维柱形图 B.二维条形图 C.等高条形图 D.独立性检验 解析:前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确. 答案:D 2.(2014年广州调研)已知x,y的取值如下表: x 0 1 3 4 y 2.2 4.3 4.8 6.7 从所得的散点图分析,y与x线性相关,且=0.95x+,则=( ) A.2.1 B.2.2 C.2.4 D.2.6 解析:由题意得=2,=4.5,将(2,4.5)代入=0.95x+可得=2.6. 答案:D 3.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表: 优秀 非优秀 总计 甲班 10 b 乙班 c 30 总计 105 已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( ) A.列联表中c的值为30,b的值为35 B.列联表中c的值为15,b的值为50 C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系” D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 解析:由题意知,成绩优秀的学生人数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A,B错误.根据列联表中的数据,得到K2的观测值为k=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确,选项D错误. 答案:C 4.(2014年通州一模)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( ) A.由样本数据得到的回归方程=x+必过样本点的中心(,) B.残差平方和越小的模型,拟合的效果越好 C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好 D.若变量y和x之间的相关系数r=-0.936 2,则变量y与x之间具有线性相关关系 解析:R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C. 答案:C 5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K2=算得, K2=≈7.8. 附表: P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 参照附表,得到的正确结论是( ) A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D.有99%以上的把握认为“爱好该项运动与性别无关” 解析:根据独立性检验的定义,由K2≈7.8>6.635可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C. 答案:C 6.某产品的广告费用x与销售额y的统计数据如下表: 广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元 解析:∵==3.5(万元), ==42, 又=x+必过(,),∴42=×9.4+,∴=9.1. ∴线性回归方程为=9.4x+9.1, ∴当x=6时,=9.4×6+9.1=65.5(万元). 答案:B 二、填空题 7.(2014年韶关模拟)某市居民2008~2012年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示: 年份 2008 2009 2010 2011 2012 收入x 11.5 12.1 13 13.3 15 支出y 6.8 8.8 9.8 10 12 根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系. 解析:由中位数的定义知,总体个数为奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系. 答案:13 正 8.(2014年甘肃部分示范校模拟)为了均衡教育资源,加大对偏远地区的教育投入,调查了某地若干户家庭的年收入x(单位:万元)和年教育支出y(单位:万元),调查显示年收入x与年教育支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.15x+0.2.由回归直线方程可知,家庭年收入每增加1万元,年教育支出平均增加________万元. 解析:由题意知0.15(x+1)+0.2-0.15x-0.2=0.15. 答案:0.15 9.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表: 理科 文科 男 13 10 女 7 20 已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025. 根据表中数据,得到k=≈4.844. 则认为选修文科与性别有关系出错的可能性为________. 解析:∵K2≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%. 答案:5% 三、解答题 10.(2013年高考重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,x=720. (1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a; (2)判断变量x与y之间是正相关还是负相关; (3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y=bx+a中, b=,a=-b, 其中,为样本平均值.线性回归方程也可写为=x+. 解析:(1)由题意知n=10,=xi==8,=yi==2, 又lxx=x-n2=720-10×82=80, lxy=xiyi-n =184-10×8×2=24, 由此得b===0.3,a=-b=2-0.3×8=-0.4, 故所求线性回归方程为y=0.3x-0.4. (2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关. (3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元). 11.一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格: 人数xi 10 15 20 25 30 35 40 件数yi 4 7 12 15 20 23 27 其中i=1,2,3,4,5,6,7. (1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图; (2)求回归直线方程.(结果保留到小数点后两位) (3)预测进店人数为80人时,商品销售的件数.(结果保留整数) 解析:(1)散点图如图. (2)∵xiyi=3 245,=25,=15.43,x=5 075,7()2=4 375,7 =2 695, ∴=≈0.79, =-b=-4.32, ∴回归直线方程是=0.79x-4.32. (3)进店人数为80人时,商品销售的件数y=0.79×80-4.32≈59. 12.(能力提升)(2013年高考福建卷)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图. (1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率; (2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”? 附:2= P(2≥k) 0.100 0.050 0.010 0.001 k 2.706 3.841 6.635 10.828 (注:此公式也可以写成K2=) 解析:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名. 所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=. (2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下: 生产能手 非生产能手 合计 25周岁以上组 15 45 60 25周岁以下组 15 25 40 合计 30 70 100 所以得K2== =≈1.79. 因为1.79<2.706, 所以没有90%的把握认为“生产能手与工人所在的年龄组有关”. [B组 因材施教·备选练习] 1.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=x+,则“(x0,y0)满足线性回归方程=x+”是“x0=,y0=”的( ) A.充分不必要条件 B.必要不充分条件 C.充要条件 D.既不充分也不必要条件 解析:x0,y0为这10组数据的平均值,又因为线性回归方程=x+必过样本中心点(,),因此(,)一定满足线性回归方程,但满足线性回归方程的数组除了(,)外,可能还有其他样本点. 答案:B 2.(2014年江西重点中学盟校第二次联考)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9. 零件数x(个) 10 20 30 40 50 加工时间y(min) 62 75 81 89 现发现表中有一个数据看不清,请你推断出该数据的值为________. 解析:由已知可计算求出=30,而回归直线方程必过点(,),则=0.67×30+54.9=75,设模糊数字为a,则 =75,计算得a=68. 答案:68 3.某超市为了了解热茶的销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表: 气温(℃) 18 13 10 -1 杯数 24 34 38 64 由表中数据算得线性回归方程=bx+a中的b≈-2,预测当气温为-5 ℃时,热茶销售量为________杯. 解析:根据表格中的数据可得,=×(18+13+10-1)=10,=×(24+34+38+64)=40. 则a=-b=40-(-2)×10=60,故=-2x+60. 当x=-5时,=-2×(-5)+60=70. 答案:70查看更多