- 2021-06-22 发布 |
- 37.5 KB |
- 4页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2019年高考数学总复习检测第68讲 变量的相关性、回归分析、独立性检验
第68讲 变量的相关性、回归分析、独立性检验 1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为(D) A.-1 B.0 C. D.1 由题意知,这组样本数据完全正相关,故相关系数为1,选D. 2.设某大学的女生的体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y =0.85x-85.71,则下列结论中不正确的是(D) A.y与x具有正的线性相关关系 B.回归直线过样本点的中心(,) C.若该大学某女生的身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生的身高为170 cm,则可断定其体重必为58.79 kg A、B、C均正确,是回归方程的性质.D项是错误的,线性回归方程只能预测学生的体重,选项D应改为“若该大学某女生身高为170 cm,则估计其体重大约为58.79 kg”才正确. 3.(2015·福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元) 6.2 7.5 8.0 8.5 9.8 据此估计,该社区一户年收入为15万元家庭的年支出为(B) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 由题意知,==10, ==8, 所以a =8-0.76×10=0.4, 所以当x=15时,y =0.76×15+0.4=11.8(万元). 4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110 由K2=算得, K2=≈7.8. 附表: P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 参照附表,得到的正确结论是(A) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 因为7.8>6.635,所以99%以上的把握认为“爱好该项运动与性别有关”,选A. 5.对于一组数据的两个函数模型,模型Ⅰ和模型Ⅱ的残差平方和分别为180.2和290.7,若从中选取一个拟合程度较好的函数模型,应选 模型Ⅰ . 残差平方和越小,函数模型对数据的拟合效果越好;残差平方和越大,说明函数模型对数据的拟合效果越差. 6.已知x、y的取值如下表所示, x 0 1 3 4 y 2.2 4.3 4.8 6.7 从所得的散点图分析,y与x线性相关,且y=0.95x+a,则a= 2.6 . 因为回归直线方程必过样本点的中心(,), 解得=2,=4.5,将(2,4.5)代入y=0.95x+a,可得a=2.6. 7.(2015·重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表: 年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元) 5 6 7 8 10 (1)求y关于t的回归方程y =b t+a ; (2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款. 附:回归方程y =b t+a 中,b =,a =-b . (1)列表计算如下: i ti yi t tiyi 1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 4 4 8 16 32 5 5 10 25 50 ∑ 15 36 55 120 这里n=5,=i==3, =i==7.2. 又ltt=-n2=55-5×32=10, lty=iyi-n=120-5×3×7.2=12, 从而b ===1.2, a =-b =7.2-1.2×3=3.6, 故所求回归方程为y =1.2t+3.6. (2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y =1.2× 6+3.6=10.8(千亿元). 8.(2015·湖北卷)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(C) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关 因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b y+a ,b >0,则z=b y+a =-0.1b x+b +a ,故x与z负相关. 9.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过这种血清的人与另外500名未使用这种血清的人一年中的感冒记录比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2=3.918,经查临界值表知P(K2≥3.841)≈0.05.下列结论中,正确结论的序号是 ① . ①有95%的把握认为“这种血清能起到预防感冒的作用”; ②若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%; ④这种血清预防感冒的有效率为5%. 因为K2=3.918≥3.841,而P(K2≥3.841)≈0.05, 所以有95%的把握认为“这种血清能起到预防感冒的作用”. 10.(2016·湖北省八校第二次联考)国内某知名大学有男生14000人,女生10000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表:(平均每天运动的时间单位:小时,该校学生平均每天运动的时间范围是[0,3]) 男生平均每天运动的时间分布情况: 平均每天 运动的时间 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3] 人数 2 12 23 18 10 x 女生平均每天运动的时间分布情况: 平均每天 运动的时间 [0, 0.5) [0.5, 1) [1, 1.5) [1.5, 2) [2, 2.5) [2.5, 3] 人数 5 12 18 10 3 y (1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1); (2)若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”. ①请根据样本估算该校“运动达人”的数量; ②请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断能否在犯错误的概率不超过0.05的前提下认为“是否为'运动达人'与性别有关?” 运动达人 非运动达人 总计 男生 女生 总计 参考公式:K2=,其中n=a+b+c+d. 参考数据: P(K2≥k0) 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.706 3.841 5.024 6.635 7.879 10.828 (1)由分层抽样得,男生抽取的人数为120×=70人,女生抽取的人数为120-70=50人,故x=5,y=2, 则该校男生平均每天运动的时间为: (0.25×2+0.75×12+1.25×23+1.75×18+2.25×10+2.75×5)≈1.5, 故该校男生平均每天运动的时间约为1.5小时. (2)①样本中“运动达人”所占比例是=,故估计该校“运动达人”有 ×(14000+10000)=4000人. ②由表格可知:, 运动达人 非运动达人 总计 男生 15 55 70 女生 5 45 50 总计 20 100 120 故K2的观测值 k==≈2.743<3.841. 故在犯错误的概率不超过0.05的前提下不能认为“是否为'运动达人'与性别有关”.查看更多