- 2021-06-16 发布 |
- 37.5 KB |
- 49页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
高考文科数学复习备课课件:第五节 变量的相关关系、统计案例
文数 课标版 第五节 变量的相关关系 1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从① 左下角 到② 右上角 的区域,对于两 个变量的这种相关关系,我们将它称为正相关. (2)负相关 教材研读 在散点图中,点散布在从③ 左上角 到④ 右下角 的区域,对于两 个变量的这种相关关系,我们将它称为负相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在⑤ 一条直线附近 ,就称这 两个变量之间具有线性相关关系,这条直线叫做回归直线. (4)最小二乘法 求回归直线,使得样本数据的点到它的⑥ 距离的平方和最小 的方法 叫做最小二乘法. (5)回归方程 方程 = x + 是两个具有线性相关关系的变量的一组数据( x 1 , y 1 ),( x 2 , y 2 ), … ,( x n , y n )的回归方程,其中 , 是待定参数. 2.回归分析 (1)回归分析是对具有⑧ 相关关系 的两个变量进行统计分析的一种 常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据( x 1 , y 1 ),( x 2 , y 2 ), … ,( x n , y n ),我们知道 = ⑨ ( , ) 称为样本点的中心. (3)相关系数: . 当 r >0时,表明两个变量⑩ 正相关 ; 当 r <0时,表明两个变量 负相关 . r 的绝对值越接近于1,表明两个变量的线性相关性 越强 . r 的绝对 值越接近于0,表明两个变量之间 几乎不存在线性相关关系 .通 | r |大于或等于 0.75 时,认为两个变量有很强的线性相关性. 3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的 不同类别 ,像这 类变量称为分类变量. (2)列联表:列出两个分类变量的 频数表 ,称为列联表.假设有两个 分类变量 X 和 Y ,它们的可能取值分别为{ x 1 , x 2 }和{ y 1 , y 2 },其样本频数列联 表(称为2 × 2列联表)为 y 1 y 2 总计 x 1 a b a + b x 2 c d c + d 总计 a + c b + d a + b + c + d 则可构造一个随机变量 K 2 = ,其中 n = a + b + c + d 为样本容量. (3)独立性检验 利用独立性假设、随机变量 K 2 来确定是否有一定把握认为“两 个分类变量 有关系 ”的方法称为两个分类变量的独立性检验. 1.观察下列各图: 其中两个变量 x , y 具有线性相关关系的图是 ( ) A.①② B.①④ C.③④ D.②③ 答案 C 由散点图知③④中 x , y 具有线性相关关系. 2.(2015湖北,4,5分)已知变量 x 和 y 满足关系 y =-0.1 x +1,变量 y 与 z 正相关.下 列结论中正确的是 ( ) A. x 与 y 正相关, x 与 z 负相关 B. x 与 y 正相关, x 与 z 正相关 C. x 与 y 负相关, x 与 z 负相关 D. x 与 y 负相关, x 与 z 正相关 答案 C 由 y =-0.1 x +1,知 x 与 y 负相关,即 y 随 x 的增大而减小,又 y 与 z 正相 关,所以 z 随 y 的增大而增大,减小而减小,所以 z 随 x 的增大而减小, x 与 z 负 相关,故选C. 3.已知 x , y 的对应取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方 程为 =0.95 x + ,则 = ( ) A.3.25 B.2.6 C.2.2 D.0 答案 B =2, =4.5,因为回归直线经过点( , ),所以 =4.5-0.95 × 2=2.6, 故选B. x 0 1 3 4 y 2.2 4.3 4.8 6.7 考点一 相关关系的判断 典例1 (1)下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的 是 ( ) (2)对四组数据进行统计,获得以下散点图,关于其相关系数的比较, 考点突破 正确的是 ( ) A. r 2 < r 4 <0< r 3 < r 1 B. r 4 < r 2 <0< r 1 < r 3 C. r 4 < r 2 <0< r 3 < r 1 D. r 2 < r 4 <0< r 1 < r 3 解析 (1)观察散点图可知,只有D选项的散点图表示的是变量 x 与 y 之间 具有负的线性相关关系. (2)由相关系数的意义,结合散点图可知 r 2 < r 4 <0< r 3 < r 1 ,故选A. 答案 (1)D (2)A 方法技巧 对两个变量的相关关系的判断有两种方法:一是根据散点图,若具有很 强的直观性,则可直接得出两个变量是正相关或负相关;二是计算相关 系数,这种方法能比较准确地反映其相关程度,相关系数的绝对值越接 近于1,相关性就越强,相关系数就是描述相关性强弱的. 1-1 为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某 班学生的两科成绩得到如图所示的散点图( x 轴、 y 轴的单位长度相同), 用回归直线方程 = bx + a 近似地刻画其相关关系,根据图形,以下结论最 有可能成立的是 ( ) A.线性相关关系较强, b 的值为1.25 B.线性相关关系较强, b 的值为0.83 C.线性相关关系较强, b 的值为-0.87 D.线性相关关系较弱,无研究价值 答案 B 由散点图可以看出两个变量所构成的点在一条直线附近,所 以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正 数,且从散点图观察,回归直线的斜率应该比直线 y = x 的斜率要小一些,综 上可知应选B. 考点二 回归方程的求法及回归分析 典例2 (2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃 圾无害化处理量(单位:亿吨)的折线图. (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加 以说明; (2)建立 y 关于 t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量. 附注: 参考数据: y i =9.32, t i y i =40.17, =0.55, ≈ 2.646. 参考公式:相关系数 r = , 回归方程 = + t 中斜率和截距最小二乘估计公式分别为: = , = - . 解析 (1)由折线图中数据和附注中参考数据得 =4, ( t i - ) 2 =28, =0.55, ( t i - )( y i - )= t i y i - y i =40.17-4 × 9.32=2.89, r ≈ ≈ 0.99. 因为 y 与 t 的相关系数近似为0.99,说明 y 与 t 的线性相关程度相当高,从而 可以用线性回归模型拟合 y 与 t 的关系. (2)由 = ≈ 1.331及(1)得 = = ≈ 0.10, = - =1.331-0.10 × 4 ≈ 0.93. 所以 y 关于 t 的回归方程为 =0.93+0.10 t . 将2016年对应的 t =9代入回归方程得: =0.93+0.10 × 9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨. 方法技巧 (1)回归直线 = x + 必过样本点的中心( , ). (2)正确运用计算 , 的公式进行准确的计算是求线性回归方程的关键. (3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系, 则可通过线性回归方程预测变量的值. 2-1 从某居民区随机抽取10个家庭,获得第 i 个家庭的月收入 x i (单位:千 元)与月储蓄 y i (单位:千元)的数据资料,算得 x i =80, y i =20, x i y i =184, =720. (1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 y = bx + a ; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程 y = bx + a 中, 其中 , 为样本平均 值.线性回归方程也可写为 = x + . 解析 (1)由题意知 n =10, = x i = =8, = y i = =2, 又 - n =720-10 × 8 2 =80, x i y i - n =184-10 × 8 × 2=24, 由此得 b = =0.3, a = - b =2-0.3 × 8=-0.4, 故所求回归方程为 y =0.3 x -0.4. (2)由于变量 y 的值随 x 值的增加而增加( b =0.3>0),故 x 与 y 之间是正相关. (3)将 x =7代入回归方程可以预测该家庭的月储蓄为 y =0.3 × 7-0.4=1.7(千元). 考点三 独立性检验 典例3 (2016辽宁沈阳模拟)为考察某种疫苗预防疾病的效果,进行动 物试验,得到统计数据如下: 未发病 发病 合计 未注射疫苗 20 x A 注射疫苗 30 y B 合计 50 50 100 现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为 . (1)求 x , y , A , B 的值; (2)绘制发病率的条形统计图; (3)能够有多大把握认为疫苗有效? 附: χ 2 = , n = a + b + c + d P ( χ 2 ≥ k 0 ) 0.05 0.01 0.005 0.001 k 0 3.841 6.635 7.879 10.828 解析 (1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物” 为事件 A , 由已知得 P ( A )= = ,所以 y =10,则 B =40, x =40, A =60. (2)未注射疫苗的发病率为 = ,注射疫苗的发病率为 = . 发病率的条形统计图如图所示. (3) χ 2 = = = ≈ 16.67>10.828, 所以至少有99.9%的把握认为疫苗有效. 规律总结 (1)独立性检验的关键是正确列出2 × 2列联表,并计算出 K 2 的值.(2)应弄 清判定两变量有关的把握性与犯错误概率的关系,根据题目要求作出正 确的回答. 3-1 通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还 是愿意走人行天桥进行抽样调查,得到如下所示的2 × 2列联表: 由 K 2 = , 算得 K 2 = ≈ 7.8. 附表: 男 女 合计 走人行天桥 40 20 60 走斑马线 20 30 50 合计 60 50 110 P ( K 2 ≥ k 0 ) 0.050 0.010 0.001 k 0 3.841 6.635 10.828 参照附表,得到的正确结论是 ( ) A.有99%以上的把握认为“选择过马路的方式与性别有关” B.有99%以上的把握认为“选择过马路的方式与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性 别有关” D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与 性别无关” 答案 A ∵ K 2 ≈ 7.8>6.635,∴有99%以上的把握认为“选择过马路的 方式与性别有关”. 则可构造一个随机变量 K 2 = ,其中 n = a + b + c + d 为样本容量. (3)独立性检验 利用独立性假设、随机变量 K 2 来确定是否有一定把握认为“两 个分类变量 有关系 ”的方法称为两个分类变量的独立性检验. 判断下列结论的正误(正确的打“√”,错误的打“ × ”) (1)相关关系与函数关系都是一种确定性的关系. ( × ) (2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性 关系去表示. (√) (3)事件 X , Y 关系越密切,则由观测数据计算得到的 K 2 的观测值越小. ( × ) 1.观察下列各图: 其中两个变量 x , y 具有线性相关关系的图是 ( ) A.①② B.①④ C.③④ D.②③ 答案 C 由散点图知③④中 x , y 具有线性相关关系. 2.(2015湖北,4,5分)已知变量 x 和 y 满足关系 y =-0.1 x +1,变量 y 与 z 正相关.下 列结论中正确的是 ( ) A. x 与 y 正相关, x 与 z 负相关 B. x 与 y 正相关, x 与 z 正相关 C. x 与 y 负相关, x 与 z 负相关 D. x 与 y 负相关, x 与 z 正相关 答案 C 由 y =-0.1 x +1,知 x 与 y 负相关,即 y 随 x 的增大而减小,又 y 与 z 正相 关,所以 z 随 y 的增大而增大,减小而减小,所以 z 随 x 的增大而减小, x 与 z 负 相关,故选C. 3.已知 x , y 的对应取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方 程为 =0.95 x + ,则 = ( ) A.3.25 B.2.6 C.2.2 D.0 答案 B =2, =4.5,因为回归直线经过点( , ),所以 =4.5-0.95 × 2=2.6, 故选B. x 0 1 3 4 y 2.2 4.3 4.8 6.7 考点一 相关关系的判断 典例1 (1)下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的 是 ( ) (2)对四组数据进行统计,获得以下散点图,关于其相关系数的比较, 考点突破 正确的是 ( ) A. r 2 < r 4 <0< r 3 < r 1 B. r 4 < r 2 <0< r 1 < r 3 C. r 4 < r 2 <0< r 3 < r 1 D. r 2 < r 4 <0< r 1 < r 3 解析 (1)观察散点图可知,只有D选项的散点图表示的是变量 x 与 y 之间 具有负的线性相关关系. (2)由相关系数的意义,结合散点图可知 r 2 < r 4 <0< r 3 < r 1 ,故选A. 答案 (1)D (2)A 方法技巧 对两个变量的相关关系的判断有两种方法:一是根据散点图,若具有很 强的直观性,则可直接得出两个变量是正相关或负相关;二是计算相关 系数,这种方法能比较准确地反映其相关程度,相关系数的绝对值越接 近于1,相关性就越强,相关系数就是描述相关性强弱的. 1-1 为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某 班学生的两科成绩得到如图所示的散点图( x 轴、 y 轴的单位长度相同), 用回归直线方程 = bx + a 近似地刻画其相关关系,根据图形,以下结论最 有可能成立的是 ( ) A.线性相关关系较强, b 的值为1.25 B.线性相关关系较强, b 的值为0.83 C.线性相关关系较强, b 的值为-0.87 D.线性相关关系较弱,无研究价值 答案 B 由散点图可以看出两个变量所构成的点在一条直线附近,所 以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正 数,且从散点图观察,回归直线的斜率应该比直线 y = x 的斜率要小一些,综 上可知应选B. 1-2 四名同学根据各自的样本数据研究变量 x , y 之间的相关关系,并求 得回归直线方程,分别得到以下四个结论: ① y 与 x 负相关且 =2.347 x -6.423; ② y 与 x 负相关且 =-3.476 x +5.648; ③ y 与 x 正相关且 =5.437 x +8.493; ④ y 与 x 正相关且 =-4.326 x -4.578. 其中一定 的结论的序号是 ( ) A.①② B.②③ C.③④ D.①④ 答案 D 由回归直线方程 = x + ,知当 >0时, y 与 x 正相关;当 <0时, y 与 x 负相关.∴①④一定不正确.故选D. 考点二 回归方程的求法及回归分析 典例2 (2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃 圾无害化处理量(单位:亿吨)的折线图. (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加 以说明; (2)建立 y 关于 t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量. 附注: 参考数据: y i =9.32, t i y i =40.17, =0.55, ≈ 2.646. 参考公式:相关系数 r = , 回归方程 = + t 中斜率和截距最小二乘估计公式分别为: = , = - . 解析 (1)由折线图中数据和附注中参考数据得 =4, ( t i - ) 2 =28, =0.55, ( t i - )( y i - )= t i y i - y i =40.17-4 × 9.32=2.89, r ≈ ≈ 0.99. 因为 y 与 t 的相关系数近似为0.99,说明 y 与 t 的线性相关程度相当高,从而 可以用线性回归模型拟合 y 与 t 的关系. (2)由 = ≈ 1.331及(1)得 = = ≈ 0.10, = - =1.331-0.10 × 4 ≈ 0.93. 所以 y 关于 t 的回归方程为 =0.93+0.10 t . 将2016年对应的 t =9代入回归方程得: =0.93+0.10 × 9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨. 方法技巧 (1)回归直线 = x + 必过样本点的中心( , ). (2)正确运用计算 , 的公式进行准确的计算是求线性回归方程的关键. (3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系, 则可通过线性回归方程预测变量的值. 2-1 从某居民区随机抽取10个家庭,获得第 i 个家庭的月收入 x i (单位:千 元)与月储蓄 y i (单位:千元)的数据资料,算得 x i =80, y i =20, x i y i =184, =720. (1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 y = bx + a ; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程 y = bx + a 中, 其中 , 为样本平均 值.线性回归方程也可写为 = x + . 解析 (1)由题意知 n =10, = x i = =8, = y i = =2, 又 - n =720-10 × 8 2 =80, x i y i - n =184-10 × 8 × 2=24, 由此得 b = =0.3, a = - b =2-0.3 × 8=-0.4, 故所求回归方程为 y =0.3 x -0.4. (2)由于变量 y 的值随 x 值的增加而增加( b =0.3>0),故 x 与 y 之间是正相关. (3)将 x =7代入回归方程可以预测该家庭的月储蓄为 y =0.3 × 7-0.4=1.7(千元). 考点三 独立性检验 典例3 (2016辽宁沈阳模拟)为考察某种疫苗预防疾病的效果,进行动 物试验,得到统计数据如下: 未发病 发病 合计 未注射疫苗 20 x A 注射疫苗 30 y B 合计 50 50 100 现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为 . (1)求 x , y , A , B 的值; (2)绘制发病率的条形统计图; (3)能够有多大把握认为疫苗有效? 附: χ 2 = , n = a + b + c + d P ( χ 2 ≥ k 0 ) 0.05 0.01 0.005 0.001 k 0 3.841 6.635 7.879 10.828 解析 (1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物” 为事件 A , 由已知得 P ( A )= = ,所以 y =10,则 B =40, x =40, A =60. (2)未注射疫苗的发病率为 = ,注射疫苗的发病率为 = . 发病率的条形统计图如图所示. (3) χ 2 = = = ≈ 16.67>10.828, 所以至少有99.9%的把握认为疫苗有效. 规律总结 (1)独立性检验的关键是正确列出2 × 2列联表,并计算出 K 2 的值.(2)应弄 清判定两变量有关的把握性与犯错误概率的关系,根据题目要求作出正 确的回答. 3-1 通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还 是愿意走人行天桥进行抽样调查,得到如下所示的2 × 2列联表: 由 K 2 = , 算得 K 2 = ≈ 7.8. 附表: 男 女 合计 走人行天桥 40 20 60 走斑马线 20 30 50 合计 60 50 110 P ( K 2 ≥ k 0 ) 0.050 0.010 0.001 k 0 3.841 6.635 10.828 参照附表,得到的正确结论是 ( ) A.有99%以上的把握认为“选择过马路的方式与性别有关” B.有99%以上的把握认为“选择过马路的方式与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性 别有关” D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与 性别无关” 答案 A ∵ K 2 ≈ 7.8>6.635,∴有99%以上的把握认为“选择过马路的 方式与性别有关”.查看更多