高考文科数学复习备课课件:第五节 变量的相关关系、统计案例

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

高考文科数学复习备课课件:第五节 变量的相关关系、统计案例

文数 课标版 第五节 变量的相关关系 1.两个变量的线性相关 (1)正相关 在散点图中,点散布在从①  左下角     到②  右上角     的区域,对于两 个变量的这种相关关系,我们将它称为正相关. (2)负相关 教材研读 在散点图中,点散布在从③  左上角     到④  右下角     的区域,对于两 个变量的这种相关关系,我们将它称为负相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在⑤  一条直线附近     ,就称这 两个变量之间具有线性相关关系,这条直线叫做回归直线. (4)最小二乘法 求回归直线,使得样本数据的点到它的⑥  距离的平方和最小     的方法 叫做最小二乘法. (5)回归方程 方程   =   x +   是两个具有线性相关关系的变量的一组数据( x 1 , y 1 ),( x 2 , y 2 ), … ,( x n , y n )的回归方程,其中   ,   是待定参数. 2.回归分析 (1)回归分析是对具有⑧  相关关系     的两个变量进行统计分析的一种 常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据( x 1 , y 1 ),( x 2 , y 2 ), … ,( x n , y n ),我们知道   =     ⑨  (   ,   )     称为样本点的中心. (3)相关系数:   . 当 r >0时,表明两个变量⑩  正相关     ; 当 r <0时,表明两个变量    负相关     . r 的绝对值越接近于1,表明两个变量的线性相关性    越强     . r 的绝对 值越接近于0,表明两个变量之间    几乎不存在线性相关关系     .通 | r |大于或等于    0.75     时,认为两个变量有很强的线性相关性. 3.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的    不同类别     ,像这 类变量称为分类变量. (2)列联表:列出两个分类变量的    频数表     ,称为列联表.假设有两个 分类变量 X 和 Y ,它们的可能取值分别为{ x 1 , x 2 }和{ y 1 , y 2 },其样本频数列联 表(称为2 × 2列联表)为 y 1 y 2 总计 x 1 a b a + b x 2 c d c + d 总计 a + c b + d a + b + c + d 则可构造一个随机变量 K 2 =               ,其中 n =        a + b + c + d      为样本容量. (3)独立性检验 利用独立性假设、随机变量        K 2      来确定是否有一定把握认为“两 个分类变量    有关系     ”的方法称为两个分类变量的独立性检验. 1.观察下列各图:   其中两个变量 x , y 具有线性相关关系的图是   (  ) A.①②     B.①④     C.③④     D.②③ 答案     C 由散点图知③④中 x , y 具有线性相关关系. 2.(2015湖北,4,5分)已知变量 x 和 y 满足关系 y =-0.1 x +1,变量 y 与 z 正相关.下 列结论中正确的是   (  ) A. x 与 y 正相关, x 与 z 负相关      B. x 与 y 正相关, x 与 z 正相关 C. x 与 y 负相关, x 与 z 负相关      D. x 与 y 负相关, x 与 z 正相关 答案     C 由 y =-0.1 x +1,知 x 与 y 负相关,即 y 随 x 的增大而减小,又 y 与 z 正相 关,所以 z 随 y 的增大而增大,减小而减小,所以 z 随 x 的增大而减小, x 与 z 负 相关,故选C. 3.已知 x , y 的对应取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方 程为   =0.95 x +   ,则   =   (  ) A.3.25     B.2.6      C.2.2     D.0 答案     B       =2,   =4.5,因为回归直线经过点(   ,   ),所以   =4.5-0.95 × 2=2.6, 故选B. x 0 1 3 4 y 2.2 4.3 4.8 6.7 考点一 相关关系的判断 典例1  (1)下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的 是   (  )     (2)对四组数据进行统计,获得以下散点图,关于其相关系数的比较, 考点突破 正确的是   (  )   A. r 2 < r 4 <0< r 3 < r 1      B. r 4 < r 2 <0< r 1 < r 3 C. r 4 < r 2 <0< r 3 < r 1      D. r 2 < r 4 <0< r 1 < r 3 解析  (1)观察散点图可知,只有D选项的散点图表示的是变量 x 与 y 之间 具有负的线性相关关系. (2)由相关系数的意义,结合散点图可知 r 2 < r 4 <0< r 3 < r 1 ,故选A. 答案  (1)D (2)A 方法技巧 对两个变量的相关关系的判断有两种方法:一是根据散点图,若具有很 强的直观性,则可直接得出两个变量是正相关或负相关;二是计算相关 系数,这种方法能比较准确地反映其相关程度,相关系数的绝对值越接 近于1,相关性就越强,相关系数就是描述相关性强弱的. 1-1  为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某 班学生的两科成绩得到如图所示的散点图( x 轴、 y 轴的单位长度相同), 用回归直线方程   = bx + a 近似地刻画其相关关系,根据图形,以下结论最 有可能成立的是   (  )   A.线性相关关系较强, b 的值为1.25 B.线性相关关系较强, b 的值为0.83 C.线性相关关系较强, b 的值为-0.87 D.线性相关关系较弱,无研究价值 答案     B 由散点图可以看出两个变量所构成的点在一条直线附近,所 以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正 数,且从散点图观察,回归直线的斜率应该比直线 y = x 的斜率要小一些,综 上可知应选B. 考点二 回归方程的求法及回归分析 典例2     (2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃 圾无害化处理量(单位:亿吨)的折线图.   (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加 以说明; (2)建立 y 关于 t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量. 附注: 参考数据:   y i =9.32,   t i y i =40.17,   =0.55,   ≈ 2.646. 参考公式:相关系数 r =   , 回归方程   =   +   t 中斜率和截距最小二乘估计公式分别为:   =   ,   =   -     . 解析  (1)由折线图中数据和附注中参考数据得   =4,   ( t i -   ) 2 =28,   =0.55,   ( t i -   )( y i -   )=   t i y i -     y i =40.17-4 × 9.32=2.89, r ≈   ≈ 0.99. 因为 y 与 t 的相关系数近似为0.99,说明 y 与 t 的线性相关程度相当高,从而 可以用线性回归模型拟合 y 与 t 的关系. (2)由   =   ≈ 1.331及(1)得   =   =   ≈ 0.10,   =   -     =1.331-0.10 × 4 ≈ 0.93. 所以 y 关于 t 的回归方程为   =0.93+0.10 t . 将2016年对应的 t =9代入回归方程得:   =0.93+0.10 × 9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨. 方法技巧 (1)回归直线   =   x +   必过样本点的中心(   ,   ). (2)正确运用计算   ,   的公式进行准确的计算是求线性回归方程的关键. (3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系, 则可通过线性回归方程预测变量的值. 2-1  从某居民区随机抽取10个家庭,获得第 i 个家庭的月收入 x i (单位:千 元)与月储蓄 y i (单位:千元)的数据资料,算得   x i =80,   y i =20,   x i y i =184,   =720. (1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 y = bx + a ; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程 y = bx + a 中,   其中   ,   为样本平均 值.线性回归方程也可写为   =   x +   . 解析  (1)由题意知 n =10,   =     x i =   =8,   =     y i =   =2, 又     - n   =720-10 × 8 2 =80,   x i y i - n      =184-10 × 8 × 2=24, 由此得 b =   =0.3, a =   - b   =2-0.3 × 8=-0.4, 故所求回归方程为 y =0.3 x -0.4. (2)由于变量 y 的值随 x 值的增加而增加( b =0.3>0),故 x 与 y 之间是正相关. (3)将 x =7代入回归方程可以预测该家庭的月储蓄为 y =0.3 × 7-0.4=1.7(千元). 考点三 独立性检验 典例3     (2016辽宁沈阳模拟)为考察某种疫苗预防疾病的效果,进行动 物试验,得到统计数据如下: 未发病 发病 合计 未注射疫苗 20 x A 注射疫苗 30 y B 合计 50 50 100 现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为   . (1)求 x , y , A , B 的值; (2)绘制发病率的条形统计图;   (3)能够有多大把握认为疫苗有效? 附: χ 2 =   , n = a + b + c + d P ( χ 2 ≥ k 0 ) 0.05 0.01 0.005 0.001 k 0 3.841 6.635 7.879 10.828 解析  (1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物” 为事件 A , 由已知得 P ( A )=   =   ,所以 y =10,则 B =40, x =40, A =60. (2)未注射疫苗的发病率为   =   ,注射疫苗的发病率为   =   . 发病率的条形统计图如图所示.   (3) χ 2 =   =   =   ≈ 16.67>10.828, 所以至少有99.9%的把握认为疫苗有效. 规律总结 (1)独立性检验的关键是正确列出2 × 2列联表,并计算出 K 2 的值.(2)应弄 清判定两变量有关的把握性与犯错误概率的关系,根据题目要求作出正 确的回答. 3-1  通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还 是愿意走人行天桥进行抽样调查,得到如下所示的2 × 2列联表: 由 K 2 =   , 算得 K 2 =   ≈ 7.8.   附表: 男 女 合计 走人行天桥 40 20 60 走斑马线 20 30 50 合计 60 50 110 P ( K 2 ≥ k 0 ) 0.050 0.010 0.001 k 0 3.841 6.635 10.828 参照附表,得到的正确结论是   (  ) A.有99%以上的把握认为“选择过马路的方式与性别有关” B.有99%以上的把握认为“选择过马路的方式与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性 别有关” D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与 性别无关” 答案     A ∵ K 2 ≈ 7.8>6.635,∴有99%以上的把握认为“选择过马路的 方式与性别有关”. 则可构造一个随机变量 K 2 =               ,其中 n =        a + b + c + d      为样本容量. (3)独立性检验 利用独立性假设、随机变量        K 2      来确定是否有一定把握认为“两 个分类变量    有关系     ”的方法称为两个分类变量的独立性检验. 判断下列结论的正误(正确的打“√”,错误的打“ × ”) (1)相关关系与函数关系都是一种确定性的关系.   ( × ) (2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性 关系去表示.   (√) (3)事件 X , Y 关系越密切,则由观测数据计算得到的 K 2 的观测值越小.   ( × ) 1.观察下列各图:   其中两个变量 x , y 具有线性相关关系的图是   (  ) A.①②     B.①④     C.③④     D.②③ 答案     C 由散点图知③④中 x , y 具有线性相关关系. 2.(2015湖北,4,5分)已知变量 x 和 y 满足关系 y =-0.1 x +1,变量 y 与 z 正相关.下 列结论中正确的是   (  ) A. x 与 y 正相关, x 与 z 负相关      B. x 与 y 正相关, x 与 z 正相关 C. x 与 y 负相关, x 与 z 负相关      D. x 与 y 负相关, x 与 z 正相关 答案     C 由 y =-0.1 x +1,知 x 与 y 负相关,即 y 随 x 的增大而减小,又 y 与 z 正相 关,所以 z 随 y 的增大而增大,减小而减小,所以 z 随 x 的增大而减小, x 与 z 负 相关,故选C. 3.已知 x , y 的对应取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方 程为   =0.95 x +   ,则   =   (  ) A.3.25     B.2.6      C.2.2     D.0 答案     B       =2,   =4.5,因为回归直线经过点(   ,   ),所以   =4.5-0.95 × 2=2.6, 故选B. x 0 1 3 4 y 2.2 4.3 4.8 6.7 考点一 相关关系的判断 典例1  (1)下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的 是   (  )     (2)对四组数据进行统计,获得以下散点图,关于其相关系数的比较, 考点突破 正确的是   (  )   A. r 2 < r 4 <0< r 3 < r 1      B. r 4 < r 2 <0< r 1 < r 3 C. r 4 < r 2 <0< r 3 < r 1      D. r 2 < r 4 <0< r 1 < r 3 解析  (1)观察散点图可知,只有D选项的散点图表示的是变量 x 与 y 之间 具有负的线性相关关系. (2)由相关系数的意义,结合散点图可知 r 2 < r 4 <0< r 3 < r 1 ,故选A. 答案  (1)D (2)A 方法技巧 对两个变量的相关关系的判断有两种方法:一是根据散点图,若具有很 强的直观性,则可直接得出两个变量是正相关或负相关;二是计算相关 系数,这种方法能比较准确地反映其相关程度,相关系数的绝对值越接 近于1,相关性就越强,相关系数就是描述相关性强弱的. 1-1  为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某 班学生的两科成绩得到如图所示的散点图( x 轴、 y 轴的单位长度相同), 用回归直线方程   = bx + a 近似地刻画其相关关系,根据图形,以下结论最 有可能成立的是   (  )   A.线性相关关系较强, b 的值为1.25 B.线性相关关系较强, b 的值为0.83 C.线性相关关系较强, b 的值为-0.87 D.线性相关关系较弱,无研究价值 答案     B 由散点图可以看出两个变量所构成的点在一条直线附近,所 以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正 数,且从散点图观察,回归直线的斜率应该比直线 y = x 的斜率要小一些,综 上可知应选B. 1-2  四名同学根据各自的样本数据研究变量 x , y 之间的相关关系,并求 得回归直线方程,分别得到以下四个结论: ① y 与 x 负相关且   =2.347 x -6.423; ② y 与 x 负相关且   =-3.476 x +5.648; ③ y 与 x 正相关且   =5.437 x +8.493; ④ y 与 x 正相关且   =-4.326 x -4.578. 其中一定   的结论的序号是   (  ) A.①②     B.②③     C.③④     D.①④ 答案     D 由回归直线方程   =   x +   ,知当   >0时, y 与 x 正相关;当   <0时, y 与 x 负相关.∴①④一定不正确.故选D. 考点二 回归方程的求法及回归分析 典例2     (2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃 圾无害化处理量(单位:亿吨)的折线图.   (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加 以说明; (2)建立 y 关于 t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾 无害化处理量. 附注: 参考数据:   y i =9.32,   t i y i =40.17,   =0.55,   ≈ 2.646. 参考公式:相关系数 r =   , 回归方程   =   +   t 中斜率和截距最小二乘估计公式分别为:   =   ,   =   -     . 解析  (1)由折线图中数据和附注中参考数据得   =4,   ( t i -   ) 2 =28,   =0.55,   ( t i -   )( y i -   )=   t i y i -     y i =40.17-4 × 9.32=2.89, r ≈   ≈ 0.99. 因为 y 与 t 的相关系数近似为0.99,说明 y 与 t 的线性相关程度相当高,从而 可以用线性回归模型拟合 y 与 t 的关系. (2)由   =   ≈ 1.331及(1)得   =   =   ≈ 0.10,   =   -     =1.331-0.10 × 4 ≈ 0.93. 所以 y 关于 t 的回归方程为   =0.93+0.10 t . 将2016年对应的 t =9代入回归方程得:   =0.93+0.10 × 9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨. 方法技巧 (1)回归直线   =   x +   必过样本点的中心(   ,   ). (2)正确运用计算   ,   的公式进行准确的计算是求线性回归方程的关键. (3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系, 则可通过线性回归方程预测变量的值. 2-1  从某居民区随机抽取10个家庭,获得第 i 个家庭的月收入 x i (单位:千 元)与月储蓄 y i (单位:千元)的数据资料,算得   x i =80,   y i =20,   x i y i =184,     =720. (1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 y = bx + a ; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程 y = bx + a 中,   其中   ,   为样本平均 值.线性回归方程也可写为   =   x +   . 解析  (1)由题意知 n =10,   =     x i =   =8,   =     y i =   =2, 又     - n   =720-10 × 8 2 =80,   x i y i - n       =184-10 × 8 × 2=24, 由此得 b =   =0.3, a =   - b   =2-0.3 × 8=-0.4, 故所求回归方程为 y =0.3 x -0.4. (2)由于变量 y 的值随 x 值的增加而增加( b =0.3>0),故 x 与 y 之间是正相关. (3)将 x =7代入回归方程可以预测该家庭的月储蓄为 y =0.3 × 7-0.4=1.7(千元). 考点三 独立性检验 典例3     (2016辽宁沈阳模拟)为考察某种疫苗预防疾病的效果,进行动 物试验,得到统计数据如下: 未发病 发病 合计 未注射疫苗 20 x A 注射疫苗 30 y B 合计 50 50 100 现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为   . (1)求 x , y , A , B 的值; (2)绘制发病率的条形统计图;   (3)能够有多大把握认为疫苗有效? 附: χ 2 =   , n = a + b + c + d P ( χ 2 ≥ k 0 ) 0.05 0.01 0.005 0.001 k 0 3.841 6.635 7.879 10.828 解析  (1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物” 为事件 A , 由已知得 P ( A )=   =   ,所以 y =10,则 B =40, x =40, A =60. (2)未注射疫苗的发病率为   =   ,注射疫苗的发病率为   =   . 发病率的条形统计图如图所示.   (3) χ 2 =   =   =   ≈ 16.67>10.828, 所以至少有99.9%的把握认为疫苗有效. 规律总结 (1)独立性检验的关键是正确列出2 × 2列联表,并计算出 K 2 的值.(2)应弄 清判定两变量有关的把握性与犯错误概率的关系,根据题目要求作出正 确的回答. 3-1  通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还 是愿意走人行天桥进行抽样调查,得到如下所示的2 × 2列联表: 由 K 2 =   , 算得 K 2 =   ≈ 7.8. 附表: 男 女 合计 走人行天桥 40 20 60 走斑马线 20 30 50 合计 60 50 110 P ( K 2 ≥ k 0 ) 0.050 0.010 0.001 k 0 3.841 6.635 10.828 参照附表,得到的正确结论是   (  ) A.有99%以上的把握认为“选择过马路的方式与性别有关” B.有99%以上的把握认为“选择过马路的方式与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性 别有关” D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与 性别无关” 答案     A ∵ K 2 ≈ 7.8>6.635,∴有99%以上的把握认为“选择过马路的 方式与性别有关”.
查看更多

相关文章

您可能关注的文档