【数学】2018届一轮复习人教A版10-3变量间的相关关系统计案例学案

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

【数学】2018届一轮复习人教A版10-3变量间的相关关系统计案例学案

§10.3 变量间的相关关系、统计案例 考纲展示►  1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程. 3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用. 考点 1 变量间的相关关系 1.常见的两变量之间的关系有两类:一类是函数关系,另一类是________;与函数关系 不同,________是一种非确定性关系. 答案:相关关系 相关关系 2.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 ________,点散布在左上角到右下角的区域内,两个变量的相关关系为________. 答案:正相关 负相关 对回归系数的理解:解释变量;预报变量. 某工厂工人月工资 y(元)依劳动产值 x(万元)变化的回归直线方程为 y^ =900x+600,下 列判断正确的是__________. ①劳动产值为 10 000 元时,工资为 500 元; ②劳动产值提高 10 000 元时,工资提高 1 500 元; ③劳动产值提高 10 000 元时,工资提高 900 元; ④劳动产值为 10 000 元时,工资为 900 元. 答案:③ 解析:回归系数 b^ 的意义为:解释变量每增加 1 个单位,预报变量平均增加 b 个单位. [典题 1] (1)下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的是(  )    A            B    C            D [答案] D [解析] 观察散点图可知,只有 D 选项的散点图表示的是变量 x 与 y 之间具有负的线性 相关关系. (2)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得回归直线方程, 分别得到以下四个结论: ①y 与 x 负相关且 y^ =2.347x-6.423; ②y 与 x 负相关且 y^ =-3.476x+5.648; ③y 与 x 正相关且 y^ =5.437x+8.493; ④y 与 x 正相关且 y^ =-4.326x-4.578. 其中一定不正确的结论的序号是(  ) A.①② B.②③ C.③④ D.①④ [答案] D [解析] 由回归方程 y^ = b^ x+ a^ 知,当 b^ >0 时,y 与 x 正相关,当 b^ <0 时,y 与 x 负 相关,∴①④一定错误. [点石成金] 相关关系的直观判断方法就是作出散点图,若散点图呈带状且区域较窄, 说明两个变量有一定的线性相关性,若呈曲线型也是有相关性,若呈图形区域且分布较乱则 不具备相关性. 考点 2 线性回归分析 1.回归分析 对具有________的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(ⅰ)画散 点图;(ⅱ)求________;(ⅲ)用回归直线方程作预报. 答案:相关关系 回归直线方程 2.回归直线 如果散点图中点的分布从整体上看大致在________附近,就称这两个变量之间具有线性 相关关系,这条直线叫做回归直线. 答案:一条直线 3.回归直线方程的求法——最小二乘法 设具有线性相关关系的两个变量 x,y 的一组观察值为(xi,yi)(i=1,2,…,n),则回归 直线方程 y^ = b^ x+ a^ 的系数为:Error!其中x= 1 n n ∑ i=1 xi,y= 1 n n ∑ i=1 yi,(x,y)称为样本点的 ________. 答案: ∑n i=1 x iyi-n x y ∑n i=1 x 2i-n x2  中心 4.相关系数 当 r>0 时,表明两个变量________; 当 r<0 时,表明两个变量________. r 的绝对值越接近于 1,表明两个变量的线性相关性________. r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性. 答案:正相关 负相关 越强 [教材习题改编]已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直 线方程为__________. 答案: y^ =1.23x+0.08 解析:设回归直线方程为 y^ =1.23x+ a^ , 因为回归直线必过样本点的中心(x,y), 将点(4,5)代入回归直线方程得 a^ =0.08, 所以所求方程为 y^ =1.23x+0.08. 变量的相关关系:散点图;回归直线过(x,y). 某工厂经过技术改造后,生产某种产品的产量 x(吨)与相应的生产能耗 y(吨标准煤)有如 下几组样本数据. x 3 4 5 6 y 2.5 3 4 4.5 据相关性检验,y 与 x 具有线性相关关系,通过线性回归分析,求得回归直线的斜率为 0.7,那么当产量 x=10 吨时,估计相应的生产能耗为__________吨标准煤. 答案:7.35 解析:先求得x=4.5,y=3.5,由 y^ =0.7x+ a^ 过点(x,y),得 a^ =0.35, 所以回归直线方程是 y^ =0.7x+0.35. 当 x=10 吨时, y^ =7+0.35=7.35(吨标准煤). [典题 2] (1)已知 x,y 的取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方程 为 y^ =0.95x+ a^ ,则 a^ =(  ) x 0 1 3 4 y 2.2 4.3 4.8 6.7 A.3.25 B.2.6 C.2.2 D.0 [答案] B [解析] 由已知得x=2,y=4.5, 因为回归方程经过点(x,y), 所以 a^ =4.5-0.95×2=2.6. (2)由某种设备的使用年限 xi(年)与所支出的维修费 yi(万元)的数据资料算得如下结果, 5 ∑ i=1 x2i=90, 5 ∑ i=1 xiyi=112, 5 ∑ i=1 xi=20, 5 ∑ i=1 yi=25. ①求所支出的维修费 y 对使用年限 x 的线性回归方程 y^ = b^ x+ a^ ; ②(ⅰ)判断变量 x 与 y 之间是正相关还是负相关; (ⅱ)当使用年限为 8 年时,试估计支出的维修费是多少. 附:在线性回归方程 y^ = b^ x+ a^ 中, b^ = ∑n i=1 x iyi-nx y ∑n i=1 x 2i-nx2 , a^ =y- b^ x,其中x,y为 样本平均值. [解] ①∵ 5 ∑ i=1 xi=20, 5 ∑ i=1 yi=25, ∴x= 1 5 5 ∑ i=1 xi=4,y= 1 5 5 ∑ i=1 yi=5, ∴ b^ = ∑5 i=1 x iyi-5x y ∑5 i=1 x 2i-5x2 = 112-5 × 4 × 5 90-5 × 42 =1.2, a^ =y- b^ x=5-1.2×4=0.2. ∴线性回归方程为 y^ =1.2x+0.2. ②(ⅰ)由①知, b^ =1.2>0, ∴变量 x 与 y 之间是正相关. (ⅱ)由①知,当 x=8 时, y^ =9.8,即使用年限为 8 年时,支出维修费约是 9.8 万元. [点石成金] 1.正确理解计算 b^ , a^ 的公式和准确的计算是求线性回归方程的关键. 2.回归直线方程 y^ = b^ x+ a^ 必过样本点的中心(x,y). 3.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否 具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测. 某地最近十年粮食需求量逐年上升,下表是部分统计数据: 年份 2006 2008 2010 2012 2014 需求量(万吨) 236 246 257 276 286 (1)利用所给数据求年需求量与年份之间的回归直线方程 y^ = b^ x+ a^ ; (2)利用(1)中所求出的回归直线方程预测该地 2016 年的粮食需求量. 解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程, 为此对数据预处理如下: 年份-2 010 -4 -2 0 2 4 需求量-257 -21 -11 0 19 29 对预处理后的数据,容易算得, x=0,y=3.2, b^ = -4 × -21+-2 × -11+2 × 19+4 × 29-5 × 0 × 3.2 -42+-22+22+42-5 × 02 = 260 40 =6.5, a^ =y- b^ x=3.2. 由上述计算结果知,所求回归直线方程为 y^ -257= b^ (x-2 010)+ a^ =6.5(x-2 010)+3.2, 即 y^ =6.5×(x-2 010)+260.2. (2)利用(1)中所求回归直线方程,可预测 2016 年的粮食需求量为 6.5×(2 016-2 010)+ 260.2=6.5×6+260.2=299.2(万吨). 考点 3 独立性检验 1.分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. 2.列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y,它 们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为 2×2 列联表: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d K2= nad-bc2 a+ba+cb+dc+d(其中 n=________为样本容量),则利用独立性 检验判断表来判断“X 与 Y 的关系”. 答案:a+b+c+d (1)[教材习题改编]为调查中学生的近视情况,测得某校 150 名男生中有 80 名近视,140 名女生中有 70 名近视.在检验这些学生眼睛近视是否与性别有关时,最有说服力的方法是 ________.(填序号) ①回归分析;②期望与方差;③独立性检验;④概率. 答案:③ 解析:“近视”与“性别”是两个分类变量,其是否有关,应该用独立性检验来判断. (2)[教材习题改编]在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得出“吸 烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,有下列四种说法:① 100 个吸烟者中至少有 99 人患有肺癌;②1 个人吸烟,那么这人有 99%的概率患有肺癌;③ 在 100 个吸烟者中一定有患肺癌的人;④在 100 个吸烟者中可能一个患肺癌的人也没有.其 中正确说法的序号是________. 答案:④  对独立性检验的理解:K2 的计算;对 P(K2≥k0)的解释. [2017·湖南张家界模拟]某高校教“统计初步”课程的教师随机调查了选该课程的一些 学生的情况,具体数据如下表:     专业 性别    非统计专业 统计专业 男 13 10 女 7 20 为了判断主修统计专业是否与性别有关系,根据表中的数据,得到 K2 的观测值 k= 50 × 13 × 20-10 × 72 23 × 27 × 20 × 30 ≈4.844. 因为 k>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ________. 附表: P(K2≥k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 答案:5% 解析:∵k>3.841,查临界值表,得 P(K2≥3.841)=0.05,故这种判断出错的可能性为 5%. [典题 3] (1)为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取 50 名学 生,得到 2×2 列联表: 理科 文科 总计 男 13 10 23 女 7 20 27 总计 20 30 50 已知 P(K2≥3.841)≈0.05, P(K2≥5.024)≈0.025. 根据表中数据,得到 K2= 50 × 13 × 20-10 × 72 23 × 27 × 20 × 30 ≈4.844,则认为选修文理科与 性别有关系出错的可能性约为________. [答案] 5% [解析] 由 K2≈4.844>3.841.故认为选修文理科与性别有关系出错的可能性约为 5%. (2)[2017·江西九江模拟]某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统 计本校高三年级每个学生一学期数学成绩平均分(采用百分制),剔除平均分在 40 分以下的学 生后,共有男生 300 名,女生 200 名.现采用分层抽样的方法,从中抽取了 100 名学生,按 性别分为两组,并将两组学生的成绩分为 6 组,得到如下所示的频数分布表. 分数段 [40, 50) [50, 60) [60, 70) [70, 80) [80, 90) [90, 100] 男 3 9 18 15 6 9 女 6 4 5 10 13 2 ①估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看, 数学成绩与性别是否有关; ②规定 80 分以上为优分(含 80 分),请你根据已知条件作出 2×2 列联表,并判断是否有 90%以上的把握认为“数学成绩与性别有关”. 优分 非优分 总计 男生 女生 总计 100 附表及公式: P(K2≥k0) 0.100 0.050 0.010 0.001 k0 2.706 3.841 6.635 10.828 K2= nad-bc2 a+bc+da+cb+d. [解] ①x男=45×0.05+55×0.15+65×0.3+75×0.25+85×0.1+95×0.15=71.5, x女=45×0.15+55×0.1+65×0.125+75×0.25+85×0.325+95×0.05=71.5, 从男、女生各自的平均分来看,并不能判断数学成绩与性别有关. ②由频数分布表可知,在抽取的 100 名学生中,“男生组”中的优分有 15 人,“女生组” 中的优分有 15 人, 据此可得 2×2 列联表如下: 优分 非优分 总计 男生 15 45 60 女生 15 25 40 总计 30 70 100 可得 K2= 100 × 15 × 25-15 × 452 60 × 40 × 30 × 70 ≈1.79, 因为 1.79<2.706,所以没有 90%以上的把握认为“数学成绩与性别有关”. [点石成金] 1.独立性检验的关键是正确列出 2×2 列联表,并计算出 K2 的值. 2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答. [2017·广西玉林、贵港联考]某市地铁即将于 2015 年 6 月开始运营,为此召开了一个价 格听证会,拟定价格后又进行了一次调查,随机抽查了 50 人,他们的收入与态度如下; 月收入 (单位: 百元) [15, 25) [25, 35) [35, 45) [45, 55) [55, 65) [65, 75] 赞成定 价者人数 1 2 3 5 3 4 认为价 格偏高 者人数 4 8 12 5 2 1 (1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与 “认为价格偏高者”的月平均收入的差距是多少(结果保留 2 位小数); (2)由以上统计数据填写下面的 2×2 列联表分析是否有 99%的把握认为“月收入以 55 百 元为分界点对地铁定价的态度有差异”. 月收入低于 55 百元的人数 月收入不低于 55 百元的人数 总计 认为价 格偏高者 赞成 定价者 总计 附:K2= nad-bc2 a+bc+da+cb+d. P(K2≥k0) 0.05 0.01 k0 3.841 6.635 解:(1)“赞成定价者”的月平均收入为 x1= 20 × 1+30 × 2+40 × 3+50 × 5+60 × 3+70 × 4 1+2+3+5+3+4 ≈50.56. “认为价格偏高者”的月平均收入为 x2= 20 × 4+30 × 8+40 × 12+50 × 5+60 × 2+70 × 1 4+8+12+5+2+1 =38.75, ∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1-x2=50.56-38.75= 11.81(百元). (2)根据条件可得 2×2 列联表如下: 月收入低于 55 百元的人数 月收入不低于 55 百元的人数 总计 认为价格 偏高者 29 3 32 赞成 定价者 11 7 18 总计 40 10 50 K2= 50 × 7 × 29-3 × 112 10 × 40 × 18 × 32 ≈6.27<6.635, ∴没有 99%的把握认为“月收入以 55 百元为分界点对地铁定价的态度有差异”. [方法技巧] 1.求回归方程,关键在于正确求出系数 a^ ,b^ ,由于 a^ , b^ 的计算量大,计 算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为 b^ ,常数项为 a^ ,这与一次函数的习惯表示不同.) 2.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否 有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取 值及判断变量取值的变化趋势;(3)求出线性回归方程. [易错防范] 1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散 点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意 义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值. 2.独立性检验中统计量 K2 的观测值 k 的计算公式很复杂,在解题中易混淆一些数据的意 义,代入公式时出错,而导致整个计算结果出错. 真题演练集训 1.[2015·福建卷]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户家庭,得到如下统计数据表: 收入 x(万元) 8.2 8.6 10.0 11.3 11.9 支出 y(万元) 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程 y^ = b^ x+ a^ ,其中 b^ =0.76, a^ = y- - b^  x.据此估计,该 社区一户年收入为 15 万元家庭的年支出为(  ) A.11.4 万元 B.11.8 万元 C.12.0 万元 D.12.2 万元 答案:B 解析:由题意知, x= 8.2+8.6+10.0+11.3+11.9 5 =10, y= 6.2+7.5+8.0+8.5+9.8 5 =8, ∴ a^ =8-0.76×10=0.4, ∴ 当 x=15 时, y^ =0.76×15+0.4=11.8(万元). 2.[2016·新课标全国卷Ⅲ]下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位: 亿吨)的折线图. 注:年份代码 1-7 分别对应年份 2008-2014. (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理 量. 附注:参考数据: 7 ∑ i=1 yi=9.32, 7 ∑ i=1 tiyi=40.17, 7 ∑ i=1 yi-y2=0.55, 7 ≈2.646. 参考公式:相关系数 r= ∑n i=1 ti-tyi-y ∑n i=1 ti-t2 ∑n i=1 yi-y2 ,回归方程 y^ = b^ t+ a^ 中斜率和截距的最小二乘估计公式分别为 b^ = ∑n i=1 ti-tyi-y ∑n i=1 ti-t2 , a^ =y- b^ t. 解:(1)由折线图中数据和附注中参考数据,得 t=4, 7 ∑ i=1 (ti-t)2=28, 7 ∑ i=1 yi-y2=0.55, 7 ∑ i=1 (ti-t)(yi-y)= 7 ∑ i=1 tiyi-t 7 ∑ i=1 yi=40.17-4×9.32=2.89,r≈ 2.89 0.55 × 2 × 2.646 ≈0.99. 因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线 性回归模型拟合 y 与 t 的关系. (2)由y= 9.32 7 ≈1.331 及(1),得 b^ = ∑7 i=1 ti-tyi-y ∑7 i=1 ti-t2 = 2.89 28 ≈0.103, a^ =y- b^ t≈1.331-0.103×4≈0.92. 所以,y 关于 t 的回归方程为 y^ =0.92+0.10t. 将 2016 年对应的 t=9 代入回归方程,得 y^ =0.92+0.10×9=1.82. 所以预测 2016 年我国生活垃圾无害化处理量约为 1.82 亿吨. 3.[2015·新课标全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣 传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响.对近 8 年的年宣 传费 xi 和年销售量 yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的 值. x y w 8 ∑ i=1 (xi -x)2 8 ∑ i=1 (wi -w)2 8 ∑ i=1 (xi- x)(yi-y) 8 ∑ i=1 (wi- w)(yi-y) 46.6 563 6.8 289.8 1.6 1 469 108.8 表中 wi= xi,w= 1 8 8 ∑ i=1 xi. (1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程. (3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费 x=49 时,年销售量及年利润的预报值是多少? ②年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线 v=α+βu 的斜率和 截距的最小二乘估计分别为β^ = ∑n i=1 ui-uvi-v ∑n i=1 ui-u2 ,α^ =v-β^ u. 解:(1)由散点图可以判断,y=c+d x适宜作为年销售量 y 关于年宣传费 x 的回归方程 类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程. 由于 d^ = ∑8 i=1 wi-wyi-y ∑8 i=1 wi-w2 = 108.8 1.6 =68, c^ =y- d^ w=563-68×6.8=100.6, 所以 y 关于 w 的线性回归方程为 y^ =100.6+68w, 因此 y 关于 x 的回归方程为 y^ =100.6+68 x. (3)①由(2)知,当 x=49 时, 年销售量 y 的预报值 y^ =100.6+68 49=576.6,年利润 z 的预报值 z^ =576.6×0.2- 49=66.32. ②根据(2)的结果知,年利润 z 的预报值 z^ =0.2(100.6+68 x)-x=-x+13.6 x+20.12. 所以当 x= 13.6 2 =6.8,即 x=46.24 时, z^ 取得最大值.故年宣传费为 46.24 千元时, 年利润的预报值最大. 4.[2014·新课标全国卷Ⅱ]某地区 2007 年至 2013 年农村居民家庭人均纯收入 y(单位: 千元)的数 据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号 t 1 2 3 4 5 6 7 人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变 化情况,并预测该地区 2015 年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为: b^ = ∑n i=1 ti-tyi-y ∑n i=1 ti-t2 , a^ =y- b^ t. 解:(1)由所给数据计算得 t= 1 7×(1+2+3+4+5+6+7)=4, y= 1 7×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, 7 ∑ i=1 (ti-t)2=9+4+1+0+1+4+9=28, 7 ∑ i=1 (ti-t)(yi-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5 +2×0.9+3×1.6=14, b^ = ∑7 i=1 ti-tyi-y ∑7 i=1 ti-t2 = 14 28=0.5, a^ =y- b^ t=4.3-0.5×4=2.3. 所求回归方程为 y^ =0.5t+2.3. (2)由(1)知, b^ =0.5>0,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加, 平均每年增加 0.5 千元. 将 2015 年的年份代号 t=9 代入(1)中的回归方程,得 y^ =0.5×9+2.3=6.8, 故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元. 课外拓展阅读 统计案例问题的规范答题 [典例] [2013·福建卷]某工厂有 25 周岁以上(含 25 周岁)工人 300 名,25 周岁以下工 人 200 名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取 了 100 名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25 周岁以上(含 25 周岁)”和“25 周岁以下”分为两组,再将两组工人的日平均生产件数分成 5 组:[50,60), [60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图. (1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 人,求至少抽到一名“25 周 岁以下组”工人的概率; (2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成 2×2 列 联表,并判断是否有 90%的把握认为“生产能手与工人所在的年龄组有关”? P(K2≥k0) 0.100 0.050 0.010 0.001 k0 2.706 3.841 6.635 10.828 附:K2= nad-bc2 a+bc+da+cb+d. [审题视角] 由频率分布直方图列举基本事件,结合古典概型,求概率.利用独立性检 验公式计算 K2. [解] (1)由已知得,样本中有 25 周岁以上组工人 60 名,25 周岁以下组工人 40 名.所 以,样本中日平均生产件数不足 60 件的工人中,25 周岁以上组工人有 60×0.05=3(人),记 为 A1,A2,A3;25 周岁以下组工人有 40×0.05=2(人),记为 B1,B2. 从中随机抽取 2 名工人,所有的可能结果共有 10 种,它们是(A1,A2),(A1,A3),(A2, A3),(A1,B1), (A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 其中,至少有 1 名“25 周岁以下组”工人的可能结果共有 7 种,它们是(A1,B1),(A1, B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 故所求的概率 P= 7 10. (2)由频率分布直方图可知,在抽取的 100 名工人中,“25 周岁以上组”中的生产能手有 60×0.25=15(人),“25 周岁以下组”中的生产能手有 40×0.375=15(人),据此可得 2×2 列联表如下: 生产能手 非生产能手 总计 25 周岁以上组 15 45 60 25 周岁以下组 15 25 40 总计 30 70 100 所以 K2= nad-bc2 a+bc+da+cb+d = 100 × 15 × 25-15 × 452 60 × 40 × 30 × 70 = 25 14≈1.79. 因为 1.79<2.706,所以没有 90%的把握认为“生产能手与工人所在的年龄组有关”. [答题模板] 第 1 步:由分层抽样计算两组工人的数目; 第 2 步:由频率分布直方图计算两组不足 60 件的人数; 第 3 步:列举 5 人抽取 2 人的基本事件数; 第 4 步,由古典概型计算概率; 第 5 步:统计生产能手与非生产能手,列 2×2 列联表; 第 6 步:由公式计算 K2,确定答案. 归纳总结 (1)分层抽样比为 100 500= 1 5,故 25 周岁以上有 300× 1 5=60(人),25 周岁以下的 200× 1 5= 40(人),然后再根据频率计算“不足 60 件”的人数,并设定符号. (2)列 2×2 列联表时,其中的数字应先由频率分布直方图算出后再列表.
查看更多

相关文章

您可能关注的文档