专题43+变量的相关性、统计案例(检测)-2019年高考数学(文)名师揭秘之一轮总复习

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

专题43+变量的相关性、统计案例(检测)-2019年高考数学(文)名师揭秘之一轮总复习

【学习目标】 1.会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间 的相关关系; 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程; 3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用; 4.了解回归的基本思想、方法及简单应用. 【知识要点】 1.相关关系的分类 从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们 将它称之为 ;点散布在从左上角到右下角的区域内,两个变量的这种 相关关系称为 . 2.线性相关 从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有 线性相关关系,这条直线叫 . 3.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的__ 最小的方法 叫最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn, yn),其回归方程为=x+,则 2ix.其中是回归方程的 ____ ,是在 y 轴上的截距. 4.样本相关系数 r=y)2,用来衡量两个变量间的线性相关关系. (1)当 r>0 时,表示两个变量 ; (2)当 r<0 时,表示两个变量 ; (3)r 的绝对值越接近 1,表明两个变量的线性相关性 ____ ;r 的绝对值越接近于 0,表 示两个变量之间几乎不存在相关关系.通常当|r|>0.75 时,认为两个变量有很强的线性相关 关系. 5.线性回归模型 (1)y=bx+a+e 中,a,b 称为模型的未知参数,e 称为随机误差. (2)相关指数 用相关指数 R2 来刻画回归的效果,其计算公式是:R2=1-y)2,R2 的值越大,说明残 差平方和越小,也就是说模型的拟合效果 ____ .在线性回归模型中,R2 表示解释变量对预 报变化的贡献率,R2 越接近于 1,表示回归效果越好. 6.独立性检验 (1)用变量的不同“值”表示个体所需的不同类别,这种变量称为分类变量. (2)列出的两个分类变量的频数表,称为列联表. (3)一般地,假设有两个分类变量 X 和 Y,它们的值域分别为{x1,x2}和{y1,y2},其样本 频数列联表(称 2×2 列联表)为: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d K2= n(ad-bc)2(a+b)(a+c)(c+d)(b+d)(其中 n=a+b+c+d 为样本容量),可利用独立性 检验判断表来判断“X 与 Y 的关系”.这种利用随机变量 K2 来确定在多大程度上可以认为“两 个分类变量有关系”的方法称为两个分类变量的独立性检验. 【高考模拟】 一、单选题 1.某种产品的广告费支出 与销售额 (单位:万元)之间的关系如下表: 2 4 5 6 8 30 40 60 50 70 若已知 与 的线性回归方程为 ,那么当广告费支出为 5 万元时,随机误差的 效应(残差)为( )万元(残差=真实值-预测值) A. 40 B. 30 C. 20 D. 10 【答案】D 【解析】 分析:把所给的广告费支出 5 万元时,代入线性回归方程,做出相应的销售额,这是一个预 测值,再求出与真实值之间有一个误差即得. 点睛:本题考查回归分析的初步应用,考查求线性回归方程,考查预测 y 的值,是一个综合 题目,是一个典型的题目. 2.已知变量 与 负相关,且由观测数据算得样本平均数 ,则由该观测的数据算 得的线性回归方程可能是 A. B. C. D. 【答案】C 【解析】 【分析】 根据 与 负相关可知 b 为负数,将样本平均数点带入选项检验,可求得回归直线方程。 【详解】 因为变量 与 负相关,所以 ,排除 A、B 选项; 因为 ,代入检验即可得到 C 是正确选项 所以选 C 【点睛】 本题考查了回归直线方程的简单应用,属于基础题。 3.经过对 K2 的统计量的研究,得到了若干个观测值,当 K2≈6.706 时,我们认为两分类变量 A、B( ) A. 有 67.06%的把握认为 A 与 B 有关系 B. 有 99%的把握认为 A 与 B 有关系 C. 有 0.010 的把握认为 A 与 B 有关系 D. 没有充分理由说明 A 与 B 有关系 【答案】B 【解析】 【分析】 根据所给的观测值,同临界值表中的临界值进行比较,根据 P(K2>3.841)=0.05,得到我 们有 1-0.05=95%的把握认为 A 与 B 有关系. 【详解】 依据下表: P( K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 【点睛】 本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不 用运算只要理解概率的意义即可. 4.有如下几个结论: ①相关指数 R2 越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程: ,一定过样本点的中心: ③残差点比较均匀地落在水平的 带 状 区 域 中 , 说 明 选 用 的 模 型 比 较 合 适 ; ④ 在 独 立 性 检 验 中 , 若 公 式 ,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能 性越强.其中正确结论的个数有( )个. A. 1 B. 2 C. 3 D. 4 【答案】D 【解析】 【分析】 根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据 残差点含义可得③为真,根据卡方含义可得④为真. 【详解】 【点睛】 相关指数 R2 越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟 合效果越好;在独立性检验中,若 回归直线方程: ,一定过点 . 5.对两个分类变量 A,B 的下列说法中正确的个数为( ) ①A 与 B 无关,即 A 与 B 互不影响; ②A 与 B 关系越密切,则 K2 的值就越大; ③K2 的大小是判定 A 与 B 是否相关的唯一依据 A. 0 B. 1 C. 2 D. 3 【答案】B 【解析】 【分析】 根据独立性检验的思想,对题目中的命题进行分析、判断正误即可. 【详解】 对于①,对事件 A 与 B 无关时,说明两事件的影响较小,不是两个互不影响,①错误; 对于②,事件 A 与 B 关系密切,说明事件 A 与 B 的相关性就越强,K2 就越大,②正确; 对于③,K2 的大小不是判定事件 A 与 B 是否相关的唯一根据,判定两事件是否相关除了公 式外; 还可以用三维柱形图和二维条形图等方法来判定,③错误; 故选:B. 【点睛】 本题考查了独立性检验思想的应用问题,属于基础题.K2 值是用来判断两个变量相关的把握 度的,不是用来判断两个变量是否相关的. 6.下列说法正确的是( ) ①线性回归方程适用于一切样本和总体; ②线性回归方程一般都有时间性; ③样本的取值范围会影响线性回归方程的适用范围; ④根据线性回归方程得到的预测值是预测变量的精确值. A. ①③④ B. ②③ C. ①② D. ③④ 【答案】B 【解析】 【分析】 根据线性回归方程研究的是具有相关关系的两个变量,可对前三者进行判断,再者因为线性 回归方程得到的预测值是预测变量的估计值,可判断最后一个也是不正确的. 【详解】 【点睛】 本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间, 这样的直线可以画出许多条,而其中的一条能最好地反映 x 与 Y 之间的关系,这条直线过样 本中心点.线性回归方程适用于具有相关关系的两个变量,对于具有确定关系的两个变量是 不适用的, 线性回归方程得到的预测值是预测变量的估计值,不是准确值. 7.经过对 K2 的统计量的研究,得到了若干个观测值,当 K2≈6.706 时,我们认为两分类变量 A、B( ) A. 有 67.06%的把握认为 A 与 B 有关系 B. 有 99%的把握认为 A 与 B 有关系 C. 有 0.010 的把握认为 A 与 B 有关系 D. 没有充分理由说明 A 与 B 有关系 【答案】B 【解析】 【分析】 根据所给的观测值,同临界值表中的临界值进行比较,根据 P(K2>3.841)=0.05,得到我 们有 1-0.05=95%的把握认为 A 与 B 有关系. 【详解】 依据下表: P( K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0. 001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 【点睛】 本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不 用运算只要理解概率的意义即可. 8.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表: 附表: 经计算 的观测值 ,则下列选项正确的是( ) A. 有 99.5%的把握认为使用智能手机对学习有影响 B. 有 99.5%的把握认为使用智能手机对学习无影响 C. 有 99.9%的把握认为使用智能手机对学习有影响 D. 有 99.9%的把握认为使用智能手机对学习无影响 【答案】A 【解析】 【分析】 由题意结合 的观测值 由独立性检验的数学思想给出正确的结论即可. 【详解】 由于 的观测值 ,其对应的值 , 据此结合独立性检验的思想可知:有 99.5%的把握认为使用智能手机对学习有影响. 本题选择 A 选项. 【点睛】 独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定 一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定 性结论,否则就可能对统计计算的结果作出错误的解释. 9.下列说法中正确的是 ( ) ①相关系数用来衡量两个变量之间线性关系的强弱, 越接近于 ,相关性越弱; ②回归直线 一定经过样本点的中心 ; ③随机误差 满足 ,其方差 的大小用来衡量预报的精确度; ④相关指数 用来刻画回归的效果, 越小,说明模型的拟合效果越好. A. ①② B. ③④ C. ①④ D. ②③ 【答案】D 【解析】 【分析】 运用相关系数、回归直线方程等知识对各个选项逐一进行分析即可 【详解】 ①相关系数用来衡量两个变量之间线性关系的强弱, 越接近于 ,相关性越强,故错误 ②回归直线 一定经过样本点的中心 ,故正确 ③随机误差 满足 ,其方差 的大小用来衡量预报的精确度,故正确 ④相关指数 用来刻画回归的效果, 越大,说明模型的拟合效果越好,故错误 综上,说法正确的是②③ 故选 【点睛】 本题主要考查的是命题真假的判断,运用相关知识来进行判断,属于基础题 10.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由 列联表算得 参照附表,得到的正确结论是( ). A. 在犯错误的概率不超过 0.01 的前提下认为“爱好该项运动与性别有关” B. 在犯错误的概率不超过 0.01 的前提下认为“爱好该项运动与性别无关” C. 在犯错误的概率不超过 0.001 的前提下,认为“爱好该项运动与性别有关” D. 在犯错误的概率不超过 0.001 的前提下,认为“爱好该项运动与性别无关” 【答案】A 【解析】 【分析】 由题意结合独立性检验的结论和临界值表给出结论即可. 【详解】 由独立性检验的结论,观测值 ,结合临界值表: , 据此可给出结论:在犯错误的概率不超过 0.01 的前提下认为“爱好该项运动与性别有关”. 本题选择 A 选项. 【点睛】 本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能 力. 二、填空题 11.春节期间,某销售公司每天销售某种取暖商品的销售额 (单位:万元)与当天的平均 气温 (单位: )有关.现收集了春节期间这个销售公司 4 天的 与 的数据列于下表: 平均气温( ) 销售额(万元) 20 23 27 30 根据以上数据,求得 与 之间的线性回归方程 的系数 ,则 ________. 【答案】 【解析】 【分析】 根据表中的数据,得到 的值,代入回归直线的方程,即可求解. 【详解】 【点睛】 本题主要考查了回归直线方程的应用问题,其中熟记回归直线方程的基本特征和准确计算样 本中心 是解答的关键,着重考查了推理与运算能力. 12.某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校 200 名高三学生的课 外体育锻炼平均每天运动的时间进行调查,如下表:(平均每天锻炼的时间单位:分钟) 将学生日均课外体育运动时间在 上的学生评价为“课外体育达标”. 平均每天锻炼的时间 (分钟) 总人数 20 36 44 50 40 10 (1)请根据上述表格中的统计数据填写下面 列联表,并通过计算判断是否能在犯错误 的概率不超过 的前提下认为“课外体育达标”与性别有关? 课外体育不达标 课外体育达标 合计 男 女 20 110 合计 (2)从上述 200 名学生中,按“课外体育达标”、“课外体育不达标”分层抽样,抽取 4 人得 到一个样本,再从这个样本中抽取 2 人,求恰好抽到一名“课外体育不达标”学生的概率. 参考公式: ,其中 . 参考数据: 0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1)见解析;(2) . 【解析】 【分析】 根据题意,由频率分布表可得 列联表,计算出 与临界值作比较即可得到结论 由题意,样本中“课外体育不达标”的学生有 人,记为: ,“课外体育达标”的 学生有 人,记为 ,列举从 名学生中任意选出 人以及恰好抽到一名“课外体育不达标”的学 生的情况,再由古典概型的计算公式计算即可求得答案 【详解】 (1)由题意可得如下列联表: 课外体育不达标 课外体育达标 合计 男 60 30 90 女 90 20 110 合计 150 50 200 由上表可得 . 所以在犯错误的概率不超过 0.01 的前提下不能判断“课外体育达标”与性别有关. 【点睛】 本题主要考查了独立性检验以及古典概型的计算公式,考查了学生分析问题解决问题的能 力,考查了对数学知识的实际应用,属于常考题型。 13.下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程 ,若变量 增加一个单位时,则 平均增加 5 个单位; ③线性回归方程 所在直线必过 ; ④曲线上的点与该点的坐标之间具有相关关系; ⑤在一个 列联表中,由计算得 ,则其两个变量之间有关系的可能性是 . 其中错误的是________. 【答案】②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确; 回归方程 若变量 增加一个单位时,则 平均减少 5 个单位; 曲线上的点与该点的坐标之间不一定具有相关关系; 在一个 列联表中,由计算得 ,只能确定两个变量之间有相关关系的可能性, 所以②④⑤均错误. 点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单 应用能力. 14.博鳌亚洲论坛 2018 年年会于 4 月 8 日至 11 日在海南博鳌举行.为了搞好对外宣传工作, 会务组选聘了 50 名记者担任对外翻译工作在右面“性别与会俄语”的 列联表中, __________. 会俄语 不会俄语 总计 男 20 女 6 总计 18 50 【答案】28 【解析】 【分析】 根据 2×2 列联表,分别计算出 a,b,d,再求 的值. 【详解】 由 2×2 列联表得 a+6=18,所以 a=12, 因为 a+b=20,所以 b=8, 因为 6+d=30,所以 d=24, 所以 a-b+d=12-8+24=28. 故答案为:28. 【点睛】 本题主要考查 2×2 列联表,意在考查学生对该知识的掌握水平和分析推理能力. 15.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如表 玩手机 不玩手机 合计 学习成绩优秀 4 8 12 学习成绩不优秀 16 2 18 合计 20 10 30 经计算 的值,则有__________ 的把握认为玩手机对学习有影响. 附: 0.15 0.10 0.05 0.025 0.010 0.005 0.001 2.072 2.706 3.841 5.024 6.635 7.879 10.828 , . 【答案】99.5 【解析】分析:由已知列联表计算出 后可得. 详解: , ∵ ,∴有 99.5%的把握认为玩手机对学习有影响. 点睛:本题考查独立性检验,解题关键是计算出 ,然后根据对照表比较即可. 16.随机询问中山市某中学的 名学生是否爱吃零食,得到如下的列联表: 男生 女生 总计 爱吃零食 不爱吃零食 总计 由 算得 . 据此我们有__________以上的把握认为“是否爱吃零食与性别有关”. 附表: 【答案】 【解析】分析:计算出 后,比较数据可得. 详解:∵ ,∴有 的把握认为“是否爱吃零食与性别有关”. 故答案为 95%. 点睛:本题考查独立性检验,此类问题关键是求出 ,然后只要与给出的数据比较就可得 出是否有关以及有多少把握. 17.某工厂为研究某种产品产量 (吨)与所需某种原材料 (吨)的相关性,在生产过程中 收集 4 组对应数据( )如下表所示:(残差=真实值-预测值) 3 4 5 6 2.5 3 4 根据表中数据,得出 关于 的线性回归方程为: .据此计算出在样本 处的残 差为-0.15,则表中 的值为__________. 【答案】 【解析】分析:据题意计算出在样本 处的残差为 可得 ,则在 处 由线性回归方程必过样本中心点 ,则 得 到关于 的方程,解出即可. 点睛:本题考查线性回归方程的应用,考查线性回归方程必过样本中心点 ,考查 计算能力,属于基础题. 18.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校 学生家长进行了问卷调查.根据从中随机抽取的 50 份调查问卷,得到了如下的列联表: 同意限定区域停车 不同意限定区域停车 合计 男 20 5 25 女 10 15 25 合计 30 20 50 则认为“是否同意限定区域停产与家长的性别有关”的把握约为__________. 附: ,其中 . 0.050 0.005 0.001 3.841 7.879 10.828 【答案】99.5%. 【解析】分析:利用公式求得 K2,与临界值比较,即可得到结论. 详解:因为 K2= ≈8.333 又 P(k2≥7.789)=0.005=0.5%. 故答案为:99.5%. 所以,我们有 99.5%的把握恩威是否同意限定区域停车与家长的性别有关. 点睛:本题考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属 于中档题. 19.①回归分析中,相关指数 的值越大,说明残差平方和越大; ②对于相关系数, 越接近 1,相关程度越大, 越接近 0,相关程度越小; ③有一组样本数据 得到的回归直线方程为 ,那么直线 必经过点 ; ④ 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合; 以上几种说法正确的序号是__________. 【答案】②③④. 【解析】分析:根据回归直线方程与独立性检验的实际意义作出判断. 详解:在回归分析中,相关指数越大,残差平方和越小,回归效果就越好,①错误; 在回归分析中,相关指数的绝对值越接近于 1,相关程度就越大,②正确 回归直线 必经过样本中心点 ,③正确; 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合,④正确. 故答案为:②③④. 点睛:本题考查线性回归方程的意义和独立性检验的应用,本题解题的关键是正确理解线性 回归方程与独立性检验的意义,属于基础题. 20.2018 年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考 察某种流感疫苗的效果,某实验室随机抽取 100 只健康小鼠进行试验,得到如下列联表: 感染 未感染 总计 注射 10 40 50 未注射 20 30 50 总计 30 70 100 参照附表,在犯错误的概率最多不超过__________的前提下,可认为“注射疫苗”与“感染流 感”有关系. (参考公式: .) 0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 【答案】0.05 【解析】分析:直接利用独立性检验 公式计算即得解. 详解:由题得 , 所以犯错误的概率最多不超过 0.05 的前提下,可认为“注射疫苗”与“感染流感”有关系. 故答案为:0.05. 点睛:本题主要考查独立性检验和 的计算,意在考查学生对这些知识的掌握水平和解决 实际问题的能力. 三、解答题 21.一则“清华大学要求从 2017 级学生开始,游泳达到一定标准才能毕业”的消息在体育界 和教育界引起了巨大反响.其实,已有不少高校将游泳列为必修内容. 某中学拟在高一-下学期开设游泳选修课,为了了解高--学生喜欢游泳是否与性别有关,该学 校对 100 名高一新生进行了问卷调查,得到如下 列联表: 喜欢游泳 不喜欢游泳 合计 男生 40 女生 30 合计 已知在这 100 人中随机抽取 1 人,抽到喜欢游泳的学生的概率为 . (1).请将上述列联表 补充完整,并判断是否可以在犯错误的概率不超过 0.001 的前提下 认为喜欢游泳与性别有关. (2)已知在被调查的学生中有 6 名来自高一(1) 班,其中 4 名喜欢游泳,现从这 6 名学生中随 机抽取 2 人,求恰有 1 人喜欢游泳的概率. 附: 0.10 0.050 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1)可以(2) 【解析】 分析:(1)根据题意计算喜欢游泳的学生人数,求出女生、男生多少人,完善列联表,再计 算观测值 ,对照临界值表即可得出结论; (2)设“恰有一人喜欢游泳”为事件 A,设 4 名喜欢游泳的学生为 ,不喜欢游泳的 学生为 ,通过列举法即可得到答案. 详解:(1)解:根据条件可知喜欢游泳的人数为 人 完成 列联表: 喜欢游泳 不喜欢游泳 合计 男生 40 10 50 女生 20 30 50 合计 60 40 100 根据表中数据,计算 可以在犯错误的概率不超过 0.001 的前提下认为喜欢游泳与性别有关. (2)解:设“恰有一人喜欢游泳”为事件 A,设 4 名喜欢游泳的学生为 , 不喜欢游泳的学生为 ,基本事件总数有 15 种: 其中恰有一人喜欢游泳的基本事件有 8 种: 所以 点睛:本题考查了独立性检验与运算求解能力,同时考查通过列举法求概率的应用,属于中 档题. 22.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种 支付方式的人数作了对比.从全国随机抽取了 100 个地区作为研究样本,计算了各个地区样 本的使用人数,其频率分布直方图如图. (1)记 A 表示事件“微信支付人数低于 50 千人”,估计 A 的概率; (2)填写下面列联表,并根据列联表判断是否有 99%的把握认为支付人数与支付方式有关; 支付人数<50 千人 支付人数≥50 千人 总计 微信支付 支付宝支付 总计 (3)根据支付人数的频率分布直方图,对两种支付方式的优劣进行比较. 附: P(K2≥K) 0.050 0.010 0. 001 K 3.841 6.635 10.828 K2= 【答案】(1)0.62(2)有 99%的把握认为支付人数与支付方式有关;(3)支付宝支付更加 优于微信支付 【解析】 【分析】 :(1)由微信支付人数的频率分布直方图可知,微信支付人数低于 50 千人的概率为 。 (2)补全列联表,由卡方公式判断独立性。 (3)根据平均数和方差比较两种支付方式的优劣。 【详解】 (1)根据题意,由微信支付人数的频率分布直方图可得: . (2)根据题意,补全列联表可得: 支付人数 千人 支付人数 千人 总计 微信支付 62 38 100 支付宝支付 34 66 100 总计 96 104 200 则有 , 故有 99%的把握认为支付人数与支付方式有关. 【点睛】 :本题考查了频率分布直方图,频率为小长方形的面积,求某范围内的概率,那么概率为范 围内的小长方形的面积之和。平均数和方差是比较数据优劣的两个重要数据,当平均数一致 时,我们比较方差的大小。 23.某市为迎接“国家义务教育均衡发展综合评估”,市教育行政部门在全市范围内随机抽取 了 所学校,并组织专家对两个必检指标进行考核评分. 其中 、 分别表示“学校的基础设施 建设”和“学校的师资力量”两项指标,根据评分将每项指标划分为 A(优秀)、B(良好)、C(及格) 三个等级,调查结果如右表所示. 例如:表中“学校的基础设施建设”指标为 B 等级的共有 20+21+2=43 所学校. 已知两项指标均为 B 等级的概率为 0.21. (1)在该样本中,若“学校的基础设施建设”优秀率是 0.4,请填写下面 2×2 列联表,并根据 列联表判断是否有 90﹪的把 握认为“学校的基础设施建设”和“学校的师资力量”有关; 师资力量(优秀) 师资力量(非优秀) 基础设施建设(优秀) 基础设施建设(非优秀) (2)在该样本的“学校的师资力量”为 C 等级的学校中,若 , ,记随机变量 ,求的分布列和数学期望. 【答案】(1)见解析;(2)见解析. 【解析】 【分析】 (1)依题意求得 n、a 和 b 的值,填写列联表,计算 K2,对照临界值得出结论; (2)由题意得到满足条件的(a,b),再计算ξ的分布列和数学期望值. 【详解】 (Ⅰ)依题意得 ,得 由 ,得 由 得 师资力量(优秀) 师资力量(非优秀) 基础设施建设(优秀) 20 21 基础设施建设(非优秀) 20 39 . 因为 , 所以没有 90﹪的把握认为“学校的基础设施建设”和“学校的师资力量”有关. (Ⅱ) , ,得到满足条件的 有: , , , , 故的分布列为 1 3 5 7 故 【点睛】 本题主要考查了独立性检验和离散型随机变量的分布列与数学期望问题,属于中档题. 24.2018 年 6 月 19 日凌晨某公司公布的年中促销全天交易数据显示,天猫年中促销当天全 天下单金额为 1592 亿元.为了了解网购者一次性购物情况,某统计部门随机抽查了 6 月 18 日 100 名网购者的网购情况,得到如下数据统计表,已知网购金额在 2000 元以上(不含 2000 元)的频率为 0.4. 网购金额(元) 频数 频率 5 0.05 15 0.15 25 0.25 30 0.3 合计 100 1 (Ⅰ)先求出 的值,再将图中所示的频率分布直方图绘制完整; (Ⅱ)对这 100 名网购者进一步调查显示:购物金额在 2000 元以上的购物者中网龄 3 年以上 的有 35 人,购物金额在 2000 元以下(含 2000 元)的购物者中网龄不足 3 年的有 20 人,请填 写下面的列联表,并据此判断能否在犯错误的概率不超过 0.025 的前提下认为网购金额超过 2000 元与网龄在 3 年以上有关? 网龄 3 年以上 网龄不足 3 年 总计 购物金额在 2000 元以上 35 购物金额在 2000 元以下 20 总计 100 参考数据: 0.15 0.10 0.05 0.025 0.010 0.005 0.001 2.072 2.076 3.841 5.024 6.635 7.879 10.828 参考公式: 其中 . (Ⅲ)从这 100 名网购者中根据购物金额分层抽出 20 人给予返券奖励,为进一步激发购物 热情,在 和 两组所抽中的 8 人中再随机抽取 2 人各奖励 1000 元现金, 求 组获得现金奖的数学期望. 【答案】(Ⅰ)见解析; (Ⅱ)在犯错误的概率不超过 0.025 的前提下认为网购金额超过 2000 元与 网龄在 3 年以上有关.(Ⅲ)1500. 【解析】 【分析】 (Ⅰ)由题意可知 2000 元以上(不含 2000 元)的频率为 0.4,所以网购金额在(2500,3000] 的频率为 0.4−0.3=0.1,由此再结合频率分布直方图与频率分布表可分别求得 的值。再 由数据补全频率分布直方图。(Ⅱ)先补全 2×2 列联表,由表中数据求得 K2 。(Ⅲ) 在(2000,2500]组获奖人数 X 为 0,1,2,求得概率及期望。 【详解】 (Ⅱ)相应的 2×2 列联表为: 由公式 K2= , 因为 5.56>5.024, 所以据此列联表判断,在犯错误的概率不超过 0.025 的前提下认为网购金额超过 2000 元与 网龄在 3 年以上有关. (Ⅲ)在(2000,2500]和(2500,3000]两组所抽出的 8 人中再抽取 2 人各奖励 1000 元现金, 则(2000,2500]组获奖人数 X 为 0,1,2, 且 , 故(2000,2500]组获得现金奖的数学期望 +1000 +2000 =1500. 【点睛】 本题综合考查频数分布表、频率分布直方图、补全 2×2 列联表、卡方计算及应用、随机变量 分布列及期望,需要对概念公式熟练运用,同时考查学生的运算能力。 25.为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对 30 名六年级学生进行了问卷调查 得到如下列联表:平均每天喝 500ml 以上为常喝,体重超过 50kg 为肥胖。 常喝 不常喝 合计 肥胖 6 2 8 不肥胖 4 18 22 合计 10 20 30 已知在全部 30 人中随机抽取 1 人,抽到肥胖的学生的概率为 。 (1)是否有 的把握认为肥胖与常喝碳酸饮料有关?说明你的理由 (2)现从常喝碳酸饮料且肥胖的学生中(2 名女生),抽取 2 人参加电视节目,则正好抽到 一男一女的概率是多少? 参考数据: (参考公式: ,其中 ) 【答案】(1)见解析;(2) 【解析】 【分析】 (1)由已知数据可求得 K2≈8.522>7.879,从而有 99.5%的把握认为肥胖与常喝碳酸饮料有 关; (2)设常喝碳酸饮料的肥胖者男生为 A、B、C、D,女生为 E,F,任取两人,利用列举法 能求出抽到一男一女的概率. 【详解】 【点睛】 本题考查概率的求法,考查古典概型概率计算公式、列举法等基础知识,考查运算求解能力, 考查函数与方程思想,是基础题. 26.随着电子商务的发展, 人们的购物习惯正在改变, 基本上所有的需求都可以通过网络购 物解决. 小韩是位网购达人, 每次购买商品成功后都会对电商的商品和服务进行评价. 现对 其近年的 200 次成功交易进行评价统计, 统计结果如下表所示. 对服务好评 对服务不满意 合计 对商品好评 80 40 120 对商品不满意 70 10 80 合计 150 50 200 (1) 是否有 的把握认为商品好评与服务好评有关? 请说明理由; (2) 若针对商品的好评率, 采用分层抽样的方式从这 200 次交易中取出 5 次交易, 并从中选 择两次交易进行观察, 求只有一次好评的概率. ( ,其中 ) 【答案】(1)有;(2) . 【解析】 【分析】 根据列联表计算 ,对照观测值表即可得到结论 利用分层抽样法抽取 次交易,计算好评的交易次数和不满意次数,用列举法计算对应的 概率值即可 【详解】 (1)由上表可得 , 所以有 的把握认为商品好评与服务好评有关. (2) 由表格可知对商品的好评率为 ,若针对商品的好评率, 采用分层抽样的方式从这 200 次 交易中取出 5 次交易, 则好评的交易次数为 3 次, 不满意的次数为 2 次, 令好评的交易为 , 不 满 意 的 交 易 , 从 5 次 交 易 中 , 取 出 2 次 的 所 有 取 法 为 , , , , 共计 10 种情况, 其中只有一次 好评的情况是 , , , , , , 共计 6 种情况. 因此, 只有一次好评的概率 为 . 【点睛】 本题主要考查了古典概型概率计算公式,利用列举法计算基本事件数及事件发生的概率,属 于基础题。 27.为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式, 在甲、乙两个平行班级进行教学实验,为了比较教学效果,期中考试后,分别从两个班级中 各随机抽取 20 名学生的成绩进行统计,结果如下表:记成绩不低于 70 分者为“成绩优良”. 分数 [50,59) [60,69) [70,79) [80,89) [90,100] 甲班频数 5 6 4 4 1 乙班频数 1 3 6 5 5 (1)由以上统计数据填写下面 2×2 列联表,并判断“成绩优良与教学方式是否有关”? 甲班 乙班 总计 成绩优良 成绩不优良 总计 现从上述 40 人中,学校按成绩是否优良采用分层抽样的方法抽取 8 人进行考核.在这 8 人 中,记成绩不优良的乙班人数为 ,求 的分布列及数学期望. 附: . 临界值表 【答案】(1)在犯错概率不超过 0.05 的前提下认为“成绩优良与教学方式有关”.(2)见解析 【解析】 【分析】 (1)根据数据对应填写,再根据卡方公式求 ,最后对照参考数据作判断,(2)先根据分层 抽样得成绩不优良的人数,再确定随机变量取法,利用组合数求对应概率,列表得分布列, 最后根据数学期望公式求期望. 【详解】 解:(1) 根据 2×2 列联表中的数据,得 的观测值为 , 在犯错概率不超过 0.05 的前提下认为“成绩优良与教学方式有关”. (2)由表可知在 8 人中成绩不优良的人数为 ,则 的可能取值为 0,1,2,3. ; ; ; . 的分布列为: 所以 . 【点睛】 求解离散型随机变量的数学期望的一般步骤为: 第一步是“判断取值”,即判断随机变量的所有可能取值,以及取每个值所表示的意义; 第二步是“探求概率”,即利用排列组合,枚举法,概率公式,求出随机变量取每个值时的概 率; 第三步是“写分布列”,即按规范形式写出分布列,并注意用分布列的性质检验所求的分布列 或某事件的概率是否正确; 第四步是“求期望值”,一般利用离散型随机变量的数学期望的定义求期望的值. 点睛:求解离散型随机变量的数学期望的一般步骤为: 第一步是“判断取值”,即判断随机变量的所有可能取值,以及取每个值所表示的意义; 第二步是“探求概率”,即利用排列组合、枚举法、概率公式(常见的有古典概型公式、几何 概型公式、互斥事件的概率和公式、独立事件的概率积公式,以及对立事件的概率公式等), 求出随机变量取每个值时的概率; 第三步是“写分布列”,即按规范形式写出分布列,并注意用分布列的性质检验所求的分布列 或某事件的概率是否正确; 第四步是“求期望值”,一般利用离散型随机变量的数学期望的定义求期望的值,对于有些实 际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布 ),则 此随机变量的期望可直接利用这种典型分布的期望公式( )求得.因此,应熟记常见 的典型分布的期望公式,可加快解题速度. 28.学校对甲、乙两个班级的同学进行了体能测验,成绩统计如下(每班 50 人): (1)成绩不低于 80 分记为“优秀”.请填写下面的 列联表,并判断是否有 的把握认 为“成绩优秀”与所在教学班级有关? (2)从两个班级的成绩在 的所有学生中任选 2 人,其中,甲班被选出的学生数记为 , 求 的分布列与数学期望. 赋: . 【答案】(1)列联表见解析,有 的把握认为:“成绩优秀”与所在教学班级有关. (2) 的分布列见解析, . 【解析】 【分析】 (1)根据数据对应填写表格,根据公式求卡方,对照参考数据确定把握率,(2)先确定随 机变量取法,再根据组合数求对应概率,列表可得分布列,最后根据数学期望公式求期望. 【详解】 (1) 列联表如下: 所以有 的把握认为:“成绩优秀”与所在教学班级有关. 的数学期望: . 【点睛】 求解离散型随机变量的数学期望的一般步骤为: 第一步是“判断取值”,即判断随机变量的所有可能取值,以及取每个值所表示的意义; 第二步是“探求概率”,即利用排列组合、枚举法、概率公式(常见的有古典概型公式、几何 概型公式、互斥事件的概率和公式、独立事件的概率积公式,以及对立事件的概率公式等), 求出随机变量取每个值时的概率; 第三步是“写分布列”,即按规范形式写出分布列,并注意用分布列的性质检验所求的分布列 或某事件的概率是否正确; 第四步是“求期望值”,一般利用离散型随机变量的数学期望的定义求期望的值,对于有些实 际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布 ),则 此随机变量的期望可直接利用这种典型分布的期望公式( )求得.因此,应熟记常见 的典型分布的期望公式,可加快解题速度. 29.某学校高三年级有学生 1000 名,经调查,其中 750 名同学经常参加体育锻炼(称为 A 类同学),另外 250 名同学不经常参加体育锻炼(称为 B 类同学),现用分层抽样方法(按 A 类、B 类分两层)从该年级的学生中抽查 100 名同学.如果以身高达到 165 厘米作为达标的 标准,对抽取的 100 名学生进行统计,得到以下列联表: 身高达标 身高不达标 总计 积极参加体育锻炼 40 不积极参加体育锻炼 15 总计 100 (1)完成上表; (2)能否有犯错率不超过 0.05 的前提下认为体育锻炼与身高达标有关系?( 的观测值精 确到 0.001). 参考公式: , 参考数据: P(K2≥k) 0.25 0.15 0.10 0.05 0.025 0.010 0.001 k 1.323 2.072 2.706 3.841 5.024 6.635 10.828 【答案】(1) 身高达标 身高不达标 总计 积极参加体育锻炼 40 35 75 不积极参加体育锻炼 10 15 25 总计 50 50 100 (2) 不能在犯错误的概率不超过 0.05 的前提下认为体育锻炼与身高达标有关系. 【解析】 【分析】 (1)由分层抽样的计算方法可求得积极参加锻炼与不积极参加锻炼的人数,填入表格中, 根据表格中的总计及各项值求出其它值即可; (2)由公式计算出 ,与参考数据表格中 3.841 作比较,若小于 3.841 则不可以,若大于 3.841 则可以. 【详解】 (Ⅰ)填写列联表如下: 身高达标 身高不达标 总计 积极参加体育锻炼 40 35 75 不积极参加体育锻炼 10 15 25 总计 50 50 100 (Ⅱ)K2 的观测值为 ≈1.333<3.841. 所以不能在犯错误的概率不超过 0.05 的前提下认为体育锻炼与身高达标有关系. 【点睛】 本题考查独立性检验,根据抽样方法进行计算填表,将数值代入公式求出 ,注意保留三 位小数,注意观测值与概率之间的大小关系与趋势. 30.第 16 届亚运会于 2010 年 11 月 12 日至 27 日在中国广州进行,为了做好接待工作, 组委会招募了 16 名男志愿者和 14 名女志愿者,调查发现,男、女志愿者中分别有 10 人和 6 人喜爱运动,其余不喜爱. (1)根据以上数据完成 2×2 列联表: 喜爱运动 不喜爱运动 总计 男 10 16 女 6 14 总计 30 (2)能否在犯错误的概率不超过 0.10 的前提下认为性别与喜爱运动有关? (3)如果从喜欢运动的女志愿者中(其中恰有 4 人会外语),抽取 2 名负责翻译工作,则抽 出的志愿者中 2 人都能胜任翻译工作的概率是多少? 附: P(K2≥k) 0.100 0.050 0.025 0.010 0.001 k 2.706 3.841 5.024 6.635 10.828 【答案】(1)见解析;(2)见解析;(3)0.4 【解析】 【分析】 根据题目条件补充 列联表中的数据 利用 列联表中的数据,计算出 的值,与临界值作比较即可得到结论 列出所有的基本事件,由古典概型的计算公式计算即可求得答案. 【详解】 (1)2×2 列联表如下: 喜爱运动 不喜爱运动 总计 男 10 6 16 女 6 8 14 总计 16 14 30 (2)假设:是否喜爱运动与性别无关,由已知数据可求得: k= ≈1.1575<2.706; 因此,在犯错的概率不超过 0.10 的前提下不能判断喜爱运动与性别有关. 【点睛】 本题主要考查了独立性检验以及古典概型的计算公式,考查了学生分析问题解决问题的能 力,考查了对数学知识的实际应用,属于常考题型。 31.在某测试中,卷面满分为 100 分,60 分为及格,为了调查午休对本次测试前两个月复 习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下 表所示: 分数段 29~ 41~ 51~ 61~ 71~ 81~ 91~ 40 50 60 70 80 90 100 午休考 生人数 23 47 30 21 14 31 14 不午休 考生人数 17 51 67 15 30 17 3 (1)根据上述表格完成列联表: 及格人数 不及格人数 总计 午休 不午休 总计 (2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义? 【答案】(1)见解析;(2)见解析 【解析】 【分析】 (1)仔细研读题干条件,可得到表中数据;(2)分别求出午睡和不午睡的学生的成绩的及格 率,进而得到结论. 【详解】 (1)根据题表中数据可以得到列联表如下: 及格人数 不及格人数 总计 午休 80 100 180 不午休 65 135 200 总计 145 235 380 (2)计算可知,午休的考生及格率为 P1= ,不午休的考生的及格率为 P2= ,则 P1>P2,因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以 后的复习中考生应尽量适当午休,以保持最佳的学习状态. 【点睛】 这个题目考查了列联表的填写,读懂题意,根据列联表的表头即可填入相应的数据;也考查 了学生对实际问题的解决能力,较为灵活的第二问,没有唯一的答案,只要能够说明理由并 且正确即可. 32.中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接 受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备,某高中每年 招收学生 1000 人,开设大学先修课程已有两年,共有 300 人参与学习先修课程,两年全校共有 优等生 200 人,学习先修课程的优等生有 50 人,这两年学习先修课程的学生都参加了考试, 并且都参加了某高校的自主招生考试(满分 100 分),结果如下表所示: (1)填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有 关系,根据列联表的独立性体验,能否在犯错误的概率不超过 0.01 的前提下认为学习先修 课程与优等生有关系? (2)已知今年有 150 名学生报名学习大学先修课程,以前两年参加大学先修课程学习成绩的 频率作为今年参加大学先修课程学习成绩的概率. ①在今年参与大学先修课程的学生中任取一人,求他获得某高校自主招生通过的概率; ②某班有 4 名学生参加了大学先修课程的学习,设获得某高校自主招生通过的人数为,求的分 布列,并求今年全校参加大学先修课程的学生获得大学自主招生通过的人数. 参考数据: 参考公式: ,期中 , 【答案】(1) 在犯错误的概率不超过 的前提下认为学习先修课程与优等生有关系 (2) ① ,②见解析 【解析】 【分析】 (1)由题意可得列联表和等高条形图,并可作出判断,然后求出 后与临界值表对照可得 结论.(2)①根据题中的统计数据可得所求概率为 ;②设获得某高校自主招生通过的 人数为,则 ,由此可得的分布列.结合 可得通过的人数为 人. 【详解】 (1)列联表如下: 等高条形图如下图, 通过图形可判断学习先修课程与优等生有关系. 又由列联表可得 , 因此在犯错误的概率不超过 的前提下认为学习先修课程与优等生有关系. 今年全校参加大学生先修课程的学生获得大学自主招生通过的人数为 . 【点睛】 (1)独立性检验的一般步骤:①根据样本数据制成 2×2 列联表;②根据公式计算 的值;③ 比较 与临界值的大小关系作出统计推断. (2) 的值可以确定在多大程度上认为“两个分类变量有关系”; 的值越大,认为“两个分类 变量有关系”的把握越大. 33.北京时间 3 月 15 日下午,谷歌围棋人工智能 与韩国棋手李世石进行最后一轮 较量, 获得本场比赛胜利,最终人机大战总比分定格 1:4.人机大战也引发全民对围 棋的关注,某学校社团为调查学生学习围棋的情况,随机抽取了 100 名学生进行调查.根据 调查结果绘制的学生日均学习围棋时间的频率分布直方图(如图所示),将日均学习围棋时 间不低于 40 分钟的学生称为“围棋迷”. (Ⅰ)根据已知条件完成列联表,并据此资料你是否有 的把握认为“围棋迷”与性别有关? 非围棋迷 围棋迷 合计 男 女 10 55 合计 (Ⅱ)将上述调查所得到的频率视为概率,现在从该地区大量学生中,采用随机抽样方法每 次抽取 1 名学生,抽取 3 次,记被抽取的 3 名淡定生中的“围棋迷”人数为 X。若每次抽取的 结果是相互独立的,求 X 的分布列,期望 E(X) 和方差 D(X) . 【答案】(1)见解析;(2)见解析. 【解析】 【分析】 (Ⅰ)由频率分布直方图可知,在抽取的 人中,“围棋迷”的人数,得到 的列联表, 根据公式求得 的值,即可作出判断. (Ⅱ)由频率分布直方图,得抽到“围棋迷”的频率,得到从观众中抽取一名“围棋迷”的概率, 再由 ,得到随机变量 的分布列,利用期望的公式求得数学期望. 【详解】 (Ⅰ)由频率分布直方图可知,在抽取的 100 人中,“围棋迷”有 25 人,从而 列联表 如下 非围棋迷 围棋迷 合计 男 30 15 45 女 45 10 55 合计 75 25 100 将 列联表中的数据代入公式计算,得 因为 ,所以没有理由认为“围棋迷”与性别有关. (Ⅱ)由频率分布直方图知抽到“围棋迷”的频率为 0.25,将频率视为概率,即从观众中抽取 一名“围棋迷”的概率为 .由题意 ,从而 的分布列为 0 1 2 3 . . 【点睛】 本题主要考查独立性检验的应用和二项分布概率计算公式、随机变量的分布列和数学期望, 其中任何审题,准去判断,得到 的二项分布,利用二项分布的概率公式,求得概 率,得到分布列和求得数学期望是解答关键,能很好的考查考生数学应用意识、基本运算求 解能力等. 34.第 31 届夏季奥林匹克运动会于 2016 年 8 月 5 日至 8 月 21 日在巴西里约热内卢举行.如 表是近五届奥运会中国代表团和俄罗斯代表团获得的金牌数的统计数据(单位:枚). 第 30 届伦敦 第 29 届北京 第 28 届雅典 第 27 届悉尼 第 26 届亚特兰大 中国 38 51 32 28 16 俄罗斯 24 23 27 32 26 (1)根据表格中两组数据在答题卡上完成近五届奥运会两国代表团获得的金牌数的茎叶图, 并通过茎叶图比较两国代表团获得的金牌数的平均值及分散程度(不要求计算出具体数值, 给出结论即可); (2)如表是近五届奥运会中国代表团获得的金牌数之和 (从第 26 届算起,不包括之前已 获得的金牌数)随时间 变化的数据: 时间 (届) 26 27 28 29 30 金牌数之和 (枚) 16 44 76 127 165 作出散点图如图: 由图可以看出,金牌数之和 与时间 之间存在线性相关关系,请求出 关于 的线性回归方程, 并预测到第 32 届奥运会时中国代表团获得的金牌数之和为多少? 【答案】(1)见解析;(2)238. 【解析】 【分析】 (1)根据表中的数据,得到近五届奥运会两国代表团获得的金牌数的茎叶图,由图可得中 国代表团获得的金牌数的平均数大于俄罗斯代表团的金牌平均数;俄罗斯代表团获得的金牌 数较集中,中国代表团获得的金牌数较分散,即可得到结论. (2)根据数据和回归系数的公式,求得 ,进而得到回归直线的方程,即可作出预测. 【详解】 (1)近五届奥运会两国代表团获得的金牌数的茎叶图如图: 由图可得中国代表团获得的金牌数的平均数大于俄罗斯代表团的金牌平均数;俄罗斯代表团 获得的金牌数较集中,中国代表团获得的金牌数较分散. (2)因为 , , , , 所以 , , 所以金牌数之和 关于时间 的线性回归方程为 , 当 时,中国代表团获得的金牌数之和的预报值 , 故预测到第 32 届奥运会时中国代表团获得的金牌数之和为 238 枚. 【点睛】 本题主要考查了茎叶图的应用,以及回归直线方程的求解及应用,其中熟记茎叶图的认识和 准确计算回归方程是解答的关键,着重考查了分析问题和解答问题的能力,以及推理与运算 能力,属于基础题. 35.为调查某地区老年人是否需要志愿者提供帮助,从该地区调查了 500 位老人,结果如下: 性别 是否需要志愿者 男 女 需要 40 30 不需要 160 270 (1)估计该地区老年人中,需要志愿提供帮助的老年人的比例; (2)能否有 99℅的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?提供帮 助的老年人的比例?说明理由. 0.050 0.010 0.001 3.841 6.635 10.828 附: 【答案】(1) ;(2)见解析. 【解析】 【分析】 (1)利用古典概型概率公式估计该地区老年人中,需要志愿提供帮助的老年人的比例.(2)先求 出 ,再利用临界值表判断有 99%的把握认为该地区的老年人是否需要帮助与性别 有关. 【详解】 【点睛】 (1)本题主要考查古典概型的概率的计算和独立性检验,意在考查学生对这些知识的掌握 水平和分析推理能力.(2) 古典概型的解题步骤:①求出试验的总的基本事件数 ;②求出事 件 A 所包含的基本事件数 ;③代公式 = . 36.某校高三课外兴趣小组为了解高三同学高考结束后是否打算观看 2018 年足球世界杯比 赛的情况,从全校高三年级 1500 名男生、1000 名女生中按分层抽样的方式抽取 125 名学生 进行问卷调查,情况如下表: 打算观看 不打算观看 女生 20 b 男生 c 25 (1)求出表中数据 b,c; (2)判断是否有 99%的把握认为观看 2018 年足球世界杯比赛与性别有关; (3)为了计算“从 10 人中选出 9 人参加比赛”的情况有多少种,我们可以发现它与“从 10 人 中选出 1 人不参加比赛”的情况有多少种是一致的.现有问题:在打算观看 2018 年足球世界 杯比赛的同学中有 5 名男生、2 名女生来自高三(5)班,从中推选 5 人接受校园电视台采 访,请根据上述方法,求被推选出的 5 人中恰有四名男生、一名女生的概率. 【答案】(1) b=30, c=50;(2) . 【解析】 【分析】 (1)根据分层抽样方法,分别求得女生和男生的人数,进而即可求解表中的数据 的值; (2)由(1)利用独立性检验的公式,求得 的值,比较即可作出判断的结果; (3)设 名男生分别为 , 名女生分别为 ,由题意列举出从 人中选出 人接受电 视台采访的基本事件的总数,找出其中恰为一男一女所包括基本时间的个数,利用古典概型 及概率的计算公式,即可求解. 【详解】 (1)根据分层抽样方法抽得女生 50 人,男生 75 人,所以 b=50-20=30(人), c=75-25=50(人) (2)因为 ,所以有 99%的把握认 为观看 2018 年足球世界杯比赛与性别有关. (说明:数值代入公式 1 分,计算结果 3 分,判断 1 分) 【点睛】 本题主要考查了独立性检验和概率的综合应用,其中解答中涉及到分层抽样的方法、及独立 性检验,以及古典概型及其概率的计算,熟记基本公式和基本的运算方法,准确运算是解答 的关键,着重考查了推理与运算能力. 37.有甲乙两个班级进行数学考试,按照大于等于 85 分为优秀,85 分以下为非优秀统计成 绩后,得到如下的列联表. 优秀 非优秀 总计 甲班 10 乙班 30 总计 105 已知在全部 105 人中随机抽取 1 人为优秀的概率为 . (1)请完成上面的列联表;(把列联表自己画到答题卡上) (2)根据列联表的数据,若按 95%的可靠性要求,能否认为“成绩与班级有关系”? 参考公式: P(K2≥k0) 0.10 0.05 0.025 0.010 k0 2.706 3.841 5.024 6.635 【答案】(1)答案见解析;(2)答案见解析. 【解析】 【分析】 由全部 人中随机抽取 人为优秀的概率为 ,可以计算出优秀人数,从而得到表中各项 数据的值 根据列联表中的数据,代入 公式,计算出 的值,与临界值比较即可得到结论 【详解】 (1) 优秀 非优秀 总计 甲班 10 45 55 乙班 20 30 50 总计 30 75 105 (2)根据列联表中的数据,得到 K2= , 因此有 95%的把握认为“成绩与班级有关系”. 【点睛】 本题主要考查了独立性检验的应用,注意独立性检验的一般步骤: 根据样本数据制成 列联表, 根据公式计算出 的值,属于中档题。 38.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产 方式为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人第一组 工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间单 位: 绘制了如下茎叶图: 根据茎叶图判断哪种生产方式的效率更高?并说明理由; 求 40 名工人完成生产任务 所需时间的中位数 m,并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的 列联表: 超过 m 不超过 m 第一种生产方式 第二种生产方式 根据 中的列联表,能否有 的把握认为两种生产方式的效率有差异? 附: , k 【答案】(1)见解析;(2)见解析;(3)能有 的把握认为两种生产方式的效率有差异. 【解析】 【分析】 根据茎叶图中的数据判断第二种生产方式的工作时间较少些,效率更高; 根据茎叶图中的数据计算它们的中位数,再填写列联表; 列联表中的数据计算观测值,对照临界值得出结论. 【详解】 根据茎叶图中的数据知, 第一种生产方式的工作时间主要集中在 之间, 第二种生产方式的工作时间主要集中在 之间, 所以第二种生产方式的工作时间较少些,效率更高; 这 40 名工人完成生产任务所需时间按从小到大的顺序排列后, 排在中间的两个数据是 79 和 81,计算它们的中位数为 ; 由此填写列联表如下; 超过 m 不超过 m 总计 第一种生产方式 15 5 20 第二种生产方式 5 15 20 总计 20 20 40 根据 中的列联表,计算 , 能有 的把握认为两种生产方式的效率有差异. 【点睛】 本题主要考查了用样本估计总体,独立性检验的应用,其中对于用样本估计总体主要注意以 下两个方面: 1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则 是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方 图比较直观; 2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于 1;在频率分布直方图 中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于 1. 39.近年来随着我国在教育科研上的投入不断加大,科学技术得到迅猛发展,国内企业的国际 竞争力得到大幅提升.伴随着国内市场增速放缓,国内有实力企业纷纷进行海外布局,第二轮 企业出海潮到来.如在智能手机行业,国产品牌已在赶超国外巨头,某品牌手机公司一直默默 拓展海外市场,在海外共设 多个分支机构,需要国内公司外派大量 后、 后中青年员工. 该企业为了解这两个年龄层员工是否愿意被外派工作的态度,按分层抽样的方式从 后和 后的员工中随机调查了 位,得到数据如下表: (1)根据调查的数据,是否有 以上的把握认为“是否愿意被外派与年龄有关”,并说明理由; (2)该公司举行参观驻海外分支机构的交流体验活动,拟安排 名参与调查的 后、 后员工参 加. 后员工中有愿意被外派的 人和不愿意被外派的 人报名参加,从中随机选出 人,记选到 愿意被外派的人数为 ; 后员工中有愿意被外派的 人和不愿意被外派的 人报名参加,从中 随机选出 人,记选到愿意被外派的人数为 ,求 的概率. 参考数据: (参考公式:,其中 ). 【答案】(1) 有 90% 以上的把握认为“是否愿意外派与年龄有关”(2) 【解析】 【分析】 (1)先计算 的值,再判断是否有 90% 以上的把握认为“是否愿意外派与年龄有关”. (2)先计算出“ ”、“ ”、“ ”、“ ”、 “ ”、 “ ”六个互斥事件的概率,再把它们相加即得 的概率. 【详解】 (1) , 所以有 90% 以上的把握认为“是否愿意外派与年龄有关”. (2)“ ”包含:“ ”、“ ”、“ ”、“ ”、 “ ”、 “ ”六个互斥事件. 且 , , , 所以, . 【点睛】 (1)本题主要考查独立性检验,考查互斥事件的概率,意在考查学生对这些知识的掌握水 平和分析推理计算能力.(2) 如果事件 互斥,那么 .如果事件 中 的 任 何 两 个 都 是 互 斥 的 , 那 么 就 说 事 件 彼 此 互 斥 . 则 = . 40.近年空气质量逐步恶化,雾霾天气现象增多,大气污染危害加重.大气污染可引起心悸、 呼吸困难等心肺疾病.为了解某市心肺疾病是否与性别有关,在某医院随机对入院的 50 人 进行问卷调查,得到了如下的列联表: 患心肺疾病 不患心肺疾病 合计 男 20 5 25 女 10 15 25 合计 30 20 50 (Ⅰ)用分层抽样的方法在患心肺疾病的人群中抽 6 人,其中男性抽多少人? (Ⅱ)在上述抽取的 6 人中选 2 人,求恰好有 1 名女性的概率; (Ⅲ)为了研究心肺疾病是否与性别有关,请计算出统计量 ,你有多大把握认为心肺疾 病与性别有关?(结果保留三个有效数字) 下面的临界值表供参考: 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参考公式: ,其中 . 【答案】(1)4 人. (2) . (3) 有 把握认为心肺疾病与性别有关. 【解析】 【分析】 (Ⅰ)根据分成抽样定义,每个个体被抽中的概率相等,即可求得抽到男性人数。 (Ⅱ)根据古典概型概率计算,列出所有可能,即可求得恰有 1 个女生的概率。 (Ⅲ)根据独立性检验的公式求 ,求得后与表中临界值比较,即可判断是否有把握。 【详解】 【点睛】 本题考查了简单抽样方法,古典概率的求法及独立性检验方法的应用,属于基础题。
查看更多

相关文章

您可能关注的文档