- 2021-06-19 发布 |
- 37.5 KB |
- 45页
文档介绍
2019届二轮复习(理)2-6-3-1统计与概率大题课件(45张)
6.3 统计与概率大题 - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - - 8 - 2 . 独立性检验 对于取值分别是 { x 1 , x 2 } 和 { y 1 , y 2 } 的分类变量 X 和 Y , 其样本频数列联表是 : - 9 - 4 . 二项分布 一般地 , 在 n 次独立重复试验中 , 事件 A 发生的次数为 X , 设每次试验中事件 A 发生的概率为 p , 则 P ( X=k ) = p k q n-k , 其中 0b 的概率 . 考 向四 - 16 - 考向一 考向二 考向三 考 向四 解 : (1) 茎叶图如下 ( 图中的茎表示十位数字 , 叶表示个位数字 ): 从茎叶图中可看出 ( 答案不唯一 ): ① A 班数据 有 集中 在茎 0,1,2 上 ,B 班数据 有 集中 在茎 1,2,3 上 ; ② A 班叶的分布是单峰的 ,B 班叶的分布基本上是对称的 ; ③ A 班数据的中位数是 10,B 班数据的中位数是 23 . - 17 - 考向一 考向二 考向三 考 向四 (2)A 班样本数据的平均值为 ( 3)A 班的样本数据中不超过 11 的数据 a 有 6 个 , 分别为 5,5,7,8,9,11;B 班的样本数据中不超过 11 的数据 b 有 3 个 , 分别为 3,9,11 . 从上述 A 班和 B 班的数据中各随机抽取一个 , 记为 ( a , b ), 分别为 (5,3),(5,9),(5,11),(5,3),(5,9),(5,11),(7,3),(7,9),(7,11),(8,3),(8,9),(8,11),(9,3),(9,9),(9,11),(11,3),(11,9),(11,11), 共 18 种 , 其中 a>b 的有 (5,3),(5,3),(7,3),(8,3),(9,3),(11,3),(11,9), 共 7 种 . 故 a>b 的概率为 P = . - 18 - 考向一 考向二 考向三 考 向四 样本的相关系数的应用 例 2 为了监控某种零件的一条生产线的生产过程 , 检验员每隔 30 min 从该生产线上随机抽取一个零件 , 并测量其尺寸 ( 单位 :cm) . 下面是检验员在一天内依次抽取的 16 个零件的尺寸 : - 19 - 考向一 考向二 考向三 考 向四 (1) 求 ( x i , i )( i= 1,2, … ,16) 的相关系数 r , 并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小 ( 若 |r|< 0 . 25, 则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小 ) . - 20 - 考向一 考向二 考向三 考 向四 - 21 - 考向一 考向二 考向三 考 向四 - 22 - 考向一 考向二 考向三 考 向四 - 23 - 考向一 考向二 考向三 考 向四 解题心得 对于样本的相关系数的应用的题目 , 题目一般都给出样本 ( x i , y i )( i= 1,2, … , n ) 的相关系数 r 的表达式 , 以及有关的数据 , 解决这类题的关键是在有关的数据中选择题目需要的数据代入公式即可 . - 24 - 考向一 考向二 考向三 考 向四 对点训练 2 下图是我国 2008 年至 2014 年生活垃圾无害化处理量 ( 单位 : 亿吨 ) 的折线图 . 注 : 年份代码 1—7 分别对应年份 2008—2014 . (1) 由折线图看出 , 可用线性回归模型拟合 y 与 t 的关系 , 请用相关系数加以说明 ; (2) 建立 y 关于 t 的回归方程 ( 系数精确到 0 . 01), 预测 2018 年我国生活垃圾无害化处理量 . - 25 - 考向一 考向二 考向三 考 向四 - 26 - 考向一 考向二 考向三 考 向四 - 27 - 考向一 考向二 考向三 考 向四 - 28 - 考向一 考向二 考 向 三 考 向四 利用回归方程进行回归分析 例 3 (2018 四川成都三模 , 理 16) 某企业统计自 2011 年到 2017 的产品研发费 x 和销售额 y 的数据如下表 : - 29 - 考向一 考向二 考 向 三 考 向四 根据上表中的数据作出散点图 , 得知产品研发费的自然对数值 z ( 精确到小数点后第二位 ) 和销售额 y 具有线性相关关系 . (1) 求销售额 y 关于产品研发费 x 的 回归方程 的 计算结果精确到小数点后第二位 ); (2) 根据 (1) 的结果预测 : 若 2018 年的销售额要达到 70 万元 , 则产品研发费大约需要多少万元 ? 参考数据 :ln 55 . 5≈4 . 02,ln 60 . 3≈4 . 10,ln 127 . 7≈4 . 85 . - 30 - 考向一 考向二 考 向 三 考 向四 - 31 - 考向一 考向二 考 向 三 考 向四 解题心得 在求两变量的回归方程时 , 由于 的 公式比较复杂 , 求它的值计算量比较大 , 为了计算准确 , 可将这个量分成几个部分分别计算 , 最后再合成 , 这样等同于分散难点 , 各个攻破 , 提高了计算的准确度 . - 32 - 考向一 考向二 考 向 三 考 向四 对点训练 3 (2018 江西上饶三模 , 理 18) 目前共享单车基本覆盖上饶市区 , 根据统计 , 市区所有人骑行过共享单车的人数已占 60%, 骑行过共享单车的人数中 , 有 30% 是学生 ( 含大中专、高职及中学生 ), 若市区人口按 40 万计算 , 学生人数约为 9 . 6 万 . (1) 任选出一名学生 , 求他 ( 她 ) 骑行过共享单车的概率 ; (2) 随着单车投放数量增加 , 乱停乱放成为城市管理的问题 , 如表是本市某组织累计投放单车数量 x 与乱停乱放单车数量 y 之间关系表 : 计算 y 关于 x 的线性回归方程 ( 其中 精确 到 0 . 000 1, 值保留三位有效数字 ), 并预测当 x= 26 000 时 , 单车乱停乱放的数量 ; - 33 - 考向一 考向二 考 向 三 考 向四 (3) 已知信州区、广丰区、上饶县、经开区四区中 , 其中有两个区的单车乱停乱放数量超过标准 , 在 “ 大美上饶 ” 活动中 , 检查组随机抽取两个区调查单车乱停乱放数量 , X 表示 “ 单车乱停乱放数量超过标准的区的个数 ”, 求 X 的分布列和数学期望 . - 34 - 考向一 考向二 考 向 三 考 向四 - 35 - 考向一 考向二 考 向 三 考 向四 - 36 - 考向一 考向二 考向三 考向四 统计图表与独立性检验的综合 例 4 (2018 全国卷 3, 理 18) 某工厂为提高生产效率 , 开展技术创新活动 , 提出了完成某项生产任务的两种新的生产方式 . 为比较两种生产方式的效率 , 选取 40 名工人 , 将他们随机分成两组 , 每组 20 人 , 第一组工人用第一种生产方式 , 第二组工人用第二种生产方式 . 根据工人完成生产任务的工作时间 ( 单位 :min) 绘制了如下茎叶图 : - 37 - 考向一 考向二 考向三 考向四 (1) 根据茎叶图判断哪种生产方式的效率更高 ? 并说明理由 ; (2) 求 40 名工人完成生产任务所需时间的中位数 m , 并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的列联表 : (3) 根据 (2) 中的列联表 , 能否有 99% 的把握认为两种生产方式的效率有差异 ? - 38 - 考向一 考向二 考向三 考向四 解 : (1) 第二种生产方式的效率更高 . 理由如下 : ① 由茎叶图可知 : 用第一种生产方式的工人中 , 有 75% 的工人完成生产任务所需时间至少 80 分钟 , 用第二种生产方式的工人中 , 有 75% 的工人完成生产任务所需时间至多 79 分钟 . 因此第二种生产方式的效率更高 . ② 由茎叶图可知 : 用第一种生产方式的工人完成生产任务所需时间的中位数为 85 . 5 分钟 , 用第二种生产方式的工人完成生产任务所需时间的中位数为 73 . 5 分钟 . 因此第二种生产方式的效率更高 . ③ 由茎叶图可知 : 用第一种生产方式的工人完成生产任务平均所需时间高于 80 分钟 ; 用第二种生产方式的工人完成生产任务平均所需时间低于 80 分钟 . 因此第二种生产方式的效率更高 . - 39 - 考向一 考向二 考向三 考向四 ④ 由茎叶图可知 : 用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最多 , 关于茎 8 大致呈对称分布 ; 用第二种生产方式的工人完成生产任务所需时间分布在茎 7 上的最多 , 关于茎 7 大致呈对称分布 . 又用两种生产方式的工人完成生产任务所需时间分布的区间相同 , 故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少 . 因此第二种生产方式的效率更高 . 以上给出了 4 种理由 , 学生答出其中任意一种或其他合理理由均可得分 . - 40 - 考向一 考向二 考向三 考向四 - 41 - 考向一 考向二 考向三 考向四 解题心得 有关独立性检验的问题解题步骤 :(1) 作出 2 × 2 列联表 ;(2) 计算随机变量 K 2 的值 ;(3) 查临界值 , 检验作答 . - 42 - 考向一 考向二 考向三 考向四 对点训练 4 “ 共享单车 ” 的出现 , 为我们提供了一种新型的交通方式 . 某机构为了调查人们对此种交通方式的满意度 , 从交通拥堵不严重的 A 城市和交通拥堵严重的 B 城市分别随机调查了 20 个用户 , 得到了一个用户满意度评分的样本 , 并绘制出如图茎叶图 . (1) 根据茎叶图 , 比较两城市满意度评分的平均值的大小及方差的大小 ( 不要求计算出具体值 , 给出结论即可 ); - 43 - 考向一 考向二 考向三 考向四 (2) 若得分不低于 80 分 , 则认为该用户对此种交通方式 “ 认可 ”, 否则认为该用户对此种交通方式 “ 不认可 ”, 请根据此样本完成下面 2 × 2 列联表 , 并据此样本分析是否有 95% 的把握认为城市拥堵与认可共享单车有关 ; (3) 若从此样本中的 A 城市和 B 城市各抽取 1 人 , 则在此 2 人中恰有 1 人认可的条件下 , 此人来自 B 城市的概率是多少 ? - 44 - 考向一 考向二 考向三 考向四 - 45 - 考向一 考向二 考向三 考向四