2021届课标版高考文科数学大一轮复习课件:§10-2 统计及统计案例(讲解部分)

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

2021届课标版高考文科数学大一轮复习课件:§10-2 统计及统计案例(讲解部分)

专题十 概率、统计及统计案例 §10.2  统计及统计案例 高考文数 考点一 抽样方法 1.三种抽样方法的比较 考点清单 2.分层抽样中公式的运用 抽样比=   =   . 3.简单随机抽样 每次每个个体被抽到的概率都相等,都是   . 在抽样过程中,每个个体被抽到的概率都是   . 4.系统抽样的步骤 当   是整数时,(1)将总体中每一个个体编号;(2)确定分段间隔 k =   ,对编号 进行分段;(3)在第一段用抽签法确定第一个个体编号 t ( t ≤ k );(4)按照一定的 规则抽取样本,通常是抽取 t , t + k , t +2 k , … , t +( n -1)· k . 当   不是整数时,先随机地从总体中 剔除余数个个体 ,然后按上述步骤进 行. 考点二 统计图表 1.频率分布直方图的特征 (1)各个小矩形的面积和为1. (2)纵轴的含义为   ,矩形的面积=组距 ×   =频率. (3)样本数据的平均数的估计值等于每个小矩形的面积乘矩形底边中点横 坐标之和. (4)众数为最高矩形的底边中点的横坐标. 2.茎叶图的优点 茎叶图的优点是可以保留原始数据,而且可以随时记录,这给数据的记录和 表示都带来了方便. 考点三 样本的数字特征 1.众数、中位数、平均数 2.方差和标准差 方差和标准差反映了数据波动程度的大小. 数字特征 样本数据 频率分布直方图 众数 出现 次数最多 的数据 取最高的小矩形底边中点的横 坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间 两个数据的平均数) 把频率分布直方图划分为左右 两个面积相等的部分,分界线与 x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘小矩形底 边中点的横坐标之和 (1)方差: s 2 =   [( x 1 -   ) 2 +( x 2 -   ) 2 + … +( x n -   ) 2 ] ; (2)标准差: s =   . 注意:方差和标准差描述了一组数据与平均数的离散程度,反映了一组数据 相对于平均数的波动情况,标准差和方差越大,说明这组数据的波动性越 大. 3.关于平均数、方差的有关性质 (1)若 x 1 , x 2 , … , x n 的平均数为   ,则 mx 1 + a , mx 2 + a , …… , mx n + a 的平均数为 m   + a . (2)数据 x 1 , x 2 , … , x n 与数据 x ' 1 = x 1 + a , x ' 2 = x 2 + a , …… , x ' n = x n + a 的方差相等. (3)若 x 1 , x 2 , … , x n 的方差为 s 2 ,则 ax 1 + b , ax 2 + b , …… , ax n + b 的方差为 a 2 s 2 . 考点四 变量间的相关性 1.回归直线方程为   =   +   x ,其中   其中(   ,   )为样本点的中心,   =     x i ,   =     y i . 2.样本相关系数 r =   . 如果| r |> r 0.05 ,那么表明有95%的把握认为 x 与 y 具有线性相关关系.如果| r | ≤ r 0.05 , 那么求回归直线方程没有意义. 3.相关指数: R 2 =1-   . R 2 越大,模型的拟合效果越好; R 2 越小,模型的拟 合效果越差. 4.相关系数 r .| r |→1,表示两个变量的线性相关性越强. | r |→0,表明两个变量之间几乎不存在线性相关性. 通常| r | ≥ 0.75时,认为两个变量有很强的线性相关性. 考点五 独立性检验 1.分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.列联表 列出两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y ,它们 的可能取值分别为{ x 1 , x 2 }和{ y 1 , y 2 },其样本频数列联表(称为2 × 2列联表)如 下: 可构造一个随机变量 K 2 =   ,其中 n = a + b + c + d 为样 本容量. 3.独立性检验 利用独立性假设、随机变量 K 2 来确定是否有一定把握认为“两个分类变 量有关系”的方法称为两个分类变量的独立性检验. 两个分类变量 X 和 Y 是否有关系的判断标准: 统计学研究表明:当 K 2 ≤ 3.841时,认为 X 与 Y 无关; 当 K 2 >3.841时,有95%的把握说 X 与 Y 有关; 当 K 2 >6.635时,有99%的把握说 X 与 Y 有关; 当 K 2 >10.828时,有99.9%的把握说 X 与 Y 有关. 方法1  解与频率分布直方图有关问题的方法 用频率分布直方图估计数字特征: ( x i 表示第 i 个小矩形底边中点的横坐标, s i 表示第 i 个小矩形的面积) 样本平均数:   = x 1 s 1 + x 2 s 2 + … + x n s n . 中位数:频率分布直方图面积的一半所对应点的横坐标. 众数:最高小矩形底边中点的横坐标. 方法技巧 例1    (2019广东广州天河综合测试(一),19)某学校高三年级学生某次身体 素质体能测试的原始成绩采用百分制,已知所有这些学生的原始成绩均分 布在[50,100]内,发布成绩使用等级制,各等级划分标准见下表. 规定: A , B , C 三个等级为合格, D 等级为不合格.为了解该校高三年级学 生身体素质情况,从中抽取了 n 名学生的原始成绩作为样本进行统计. 按照[50,60),[60,70),[70,80),[80,90),[90,100]分组作出的频率分布直方图如 图1所示,样本中分数在80分及以上的所有数据的茎叶图如图2所示. 百分制 85分及以上 70分到84分 60分到69分 60分以下 等级 A B C D   (1)求 n 和频率分布直方图中的 x , y 的值,并估计该校高三年级学生成绩是合 格的概率; (2)根据频率分布直方图,求成绩的中位数(精确到0.1); (3)在选取的样本中,从 A , D 两个等级的学生中随机抽取2名学生进行调研, 求至少有一名学生是 A 等级的概率. 解析 (1)由题意知,样本容量 n =   =50, x =   =0.004, y =   =0.018. 因为成绩是合格的人数为(1-0.1) × 50=45, 所以抽取的50人中成绩是合格等级的概率 P =   , 即估计该校高三年级学生成绩是合格的概率为   . (2)根据频率分布直方图,知成绩的中位数为70+   × 10 ≈ 73.9(分). (3)由茎叶图知, A 等级的学生有3人,由频率分布直方图知 D 等级的学生有 0.1 × 50=5人, 记 A 等级的学生为 a 、 b 、 c , D 等级的学生为 d 、 e 、 f 、 g 、 h , 从这8人中随机抽取2人,基本事件是 ab 、 ac 、 ad 、 ae 、 af 、 ag 、 ah 、 bc 、 bd 、 be 、 bf 、 bg 、 bh 、 cd 、 ce 、 cf 、 cg 、 ch 、 de 、 df 、 dg 、 dh 、 ef 、 eg 、 eh 、 fg 、 fh 、 gh ,共28个; 至少有一名学生是 A 等级的基本事件是 ab 、 ac 、 ad 、 ae 、 af 、 ag 、 ah 、 bc 、 bd 、 be 、 bf 、 bg 、 bh 、 cd 、 ce 、 cf 、 cg 、 ch ,共18个,故所求的概率 P =   =   . 方法2  样本的数字特征的求解及其应用 平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可 对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均 数、中位数、众数可描述总体的集中趋势,方差和标准差可描述数据的波 动大小. 例2    (2018河南周口期末抽测,18)甲、乙两人在相同条件下各射击10次, 每次中靶环数情况如图所示:   (1)请填写下表(写出计算过程): 平均数 方差 命中9环及9环以上的次数 甲 乙 (2)从下列三个不同的角度对这次测试结果进行分析: ①从平均数和方差相结合看(分析谁的成绩更稳定); ②从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些); ③从折线图上两人射击命中环数的走势看(分析谁更有潜力). 解析 甲射击10次中靶环数分别为9,5,7,8,7,6,8,6,7,7. 将它们由小到大排列为5,6,6,7,7,7,7,8,8,9. 乙射击10次中靶环数分别为2,4,6,8,7,7,8,9,9,10. 将它们由小到大排列为2,4,6,7,7,8,8,9,9,10. (1)   =   × (5+6 × 2+7 × 4+8 × 2+9)=7(环),   =   × (2+4+6+7 × 2+8 × 2+9 × 2+10)=7(环),   =   × [(5-7) 2 +(6-7) 2 × 2+(7-7) 2 × 4+(8-7) 2 × 2+(9-7) 2 ]=   × (4+2+0+2+4)=1.2,   =   × [(2-7) 2 +(4-7) 2 +(6-7) 2 +(7-7) 2 × 2+(8-7) 2 × 2+(9-7) 2 × 2+(10-7) 2 ]=   × (25+9 +1+0+2+8+9)=5.4. 填表如下: 平均数 方差 命中9环及9环以上的次数 甲 7 1.2 1 乙 7 5.4 3 (2)①∵平均数相同,   <   , ∴甲的成绩比乙的成绩稳定. ②∵平均数相同,命中9环及9环以上的次数甲比乙少, ∴乙的成绩比甲成绩好些. ③甲成绩在平均数上下波动;而乙成绩处于上升势头,从第三次以后就没有 比甲少的情况发生,乙更有潜力. 方法3  回归直线方程的求解与运用 1.求回归直线方程的步骤 (1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系; (2)利用公式   =   ,   =   -     求得回归系数; (3)写出回归直线方程. 2.非线性回归方程的求法 (1)根据原始数据作出散点图; (2)根据散点图选择恰当的拟合函数; (3)作恰当变换,将其转化成线性函数,求线性回归方程; (4)在(3)的基础上通过相应变换,即可得非线性回归方程. 例3    (2018陕西西安一中月考,5)已知变量 x 与变量 y 之间具有相关关系,并 测得如下一组数据: 则变量 x 与 y 之间的线性回归方程可能为   (  ) A.   =0.7 x -2.3      B.   =-0.7 x +10.3 C.   =-10.3 x +0.7     D.   =10.3 x -0.7 x 6 5 10 12 y 6 5 3 2 解析 根据题表中数据得   =   × (6+5+10+12)=   ,   =   × (6+5+3+2)=4,且变 量 y 随变量 x 的增大而减小,故 x 与 y 是负相关,将   代入四个选项中一一 验证,当   =   时,-0.7 ×   +10.3 ≈ 4,故选B. 答案    B 方法4  独立性检验的思想方法 独立性检验的具体做法: 1.根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概 率的上界 α ,然后查临界值表确定临界值 k 0 . 2.利用公式 K 2 =   计算随机变量 K 2 的观测值 k . 3.如果 k ≥ k 0 ,就推断“ X 与 Y 有关系”,这种推断犯错误的概率不超过 α ;否 则,就认为在犯错误的概率不超过 α 的前提下不能推断“ X 与 Y 有关系”,或 者在样本数据中没有发现足够证据支持结论“ X 与 Y 有关系”. 例4    (2018广东江门3月模拟(一模),18)为探索课堂教学改革,江门某中学 数学老师用“传统教学”和“导学案”两种教学方式分别在甲、乙两个 平行班进行教学试验.为了解教学效果,期末考试后,分别从两个班级各随 机抽取20名学生的成绩进行统计,得到如下茎叶图.记成绩不低于70分者为 “成绩优良”. (1)请大致判断哪种教学方式的教学效果更佳,并说明理由; (2)构造一个教学方式与成绩优良的2 × 2列联表,并判断能否在犯错误的概 率不超过0.05的前提下认为“成绩优良与教学方式有关”.   附: K 2 =   ,其中 n = a + b + c + d   独立性检验临界值表: P ( K 2 ≥ k 0 ) 0.10 0.05 0.025 0.010 k 0 2.706 3.841 5.024 6.635 解析 (1)“导学案”教学方式教学效果更佳. 理由1:乙班样本数学成绩大多在70分以上,甲班样本数学成绩70分以下的 明显更多. 理由2:甲班样本数学成绩的平均分为70.2,乙班样本数学成绩的平均分为 79.05. 理由3:甲班样本数学成绩的中位数为   =70,乙班样本数学成绩的中位 数为   =77.5. (2)2 × 2列联表如下: 甲班 乙班 总计 成绩优良 10 16 26 成绩不优良 10 4 14 总计 20 20 40 由上表可得 K 2 =   ≈ 3.956>3.841, 所以能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式 有关”.
查看更多

相关文章

您可能关注的文档