- 2021-06-12 发布 |
- 37.5 KB |
- 17页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
浙江专用2021届高考数学一轮复习第十一章概率与统计11-4抽样方法与总体分布的估计课件
§11.4 抽样方法与总体分布的估计 高考数学 考点一 随机抽样 1.简单随机抽样 (1)定义:一般地,设一个总体含有 N 个个体,从中逐个① 不放回 地抽取 n 个个体作为样本( n ≤ N ),如果每次抽取时各个个体被抽到的机会都相等,就 把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样方法有两种:随机数法和抽签法. 考点 清单 2.分层抽样 (1)定义:一般地,在抽样时,将总体分成② 互不交叉 的层,然后按照一定 的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作 为样本,这种抽样方法是分层抽样. (2)应用范围:总体是由③ 差异明显 的几个部分组成的. (3)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样, 抽样比= = . 考点二 用样本估计总体 1.频率分布表与频率分布直方图 频率分布表与频率分布直方图的绘制步骤如下: (1)求极差,即求一组数据中最大值与最小值的差; (2)决定组距与组数; (3)将数据分组; (4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与 样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布 表; (5) 画频率分布直方图 ,依据频率分布表画出频率分布直方图,其中纵坐标 (小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上 的小长方形的面积,即每个小长方形的面积=组距 × =频率. 各个小长方形面积的总和等于④ 1 . 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得 到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数 增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统 计中称这条光滑曲线为总体密度曲线. 3.用样本的数字特征估计总体的数字特征 数字特征 样本数据 频率分布直方图 众数 出现⑤ 次数最多 的数据 取最高的小长方形底边中点的 横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间 两个数据的⑥ 平均数 ) 把频率分布直方图划分为左右 两个面积相等的部分,分界线与 x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小长方形的面积乘小长方 形底边中点的横坐标之和 方差和标准差 方差和标准差反映了数据波动程度的大小. 方差: s 2 = [( x 1 - ) 2 +( x 2 - ) 2 + … +( x n - ) 2 ]; 标准差: s = . 注意:方差和标准差描述了一组数据与平均数的离散程度,反映了一组数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波动性越大. 4.茎叶图 (1)茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是 从茎的旁边生长出来的数. (2)茎叶图的画法步骤 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小顺序排成一列. 考法一 频率分布直方图的应用 知能拓展 例1 (2018安徽淮北一模,19)下图为2017届淮北师范大学数学与应用数学 专业 N 名毕业生的综合测评成绩(百分制)的频率分布直方图,已知80~90分 数段的毕业生人数为21. (1)求该专业毕业总人数 N 和90~95分数段内的人数 n ; (2)现欲将90~95分数段内的 n 名毕业生随机地分配到 A 、 B 、 C 三所学校,每 所学校至少分配两名毕业生. ①若这 n 名毕业生中甲、乙两人必须进同一所学校,共有多少种不同的分 配方法? ②若这 n 名毕业生中恰有两名女生,设随机变量 ξ 表示 n 名毕业生中分配往 B 学校的两名毕业生中女生的人数,求 ξ 的分布列和数学期望. 解题导引 解析 (1)80~90分数段的频率 p 1 =(0.04+0.03) × 5=0.35, 此分数段的毕业生人数为21, ∴毕业生的总人数 N = =60, 90~95分数段的频率 p 2 =1-(0.01+0.04+0.05+0.04+0.03+0.01) × 5=0.1, ∴90~95分数段内的人数 n =60 × 0.1=6. (2)①将90~95分数段内的6名毕业生随机地分配到 A 、 B 、 C 三所学校,每所 学校至少分配两名毕业生,且甲、乙两人必须进同一所学校,则共有 · =18种不同的分配方法. ② ξ 的所有可能取值为0,1,2, P ( ξ =0)= = , P ( ξ =1)= = , P ( ξ =2)= = , 所以 ξ 的分布列为 所以随机变量 ξ 的数学期望 E ( ξ )=0 × +1 × +2 × = . ξ 0 1 2 P 方法总结 1.用频率分布直方图解决相关问题时,应正确理解图中各个量 的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个 特点:(1)纵轴表示频率/组距;(2)频率分布直方图中各小长方形高的比就是 相应各组的频率之比;(3)直方图中各小长方形的面积是相应各组的频率, 所有的小长方形的面积之和等于1,即频率之和为1. 2.用频率分布直方图估计样本的数字特征 (1)平均数: = x i S i ( x i 表示第 i 个小矩形底边中点的横坐标, S i 表示第 i 个小矩 形的面积). (2)方差: s 2 = ( x i - ) 2 · S i . (3)众数:最高小矩形底边中点的横坐标. (4)中位数:把频率分布直方图划分为左右两个面积相等的部分时,分界线 与横轴交点的横坐标. 考法二 样本的数字特征及其应用 例2 (2018河南新乡一模,19)为了了解甲、乙两个工厂生产的轮胎的宽度 是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记 录下来并绘制出如下的折线图: 解题导引 (1)根据公式 = 求出平均值. (2)由方差公式求出甲、乙两厂轮胎宽度的方差,比较大小,判断两厂的轮 胎哪个相对更好. (1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值; (2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个的轮胎相对更好. 解析 (1)甲厂10个轮胎宽度的平均值 = × (195+194+196+193+194+19 7+196+195+193+197)=195(mm), 乙厂10个轮胎宽度的平均值 = × (195+196+193+192+195+194+195+19 2+195+193)=194(mm). (2)甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195, 平均数 = × (195+194+196+194+196+195)=195, 方差 = × [(195-195) 2 +(194-195) 2 +(196-195) 2 +(194-195) 2 +(196-195) 2 +(195- 195) 2 ]= , 乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195, 平均数 = × (195+196+195+194+195+195)=195, 方差 = × [(195-195) 2 +(196-195) 2 +(195-195) 2 +(194-195) 2 +(195-195) 2 +(195- 195) 2 ]= , ∵两厂标准轮胎宽度的平均数相等,但乙厂的方差更小, ∴乙厂的轮胎相对更好. 方法总结 1.平均数、中位数、众数与方差、标准差都是重要的数字特 征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的 实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可 描述波动大小. 2.有关平均数、方差的一些结论: (1)若数据 x 1 , x 2 , … , x n 的平均数为 ,那么 mx 1 + a , mx 2 + a , mx 3 + a , … , mx n + a 的平均 数是 m + a . (2)设数据 x 1 , x 2 , … , x n 的方差为 s 2 ,则 ① s 2 = [( x 1 - ) 2 +( x 2 - ) 2 + … +( x n - ) 2 ]; ②数据 x 1 + a , x 2 + a , … , x n + a 的方差也为 s 2 ; ③数据 ax 1 , ax 2 , … , ax n 的方差为 a 2 s 2 .查看更多