- 2021-06-11 发布 |
- 37.5 KB |
- 30页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2019届二轮复习(理)概率统计综合学案(全国通用)
【母题原题 1】【2018 新课标 1,理 20】某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用户 之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取 20 件作检验, 再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为 ,且各 件产品是否为不合格品相互独立. (1)记 20 件产品中恰有 2 件不合格品的概率为 ,求 的最大值点 . (2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 作为 的值.已知每件产品 的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用. (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求 ; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? . 所以 . (ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为 400 元. 由于 ,故应该对余下的产品作检验. 点睛:该题考查的是有关随机变量的问题,在解题的过程中,一是需要明确独立重复试验成功次数对应的 概率公式,再者就是对其用函数的思想来研究,应用导数求得其最小值点,在做第二问的时候,需要明确 离散型随机变量的可取值以及对应的概率,应用期望公式求得结果,再有就是通过期望的大小关系得到结 论. 【母题原题 2】【2017 新课标 1,理 19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线 上随机抽取 16 个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零 件的尺寸服从正态分布 N(μ,σ2). (1)假设生产状态正常,记 X 表示一天内抽取的 16 个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求 P(X≥1)及 X 的数学期望; (2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可 能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性; (ⅱ)下面是检验员在一天内抽取的 16 个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得 xi=9.97,s= ≈0.212,其中 xi 为抽取的第 i 个零件的尺 寸,i=1,2,…,16. 用样本平均数 作为 μ 的估计值 ,用样本标准差 s 作为 σ 的估计值 ,利用估计值判断是否需对当天的生产过 程进行检查?剔除( -3 +3 )之外的数据,用剩下的数据估计 μ 和 σ(精确到 0.01). 附:若随机变量 服从正态分布 N(μ,σ2),则 P(μ-3σ< <μ+3σ)=0.997 4. 0.997 416≈0.959 2, ≈0.09. 因此 σ 的估计值为 ≈0.09. 【母题原题 3】【2016 新课标 1,理 19】某公司计划购买 2 台机器,该种机器使用三年后即被淘汰.机器有一 易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200 元.在机器使用期间,如果备件不足再购买, 则每个 500 元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台这种机器在三年 使用期内更换的易损零件数,得下面柱状图: 以这 100 台机器更换的易损零件数的频率代替 1 台机器更换的易损零件数发生的概率,记 X 表示 2 台机器三 年内共需更换的易损零件数,n 表示购买 2 台机器的同时购买的易损零件数. (Ⅰ)求 X 的分布列; (Ⅱ)若要求 P(X≤n)≥0.5,确定 n 的最小值; (Ⅲ)以购买易损零件所需费用的期望值为决策依据,在 n=19 与 n=20 之中选其一,应选用哪个? 【解析】(Ⅰ)由柱状图 并以频率代替概率 可得,一台机器在三年内需更换的易损零件数为 8,9,10,11 的概 率分别为 0.2,0.4,0.2,0.2. 从而 P(X=16)=0.2×0.2=0.04; X16 17 18 19 20 21 22 P0.040.160.240.240.20.080.04 (Ⅱ)由(Ⅰ)知 P(X≤18)=0.44,P(X≤19)=0.68,故 n 的最小值为 19. (Ⅲ)记 Y 表示 2 台机器在购买易损零件上所需的费用(单位:元). 当 n=19 时 , EY=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040. 当 n=20 时 , EY=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080. 可知当 n=19 时所需费用的期望值小于 n=20 时所需费用的期望值,故应选 n=19. 【热点剖析】从近几年的高考试题来看,频率分布直方图、茎叶图、平均数、方差、分布列是高考的热点, 题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平 均数等知识结合在一起,考查学生应用知识解决问题的能力.独立性检验、回归分析高考对此部分内容考查 有加强趋势,主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的 统计思想,在高考中多为选择、填空题,也有解答题出现.频率分布直方图、茎叶图、平均数、方差,离散型 随机变量的分布列与期望仍然是考查的热点,同时应注意和概率、平均数、分布列,期望,二项分布,正态分 布等知识的结合,同时应注意独立性检验在实际生活中的应用,有可能涉及一道与独立检验有关的大题. 【经验分享】 1.进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差 异要大,且互不重叠; (2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同; (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样. 2.在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整 理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶 图,但没有表示两组记录那么直观、清晰. 3.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直 线方程才有实际意义,否则,求出的回归直线方程毫无意义. 4.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值. 5.r 的大小只说明是否相关并不能说明拟合效果的好坏,R2 才是判断拟合效果好坏的依据. 6.独立性检验的随机变量 K2=2.706 是判断是否有关系的临界值,K2<2.076 应判断为没有充分证据显示 X 与 Y 有关系,而不能作为小于 90 的量化值来判断. 7. 概率计算题的核心环节就是把一个随机事件进行类似本题的分拆,这中间有三个概念,事件的互斥,事件的 对立和事件的相互独立,在概率的计算中只要弄清楚了这三个概念,根据实际情况对事件进行合理的分拆,就 能把复杂事件的概率计算转化为一个个简单事件的概率计算,达到解决问题的目的. 8.在解含有相互独立事件的概率题时,首先把所求的随机事件分拆成若干个互斥事件的和,其次将分拆后的 每个事件分拆为若干个相互独立事件的乘积,这两个事情做好了,问题的思路就清晰了,接下来就是按照相关 的概率值进行计算的问题了,如果某些相互独立事件符合独立重复试验概型,就把这部分归结为用独立重复 试验概型,用独立重复试验概型的概率计算公式解答. 9.相当一类概率应用题都是比如掷硬币、掷骰子、摸球等概率模型赋予实际背景后得出来的,我们在解题时 就要把实际问题再还原为我们常见的一些概率模型,这就要根据问题的具体情况去分析,对照常见的概率模 型,把不影响问题本质的因素去除,抓住问题的本质. 10.求解一般的随机变量的期望和方差的基本方法是:先根据随机变量的意义,确定随机变量可以取哪些值, 然后根据随机变量取这些值的意义求出取这些值的概率,列出分布列,根据数学期望和方差的公式计算. 【知识整合】 一,统计初步 1.简单随机抽样 简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操 作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法. 2.系统抽样 (1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一 个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样. (2)系统抽样的步骤: ①编号.采用随机的方式将总体中的个体编号. ②分段.先确定分段的间隔 k.当N n(N 为总体中的个体数,n 为样本容量)是整数时,k=N n;当N n不是整数时,通过 从总体中随机剔除一些个体使剩下的总体中个体总数 N′能被 n 整除,这时 k=N′ n .③确定起始个体编号.在第 1 段用简单随机抽样确定起始的个体编号 S. ④按照事先确定的规则抽取样本.通常是将 S 加上间隔 k,得到第 2 个个体编号 S+k,再将(S+k)加上 k,得到 第 3 个个体编号 S+2k,这样继续下去,获得容量为 n 的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n- 1)k. 3.分层抽样 (1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层, 然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法 叫做分层抽样. 分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体 数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数 目,分层要恰当. (2)分层抽样的步骤 ①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本. (3)分层抽样的优点 分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而 且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用. 4.绘制频率分布直方图 把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的 频率 组距,这样得出一系列 的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴 表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于 1. 5.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在 样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便 记录与表示,但当样本数据较多时,茎叶图就不太方便. 6.平均数、中位数和众数 (1)平均数:一组数据的总和除以数据的个数所得的商就是平均数. (2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据 的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数. (3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的 众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数). (4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上 的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中 每个小矩形的面积乘以小矩形底边中点的横坐标之和. 7.方差、标准差 (1)设样本数据为 x1,x2,…,xn 样本平均数为 x - ,则 s2=1 n[(x1- x - )2+(x2- x - )2+…+(xn- x - )2]=1 n[(x12+x22+… +xn2)-nx2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越 大.把样本方差的算术平方根叫做这组数据的样本标准差. (2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则 反映一组数据围绕平均数波动的大小. 8.两个变量的线性相关 (1)散点图 将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的 图形叫做散点图.利用散点图可以判断变量之间有无相关关系. (2)正相关、负相关 如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也 由小变大,这种相关称为正相关. 反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一 个变量的值由大变小,这种相关称为负相关. 9.回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方 程,③用回归直线方程作预报. (1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变 量之间具有线性相关关系,这条直线叫做回归直线. (2)回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量 x、y 的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方程y^ =a^ +b^ x 的系数为: b^= ∑ i=1 n xiyi-n x · y ∑ i=1 n xi 2-n x 2 = ∑ i=1 n (xi- x-)(yi- y-) ∑ i=1 n (xi- x-)2 a^= y--b^ x 其中 x - =1 n n ∑ i=1 xi, y - =1 n n ∑ i=1 yi,( x - , y - )称作样本点的中心. a^ ,b^ 表示由观察值用最小二乘法求得的 a,b 的估计值,叫回归系数. 10.独立性检验 (1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量. (2)两个分类变量 X 与 Y 的频数表,称作 2×2 列联表. 二.随机事件的概率 1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件. (1)在条件 下,一定会发生的事件叫做相对于条件 的必然事件. (2)在条件 下,一定不会发生的事件叫做相对于条件 的不可能事件. (3)必然事件与不可能事件统称为确定事件. (4)在条件 下可能发生也可能不发生的事件,叫做随机事件. (5)确定事件和随机事件统称为事件,一般用大写字母 表示. 2.频率与概率 (1)在相同的条件 下重复 次试验,观察某一事件 是否出现,称 次试验中事件 出现的次数 为事件 出现的频数,称事件 出现的比例 为事件 出现的频率. (2)对于给定的随机事件 ,如果随着试验次数的增加,事件 发生的频率 稳定在某个常数上,把这个 常数记作 ,称为事件 的概率,简称为 的概率. 3.互斥事件与对立事件 互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即 为不可能事件 ( ),则称事件 与事件 互斥,其含义是:事件 与事件 在任何一次试验中不会同时发生. 一般地,如果事件 中的任何两个都是互斥的,那么就说事件 彼此互斥. 对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即 为不可能事件,而 为 必然事件,那么事件 与事件 互为对立事件,其含义是:事件 与事件 在任何一次试验中有且仅有一个 发生. 互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是 S S S S S , , ,A B C S n A n A An A A ( ) A n nf A n = A A A ( )nf A ( )p A A A A B A B φ= A B A B 1 2, , , nA A A 1 2, , , nA A A A B A B A B A B 两个事件对立的必要非充分条件. 4.事件的关系与运算 定义 符号表示 包含关系 如果事件 发生,则事件 一定发生,这时称事件 包含事件 (或称事件 包含于事件 ) (或 ) 相等关系] 若 且 ,那么称事件 与事件 相等 并事件 (和事件) 若某事件发生当且仅当事件 发生或事件 发生,则称此事 件为事件 与事件 的并事件(或和事件) (或 ) 交事件 (积事件) 若某事件发生当且仅当事件 发生且事件 发生,则称此事 件为事件 与事件 的交事件(或积事件) (或 ) 互斥事件 若 为不可能事件,那么称事件 与事件 互斥 对立事件 若 为不可能事件, 为必然事件,那么称事件 与 事件 互为对立事件 且 5.随机事件的概率 事件 的概率:在大量重复进行同一试验时,事件 发生的频率 总接近于某个常数,在它附近摆动,这时就 把这个常数叫做事件 的概率,记作 . 由定义可知 ,显然必然事件的概率是 ,不可能事件的概率是 . 5.概率的几个基本性质 (1)概率的取值范围: . (2)必然事件的概率: . (3)不可能事件的概率: . (4)互斥事件的概率加法公式: ① ( 互斥),且有 . ② ( 彼此互斥). (5)对立事件的概率: . 三.古典概型 1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件 A 由几个基本事件 组成.如果一次试验中可能出现的结果有 n 个,即此试验由 n 个基本事件组成,而且所有结果出现的可能性都 A B B A A B B A⊇ A B⊆ B A⊇ A B⊇ A B A B= A B A B A B A B+ A B A B A B AB A B A B A B φ= A B A B A B A B φ= A B = Ω A A n m A ( )p A ( )0 1p A≤ ≤ 1 0 ( )0 1p A≤ ≤ ( ) 1p A = ( ) 0p A = ( ) ( ) ( )p A B p A p B= + ,A B ( ) ( ) ( ) 1p A A p A p A+ = + = ( ) ( ) ( ) ( )1 2 1 2n np A A A p A p A p A= + + + 1 2, , , nA A A ( ) ( )1P A P A= − 相等,那么每一基本事件的概率都是 .如果某个事件 A 包含的结果有 m 个,那么事件 A 的概率 P(A)= . 基本事件的特点 (1)任何两个基本事件是互斥的. (2)任何事件都可以表示成基本事件的和(除不可能事件). 2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型. ①试验中所有可能出现的基本事件只有有限个,即有限性. ②每个基本事件发生的可能性相等,即等可能性. 概率公式:P(A)=A包含的基本事件的个数 基本事件的总数 . 四.几何概型 1.(1)随机数的概念: 随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的. ] (2)随机数的产生方法 ①利用函数计算器可以得到 0 1 之间的随机数; ②在 Scilab 语言中,应用不同的函数可产生 0 1 或 a b 之间的随机数. 2.几何概型 (1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率 模型为为几何概率模型,简称几何概型. (2)特点:①无限性:在一次试验中,可能出现的结果有无限多个; ②等可能性:每个结果的发生具有等可能性. (3)几何概型的解题步骤: 首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量 有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和 事件 构成的区域长度(角度、弧长等),最后代公式 构成事件A的区域长度面积或体积 试验的全部结果所构成的区域长度面积或体积;如果是二维、三维的问题,先设出二维或三维变 量,再列出试验的全部结果和事件 分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代 公式. (4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系. 3.几种常见的几何概型 (1)设线段 l 是线段 L 的一部分,向线段 L 上任投一点.若落在线段 l 上的点数与线段 L 的长度成正比, 而与线段 l 在线段 l 上的相对位置无关,则点落在线段 l 上的概率为: n 1 n m A A ( )p A = P=l 的长度/L 的长度 (2)设平面区域 g 是平面区域 G 的一部分,向区域 G 上任投一点,若落在区域 g 上的点数与区域 g 的面积成 正比,而与区域 g 在区域 G 上的相对位置无关,则点落在区域 g 上概率为: P=g 的面积/G 的面积 (3)设空间区域上 v 是空间区域 V 的一部分,向区域 V 上任投一点.若落在区域 v 上的点数与区域 v 的体积 成正比,而与区域 v 在区域 v 上的相对位置无关,则点落在区域 V 上的概率为: P=v 的体积/V 的体积 五.条件概率 1.条件概率及其性质 (1)对于任何两个事件 和 ,在已知事件 发生的条件下,事件 发生的概率叫做条件概率,用符号 来表示,其公式为 . 在古典概型中,若用 表示事件 中基本事件的个数,则 . (2)条件概率具有的性质: ① ; ② 如果 和 是两互斥事件,则 . 2.相互独立事件 (1)对于事件 、 ,若 的发生与 的发生互不影响,则称 、 是相互独立事件. (2)若 与 相互独立,则 , . (3)若 与 相互独立,则 与 , 与 , 与 也都相互独立. (4)若 ,则 与 相互独立. 3.独立重复试验 独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只 有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的. 六.离散型随机变量的分布列 离散型随机变量的分布列 (1)随机变量 如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,随机变量常用字母 X,Y,ξ,η 等表 A B A B ( )/p B A ( ) ( ) ( )/ p ABp B A P A = ( )n A A ( ) ( ) ( )/ n ABp B A n A = ( )0 / 1p B A≤ ≤ B C ( ) ( ) ( )/ / /p B C A p B A p C A= + A B A B A B A B ( ) ( )/p B A p B= ( ) ( ) ( ) ( ) ( )/p AB p B A P A P A P B= ⋅ = ⋅ A B A B A B A B ( ) ( ) ( )p AB P A P B= ⋅ A B 示. (2)离散型随机变量 对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. 若 是随机变量, ,其中 是常数,则 也是随机变量. 2.常见离散型随机变量的分布列 (1)两点分布: 若随机变量 服从两点分布,即其分布列为 0 1 其中 ,则称离散型随机变量 服从参数为 的两点分布.其中 称为成功概率. (2)超几何分布: 在含有 件次品的 件产品中,任取 件,其中恰有 件次品,则事件{ }发生的概率为 , ,其中 ,且 ,称分布列 为超几何分布列. 0 1 … m … (3)设离散型随机变量 可能取得值为 , ,…, ,… , 取每一个值 ( )的概率为 ,则称表 … … … … 为随机变量 X 的概率分布列,简称 X 的分布列.有时为了表达简单,也用等式 , 表 示 的分布列. 分布列的两个性质 ① , ;② . 七.二项分布: 1.离散型随机变量的二项分布:在一次随机试验中,某事件可能发生也可能不发生,在 次独立重复试验 中这个事件发生的次数 是一个随机变量.如果在一次试验中某事件发生的概率是 ,那么在 次独立重 ξ a bη ξ= + ,a b η X X P 1 p− p 0 1p< < X p ( )1p P X= = M N n X X k= ( ) k n k M N M n N C CP X k C − −= = 0,1,2, ,k m= { }min ,m M n= , , , ,n N M N n M N N ∗≤ ≤ ∈ X P 0 0n M N M n N C C C − − 1 1n M N M n N C C C − − m n m M N M n N C C C − − X 1x 2x ix nx X ix 1,2, ,i n= ( )i iP X x p= = X 1x 2x ix nx P 1p 2p ip np ( )i iP X x p= = 1,2, ,i n= X 0ip ≥ 1,2, ,i n= 1 2 1np p p+ + + = n ξ p n 复试验中这个事件恰好发生 次的概率是 ,( …, )于是得到 随机变量 的概率分布如下: 由于 恰好是二项展开式 中的各项的值,所以称这样的随机变 量 服从二项分布,记作 ,其中 , 为参数,并记 = .… 2.二项分布的期望与方差:若 ,则 , 八.正态分布 1.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本 容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体 密度曲线. 它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度 曲线,直线 及 轴所围图形的面积. 2.正态分布密度函数: ,( , ) 其中 π 是圆周率; 是自然对数的底; 是随机变量的取值; 为正态分布的均值; 是正态分布的标准 差.正态分布一般记为 … … … … k knkk nn qpCkP −== )(ξ 0,1,2,3,k = pq −= 1 ξ knkk n qpC − 011100)( qpCqpCqpCqpCpq nn n knkk n n n n n n +++++=+ −− ξ ( ),B n pξ n p knkk n qpC − ( ); ,b k n p ( ),B n pξ E npξ = ( )1D np pξ = − ,x a x b= = x ( )2 22 , 1( ) 2 x x e µ σ µ σϕ πσ −− = 0σ > x−∞ < < +∞ e x µ σ ),( 2σµN ξ 0 1 k n P n n qpC 00 111 −n n qpC knkk n qpC − 0qpC nn n 正态分布的定义及表示 函数 ,其中实数 和 ( >0)为参数.我们称 的图像 为正态分布密度曲线,简称正态曲线. 如果对于任何实数 ,随机变量 满足 则称随机变量 服从 正态分布,正态分布完全由参数 确定,因此正态分布常记作 ,如果随机变量 服从正态 分布,则记为 .正态分布 )是由均值 和标准差 唯一决定的分布 3.正态曲线 有以下性质: (1)曲线位于 轴上方,与 轴不相交; (2)曲线是单峰的,它关于直线 对称; (3)曲线在 处达到峰值 1 σ 2π ; (4)曲线与 轴围成的图形的面积为 1; (5)当 一定时,曲线随着 的变化而沿 轴平移; (6)当 一定时,曲线的形状由 确定, 越小,曲线越“瘦高”,表示总体的分布越集中; 越大,曲线越“矮 胖”,表示总体的分布越分散. 4.正态总体在三个特殊区间内取值的概率值 ①P(μ-σ查看更多
相关文章
- 当前文档收益归属上传用户