- 2021-06-10 发布 |
- 37.5 KB |
- 17页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
【数学】2019届一轮复习全国通用版高考必考题突破讲座(六)统计与概率、随机变量及其分布列学案
高考必考题突破讲座(六) 统计与概率、随机变量及其分布列 题型特点 考情分析 命题趋势 1.概率问题的核心是概率计算.其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,他们是高考考查的核心内容. 2.离散型随机变量的分布列及其期望的考查是历来高考的重点,特别是与统计内容的渗透,背景新颖,充分体现了概率与统计的工具性和交汇性. 2017·全国卷Ⅱ,18 2017·北京卷,17 2017·天津卷,16 2017·江苏卷,23 以统计的图、表为载体,结合概率的应用,考查特征数字和概率的计算,以及独立变量、相关变量间的关系判断. 分值:10~12分 1.常见概率模型的计算 几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式. 2.离散型随机变量的分布列、均值与方差 离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练. 3.概率与统计的综合应用 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算. 4.统计与统计案例 能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查. 【例1】 现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率; (2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率; (3)用X,Y分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X-Y|,求随机变量ξ的分布列. 解析 依题意,这4个人中,每个人去参加甲游戏的概率为,去参加乙游戏的概率为. 设“这4个人恰有i人去参加甲游戏”事件Ai(i=0,1,2,3,4). 则P(Ai)=Ci4-i. (1)这4个人中恰有2人参加甲游戏的概率 P(A2)=C22=. (2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B,则B=A3+A4且A3与A4互斥. 故P(B)=P(A3+A4)=P(A3)+P(A4)=C3×+C4=. (3)依题设,ξ的所有可能取值为0,2,4. 且A1与A3互斥,A0与A4互斥. 则P(ξ=0)=P(A2)=, P(ξ=2)=P(A1+A3)=P(A1)+P(A3) =C1·3+C3×=, P(ξ=4)=P(A0+A4)=P(A0)+P(A4) =C4+C4=. 于是ξ的分布列是 ξ 0 2 4 P 【例2】 (2017·北京卷)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者. (1)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率; (2)从图中A,B,C,D四人中随机选出两人,记ξ为选出的两人中指标x的值大于1.7的人数,求ξ的分布列和数学期望E(ξ); (3)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小(只需写出结论). 解析 (1)由图知,在服药的50名患者中,指标y的值小于60的有15人. 所以从服药的50名患者中随机选出一人,此人指标y的值小于60的概率为=0.3. (2)由图知,A,B,C,D四人中,指标x的值大于1.7的有2人:A和C. 所以ξ的所有可能取值为0,1,2. P(ξ=0)==,P(ξ=1)==,P(ξ=2)==. 所以ξ的分布列为 ξ 0 1 2 P 故ξ的期望E(ξ)=0×+1×+2×=1. (3)在这100名患者中,服药者指标y数据的方差大于未服药者指标y数据方差. 【例3】 (2018·湖南长沙一模)2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示. (1)分别求出成绩在第3,4,5组的人数; (2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽出6人进行面试. ①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率,②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望. 解析 (1)由频率分布直方图知: 第3组的人数为5×0.06×40=12; 第4组的人数为5×0.04×40=8; 第5组的人数为5×0.02×40=4. (2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人. ①设“甲或乙进入第二轮面试”为事件A,则 P(A)=1-=, 所以甲或乙进入第二轮面试的概率为. ②X的所有可能取值为0,1,2, P(X=0)==,P(X=1)==,P(X=2)==. 所以X的分布列为 X 0 1 2 P E(X)=0×+1×+2×==. 【例4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量. 附注: 参考数据:i=9.32,iyi=40.17,=0.55,=2.646. 参考公式:相关系数r=, 回归方程=+t中斜率和截距的最小二乘法估计公式分别为 =,=-. 解析 (1)由折线图中数据和附注中参考数据得 =4,(ti-)2=28,=0.55, (ti-)(yi-)=iyi-i=40.17-4×9.32=2.89, r≈≈0.99. 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系. (2)由=≈1.331及(1)得==≈0.103,=-=1.331-0.103×4≈0.92. 所以y关于t的回归方程为=0.92+0.10t. 将2019年对应的t=9代入回归方程得=0.92+0.10×9=1.82. 所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨. 1.(2018·河北沧州一模)甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为,乙获胜的概率为,各局比赛结果相互独立. (1)求甲在4局以内(含4局)赢得比赛的概率; (2)记X为比赛决出胜负时的总局数,求X的分布列和数学期望. 解析 用A表示“甲在4局以内(含4局)赢得比赛”,Ak表示“第k局甲获胜”,Bk表示“第k局乙获胜”,则P(Ak)=, P(Bk)=,k=1,2,3,4,5. (1)P(A)=P(A1A2)+P(B1A2A3)+P(A1B2A3A4) =P(A1)P(A2)+P(B1)P(A2)P(A3)+P(A1)P(B2)P(A3)P(A4) =2+×2+××2=. (2)X的可能取值为2,3,4,5. P(X=2)=P(A1A2)+P(B1B2) =P(A1)P(A2)+P(B1)P(B2)=, P(X=3)=P(B1A2A3)+P(A1B2B3) =P(B1)P(A2)P(A3)+P(A1)P(B2)P(B3)=, P(X=4)=P(A1B2A3A4)+P(B1A2B3B4) =P(A1)P(B2)P(A3)P(A4)+P(B1)P(A2)P(B3)P(B4)=, P(X=5)=1-P(X=2)-P(X=3)-P(X=4)=. 故X的分布列为 X 2 3 4 5 P E(X)=2×+3×+4×+5×=. 2.(2018·广东广州质检)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720. (1)求家庭的月储蓄y对月收入x的线性回归方程=x+; (2)判断变量x与y之间是正相关还是负相关; (3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程=x+中,=,=-, 其中,为样本平均值. 解析 (1)由题意知n=10,=i==8, =i==2,lxx=-n2=80, 又lxy=iyi-n =184-10×8×2=24, 由此得===0.3, =-=2-0.3×8=-0.4, 故所求线性回归方程为=0.3x-0.4. (2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关. (3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元). 3.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下. (1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率; (2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关; 箱产量<50 kg 箱产量≥50 kg 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附: P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 K2=. 解析 (1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于50 kg的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P(B)的估计值为0.62. 新养殖法的箱产量不低于50 kg的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P(C)的估计值为0.66. 因此事件A的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得列联表. 箱产量<50 kg 箱产量≥50 kg 旧养殖法 62 38 新养殖法 34 66 K2=≈15.705. 由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5, 箱产量低于55 kg的直方图面积为 (0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+≈52.35(kg). 4.(2018·湖北襄阳五中适应性考试)某商场计划销售某种产品,现邀请生产该产品的甲、乙两个厂家进场试销10天.两个厂家提供的返利方案如下:甲厂家每天固定返利70元,且每卖出一件产品厂家再返利2元;乙厂家无固定返利,卖出40件以内(含40件)的产品,每件产品厂家返利4元,超出40件的部分每件返利6元.经统计,两个厂家的试销情况茎叶图如下. (1)现从甲厂家试销的10天中抽取两天,求这两天的销售量都大于40的概率; (2)若将频率视作概率,回答以下问题: ①记乙厂家的日返利额为X(单位:元),求X的分布列和数学期望; ②商场拟在甲、乙两个厂家中选择一家长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由. 解析 (1)记“抽取的两天销售量都大于40”为事件A, 则P(A)==. (2)①设乙产品的日销售量为a, 则当a=38时,X=38×4=152;当a=39时,X=39×4=156; 当a=40时,X=40×4=160; 当a=41时,X=40×4+1×6=166; 当a=42时,X=40×4+2×6=172; ∴X的所有可能取值为152,156,160,166,172, ∴X的分布列为 X 152 156 160 166 172 P ∴E(X)=152×+156×+160×+166×+172×=162. ②依题意,甲厂家的日平均销售量为 38×0.2+39×0.4+40×0.2+41×0.1+42×0.1=39.5, ∴甲厂家的日平均返利额为70+39.5×2=149元, 由①得乙厂家的日平均返利额为162元(>149元), ∴推荐该商场选择乙厂家长期销售. 课时达标 讲座(六) [解密考纲]概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、数据分析能力.概率问题的核心是概率计算,其中事件的互斥、对立、独立和随机变量的分布是概率计算的核心.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征.统计与概率内容相互渗透,背景新颖. 1.(2018·海南模拟)已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在[90,100]内的有6人. (1)求n的值; (2)若成绩在[40,50)内的人数是成绩在[50,60)内的人数的,规定60分以下为不及格,从不及格的人中任意选取3人,求成绩在50分以下的人数X的分布列和数学期望. 解析 (1)依题意得 ⇒b=0.01, 因为成绩在[90,100]内的有6人,所以n==60. (2)由⇒ 于是成绩在[40,50)及[50,60)内的人数分别为3和9,即不及格的人数为12,从中任选3人,则成绩在50分以下的人数X的所有可能取值为0,1,2,3, 且P(X=0)==,P(X=1)==, P(X=2)==,P(X=3)==, 所以X的分布列如下 X 0 1 2 3 P 故X的数学期望为E(X)=0×+1×+2×+3×=. 2.(2018·广东五校联考)下图是某市11月1日至14日的空气质量指数趋势图,空气质量指数(AQI)小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择11月1日至11月12日中的某一天到达该市,并停留3天. (1)求此人到达当日空气重度污染的概率; (2)设ξ是此人停留期间空气重度污染的天数,求ξ的分布列与数学期望. 解析 设Ai表示事件“此人于11月i日到达该市”(i=1,2,…,12). 依题意知,P(Ai)=,且Ai∩Aj=∅(i≠j). (1)设B为事件“此人到达当日空气重度污染”,则B=A1∪A2∪A3∪A7∪A12, 所以P(B)=P(A1∪A2∪A3∪A7∪A12)=P(A1)+P(A2)+P(A3)+P(A7)+P(A12)=, 即此人到达当日空气重度污染的概率为. (2)由题意可知,ξ的所有可能取值为0,1,2,3, P(ξ=0)=P(A4∪A8∪A9)=P(A4)+P(A8)+P(A9)==, P(ξ=2)=P(A2∪A11)=P(A2)+P(A11)==, P(ξ=3)=P(A1∪A12)=P(A1)+P(A12)==, P(ξ=1)=1-P(ξ=0)-P(ξ=2)-P(ξ=3) =1---=, 所以ξ的分布列为 ξ 0 1 2 3 P 故ξ的数学期望E(ξ)=0×+1×+2×+3×=. 3.(2018·河南焦作模拟)某单位共10名员工,他们某年的收入如下表. 员工编号 1 2 3 4 5 6 7 8 9 10 年薪/万元 3 3.5 4 5 5.5 6.5 7 7.5 8 50 (1)求该单位员工当年年薪的平均值和中位数; (2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望; (3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少? 附:线性回归方程=x+中系数计算公式 =,=-,其中,表示样本均值. 解析 (1)平均值为10万元,中位数为6万元. (2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2. P(ξ=0)==,P(ξ=1)==, P(ξ=2)==, 所以ξ的分布列为 ξ 0 1 2 P 数学期望为E(ξ)=0×+1×+2×=. (3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪, 则=2.5,=5,(xi-)2=2.25+0.25+0.25+2.25=5, (xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7, ===1.4, =-=5-1.4×2.5=1.5, 因此线性回归方程为y=1.4x+1.5, 可预测该员工第5年的年薪收入为8.5万元. 4.(2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立, 且在各路口遇到红灯的概率分别为,,. (1)记X表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 解析 (1)随机变量X的所有可能取值为0,1,2,3. P(X=0)=××=, P(X=1)=××+××+××=, P(X=2)=××+××+××=, P(X=3)=××=. 所以随机变量X的分布列为 X 0 1 2 3 P ∴E(X)=0×+1×+2×+3×=. (2)设Y表示第一辆车遇到红灯的个数,Z表示第二辆车遇到红灯的个数,则所求事件的概率为 P(Y+Z=1)=P(Y=0,Z=1)+P(Y=1,Z=0) =P(Y=0)P(Z=1)+P(Y=1)P(Z=0) =×+×=. 所以这2辆车共遇到了1个红灯的概率为. 5.(2018·河南洛阳统考)某教师为了了解本校高三学生一模考试的数学成绩情况,将所教两个班级的数学成绩(单位:分)绘制成如图所示的茎叶图. (1)分别求出甲、乙两个班级数学成绩的中位数、众数; (2)若规定成绩大于或等于115分为优秀,分别求出两个班级数学成绩的优秀率; (3)在(2)的条件下,若用甲班学生数学成绩的频率估计概率,从该校高三年级中随机抽取3人,记这3人中数学成绩优秀的人数为X,求X的分布列和数学期望. 解析 (1)由所给的茎叶图知,甲班50名同学的成绩由小到大排序,排在第25,26位的是108,109,数量最多的是103,故甲班数学成绩的中位数是108.5,众数是103; 乙班48名同学的成绩由小到大排序,排在第24,25位的是106,107,数量最多的是92和101,故乙班数学成绩的中位数是106.5,众数为92或101. (2)由茎叶图中的数据可知,甲班中数学成绩为优秀的人数为20,优秀率为=;乙班中数学成绩为优秀的人数为18,优秀率为=. (3)用甲班学生数学成绩的频率估计概率,则高三学生数学成绩的优秀率P=,则X的所有可能取值为0,1,2,3, 且X~B, P(X=0)=C3=; P(X=1)=C××2=; P(X=2)=C×2×=; P(X=3)=C×3=; X的分布列为 X 0 1 2 3 P E(X)=0×+1×+2×+3×=或E(X)=3×=. 6.(2018·河北保定模拟)某市拟实行机动车尾号限行交替措施,为了解民众对“车辆限行”的态度,随机调查了50人,并将调查结果制成下表. 年龄/岁 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75) 频数 5 10 15 10 5 5 赞成人数 4 6 9 6 3 4 (1)若从年龄在[15,25),[25,35)的被调查者中各随机选取2人进行跟踪调查,选中的4人中不赞成“车辆限行”的人数记为X,求X的分布列和期望; (2)把年龄在[15,45)称为中青年,年龄在[45,75)称为中老年,请根据上表完成2×2列联表,并说明民众对“车辆限行”的态度与年龄是否有关联. 态度 年龄 赞成 不赞成 总计 中青年 中老年 总计 参考公式和数据χ2= χ2 ≤2.706 >2.706 >3.841 >6.635 A,B关联性 无关联 90% 95% 99% 解析 (1)X的取值为0,1,2,3,则 P(X=0)=·==, P(X=1)=·+·==, P(X=2)=·+·==, P(X=3)=·==, X的分布列为 X 0 1 2 3 P E(X)=0×+1×+2×+3×=1.2. (2)2×2列联表如图所示. 态度 年龄 赞成 不赞成 总计 中青年 19 11 30 中老年 7 13 20 总计 32 18 50 χ2=≤2.706, 说明民众对“车辆限行”的态度与年龄没有关联.查看更多