【数学】2020届一轮复习(文)人教通用版高考专题突破六高考中的概率与统计问题学案
高考专题突破六 高考中的概率与统计问题
题型一 古典概型与几何概型
例1 (1)若函数f(x)= 在区间[0,e]上随机取一个实数x,则f(x)的值不小于常数e的概率是( )
A. B.1- C. D.
答案 B
解析 当0≤x<1时,f(x)
0,即a2>b2.由题意知所有的基本事件有9个,即(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),
(3,2),其中第一个数表示a的取值,第二个数表示b的取值.
满足a2>b2的有6个基本事件,即(1,0),(2,0),(2,1),(3,0),(3,1),(3,2),
所以所求事件的概率为=.
(2)如图所示,正方形BCDE和正方形ABFG的边长分别为2a和a,连接CE和CG,现将一把芝麻随机地撒在该图形中,则芝麻落在阴影部分的概率是( )
A. B. C. D.
答案 A
解析 设题图中阴影部分的面积是S,则S=S正方形ABFG+S△BCE-S△AGC,∵S正方形ABFG=a2,S△BCE=×2a×2a=2a2,S△AGC=(a+2a)×a=a2,∴S=a2,又整体区域的面积为5a2,∴芝麻落在阴影部分的概率是=,故选A.
题型二 概率与统计的综合应用
例2 (2016·全国Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1
台机器的同时应购买19个还是20个易损零件?
解 (1)当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700.
所以y与x的函数解析式为
y=(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为
(3 800×70+4 300×20+4 800×10)=4 000;
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为
(4 000×90+4 500×10)=4 050.
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
思维升华 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.
跟踪训练2 某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图.
(1)求图中实数a的值;
(2)若该校高一年级共有640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;
(3)若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,求这2
名学生的数学成绩之差的绝对值不大于10的概率.
解 (1)由已知,得10×(0.005+0.010+0.020+a+0.025+0.010)=1,解得a=0.030.
(2)根据频率分布直方图,可知成绩不低于60分的频率为1-10×(0.005+0.010)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级期中考试数学成绩不低于60分的人数为640×0.85=544.
(3)易知成绩在[40,50)分数段内的人数为40×0.05=2,这2人分别记为A,B;成绩在[90,100]分数段内的人数为40×0.1=4,这4人分别记为C,D,E,F.若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,则所有的基本事件有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15个.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定大于10.记“这2名学生的数学成绩之差的绝对值不大于10”为事件M,则事件M包含的基本事件有(A,B),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共7个,故所求概率P(M)=.
题型三 概率与统计案例的综合应用
例3 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品
不喜欢甜品
合计
南方学生
60
20
80
北方学生
10
10
20
合计
70
30
100
(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;
(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.
附:
P(χ2≥k0)
0.100
0.050
0.010
k0
2.706
3.841
6.635
χ2=.
解 (1)将2×2列联表中数据代入公式计算,得
χ2==≈4.762.
由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
(2)设这5名数学系的学生喜欢甜品的为a1,a2,不喜欢甜品的为b1,b2,b3,从5名数学系的学生中任取3人的一切可能结果所组成的基本事件空间
Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.
Ω由10个基本事件组成,且这些基本事件出现是等可能的.
用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)},A由7个基本事件组成,因而P(A)=.
思维升华 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
跟踪训练3 某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.
(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;
(2)根据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?
选择自然科学类
选择社会科学类
合计
男生
女生
合计
附:χ2=,其中n=a+b+c+d.
P(χ2≥k0)
0.500
0.400
0.250
0.150
0.100
k0
0.455
0.708
1.323
2.072
2.706
P(χ2≥k0)
0.050
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
解 (1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会科学类的频率为=,
女生选择社会科学类的频率为=.
由题意,知男生总数为1 200×=700,
女生总数为1 200×=500,
所以估计选择社会科学类的人数为
700×+500×=600.
(2)根据统计数据,可得列联表如下:
选择自然科学类
选择社会科学类
总计
男生
60
45
105
女生
30
45
75
总计
90
90
180
则χ2==≈5.142 9>5.024,
所以在犯错误的概率不超过0.025的前提下能认为科类的选择与性别有关.
1.在不等式组所表示的平面区域内的所有格点(横、纵坐标均为整数的点称为格点)中任取3个点,则该3点恰能作为一个三角形的3个顶点的概率为________.
答案
解析 不等式组表示的平面区域内的格点有(2,1),(2,2),(3,1),(3,2),(3,3),共5个,从中任取3个点,有10种取法,其中共线的3点不能构成三角形,有(3,1),(3,2),(3,3) 1种情况,所以能够作为三角形3个顶点的情况有9种,故所求概率是.
2.如图所示,四个相同的直角三角形与中间的小正方形拼成一个边长为2的大正方形,且直角三角形中较小的锐角θ=.现在向该正方形区域内随机地投掷一枚飞镖,则飞镖落在小正方形内的概率是________.
答案
解析 易知小正方形的边长为-1,故小正方形的面积为S1=(-1)2=4-2,
又大正方形的面积为S=2×2=4,故飞镖落在小正方形内的概率P===.
3.(2018·大连模拟)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80的为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
P(χ2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
附:χ2=.
解 (1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.
所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)组工人有60×0.005×10=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.005×10=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×(0.02+0.005)×10=15(人),“25周岁以下组”中的生产能手有40×(0.032 5+0.005)×10=15(人),
据此可得2×2列联表如下:
生产能手
非生产能手
总计
25周岁以上(含25周岁)组
15
45
60
25周岁以下组
15
25
40
总计
30
70
100
所以得χ2=
==≈1.79.
因为1.79<2.706.
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
4.某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,
得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损.
(1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;
(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并绘制了如下对照表:
年龄x
20
30
40
50
周均学习成语知识时间y
2.5
3
4
4.5
根据表中数据,试求回归直线方程 = x+ ,并预测年龄为55岁的观众周均学习成语知识的时间.
参考公式: =, =- .
解 (1)设被污损的数字为a,则a有10种情况.
由88+89+90+91+92>83+83+87+90+a+99,
得a<8,
∴有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数,
所求概率为=.
(2)由表中数据,计算得=35,=3.5,
===0.07,
=- =3.5-0.07×35=1.05.
∴ =0.07x+1.05.
当x=55时, =4.9.
即预测年龄为55岁的观众周均学习成语知识的时间为4.9小时.
5.长沙某购物中心在开业之后,为了解消费者购物金额的分布情况,在当月的电脑消费小票中随机抽取n张进行统计,将结果分成6组,分别是[0,100),[100,200),[200,300),[300,400),[400,500),[500,600],制成如图所示的频率分布直方图(假设消费金额均在[0,600]元的区间内).
(1)若按分层抽样的方法在消费金额为[400,600]元区间内抽取6张电脑小票,再从中任选2张,求这2张小票均来自[400,500)元区间的概率;
(2)为做好五一劳动节期间的商场促销活动,策划人员设计了两种不同的促销方案.
方案一:全场商品打八折.
方案二:全场购物满100元减20元,满300元减80元,满500元减120元,以上减免只取最高优惠,不重复减免,利用直方图的信息分析:哪种方案优惠力度更大,并说明理由(直方图中每个小组取中间值作为该组数据的替代值).
解 (1)由题意知,在[400,500)元区间内抽4张,分别记为a,b,c,d,在[500,600]元区间内抽2张,分别记为E,F,
设“2张小票均来自[400,500)元区间”为事件A,
从中任选2张,有以下选法:ab,ac,ad,aE,aF,bc,bd,bE,bF,cd,cE,cF,dE,dF,EF,共15种.
其中,2张小票均来自[400,500)元区间的有ab,ac,ad,bc,bd,cd,共6种,
∴P(A)=.
(2)方法一 由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05.
方案一:购物的平均费用为0.8×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+
550×0.05)=0.8×275=220(元).
方案二:购物的平均费用为50×0.1+130×0.2+230×0.25+270×0.3+370×0.1+430×0.05=228(元).
∵220<228,∴方案一的优惠力度更大.
方法二 由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05,
方案一:平均优惠金额为0.2×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+550×0.05)=0.2×275=55(元).
方案二:平均优惠金额为20×(0.2+0.25)+80×(0.3+0.1)+120×0.05=47(元).
∵55>47,∴方案一的优惠力度更大.
6.某校高三期中考试后,数学教师对本次全部数学成绩按1∶30进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:
分数段(分)
[50,70)
[70,90)
[90,110)
[110,130)
[130,150]
总计
频数
b
频率
a
0.25
(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);
(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值大于10的概率.
解 (1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,
∴a=0.1,b=3.
成绩在[70,90)内的样本数为0.25×20=5.
∴成绩在[90,110)内的样本数为20-2-5-5=8.
估计这次考试全校高三学生数学成绩的及格率为
P=1-0.1-0.25=0.65.
(2)所有可能的结果为
(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,
取出的两个样本中数字之差的绝对值大于10的结果为(100,116),(100,118),(100,128),(102,116),(102,118),(102,128),(106,118),(106,128),(106,118),(106,128),(116,128),共11个,
∴P(A)=.