【数学】2019届一轮复习人教A版(文)11概率高考专题突破六学案
高考专题突破六 高考中的概率与统计问题
【考点自测】
1.在可行域内任取一点,其规则如程序框图所示,则能输出数对(x,y)的概率是( )
A.B.C.D.
答案 B
解析 由题意知,可行域为正方形,输出数对(x,y)形成的图形为图中阴影部分,
故所求概率为
P==.
2.(2017·湖南邵阳二模)假设有两个分类变量X和Y的2×2列联表如下:
Y
X
y1
y2
总计
x1
a
10
a+10
x2
c
30
c+30
总计
60
40
100
对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( )
A.a=45,c=15 B.a=40,c=20
C.a=35,c=25 D.a=30,c=30
答案 A
解析 根据2×2列联表与独立性检验可知,当与相差越大时,X与Y有关系的可能性越大,即a,c相差越大,与相差越大,故选A.
3.(2017·金华模拟)设样本数据x1,x2,…,x10的均值和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为( )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
答案 A
解析 =1,yi=xi+a,所以y1,y2,…,y10的均值为1+a,方差不变仍为4.故选A.
4.已知高一年级某班有63名学生,现要选1名学生作为标兵,每名学生被选中的概率是相同的,若“选出的标兵是女生”的概率是“选出的标兵是男生”的概率的,则这个班男生的人数为________.
答案 33
解析 根据题意,设该班的男生人数为x,则女生人数为63-x,因为每名学生被选中的概率是相同的,根据古典概型的概率计算公式知,“选出的标兵是女生”的概率是,“选出的标兵是男生”的概率是,故=×,解得x=33,故这个班男生的人数为33.
5.某单位为了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
由表中数据得线性回归方程为=x+中的=-2,预测当气温为-4℃时,用电量约为________度.
答案 68
解析 根据题意知==10,==40,因为回归直线过样本点的中心,
所以=40-(-2)×10=60,
所以当x=-4时,y=(-2)×(-4)+60=68,
所以用电量约为68度.
题型一 古典概型与几何概型
例1 (1)(2017·榆林二模)若函数f(x)=在区间[0,e]上随机取一个实数x,则f(x)的值不小于常数e的概率是( )
A. B.1-
C. D.
答案 B
解析 当0≤x<1时,f(x)
0,即a2>b2.由题意知所有的基本事件有9个,即(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),
(3,2),其中第一个数表示a的取值,第二个数表示b的取值.
满足a2>b2的有6个基本事件,即(1,0),(2,0),(2,1),(3,0),(3,1),(3,2),
所以所求事件的概率为=.
(2)(2017·青岛模拟)如图所示,四个相同的直角三角形与中间的小正方形拼成一个边长为2的大正方形,若直角三角形中较小的锐角θ=.现在向该正方形区域内随机地投掷一枚飞镖,则飞镖落在小正方形内的概率是________.
答案
解析 易知小正方形的边长为-1,故小正方形的面积为S1=(-1)2=4-2,
又大正方形的面积为S=2×2=4,故飞镖落在小正方形内的概率P===.
题型二 概率与统计的综合应用
例2 (2017·西安质检)长时间用手机上 严重影响着学生的身体健康,某校为了解A,B两班学生手机上 的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上 的时长作为样本绘制成茎叶图如图所示(图中的茎表示十位数字,叶表示个位数字).
(1)你能否估计哪个班级平均每周上 时间较长?
(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机抽取一个不超过21的数据记为b,求a>b的概率.
解 (1)A班样本数据的平均值为(9+11+14+20+31)=17,
由此估计A班学生每周平均上 时间为17小时;
B班样本数据的平均值为
(11+12+21+25+26)=19,
由此估计B班学生每周平均上 时间为19小时.
所以B班学生上 时间较长.
(2)A班的样本数据中不超过19的数据a有3个,分别为9,11,14,B班的样本数据中不超过21的数据b也有3个,分别为11,12,21.从A班和B班的样本数据中各随机抽取一个共有9种不同的情况,
分别为(9,11),(9,12),(9,21),(11,11),(11,12),(11,21),(14,11),(14,12),(14,21),
其中a>b的情况有(14,11),(14,12)2种,
故a>b的概率P=.
思维升华概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.
跟踪训练2某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图.
(1)求图中实数a的值;
(2)若该校高一年级共有640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;
(3)若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.
解 (1)由已知,得10×(0.005+0.010+0.020+a+0.025+0.010)=1,解得a=0.03.
(2)根据频率分布直方图,可知成绩不低于60分的频率为1-10×(0.005+0.010)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级期中考试数学成绩不低于60分的人数为640×0.85=544.
(3)易知成绩在[40,50)分数段内的人数为40×0.05=2,这2人分别记为A,B;成绩在[90,100]分数段内的人数为40×0.1=4,这4人分别记为C,D,E,F.若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,则所有的基本事件有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15个.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定大于10.记“这2名学生的数学成绩之差的绝对值不大于10”为事件M,则事件M
包含的基本事件有(A,B),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共7个,故所求概率P(M)=.
题型三 概率与统计案例的综合应用
例3 某校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会 学类、自然 学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会 学类的男生、女生均为45人.
(1)分别计算抽取的样本中男生、女生选择社会 学类的频率,并以统计的频率作为概率,估计实际选课中选择社会 学类的学生人数;
(2)根据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为 类的选择与性别有关?
选择自然 学类
选择社会 学类
合计
男生
女生
合计
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.500
0.400
0.250
0.150
0.100
k0
0.455
0.708
1.323
2.072
2.706
P(K2≥k0)
0.050
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
解 (1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会 学类的频率为=,
女生选择社会 学类的频率为=.
由题意,知男生总数为1200×=700,
女生总数为1200×=500,
所以估计选择社会 学类的人数为
700×+500×=600.
(2)根据统计数据,可得列联表如下:
选择自然 学类
选择社会 学类
合计
男生
60
45
105
女生
30
45
75
合计
90
90
180
则k==≈5.1429>5.024,
所以在犯错误的概率不超过0.025的前提下能认为 类的选择与性别有关.
思维升华统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
跟踪训练3近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:
(1)请将如图的列联表补充完整.若用分层抽样的方法在患三高疾病的人群中抽9人,其中女生抽多少人?
(2)为了研究患三高疾病是否与性别有关,请计算出统计量K2的观测值k,并说明是否可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.
患三高疾病
不患三高疾病
总计
男
6
30
女
总计
36
下面的临界值表供参考:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式K2=,其中n=a+b+c+d)
解 (1)完善补充列联表如下:
患三高疾病
不患三高疾病
总计
男
24
6
30
女
12
18
30
总计
36
24
60
在患三高疾病人群中抽9人,则抽取比例为=,
所以女性应该抽取12×=3(人).
(2)根据2×2列联表,则K2的观测值
k==10>7.879.
所以可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.
1.某单位对职员中的老年、中年、青年进行健康状况调查,其中老年、中年、青年职员的人数之比为k∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知在老年职员中抽取了24人,则在青年职员中抽取的人数为____________.
答案 36
解析 ∵老年、中年、青年职员的人数之比为k∶5∶3,
∴=,解得k=2,∴在青年职员中抽取的人数为120×=36.
2.在不等式组所表示的平面区域内的所有格点(横、纵坐标均为整数的点称为格点)中任取3个点,则该3点恰能作为一个三角形的3个顶点的概率为________.
答案
解析 不等式组表示的平面区域内的格点有(2,1),(2,2),(3,1),(3,2),(3,3),共5个,从中任取3个点,有10种取法,其中共线的3点不能构成三角形,有(3,1),(3,2),(3,3),1种情况,所以能够作为三角形3个顶点的情况有9种,故所求概率是.
3.(2018·唐山模拟)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80的为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90 的把握认为“生产能手与工人所在的年龄组有关”?
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
附:K2=.
解 (1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.
所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:
生产能手
非生产能手
合计
25周岁以上(含25周岁)组
15
45
60
25周岁以下组
15
25
40
合计
30
70
100
所以得k=
==≈1.79.
因为1.79<2.706.
所以没有90 的把握认为“生产能手与工人所在的年龄组有关”.
4.(2018·北京海淀区模拟)某商场在元旦举行购物抽奖促销活动,规定顾客从装有编号为0,1,2,3,4的五个相同小球的抽奖箱中一次任意摸出两个小球,若取出的两个小球的编号之和等于7,则中一等奖,等于6或5,则中二等奖,等于4,则中三等奖,其余结果为不中奖.
(1)求中二等奖的概率;
(2)求不中奖的概率.
解 (1)记“中二等奖”为事件A.
从五个小球中一次任意摸出两个小球,不同的结果有{0,1},{0,2},{0,3},{0,4},{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共10个基本事件.
记两个小球的编号之和为x,由题意可知,事件A包括两个互斥事件:x=5,x=6.
事件x=5的取法有2种,即{1,4},{2,3},
故P(x=5)==;
事件x=6的取法有1种,即{2,4},故P(x=6)=.
所以P(A)=P(x=5)+P(x=6)=+=.
(2)记“不中奖”为事件B,则“中奖”为事件,由题意可知,事件包括三个互斥事件:中一等奖(x=7),中二等奖(事件A),中三等奖(x=4).
事件x=7的取法有1种,即{3,4},故P(x=7)=;
事件x=4的取法有{0,4},{1,3},共2种,
故P(x=4)==.
由(1)可知,P(A)=.
所以P()=P(x=7)+P(x=4)+P(A)
=++=.
所以不中奖的概率为P(B)=1-P()=1-=.
5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
(1)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线;
(2)试预测加工10个零件需要的时间.
(注:b=,=-,iyi=52.5,=54)
解 (1)由表中数据得
=×(2+3+4+5)=3.5,
=×(2.5+3+4+4.5)=3.5,
∴==0.7,
=3.5-0.7×3.5=1.05.
∴=0.7x+1.05.
回归直线如图所示.
(2)将x=10代入线性回归方程,得
=0.7×10+1.05=8.05,
故预测加工10个零件需要8.05小时.
6.某校高三期中考试后,数学教师对本次全部数学成绩按1∶20进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,
同时得到如下表所示的频率分布表:
分数段(分)
[50,70)
[70,90)
[90,110)
[110,130)
[130,150]
总计
频数
b
频率
a
0.25
(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);
(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值小于或等于10的概率.
解 (1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,
∴a=0.1,b=3.
∵成绩在[90,110)范围内的频率为1-0.1-0.25-0.25=0.4,
∴成绩在[90,110)范围内的样本数为20×0.4=8.
估计这次考试全校高三学生数学成绩的及格率为
P=1-0.1-0.25=0.65.
(2)所有可能的结果为
(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,
取出的两个样本中数字之差小于或等于10的结果为(100,102),(100,106),(100,106),(102,106),(102,106),(106,106),(106,116),(106,116),(116,118),(118,128),共10个,
∴P(A)=.