【数学】2018届一轮复习人教A版第一部分专题四概率与统计学案
[研高考·明考点]
年份
卷别
小题考查
大题考查
2017
卷Ⅰ
T2·用样本的数字特征估计总体的数字特征
T19·相关系数的计算,均值、标准差公式的应用
T4·数学文化,有关面积的几何概型
卷Ⅱ
T11·古典概型的概率计算
T19·频率分布直方图,频率估计概率,独立性检验
卷Ⅲ
T3·折线图的识别与应用
T18·频数分布表,用频率估计概率
2016
卷Ⅰ
T3·古典概型求概率
T19·柱状图、频数、平均值,用样本估计总体
卷Ⅱ
T8·与时间有关的几何概型求概率
T18·频数、频率估计概率,平均值的应用
卷Ⅲ
T4·统计图表的应用
T18·变量间的线性相关关系,回归方程的求解与应用
T5·古典概型求概率
2015
卷Ⅰ
T4·新定义、古典概型求概率
T19·散点图,求回归方程及函数的最值
卷Ⅱ
T3·条形图、两个变量的相关性
T18·频率分布直方图,方差,用频率估计概率
[析考情·明重点]
小题考情分析
大题考情分析
常考点
1.用样本估计总体(3年3考)
2.古典概型与几何概型(3年6考)
常考点
高考对概率、统计这部分在解答题中的考查综合性较强,将概率、统计的有关知识(特别是直方图、样本数字特征等)有机地交融在一起,有时仅考查利用统计知识(特别是线性回归方程)解决实际问题,题型主要有:
1.概率与用样本估计总体交汇问题
2.回归分析与统计的交汇问题
偶考点
变量间的相关关系、统计案例
偶考点
独立性检验与统计的交汇问题
第一讲 小题考法——概率、统计、统计案例
考点(一)
主要考查用统计图表估计总体以及利用样本的数字特征估计总体,且以统计图表的考查为主.
用样本估计总体
[典例感悟]
[典例] (1)(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0 ℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20 ℃的月份有5个
(2)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( )
A.①③ B.①④
C.②③ D.②④
(3)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.100,10 B.200,10
C.100,20 D.200,20
[解析] (1)由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;平均最高气温高于20℃的月份有2个,故D错误.
(2)∵甲==29,
乙==30,
∴甲<乙.
又s==,
s==2,
∴s甲>s乙.故可判断结论①④正确.
(3)易知样本容量为(3 500+4 500+2 000)×2%=200;抽取的高中生人数为2 000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.
[答案] (1)D (2)B (3)D
[方法技巧]
1.方差的计算与含义
(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算.
(2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大.
2.与频率分布直方图有关问题的常见类型及解题策略
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可以求出其他数据.
(2)已知频率分布直方图,求某个范围内的数据.可利用图形及某范围结合求解.
[演练冲关]
1.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解析:选A 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A错误.由图可知,B、C、D正确.
2.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
解析:选A 由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以×[56+62+65+74+(70+x)]=×(59+61+67+65+78),解得x=3.
3.某电子商务公司对10 000名网络购物者2017年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
解析:(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.
答案:(1)3 (2)6 000
考点(二)
主要考查线性回归方程的求解及应用,对独立性检验的考查较少.
变量间的相关关系、统计案例
[典例感悟]
[典例] (1)(2017·兰州诊断)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
m
70
根据表中提供的全部数据,用最小二乘法得出y与x的线性回归方程为=6.5x+17.5,则表中m的值为( )
A.45 B.50 C.55 D.60
(2)(2017·南昌模拟)设某中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据样本数据(xi,yi)(i=1,2,3,…,n),用最小二乘法近似得到回归直线方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正线性相关关系
B.回归直线过样本点的中心(,)
C.若该中学某高中女生身高增加1 cm,则其体重约增加0.85 kg
D.若该中学某高中女生身高为160 cm,则可断定其体重必为50.29 kg
[解析] (1)==5,
==.
∵当=5时,=6.5×5+17.5=50,
∴=50,解得m=60.
(2)因为回归直线方程=0.85x-85.71中x的系数为0.85>0,因此y与x具有正线性相关关系,所以选项A正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(,),所以选项B正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,所以若该中学某高中女生身高增加1 cm,则其体重约增加0.85 kg,所以选项C正确,选项D不正确.
[答案] (1)D (2)D
[方法技巧]
求回归直线方程的关键及实际应用
(1)求回归直线方程的关键是正确理解,的计算公式和准确地求解.
(2)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
[演练冲关]
1.(2018届高三·湖北七市(州)联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如表所示(单位:万元):
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由上表可得回归方程为=10.2x+,据此模型,预测广告费为10万元时的销售额约为( )
A.101.2万元 B.108.8万元
C.111.2万元 D.118.2万元
解析:选C 根据统计数据表,可得=×(2+3+4+5+6)=4,=×(29+41+50+59+71)=50,而回归直线=10.2x+经过样本点的中心(4,50),∴50=10.2×4+,解得=9.2,∴回归方程为=10.2x+9.2.当x=10时,y=10.2×10+9.2=111.2,故选C.
2.(2018届高三·湘中名校联考)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果k>3.841,那么有把握认为“X和Y有关系”的百分比为( )
P(K2>k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.5% B.75%
C.99.5% D.95%
解析:选D 由表中数据可得,当k>3.841时,有0.05的机率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的机率,也就是有95%的把握认为变量之间有关系,故选D.
考点(三)
主要考查古典概型及几何概型概率公式的应用.
古典概型与几何概型
[典例感悟]
[典例] (1)(2016·全国卷Ⅲ)
小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M,I,N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( )
A. B.
C. D.
(2)(2017·全国卷Ⅰ)如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )
A. B.
C. D.
(3)(2018届高三·湖北五市十校联考)在矩形ABCD中,AD=1,AB=2AD,在CD上任取一点P,△ABP的最大边是AB的概率为( )
A. B.
C.-1 D.-1
[解析] (1)∵Ω={(M,1),(M,2),(M,3),(M,4),(M,5),(I,1),(I,2),(I,3),(I,4),(I,5),(N,1),(N,2),(N,3),(N,4),(N,5)},
∴事件总数有15种.
∵正确的开机密码只有1种,∴P=.
(2)不妨设正方形的边长为2,则正方形的面积为4,正方形的内切圆的半径为1,面积为π.由题意,得S黑=S圆=,故此点取自黑色部分的概率P==.
(3)分别以A,B为圆心,AB的长为半径画弧,交CD于P1,P2,则当P在线段P1P2间运动时,能使得△ABP的最大边是AB,在Rt△P2BC中,BP2=2,BC=1,故CP2=,DP2=2-,同理CP1=2-,所以P1P2=2-(2-)×2=2-2,所以=-1,即△ABP的最大边是AB的概率为-1.
[答案] (1)C (2)B (3)D
[方法技巧]
1.利用古典概型求概率的关键及注意点
(1)正确求出基本事件总数和所求事件包含的基本事件总数.
(2)对于较复杂的题目条件计数时要正确分类,分类时应不重不漏.
2.几何概型的适用条件及求解关键
(1)当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解.
(2)求解关键是寻找构成试验的全部结果的区域和事件发生的区域,有时需要设出变量,在坐标系中表示所需要的区域.
[演练冲关]
1.(2018届高三·湘中名校联考)从集合A={-2,-1,2}中随机选取一个数记为a,从集合B={-1,1,3}中随机选取一个数记为b,则直线ax-y+b=0不经过第四象限的概率为( )
A. B. C. D.
解析:选A 从集合A,B中随机选取一个数后组合成的数对有(-2,-1),(-2,1),(-2,3),(-1,-1),(-1,1),(-1,3),(2,-1),(2,1),(2,3),共9对,要使直线ax-y+b=0不经过第四象限,则需a≥0,b≥0,共有2对满足,所以所求概率P=,故选A.
2.(2017·长春质检)如图,扇形AOB的圆心角为120°,点P在弦AB上,且AP=AB,延长OP交弧AB于点C,现向扇形AOB内投一点,则该点落在扇形AOC内的概率为( )
A. B. C. D.
解析:选A 设OA=3,则AB=3,AP=,由余弦定理可求得OP=,则∠AOP=30°,所以扇形AOC的面积为,又扇形AOB的面积为3π,从而所求概率为=.
3.(2017·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为( )
A. B. C. D.
解析:选D 记两次取得卡片上的数字依次为a,b,则一共有25个不同的数组(a,b),其中满足a>b
的数组共有10个,分别为(2,1),(3,1),(3,2),(4,1),(4,2),(4,3),(5,1),(5,2),(5,3),(5,4),因此所求的概率P==.
4.(2017·天津高考)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为( )
A. B.
C. D.
解析:选C 从5支彩笔中任取2支不同颜色的彩笔,有10种不同取法:(红,黄),(红,蓝),(红,绿),(红,紫),(黄,蓝),(黄,绿),(黄,紫),(蓝,绿),(蓝,紫),(绿,紫).而取出的2支彩笔中含有红色彩笔的取法有(红,黄),(红,蓝),(红,绿),(红,紫),共4种,故所求概率P==.
5.(2017·江苏高考)记函数f(x)=的定义域为D.在区间[-4,5]上随机取一个数x,则x∈D的概率是________.
解析:由6+x-x2≥0,解得-2≤x≤3,则D=[-2,3],则所求概率P==.
答案:
[必备知能·自主补缺]
(一) 主干知识要记牢
1.概率的计算公式
(1)古典概型的概率计算公式
P(A)=;
(2)互斥事件的概率计算公式
P(A∪B)=P(A)+P(B);
(3)对立事件的概率计算公式
P()=1-P(A);
(4)几何概型的概率计算公式
P(A)=.
2.抽样方法
(1)三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随
机抽样
从总体中逐个抽取
总体中的个数较少
是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等
系统
抽样
将总体均分成几部分,按事先确定的规则,在各部分抽取
在起始部分抽样时,采用简单随机抽样
总体中的个数比较多
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时,采用简单随机抽样或者系统抽样
总体由差异明显的几部分组成
(2)分层抽样中公式的运用
①抽样比==;
②层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量.
3.用样本数字特征估计总体
(1)众数、中位数、平均数
定义
特点
众数
在一组数据中出现次数最多的数据
体现了样本数据的最大集中点,不受极端值的影响,而且不唯一
中位数
将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
中位数不受极端值的影响,仅利用了排在中间数据的信息,只有一个
平均数
样本数据的算术平均数
与每一个样本数据有关,只有一个
(2)方差和标准差
方差和标准差反映了数据波动程度的大小.
①方差:
s2=[(x1-)2+(x2-)2+…+(xn-)2];
②标准差:
s= .
(二) 二级结论要用好
1.频率分布直方图的3个结论
(1)小长方形的面积=组距×=频率.
(2)各小长方形的面积之和等于1.
(3)小长方形的高=,所有小长方形高的和为.
2.与平均数和方差有关的4个结论
(1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a;
(2)数据x1,x2,…,xn与数据x=x1+a,x=x2+a,…,x=xn+a的方差相等,即数据经过平移后方差不变;
(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2;
(4)s2=(xi-)2=-2,即各数平方的平均数减去平均数的平方.
求s2时,可根据题目的具体情况,结合题目给出的参考数据,灵活选用公式形式.
3.线性回归方程
线性回归方程=x+一定过样本点的中心(,).
[针对练1] (2018届高三·惠州调研)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):
零件数x/个
10
20
30
40
50
加工时间y/分钟
62
68
75
81
89
由最小二乘法求得回归方程=0.67x+,则的值为________.
解析:因为==30,
==75,
所以回归直线一定过样本点的中心(30,75),
将其代入=0.67x+,可得75=0.67×30+,解得=54.9.
答案:54.9
(三) 易错易混要明了
1.应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.
2.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.
3.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
4.在求解几何概型的概率时,要注意分清几何概型的类别(
体积型、面积型、长度型、角度型等).
[针对练2] 一种小型电子游戏的主界面是半径为r的圆,点击圆周上的点A后,该点在圆周上随机转动,最后落在点B处,当线段AB的长不小于r时自动播放音乐,则一次转动能播放音乐的概率为________.
解析:如图,当|AB|≥r,即点B落在劣弧CC′上时才能播放音乐.又劣弧CC′所对应的圆心角为,所以一次转动能播放音乐的概率为=.
答案:
[课时跟踪检测]
A组——12+4提速练
一、选择题
1.(2017·南昌模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n=( )
A.860 B.720
C.1 020 D.1 040
解析:选D 根据分层抽样方法,得×81=30,解得n=1 040.
2.(2018届高三·西安八校联考)某班对八校联考成绩进行分析,利用随机数表法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是( )
(注:下表为随机数表的第8行和第9行)
第8行
第9行
A.07 B.25
C.42 D.52
解析:选D 依题意得,依次选出的个体分别为12,34,29,56,07,52,…因此选出的第6个个体是52,故选D.
3.(2017·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )
A.5 B.7
C.10 D.50
解析:选D 根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50,故选D.
4.(2016·全国卷Ⅱ)从区间[0,1]随机抽取2n个数x1,x2,…,xn,y1,y2,…,yn,构成n个数对(x1,y1),(x2,y2),…,(xn,yn),其中两数的平方和小于1的数对共有m个,则用随机模拟的方法得到的圆周率π的近似值为( )
A. B.
C. D.
解析:选C 因为x1,x2,…,xn,y1,y2,…,yn都在区间[0,1]内随机抽取,所以构成的n个数对(x1,y1),(x2,y2),…,(xn,yn)都在边长为1的正方形OABC内(包括边界),如图所示.若两数的平方和小于1,则对应的数对在扇形OAC内(不包括扇形圆弧上的点所对应的数对),故在扇形OAC内的数对有m个.用随机模拟的方法可得=,即=,所以π=.
5.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
解析:选D 因为所有样本点都在直线y=x+1上,所以这组样本数据完全正相关,故其相关系数为1.
6.甲、乙两位歌手在“中国新歌声”选拔赛中,5次得分情况如图所示.记甲、乙两人的平均得分分别为甲,乙,则下列判断正确的是( )
A.甲<乙,甲比乙成绩稳定
B.甲<乙,乙比甲成绩稳定
C.甲>乙,甲比乙成绩稳定
D.甲>乙,乙比甲成绩稳定
解析:选B 甲==85,
乙==86,
s=[(76-85)2+(77-85)2+(88-85)2+(90-85)2+(94-85)2]=52,
s=[(75-86)2+(88-86)2+(86-86)2+(88-86)2+(93-86)2]=35.6,
所以甲<乙,s>s,故乙比甲成绩稳定,故选B.
7.(2017·洛阳统考)若θ∈[0,π],则sin>成立的概率为( )
A. B. C. D.1
解析:选B 依题意,当θ∈[0,π]时,θ+∈,由sin>得≤θ+<,即0≤θ<.因此,所求的概率为=.
8.将一枚骰子先后抛掷两次,并记朝上的点数分别为m,n,m为2或4时,m+n>5的概率为( )
A. B. C. D.
解析:选D 依题意得,先后抛掷两次骰子所得的点数对(m,n)为:(1,1),(1,2),(1,3),(1,4),(1,5),…,(6,5),(6,6),共有36组,其中当m=2或4时,相应的点数对(m,n)共有12组.当m=2时,满足m+n>5,即n>3的点数对(m,n)共有3组;当m=4时,满足m+n>5,即n>1的点数对(m,n)共有5组,因此所求的概率为=.
9.(2017·惠州调研)
齐王与田忌赛马,田忌的上等马优于齐王的中等马,劣于齐王的上等马,田忌的中等马优于齐王的下等马,劣于齐王的中等马,田忌的下等马劣于齐王的下等马,现从双方的马匹中各随机选一匹进行一场比赛,则田忌的马获胜的概率为( )
A. B. C. D.
解析:选A 设田忌的上、中、下三个等次的马分别为A,B,C,齐王的上、中、下三个等次的马分别为a,b,c,从双方的马匹中各随机选一匹进行一场比赛的所有可能结果有Aa,Ab,Ac,Ba,Bb,Bc,Ca,Cb,Cc,共9种,田忌马获胜有Ab,Ac,Bc,共3种,所以田忌的马获胜的概率为.
10.(2018届高三·西安八校联考)在平面区域{(x,y)|0≤x≤1,1≤y≤2}内随机投入一点P,则点P的坐标(x,y)满足y≤2x的概率为( )
A. B. C. D.
解析:选D 依题意得,不等式组表示的平面区域为如图所示的正方形ABCD的内部(含边界),其面积为1×1=1,不等式组表示的平面区域为图中阴影部分(含边界),其面积为××1=,因此所求的概率为.
11.(2018届高三·广东五校联考)在区间[-1,1]上随机取一个数k,使直线y=k(x+3)与圆x2+y2=1相交的概率为( )
A. B. C. D.
解析:选C 若直线y=k(x+3)与圆x2+y2=1相交,则圆心到直线的距离d=<1,解得-
m
C.n=m D.不能确定
解析:选A 由题意可得,=,
=,
则==·+·=·+·=a+(1-a),所以=a,=1-a,又00,且a≠1),在集合,,,3,4,5,6,7中任取一个数a,则f(3a+1)>f(2a)>0的概率为________.
解析:∵3a+1>2a,f(3a+1)>f(2a),f(x)=logax-loga8,∴a>1.又f(2a)>0,∴2a>8,即a>4,符合条件的a的值为5,6,7,故所求概率为.
答案:
15.(2017·张掖模拟)在区间[0,π]上随机取一个数θ,则使≤sin θ+cos θ≤2成立的概率为________.
解析:由≤sin θ+cos θ≤2,得≤sinθ+≤1,结合θ∈[0,π],得满足条件的θ∈,∴使≤sin θ+cos θ≤2成立的概率为=.
答案:
16.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为甲,乙,则甲>乙的概率是________.
解析:设污损处的数字为m,由(84+85+87+90+m+99)=(86+87+91+92+94),得m=5,即当m=5时,甲、乙两人的平均成绩相等.m的取值有0,1,2,3,…,9,共10种可能,其中,当m=6,7,8,9时,甲>乙,故所求概率为=.
答案:
B组——能力小题保分练
1.(2017·成都模拟)两位同学约定下午5:30~6:00在图书馆见面,且他们5:30~6:00之间到达的时刻是等可能的,先到的同学须等待,若15分钟后还未见面便离开.则这两位同学能够见面的概率是( )
A. B. C. D.
解析:选D 如图所示,以5:30作为原点O,建立平面直角坐标系,设两位同学到达的时刻分别为x,y,设事件A表示两位同学能够见面,所构成的区域为A={(x,y)||x-y|≤15},即图中阴影部分,根据几何概型概率计算公式得P(A)==.
2.(2017·广州模拟)四个人围坐在一张圆桌旁,每个人面前放着一枚完全相同的硬币,所有人同时抛出自己的硬币.若硬币正面朝上,则这个人站起来;若硬币正面朝下,则这个人继续坐着.那么没有相邻的两个人站起来的概率为( )
A. B. C. D.
解析:选B 四个人按顺序围成一桌,同时抛出自己的硬币抛出的硬币正面记为0,反面记为1,则总的基本事件为(0,0,0,0),(0,0,0,1),(0,0,1,0),(0,0,1,1),(0,1,0,0),(0,1,0,1),(0,1,1,0),(0,1,1,1),(1,0,0,0),(1,0,0,1),(1,0,1,0),(1,0,1,1),(1,1,0,0)(1,1,0,1),(1,1,1,0),(1,1,1,1),共有16种情况.若四个人同时坐着,有1种情况;若三个人坐着,一个人站着,有4种情况;若两个人坐着,两个人站着,此时没有相邻的两个人站起来有2种情况.所以没有相邻的两个人站起来的情况共有1+4+2=7种,故所求概率为.
3.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是( )
A.13,12 B.13,13
C.12,13 D.13,14
解析:选B 设等差数列{an}的公差为d(d≠0),a3=8,a1a7=a=64,即(8-2d)(8+4d)=64,又d≠0,所以d=2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为==13,中位数为=13.
4.根据如下样本数据:
x
3
4
5
6
7
y
4.0
a-5.4
-0.5
0.5
b-0.6
得到的回归方程为=bx+a.若样本点的中心为(5,0.9),则当x每增加1个单位时,y就( )
A.增加1.4个单位 B.减少1.4个单位
C.增加7.9个单位 D.减少7.9个单位
解析:选B 依题意得,=0.9,故a+b=6.5;①
又样本点的中心为(5,0.9),故0.9=5b+a,②
联立①②,解得b=-1.4,a=7.9,则=-1.4x+7.9,
所以当x每增加1个单位时,y就减少1.4个单位.
5.正六边形ABCDEF的边长为1,在正六边形内随机取点M,则使△MAB的面积大于的概率为________.
解析:如图所示,作出正六边形ABCDEF,其中心为O,过点O作OG⊥AB,垂足为G,则OG的长为中心O到AB边的距离.
易知∠AOB==60°,且OA=OB,所以△AOB是等边三角形,所以OA=OB=AB=1,OG=OA·sin 60°=1×=,即对角线CF上的点到AB的距离都为.
设△MAB中AB边上的高为h,则由S△MAB=×1×h>,解得h>.
所以要使△MAB的面积大于,只需满足h>,即需使M位于CF
的上方.故由几何概型得,△MAB的面积大于的概率P==.
答案:
6.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为________.
解析:总体容量为6+12+18=36.当样本容量为n时,由题意可知,系统抽样的抽样距为,分层抽样的抽样比是,则采用分层抽样法抽取的乒乓球运动员人数为6×=,篮球运动员人数为12×=,足球运动员人数为18×=,可知n应是6的倍数,36的约数,故n=6,12,18.当样本容量为n+1时,剔除1个个体,此时总体容量为35,系统抽样的抽样距为,因为必须是整数,所以n只能取6,即样本容量n为6.
答案:6
第二讲 大题考法——概率与统计
题型(一)
主要考查随机事件的概率、古典概型、频率分布直方图、茎叶图等的应用.
概率与用样本估计总体的交汇问题
[典例感悟]
[典例1] (2016·全国卷Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
[解] (1)当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700,所以y与x的函数解析式为
y=(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800(元),20台的费用为4 300(元),10台的费用为4 800(元),因此这100台机器在购买易损零件上所需费用的平均数为(3 800×70+4 300×20+4 800×10)=4 000(元).
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000(元),10台的费用为4 500(元),因此这100台机器在购买易损零件上所需费用的平均数为(4 000×90+4 500×10)=4 050(元).比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
[备课札记]
[方法技巧]
解决概率与用样本估计总体交汇问题的方法
[演练冲关]
1.(2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃
)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
解:(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.
(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y=6×450-4×450=900;
若最高气温位于区间[20,25),
则Y=6×300+2(450-300)-4×450=300;
若最高气温低于20,则Y=6×200+2(450-200)-4×450=-100.所以Y的所有可能值为900,300,-100.
Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为=0.8,因此Y大于零的概率的估计值为0.8.
题型(二)
主要考查线性回归方程的求解与应用.
回归分析与统计的交汇问题
[典例感悟]
[典例2] (2016·全国卷Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t
的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
参考数据:i=9.32,iyi=40.17, =0.55,≈2.646.
参考公式:相关系数r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为=,=- .
[解] (1)由折线图中的数据和附注中的参考数据得=4,(ti-)2=28, =0.55,(ti-)(yi-)=iyi-i=40.17-4×9.32=2.89,所以r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得==≈0.103.=- ≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
[备课札记]
[方法技巧]
破解回归分析问题的关键
(1)会依据表格及公式=,=-求线性回归方程中的参数的值,注意不要代错公式;
(2)已知变量的某个值去预测相应预报变量时,只需把该值代入回归方程=x+中.
[演练冲关]
2.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得=i=9.97,s==≈0.212, ≈18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在(-3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在(-3s,+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,…,n)的相关系数
r=,≈0.09.
解:(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为r==≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)①由于=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(-3s,+3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为(16×9.97-9.22)=10.02,所以这条生产线当天生产的零件尺寸的均值的估计值为10.02,=16×0.2122+16×9.972≈1 591.134,剔除第13个数据,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,所以这条生产线当天生产的零件尺寸的标准差的估计值为≈0.09.
题型(三)
主要考查抽样、随机事件、古典概型、频率分布直方图的应用以及K2的计算与应用.
独立性检验与概率、统计的交汇问题
[典例感悟]
[典例3] (2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
K2=.
[解] (1)旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
根据表中数据及K2的计算公式得,
K2=≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
[备课札记]
[方法技巧]
(1)假设两个分类变量X与Y无关系;
(2)找相关数据,列出2×2列联表;
(3)由公式K2=(其中n=a+b+c+d)计算出K2的观测值;
(4)将K2的观测值与临界值进行对比,进而得出统计推断,这些临界值,在考题中常会附在题后.
[演练冲关]
3.(2017·长春质检)为了打好脱贫攻坚战,某贫困县农科院针对玉米种植情况进行调研,力争有效地改良玉米品种,为农民提供技术支援.现对已选出的一组玉米的茎高进行统计,获得茎叶图如图(单位:厘米),设茎高大于或等于180厘米的玉米为高茎玉米,否则为矮茎玉米.
(1)列出2×2列联表,并判断是否可以在犯错误的概率不超过1%的前提下,认为抗倒伏与玉米矮茎有关?
(2)为了改良玉米品种,现采用分层抽样的方法从抗倒伏的玉米中抽出5株,再从这5株玉米中选取2株进行杂交试验,则选取的植株均为矮茎的概率是多少?
附:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解:(1)根据统计数据得2×2列联表如下:
抗倒伏
易倒伏
总计
矮茎
15
4
19
高茎
10
16
26
总计
25
20
45
由于K2的观测值k=≈7.287>6.635,因此可以在犯错误的概率不超过1%的前提下,认为抗倒伏与玉米矮茎有关.
(2)按照分层抽样的方法抽到的高茎玉米有2株,设为A,B,抽到的矮茎玉米有3株,设为a,b,c,从这5株玉米中取出2株的取法有AB,Aa,Ab,Ac,Ba,Bb,Bc,ab,ac,bc,共10种,其中均为矮茎的选取方法有ab,ac,bc,共3种,因此选取的植株均为矮茎的概率是.
概率问题重在“辨”——辨析、辨型
[循流程思维——入题快]
概率问题的求解关键是辨别它的概率模型,只要找到模型,问题便迎刃而解.而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途.另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件.
[按流程解题——快又准]
[典例] (2016·全国卷Ⅱ)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
(1)记A为事件:“一续保人本年度的保费不高于基本保费”,求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求P(B)的估计值;
(3)求续保人本年度平均保费的估计值.
❶辨析:判断事件A包括试验发生的情况为:一年内出险次数小于2,即出险次数为0和1两种情况
❷辨型:该问题为求随机事件的概率,利用互斥事件的关系求解
❸辨析:判断事件B所包含的基本事件
❹辨型:随机事件的概率,并代入公式求解
[解题示范]
(1)事件A发生当且仅当一年内出险次数小于2.❶
由所给数据知,一年内出险次数小于2的频率为=0.55,
故P(A)的估计值为0.55.❷
(2)事件B发生当且仅当一年内出险次数大于1且小于4.❸
由所给数据知,一年内出险次数大于1且小于4的频率为=0.3,故P(B)的估计值为0.3.❹
(3)由所给数据得
保费
0.85a
a
1.25a
1.5a
1.75a
2a
频率
0.30
0.25
0.15
0.15
0.10
0.05
调查的200名续保人的平均保费为0.85a×0.30+a×0.25+1.25a×0.15+1.5a×0.15+1.75a×0.10+2a×0.05=1.192 5a.
因此,续保人本年度平均保费的估计值为1.192 5a.
[思维升华] 往往与实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
[应用体验]
(2018届高三·湖北七市(州)联考)某校举行运动会,其中三级跳远的成绩在8.0米(四舍五入,精确到0.1米)以上的进入决赛,把所得数据进行整理后,分成6组,画出频率分布直方图的一部分(如图),已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30,第6小组的频数是7.
(1)求进入决赛的人数;
(2)经过多次测试发现,甲的成绩均匀分布在8~10米之间,乙的成绩均匀分布在9.5~10.5米之间,现甲、乙各跳一次,求甲比乙跳得远的概率.
解:(1)第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)=0.14,则总人数为=50.易知第4,5,6组的学生均进入决赛,人数为(0.28+0.30+0.14)×50=36,即进入决赛的人数为36.
(2)设甲、乙各跳一次的成绩分别为x,y米,则作出不等式组表示的平面区域如图中长方形ABCD所示,设事件A表示“甲比乙跳得远”,则x>y,满足的区域如图中阴影部分所示.由几何概型得P(A)==,即甲比乙跳得远的概率为.
1.汽车发动机排量可以分为两大类,高于1.6 L的称为大排量,否则称为小排量.加油时,有92号与95号两种汽油可代选择.某汽车网站的注册会员中,有300名会员参与了网络调查,结果如下:
汽车排量
加油类型
小排量
大排量
92号
160
96
95号
20
24
附:K2=
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
(1)根据此次调查,是否有95%的把握认为该网站会员给汽车加油时进行的型号选择与汽车排量有关?
(2)从调查的大排量汽车中按“加油类型”用分层抽样的方法抽取一个容量为5的样本,将该样本看成一个整体,从中任意抽取3辆汽车,求这3辆汽车都是“加92号汽油”的概率.
解:(1)∵K2=≈4.545>3.841,
∴有95%的把握认为该网站会员给汽车加油时进行的型号选择与汽车排量有关.
(2)由题意可知,抽出的5辆汽车中加92号汽油的有4辆,分别记为A1,A2,A3,A4;加95号汽油的有1辆,记为B.
从已经抽出的5辆汽车中抽取3辆,有:
{B,A1,A2},{B,A1,A3},{B,A1,A4},{B,A2,A3},{B,A2,A4},{B,A3,A4},{A1,A2,A3},{A1,A2,A4},{A1,A3,A4},{A2,A3,A4},共计10种结果,
满足条件的有:{A1,A2,A3},{A1,A2,A4},{A1,A3,A4},{A2,A3,A4},共计4种结果.
由古典概型的概率计算公式可得所求概率为=.
2.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5.
所以总体中分数在区间[40,50)内的人数估计为
400×=20.
(3)由题意可知,样本中分数不小于70的学生人数为
(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
3.(2017·武昌调研)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.
(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.
由以上样本的频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.
(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,
所以2.5≤x<3.
由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
4.某地电影院为了了解当地影迷对快要上映的一部电影的票价的看法,进行了一次调研,得到了票价x(单位:元)与渴望观影人数y(单位:万人)的结果如下表:
x(单位:元)
30
40
50
60
y(单位:万人)
4.5
4
3
2.5
(1)若y与x具有较强的相关关系,试分析y与x之间是正相关还是负相关;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;
(3)根据(2)中求出的线性回归方程,预测票价定为多少元时,能获得最大票房收入.
参考公式:=,=-.
解:(1)由表中数据易知,y随x的增大而减小,故y与x之间是负相关.
(2)由表中数据可得=45,=3.5,
iyi-4=-35,-42=500,
则==-0.07,=3.5+0.07×45=6.65,
所以,所求线性回归方程为=-0.07x+6.65.
(3)根据(2)中的线性回归方程,若票价为x元,则渴望观影人数约为(-0.07x+6.65)万人,可预测票房收入为z=x(-0.07x+6.65)=-0.07x2+6.65x=-0.07(x-47.5)2+157.937 5,易得,当x=47.5时,z取得最大值,即票价定为47.5元时,能获得最大票房收入.
5.某高中学校高一年级学生某次身体素质体能测试的原始成绩采用百分制,已知所有这些学生的原始成绩均分布在[50,100]内,发布成绩使用等级制.各等级划分标准见图表.规定:A,B,C三级为合格等级,D为不合格等级.
分数
85分及以上
70分到84分
60分到69分
60分以下
等级
A
B
C
D
为了解该校高一年级学生身体素质情况,从中抽取了n名学生的原始成绩作为样本进行统计.按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图如图①所示,样本中原始成绩在80分及以上的所有数据的茎叶图如图②所示.
(1)求n和频率分布直方图中的x,y的值,并估计该校高一年级学生成绩是合格等级的概率;
(2)在选取的样本中,从成绩为A,D两个等级的学生中随机抽取2名学生进行调研,求至少有一名学生的成绩是A等级的概率.
解:(1)由频率分布直方图及茎叶图中的相关数据可知,样本容量n==50,
x==0.004,
y==0.018.
因为成绩是合格等级的频率为1-0.1=,
依据样本估计总体的思想,该校高一年级学生成绩是合格等级的概率是.
(2)由频率分布直方图及茎叶图知,A等级学生共有3名,D等级学生共有0.1×50=5名,记A等级学生分别为A1,A2,A3,D等级学生分别为D1,D2,D3,D4,D5,则从8名学生中随机抽取2名学生的所有情况为A1A2,A1A3,A1D1,A1D2,A1D3,A1D4,A1D5,A2A3,A2D1,A2D2,A2D3,A2D4,A2D5,A3D1,A3D2,A3D3,A3D4,A3D5,D1D2,D1D3,D1D4,D1D5,D2D3,D2D4,D2D5,D3D4,D3D5,D4D5,共28个基本事件.
记“至少有一名学生的成绩是A等级”为事件E,则其对立事件的可能结果为D1D2,D1D3,D1D4,D1D5,D2D3,D2D4,D2D5,D3D4,D3D5,D4D5,共10种.
所以P(E)=1-P()=1-=.
第三讲 创新考法与思想方法
[常见创新考法]
创新点(一) 创新命题情景考应用能力
此类问题多以现实中的生活实例或最新时事为背景考查概率、统计的求解及应用.
[典例1] 交强险是车主必须为机动车购买的险种,若普通6座以下私家车投保交强险第一年的费用(基准保费)统一为a
元,在下一年续保时,实行的是费率浮动机制,且保费与上一年度车辆发生道路交通事故的情况相联系.发生交通事故的次数越多,费率也就越高,具体浮动情况如下表:
交强险浮动因素和费率浮动比率表
浮动因素
浮动比率
A1
上一个年度未发生有责任道路交通事故
下浮10%
A2
上两个年度未发生有责任道路交通事故
下浮20%
A3
上三个及以上年度未发生有责任道路交通事故
下浮30%
A4
上一个年度发生一次有责任不涉及死亡的道路交通事故
0%
A5
上一个年度发生两次及两次以上有责任道路交通事故
上浮10%
A6
上一个年度发生有责任道路交通死亡事故
上浮30%
某机构为了研究某一品牌普通6座以下私家车的投保情况,随机抽取了60辆车龄已满三年该品牌同型号私家车的下一年续保时的情况,统计得到了下面的表格:
类型
A1
A2
A3
A4
A5
A6
数量
10
5
5
20
15
5
(1)求一辆普通6座以下私家车在第四年续保时保费高于基本保费的频率;
(2)某二手车销售商专门销售这一品牌的二手车,且将下一年的交强险保费高于基本保费的车辆记为事故车.假设购进一辆事故车亏损5 000元,一辆非事故车盈利10 000元.且各种投保类型的频率与上述机构调查的频率一致,完成下列问题:
①若该销售商店内有6辆(车龄已满三年)该品牌二手车,某顾客欲在店内随机挑选2辆车,求这2辆车恰好有一辆为事故车的概率;
②若该销售商一次购进120辆(车龄已满三年)该品牌二手车,求一辆车盈利的平均值.
[解] (1)一辆普通6座以下私家车第四年续保时保费高于基本保费的频率为=.
(2)①由统计数据可知,该销售商店内的6辆该品牌车龄已满三年的二手车中有2辆事故车,设为b1,b2,4辆非事故车,设为a1,a2,a3,a4.从6辆车中随机挑选2辆车的情况有(b1,b2),(b1,a1),(b1,a2),(b1,a3),(b1,a4),(b2,a1),(b2,a2),(b2,a3),(b2,a4),(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4),共15种.其中2辆车恰好有一辆为事故车的情况有(b1,a1),(b1,a2),(b1,a3),(b1,a4),(b2,a1),(b2,a2),(b2,a3),(b2,a4),共8种.
所以该顾客在店内随机挑选2辆车,这2辆车恰好有一辆事故车的概率为.
②由统计数据可知,该销售商一次购进120辆该品牌车龄已满三年的二手车有事故车40辆,非事故车80辆,
所以一辆车盈利的平均值为[(-5 000)×40+10 000×80]=5 000(元).
[点评] 本例以“交强险”这一实际生活实例为背景,考查了古典概型概率的求法以及平均值的计算.
[演练冲关]
1.(2017·福州模拟)在国际风帆比赛中,成绩以低分为优胜,比赛共11场,并以最佳的9场成绩计算最终的名次.在一次国际风帆比赛中,前7场比赛结束后,排名前8位的选手积分如下表:
运动员
比赛场次
总分
1
2
3
4
5
6
7
8
9
10
11
A
3
2
2
2
4
2
6
21
B
1
3
5
1
10
4
4
28
C
9
8
6
1
1
1
2
28
D
7
8
4
4
3
1
8
35
E
3
12
5
8
2
7
5
42
F
4
11
6
9
3
6
8
47
G
10
12
12
8
12
10
7
71
H
12
12
6
12
7
12
12
73
(1)根据表中的比赛数据,比较运动员A与B的成绩及稳定情况;
(2)从前7场平均分低于6.5分的运动员中,随机抽取2个运动员进行兴奋剂检查,求至少有1个运动员平均分不低于5分的概率;
(3)请依据前7场比赛的数据,预测冠亚军选手,并说明理由.
解:(1)运动员A的平均分1=×21=3,
方差s=×[(3-3)2+(2-3)2×4+(4-3)2+(6-3)2]=2;
运动员B的平均分2=×28=4,
方差s=×[(1-4)2×2+(3-4)2+(5-4)2+(10-4)2+(4-4)2×2]=8.
从平均分和方差来看,运动员A的平均分及方差都比运动员B的小,也就是说,前7场比赛,运动员A的成绩优异,而且表现较为稳定.
(2)由表可知,平均分低于6.5分的运动员共有5个,其中平均分低于5分的运动员有3个,分别为A,B,C,平均分不低于5分且低于6.5分的运动员有2个,分别为D,E.从这5个运动员中任取2个共有10种情况:AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,
其中至少有1个运动员平均分不低于5分的有7种情况.则所求概率为P=.
(3)尽管此时还有4场比赛没有进行,但这里我们可以假定每位选手在各自的11场比赛中发挥的水平大致相同,因而可以把前7场比赛的成绩看作总体的一个样本,并由此估计每位运动员最后比赛的成绩.从已经结束的7场比赛的积分来看,运动员A的成绩最为优异,而且表现最为稳定,因此,预测运动员A将获得最后的冠军.而运动员B和C平均分相同,但运动员C得分总体呈下降趋势,所以预测运动员C将获得亚军.
(说明:方案不唯一,其他言之有理的方案也可)
创新点(二) 创新命题角度考迁移能力
概率是近几年高考的热点之一,主要考查随机事件的概率、古典概型、几何概型等知识,近几年高考对概率的考查由单一型向知识交汇型转化,多与统计、函数与方程、数列、平面向量、不等式(线性规划)等知识交汇命题.
[典例2] 设f(x)和g(x)都是定义在同一区间上的两个函数,若对任意x∈[1,2],都有|f(x)+g(x)|≤8,则称f(x)和g(x)是“友好函数”,设f(x)=ax,g(x)=.
(1)若a∈{1,4},b∈{-1,1,4},求f(x)和g(x)是“友好函数”的概率;
(2)若a∈[1,4],b∈[1,4],求f(x)和g(x)是“友好函数”的概率.
[解] (1)设事件A表示f(x)和g(x)是“友好函数”,则|f(x)+g(x)|(x∈[1,2])所有的情况有:x-,x+,x+,4x-,4x+,4x+,共6种且每种情况出现的可能性相同.
又当a>0,b>0时,ax+在上递减,在上递增;
x-和4x-在(0,+∞)上递增,
∴对x∈[1,2]可使|f(x)+g(x)|≤8恒成立的有x-,x+,x+,4x-,故事件A包含的基本事件有4种,
∴P(A)==,故所求概率为.
(2)设事件B表示f(x)和g(x)是“友好函数”,
∵a是从区间[1,4]中任取的数,b是从区间[1,4]中任取的数,
∴点(a,b)所在区域是长为3,宽为3的正方形区域.
要使x∈[1,2]时,|f(x)+g(x)|≤8恒成立,
需f(1)+g(1)=a+b≤8,且f(2)+g(2)=2a+≤8,
∴满足事件B的点(a,b)的区域是如图所示的阴影部分.
∴P(B)==,故所求概率为.
[点评] 本题考查了函数的新定义、函数的性质及古典概型和几何概型的应用,命题角度独特、形式新颖,有一定的综合性,求解本例的关键是:一要正确理解“友好函数”的定义;二要由a,b的范围确定“友好函数”所满足的条件,即f(1)+g(1)≤8,且f(2)+g(2)≤8;三要判断第(1)问、第(2)问中涉及到的分别是何种概型.
[演练冲关]
2.已知函数f(x)=2x2-4ax+2b2,若a∈{4,6,8},b∈{3,5,7},则该函数有两个零点的概率为________.
解析:要使函数f(x)=2x2-4ax+2b2有两个零点,即方程x2-2ax+b2=0要有两个不等的实根,则Δ=4a2-4b2>0,又a∈{4,6,8},b∈{3,5,7},即a>b,而(a,b)的取法共有9种,其中满足a>b的取法有(4,3),(6,3),(6,5),(8,3),(8,5),(8,7),共6种,所以所求的概率为=.
答案:
3.若不等式x2+y2≤2所表示的平面区域为M,不等式组表示的平面区域为N,现随机向区域N内抛一粒豆子,则豆子落在区域M内的概率为________.
解析:作出不等式组与不等式表示的可行域如图所示,平面区域N的面积为×3×(6+2)=12,区域M在区域N内的面积为π()2=,故所求概率P==.
答案:
[常用思想方法]
数学思想在本专题中的应用
1.应用数形结合思想求解几何概型的概率问题
[典例1] 已知三点A(2,1),B(1,-2),C,-,动点P(a,b)满足0≤·≤2,且0≤·≤2,则动点P到点C的距离小于的概率为________.
[解析] ∵A(2,1),B(1,-2),
∴·=2a+b,·=a-2b,
∵0≤·≤2,且0≤·≤2,
∴0≤2a+b≤2,且0≤a-2b≤2,作出不等式表示的平面区域如图中正方形OEFG所示,
∵|CP|<,∴点P对应的区域为以C为圆心,为半径的圆的内部,如图中阴影部分所示.
由解得
即E,|OE|= =,
∴正方形OEFG的面积为×=,又阴影部分的面积为π×2=,
∴根据几何概型的概率计算公式可知所求的概率为=.
[答案]
[点评] 本题将条件0≤·≤2与0≤·≤2转化为正方形OEFG的面积,将动点P到点C的距离小于转化为圆C的面积,然后借助数形结合及几何概型的概率公式求解.
2.应用转化与化归思想解决与互斥事件有关的概率的计算问题
[典例2] 某商场有奖销售中,购满100元商品得1张奖券,多购多得.1 000张奖券为一个开奖单位,设特等奖1个,一等奖10个,二等奖50个.设1张奖券中特等奖、一等奖、二等奖的事件分别为A,B,C,求:
(1)P(A),P(B),P(C);
(2)1张奖券的中奖概率;
(3)1张奖券不中特等奖且不中一等奖的概率.
[解] (1)P(A)=,P(B)==,P(C)==.故事件A,B,C的概率分别为
,,.
(2)1张奖券中奖包含中特等奖、一等奖、二等奖.
设“1张奖券中奖”这个事件为M,则M=A∪B∪C.
因为A,B,C两两互斥,所以P(M)=P(A∪B∪C)=P(A)+P(B)+P(C)==.
故1张奖券的中奖概率为.
(3)设“1张奖券不中特等奖且不中一等奖”为事件N,则事件N与“1张奖券中特等奖或中一等奖”为对立事件,所以P(N)=1-P(A∪B)=1-+=.
故1张奖券不中特等奖且不中一等奖的概率为.
[点评] 本题将事件“1张奖券中奖”的概率转化为事件“中特等奖”、“中一等奖”、“中二等奖”概率的和求解;将“1张奖券不中特等奖且不中一等奖”事件的概率转化为先求其对立事件“1张奖券中特等奖或中一等奖”的概率后再求解.
[课时跟踪检测]
一、选择题
1.(2017·福州模拟)在检测一批相同规格质量共500 kg的航空用耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,则这批航空用耐热垫片中非优质品的质量约为( )
A.2.8 kg B.8.9 kg
C.10 kg D.28 kg
解析:选B 由题意,可知抽到非优质品的概率为,所以这批航空用耐热垫片中非优质品的质量约为500×=≈8.9 kg.
2.从集合{2,3,4,5}中随机抽取一个数a,从集合{1,3,5}中随机抽取一个数b,则向量m=(a,b)与向量n=(1,-1)垂直的概率为( )
A. B.
C. D.
解析:选A 由题意可知m=(a,b)有:(2,1),(2,3),(2,5),(3,1),(3,3),(3,5),(4,1),(4,3),(4,5),(5,1),(5,3),(5,5),共12种情况.因为m⊥n,所以m·n=0,所以a×1+
b×(-1)=0,即a=b,满足条件的有:(3,3),(5,5),共2种情况,故所求概率为=.故选A.
3.在区间[0,2]上随机地取一个数x,则事件“-1≤log≤1”发生的概率为
( )
A. B.
C. D.
解析:选A 不等式-1≤log≤1可化为log2≤log≤log,即≤x+≤2,解得0≤x≤,故由几何概型的概率公式得P==.
4.已知M={1,2,3,4},若a∈M,b∈M,则函数f(x)=ax3+bx2+x-3在R上为增函数的概率是( )
A. B.
C. D.
解析:选A 记事件A为“函数f(x)=ax3+bx2+x-3在R上为增函数”.
因为f(x)=ax3+bx2+x-3,所以f′(x)=3ax2+2bx+1.
当函数f(x)在R上为增函数时,f′(x)≥0在R上恒成立.
又a>0,所以Δ=(2b)2-4×3a=4b2-12a≤0在R上恒成立,即a≥.
当b=1时,有a≥,故a可取1,2,3,4,共4个数;
当b=2时,有a≥,故a可取2,3,4,共3个数;
当b=3时,有a≥3,故a可取3,4,共2个数;
当b=4时,有a≥,故a无可取值.
综上,事件A包含的基本事件有4+3+2=9(种).
又a,b∈{1,2,3,4},所以所有的基本事件共4×4=16(种).
故所求事件A的概率为P(A)=,故选A.
5.空气质量指数(Air Quality
Index,简称AQI)是定量描述空气质量状况的无量纲指数.空气质量按照AQI大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士记录去年某地某月10天的AQI的茎叶图如图.利用该样本估计该地本月空气质量优良(AQI≤100)的天数(按这个月总共30天计算)为( )
A.15 B.18
C.20 D.24
解析:选B 从茎叶图中可以发现该样本中空气质量优的天数为2,空气质量良的天数为4,故该样本中空气质量优良的频率为=,则估计该地本月空气质量优良的频率为,从而估计该地本月空气质量优良的天数为30×=18.
6.在长度为3的线段上随机取两点,将其分成三条线段,则恰有两条线段的长度大于1的概率为( )
A. B.
C. D.
解析:选B 在长度为3的线段上随机取两点,将其分成三条线段,设其长度分别为x,y,3-x-y,则其表示的平面区域为如图所示的△AOB的内部(不含边界),而恰有两条线段的长度大于1,则需满足或或
可行域如图中阴影部分所示(不含边界),则恰有两条线段的长度大于1的概率为P==.
二、填空题
7.(2017·武昌调研)已知某射击运动员每次射击击中目标的概率都为80%.现采用随机模拟的方法估计该运动员4次射击至少3次击中目标的概率:先由计算器产生0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标;再以每4个随机数为一组,代表4次射击的结果.经随机模拟产生了如下20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 1417 4698 0371 6233 2616 8045 6011 3661 9597 7424 7610 4281
据此估计,该射击运动员4次射击至少3次击中目标的概率为________.
解析:4次射击中有1次或2次击中目标的有:7140,1417,0371,6011,7610,∴所求概率P=1-=0.75.
答案:0.75
8.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差s2可能的最大值是________.
解析:由题意可设两个被污损的数据分别为10+a,b,(a,b∈Z,0≤a≤9),则10+a+b+9+10+11=50,即a+b=10,b=10-a,所以s2=[(9-10)2+(10-10)2+(11-10)2+(10+a-10)2+(b-10)2]=[2+a2+(b-10)2]=(1+a2)≤×(1+92)=32.8.
答案:32.8
9.在[-1,1]上随机地取一个数k,则事件“直线y=kx与圆(x-5)2+y2=9相交”发生的概率为________.
解析:由直线y=kx与圆(x-5)2+y2=9相交,得 <3,
即16k2<9,解得-<k<.
由几何概型的概率计算公式可知P==.
答案:
三、解答题
10.某校高三期中考试后,数学教师对本次全部数学成绩按1∶20进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:
分数
段(分)
[50,70)
[70,90)
[90,110)
[110,130)
[130,150]
总计
频数
b
频率
a
0.25
(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);
(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出的两个样本数字之差的绝对值小于或等于10的概率.
解:(1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,∴a=0.1,b=3.
∵成绩在[90,110)范围内的频率为1-0.1-0.25-0.25=0.4,
∴成绩在[90,110)范围内的样本数为20×0.4=8,
估计这次考试全校高三学生数学成绩的及格率为P=1-0.1-0.25=0.65.
(2)一切可能的结果组成的基本事件空间为
Ω={(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128)},共21个基本事件,
设事件A=“取出的两个样本数字之差的绝对值小于等于10”,
则A={(100,102),(100,106),(100,106),(102,106),(102,106),(106,106),(106,116),(106,116),(116,118),(118,128)},共10个基本事件,
∴P(A)=.
11.(2018届高三·湘中名校联考)某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获利润50元,未售出的产品,每盒亏损30元.根据历史资料,得到开学季市场需求量的频率分布直方图,如图所示.该同学为这个开学季购进了160盒该产品,以x(单位:盒,100≤x≤200)表示这个开学季内的市场需求量,y(单位:元)表示这个开学季内经销该产品的利润.
(1)根据频率分布直方图估计这个开学季内市场需求量x的众数和平均数;
(2)将y表示为x的函数;
(3)根据频率分布直方图估计利润y不少于4 800元的概率.
解:(1)由频率分布直方图得:
这个开学季内市场需求量x的众数估计值是150.
需求量为[100,120)的频率为0.005×20=0.1,
需求量为[120,140)的频率为0.01×20=0.2,
需求量为[140,160)的频率为0.015×20=0.3,
需求量为[160,180)的频率为0.012 5×20=0.25,
需求量为[180,200]的频率为0.007 5×20=0.15.
则平均数=110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.
(2)因为每售出1盒该产品获利润50元,未售出的产品,每盒亏损30元,
所以当100≤x≤160时,y=50x-30×(160-x)=80x-4 800,
当160
查看更多