专题18+概率与统计-2017年高考数学(理)备考黄金易错点
1.为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是( )
A.B.C.D.
答案 C
2.某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )
A.B.C.D.
答案 B
解析 如图所示,画出时间轴:
小明到达的时间会随机的落在图中线段AB中,而当他的到达时间落在线段AC或DB时,才能保证他等车的时间不超过10分钟,根据几何概型得所求概率P==,故选B.
3.袋中装有偶数个球,其中红球、黑球各占一半.甲、乙、丙是三个空盒,每次从袋中任意取出两个球,将其中一个球放入甲盒,如果这个球是红球,就将另一个球放入乙盒,否则就放入丙盒.重复上述过程,直到袋中所有球都被放入盒中,则( )
A.乙盒中黑球不多于丙盒中黑球
B.乙盒中红球与丙盒中黑球一样多
C.乙盒中红球不多于丙盒中红球
D.乙盒中黑球与丙盒中红球一样多
答案 B
解析 取两个球往盒子中放有4种情况:
①红+红,则乙盒中红球数加1;
②黑+黑,则丙盒中黑球数加1;
4.同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,则在2次试验中成功次数X的均值是________.
答案
解析 由题可知,在一次试验中,试验成功(即至少有一枚硬币正面向上)的概率为P=1-×=,∵2次独立试验成功次数X满足二项分布X~B,则E(X)=2×=.
5.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20℃的月份有5个
答案 D
解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D.
6.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56B.60C.120D.140
答案 D
解析 设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.
7.某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.
学生序号
1
2
3
4
5
6
7
8
9
10
立定跳远(单位:米)
1.96
1.92
1.82
1.80
1.78
1.76
1.74
1.72
1.68
1.60
30秒跳绳(单位:次)
63
a
75
60
63
72
70
a-1
b
65
在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则( )
A.2号学生进入30秒跳绳决赛
B.5号学生进入30秒跳绳决赛
C.8号学生进入30秒跳绳决赛
D.9号学生进入30秒跳绳决赛
答案 B
8.如图是我市某小区100户居民2015年月平均用水量(单位:t)的频率分布直方图的一部分,则该小区2015年的月平均用水量的中位数的估计值为________.
答案 2.02
解析 由图可知,前五组的频率依次为0.04,0.08,0.15,0.22,0.25,因此前五组的频数依次为4,8,15,22,25,由中位数的定义,应是第50个数与第51个数的算术平均数,而前四组的频数和:4+8+15+22=49,是第五组中第1个数与第2个数的算术平均数,中位数是2+(2.5-2)×=2.02.
9.某高中学校共有学生1800名,各年级男女学生人数如下表.已知在全校学生中随机抽取1名,抽到高二女生的概率是0.16.
高一年级
高二年级
高三年级
女生
324
x
280
男生
316
312
y
现用分层抽样的方法,在全校抽取45名学生,则应在高三抽取的学生人数为________.
答案 14
10.全网传播的融合指数是衡量电视媒体在中国网民中影响力的综合指标.根据相关报道提供的全网传播2015年某全国性大型活动的“省级卫视新闻台”融合指数的数据,对名列前20名的“省级卫视新闻台”的融合指数进行分组统计,结果如表所示.
组号
分组
频数
1
4,5)
2
2
5,6)
8
3
6,7)
7
4
7,8]
3
(1)现从融合指数在4,5)和7,8]内的“省级卫视新闻台”中随机抽取2家进行调研,求至少有1家的融合指数在7,8]内的概率;
(2)根据分组统计表求这20家“省级卫视新闻台”的融合指数的平均数.
解 方法一 (1)融合指数在7,8]内的“省级卫视新闻台”记为A1,A2,A3;融合指数在4,5)内的“省级卫视新闻台”记为B1,B2,从融合指数在4,5)和7,8]内的“省级卫视新闻台”中随机抽取2家的所有基本事件是:
{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10个.
其中,至少有1家融合指数在7,8]内的基本事件是:{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,
事件是:
{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},共10个.
其中,没有1家融合指数在7,8]内的基本事件是:{B1,B2},共1个.
所以所求的概率P=1-=.
(2)同方法一.
易错起源1、古典概型和几何概型
例1、(1)如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为( )
A.B.C.D.
(2)在-1,1]上随机地取一个数k,则事件“直线y=kx与圆(x-5)2+y2=9相交”发生的概率为________.
答案 (1)C (2)
解析 (1)从1,2,3,4,5中任取3个不同的数共有如下10个不同的结果:(1,2,3),(1,2,4),(1,2,5),(1,3,4),(1,3,5),(1,4,5),(2,3,4),(2,3,5),(2,4,5),(3,4,5),其中勾股数只有(3,4,5),所以概率为.故选C.
(2)由已知得,圆心(5,0)到直线y=kx的距离小于半径,∴<3,解得-
n.
(1)求m与n的值;
(2)该校根据三个社团活动安排情况,对进入“摄影”社的同学增加校本选修学分1分,对进入“棋类”社的同学增加校本选修学分2分,对进入“国学”社的同学增加校本选修学分3分.求该新同学在社团方面获得校本选修课学分分数的分布列及均值.
解 (1)依题意,
解得
(2)由题设该新同学在社团方面获得校本选修课学分的分数为随机变量X,则X的值可以为0,1,2,3,4,5,6.
故X的分布列为
X
0
1
2
3
4
5
6
P
所以E(X)=0×+1×+2×+3×+4×+5×+6×=.
【名师点睛】
求解随机变量分布列问题的两个关键点
(1)求离散型随机变量分布列的关键是正确理解随机变量取每一个值所表示的具体事件,然后综合应用各类概率公式求概率.
(2)求随机变量均值与方差的关键是正确求出随机变量的分布列.若随机变量服从二项分布,则可直接使用公式法求解.
【锦囊妙计,战胜自我】
1.离散型随机变量的分布列的两个性质
(1)pi≥0 (i=1,2,…,n);(2)p1+p2+…+pn=1.
2.均值公式
E(X)=x1p1+x2p2+…+xnpn.
3.均值的性质
(1)E(aX+b)=aE(X)+b;
(2)若X~B(n,p),则E(X)=np.
4.方差公式
D(X)=x1-E(X)]2·p1+x2-E(X)]2·p2+…+xn-E(X)]2·pn,标准差为.
5.方差的性质
(1)D(aX+b)=a2D(X);
(2)若X~B(n,p),则D(X)=np(1-p).
易错起源4、抽样方法
例4、(1)某月月底,某商场想通过抽取发票存根的方法估计该月的销售总额.先将该月的全部销售发票的存根进行了编号,1,2,3,…,然后拟采用系统抽样的方法获取一个样本.若从编号为1,2,3,…,10的前10张发票的存根中随机抽取1张,然后再按系统抽样的方法依编号顺序逐次产生第2张、第3张、第4张、……,则抽样中产生的第2张已编号的发票存根,其编号不可能是( )
A.13 B.17
C.19 D.23
(2)为了研究雾霾天气的治理,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y,z,依次构成等差数列,且4,y,z+4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________.
答案 (1)D (2)2
所以甲、乙、丙三组城市的个数分别为4,8,12.
因为一共要抽取6个城市,所以抽样比为=.
故乙组城市应抽取的个数为8×=2.
【变式探究】(1)要考察某公司生产的500克袋装牛奶中三聚氰胺的含量是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数法抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________.(下面摘取了随机数表第7行至第9行)
84421753315724550688770474476721763350258392120676(第7行)
63016378591695556719981050717512867358074439523879(第8行)
33211234297864560782524207443815510013429966027954(第9行)
(2)利用分层抽样的方法在学生总数为1200人的年级中抽出20名同学,其中有女生8人,则该年级男生的人数约为________.
答案 (1)068 (2)720
【名师点睛】
(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
【锦囊妙计,战胜自我】
1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
易错起源5、用样本估计总体
例5、(1)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.平均数 B.标准差
C.众数 D.中位数
(2)若五个数1,2,3,4,a的平均数为3,则这五个数的标准差是________.
答案 (1)B (2)
解析 (1)设样本A中的数据为xi,则样本B中的数据为yi=xi-5,则样本数据B中的众数和平均数以及中位数和A中的众数,平均数,中位数相差5,只有标准差没有发生变化,故选B.
(2)由平均数的定义知=3,
所以10+a=15,即a=5;
由标准差的计算公式可得
s==.
【变式探究】(1)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为( )
A.117 B.118
C.118.5 D.119.5
(2)某学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在20,60]元的样本,其频率分布直方图如图所示,其中支出在50,60]元的学生有30人,则n的值为( )
A.100 B.1000
C.90 D.900
答案 (1)B (2)A
【名师点睛】
(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.
【锦囊妙计,战胜自我】
1.频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×.
2.频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
易错起源6、统计案例
例6、(1)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.
从这次考试成绩看,
①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;
②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.
(2)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩B.视力C.智商D.阅读量
答案 (1)①乙 ②数学 (2)D
解析 (1)①由散点图可知:越靠近坐标原点O名次越好,乙同学语文成绩好,而总成绩年级名次靠后;而甲同学语文成绩名次比总成绩名次差,所以应是乙同学语文成绩名次比总成绩名次靠前.
②丙同学总成绩年级名次比数学成绩年级名次差,所以丙同学成绩名次更靠前的是数学.
(2)根据数据求出K2的值,再进一步比较大小.
A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
K2==.
B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
K2==.
∴与性别有关联的可能性最大的变量是阅读量.
【变式探究】(1)随机采访50名观众对某电视节目的满意度,得到如下列联表:
单位:人
满意
不满意
合计
男
10
20
30
女
15
5
20
合计
25
25
50
附表和公式如下:
P(K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
K2=,其中n=a+b+c+d为样本容量.
根据以上数据可知( )
A.有95%的把握认为对电视节目的满意度与性别无关
B.有99%的把握认为对电视节目的满意度与性别无关
C.有99%的把握认为对电视节目的满意度与性别有关
D.有95%的把握认为对电视节目的满意度与性别有关
(2)设某市现代中学的男生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据样本数据(xi,yi) (i=1,2,…,n),且最小二乘法建立的回归方程为=0.95x-99.88,给定下列结论:
①y与x具有正的线性相关关系;
②回归直线过样本点的中心(,);
③若该中学某男生身高增加1cm,则其体重约增加0.95kg;
④若该中学某男生身高为180cm,则可预测其体重约为71.12kg.
其中正确的结论是________.
答案 (1)C (2)①②③④
【名师点睛】
(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(,),应引起关注.
(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K2求解即可.
【锦囊妙计,战胜自我】
1.线性回归方程
方程=x+称为线性回归方程,其中=,=-,(,)称为样本点的中心.
2.随机变量
K2=,其中n=a+b+c+d.
1.一枚硬币连掷2次,只有一次出现正面的概率为( )
A. B.
C. D.
答案 D
解析 一枚硬币连掷2次可能出现(正,正)、(反,反)、(正,反)、(反,正)四种情况,只有一次出现正面的情况有两种,∴P==,故选D.
2.某高中数学老师从一张测试卷的12道选择题、4道填空题、6道解答题中任取3道题作分析,则在取到选择题时解答题也取到的概率为( )
A. B.
C. D.
答案 C
解析 从题设22道题中任取3题,选到选择题的选法有(C-C)种,选到选择题也选到解答题的选法
3.已知三个正态分布密度函数φi(x)=e(x∈R,i=1,2,3)的图象如图所示,则( )
A.μ1<μ2=μ3,σ1=σ2>σ3
B.μ1>μ2=μ3,σ1=σ2<σ3
C.μ1=μ2<μ3,σ1<σ2=σ3
D.μ1<μ2=μ3,σ1=σ2<σ3
答案 D
解析 正态曲线关于直线x=μ对称,由题图可知μ1<μ2=μ3;而σ决定正态曲线的形状,σ越小,图象越“瘦而高”,σ越大,图象越“胖而矮”,所以σ1=σ2<σ3,故选D.
4.甲、乙两个运动员射击命中环数ξ,η的分布列如下表.其中射击成绩比较稳定的运动员是( )
环数k
8
9
10
P(ξ=k)
0.3
0.2
0.5
P(η=k)
0.2
0.4
0.4
A.甲 B.乙
C.一样 D.无法比较
答案 B
解析 由题中分布列可得,E(ξ)=0.3×8+0.2×9+0.5×10=9.2,E(η)=0.2×8+0.4×9+0.4×10=9.2=E(ξ),
5.设不等式组所表示的区域为M,函数y=的图象与x轴所围成的区域为N,向M内随机投一个点,则该点落在N内的概率为( )
A. B.
C. D.
答案 B
解析 画出区域M及区域N,如图所示.
区域M的面积为2,区域N的面积为,由几何概型知所求概率P=.故选B.
6.某餐厅的原料费支出x与销售额y(单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y与x的线性回归方程为=8.5x+7.5,则表中的m的值为( )
x
2
4
5
6
8
y
25
35
m
55
75
A.50 B.55
C.60 D.65
答案 C
解析 ==5,
==,
又=8.5+7.5=50,
因此=50,m=60,故选C.
7.某校高三学生有3000名,在一次模拟考试中数学成绩X服从正态分布N(100,σ2),已知P(80,则p的取值范围是________.
答案 (0,)
解析 由已知得P(η=1)=p,P(η=2)=(1-p)p,P(η=3)=(1-p)2,则E(η)=p+2(1-p)p+3(1-p)2=p2-3p+3>,解得p>或p<,又p∈(0,1),
所以p∈(0,).