专题18+统计与统计案例(仿真押题)-2017年高考数学(理)命题猜想与仿真押题
专题18 统计与统计案例(仿真押题)
2017年高考数学(理)命题猜想与仿真押题
1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人.现采取分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15
C.10,5,30 D.15,10,20
解析:先确定抽样比为=,则依次抽取的人数分别为×300=15,×200=10和×400=20.故选D.
答案:D
2.某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是 ( )
A.125 B.5
C.45 D.3
解析:由茎叶图知平均值为=125,∴s2=(125-114)2+(125-126)2+(125-128)2+(125-132)2]=45.
答案:C
3.为了判定两个分类变量X和Y是否有关系,应用K2独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是( )
A.有95%的把握认为“X和Y有关系”
B.有95%的把握认为“X和Y没有关系”
C.有99%的把握认为“X和Y有关系”
D.有99%的把握认为“X和Y没有关系”
解析:依题意,K2=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”,选A.
答案:A
4.为了研究某大型超市开业天数与销售额的情况,随机抽取了5
天,其开业天数与每天的销售额的情况如下表所示:
开业天数
10
20
30
40
50
销售额/天(万元)
62
75
81
89
根据上表提供的数据,求得y关于x的线性回归方程为=0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A.67 B.68
C.68.3 D.71
解析:设表中模糊看不清的数据为m.因为x==30,又样本中心(,)在回归直线=0.67x+54.9上,所以==0.67×30+54.9,得m=68,故选B.
答案:B
5.采用系统抽样方法从1 000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间1,400]的人做问卷A,编号落入区间401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为( )
A.12 B.13
C.14 D.15
6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的直方图如图所示,假设得分的中位数为me,众数为m0,平均数为x,则( )
A.me=m0=x B.me=m0
5.9,所以m0”或“<”)
【答案】< > 【解析】 方法一:画出散点图,粗略估计回归直线的位置,再画出过点(4,3),(5,4)的直线,如图所示.由图易知a.
方法二:由公式可得=0.7,=0.35.由题意可得b=1,a=-1,所以a.
12.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1000户.从普通家庭中用简单随机抽样的方法抽取990户,从高收入家庭中用简单随机抽样的方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,请估计该地拥有3套或3套以上住房的家庭所占的比例是________.
【答案】5.7%
【解析】 该地拥有3套或3套以上住房的家庭估计有99 000×+1000×=5700(户),
所以所占比例约为=5.7%.
13.一个容量为20的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8且前4项和S4=28,则此样本数据的平均数和中位数分别是________.
【答案】23,23
【解析】 设公差为d,则a1+2d=8,4a1+6d=28,解得a1=4,d=2,所以此样本数据的中位数是=a1+d=4+19=23,平均数是=a1+d=23.
14.某校在一次期末考试中,全校学生的数学成绩都介于60分到140分之间(满分150分),为了估计该校学生的数学考试情况,从该校2000名学生的数学成绩中随机抽取50名学生的数学成绩,将统计结果按如下方式分成八组:第一组60,70),第二组70,80),……,第八组130,140].该图是按照上述分组得到的频率分布直方图的一部分.
(1)求第七组的频率,并将频率分布直方图补充完整;
(2)估计该校2000名学生这次考试的数学成绩的平均分(同一组数据使用中间值作代表);
(3)估计该校在这次考试中数学成绩在100,140]的人数.
解:(1)由频率分布直方图知第七组的频率为
1-(0.004+0.012+0.016+0.03+0.02+0.006+0.004)×10=0.08.
完整的频率分布直方图如下图所示.
(2)该校2000名学生这次考试的数学成绩的平均分数为
65×0.04+75×0.12+85×0.16+95×0.3+105×0.2+115×0.06+125×0.08+135×0.04=97.
(3)数学成绩在100,140]内的频率是(0.02+0.006+0.008+0.004)×10=0.38,
所以该校这次考试中数学成绩在100,140]内的人数约为2000×0.38=760.
15.从某大学随机选取7名女大学生,其身高x(单位:cm)和体重y(单位:kg)的有关数据如下表:
编号
1
2
3
4
5
6
7
身高x
163
164
165
166
167
168
169
体重y
52
52
53
55
54
56
56
(1)求出回归方程;
(2)利用(1)中的回归方程,分析这7名女大学生的身高和体重的变化,并预测一名身高为172 cm的女大学生的体重.
(2)=0.75>0说明身高x每增加1个单位,体重y就增加0.75个单位,这表明体重与身高具有正的线性相关关系.对于身高为172 cm的女大学生,由回归方程可以预测其体重为0.75×172-70.5=58.5(kg).
16.在一次数学测验后,班级学委对选答题的选题情况进行统计,如下表:
几何证
明选讲
极坐标与
参数方程
不等式
选讲
合计
男同学
12
4
6
22
女同学
0
8
12
20
合计
12
12
18
42
(1)在统计结果中,如果把几何证明选讲和极坐标与参数方程称为“几何类”,把不等式选讲称为“代数类”,我们可以得到如下2×2列联表.
几何类
代数类
合计
男同学
16
6
22
女同学
8
12
20
合计
24
18
42
能否认为选做“几何类”或“代数类”与性别有关,若有关,你有多大的把握?
(2)在原始统计结果中,如果不考虑性别因素,按分层抽样的方法从选做不同选答题的同学中随机选出7名同学进行座谈.已知这名学委和2名数学课代表都在选做“不等式选讲”的同学中.
①求在这名学委被选中的条件下,2名数学课代表也被选中的概率;
②记抽取到数学课代表的人数为X,求X的分布列及数学期望E(X).
下面临界值表仅供参考:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
②由题意知X的可能取值为0,1,2.
依题意P(X=0)==;
P(X=1)==;
P(X=2)==.
从而X的分布列为
X
0
1
2
P
所以E(X)=0×+1×+2×=.
17.某市积极倡导学生参与绿色环保活动,其中代号为“环保卫士——12369”的绿色环保活动小组对2014年全年的空气污染指数API进行监测,下表是在这一年内随机抽取的100天的统计结果.
API
0,50]
(50,100]
(100,150]
(150,200]
(200,250]
(250,300]
>300
空气
质量
优
良
轻微污染
轻度污染
中度污染
中重污染
重度
污染
天数
4
13
18
30
9
11
15
(1)若该市某企业每天由空气污染造成的经济损失P(单位:元)与空气污染指数API(记为t)的关系为P=在这一年内随机抽取一天,估计该天经济损失P在区间(200,600]内的概率;
(2)若本次抽取的样本数据有30天是在供暖季节,其中有8天为重度污染,完成2×2列联表,并判断是否有95%的把握认为该市本年度空气重度污染与供暖有关.
非重度污染
重度污染
合计
供暖季
非供暖季
合计
100
下面临界值表供参考:
P(K2≥k0)
0.15
0.10
0.05
k0
2.072
2.706
3.841
P(K2≥k0)
0.010
0.005
0.001
k0
6.635
7.879
10.828
参考公式:K2=
18.某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:
年份x
2011
2012
2013
2014
2015
储蓄存款y(千亿元)
5
6
7
8
10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 010,z=y-5,得到下表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
(2)通过(1)中的方程,求出y关于x的回归方程;
(3)用所求回归方程预测到2020年年底,该地储蓄存款额可达多少?
附:对于线性回归方程=x+,其中=,=-.
解析:(1)=3,=2.2,tizi=45,t=55,
==1.2,=-=2.2-3×1.2=-1.4,
∴z=1.2t-1.4.
(2)将t=x-2 010,z=y-5,代入z=1.2t-1.4,
得y-5=1.2(x-2 010)-1.4,即y=1.2x-2 408.4.
(3)∵y=1.2×2 020-2 408.4=15.6,
∴预测到2020年年底,该地储蓄存款额可达15.6千亿元.
19.某医院对治疗支气管肺炎的两种方案A,B进行比较研究,将志愿者分为两组,分别采用方案A和方案B进行治疗,统计结果如下:
有效
无效
合计
使用方案A组
96
120
使用方案B组
72
合计
32
(1)完成上述列联表,并比较两种治疗方案有效的频率;
(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解析:(1)列联表如下:
有效
无效
合计
使用方案A组
96
24
120
使用方案B组
72
8
80
合计
168
32
200
使用方案A组有效的频率为=0.8;使用方案B组有效的频率为=0.9.方案B组更有效.
(2)K2=≈3.571<3.841,
所以,不能在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关.