专题17+统计与统计案例(仿真押题)-2017年高考数学(文)命题猜想与仿真押题
1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人.现采取分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15
C.10,5,30 D.15,10,20
【答案】:D
【解析】:先确定抽样比为=,则依次抽取的人数分别为×300=15,×200=10和×400=20.故选D.
2.某同学进入高三后,4次月考的数学成绩的茎叶图如图.则该同学数学成绩的方差是 ( )
A.125 B.5
C.45 D.3
【答案】:C
3.为了判定两个分类变量X和Y是否有关系,应用K2独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是( )
A.有95%的把握认为“X和Y有关系”
B.有95%的把握认为“X和Y没有关系”
C.有99%的把握认为“X和Y有关系”
D.有99%的把握认为“X和Y没有关系”
【答案】:A
【解析】:依题意,K2=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”,选A.
4.为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:
开业天数
10
20
30
40
50
销售额/天 (万元)
62
75
81
89
根据上表提供的数据,求得y关于x的线性回归方程为=0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A.67 B.68
C.68.3 D.71
【答案】B
【解析】:设表中模糊看不清的数据为m.因为x==30,又样本中心(,)在回归直线=0.67x+54.9上,所以==0.67×30+54.9,得m=68,故选B.
5.采用系统抽样方法从1 000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间1,400]的人做问卷A,编号落入区间401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为( )
A.12 B.13
C.14 D.15
【答案】:A
6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的直方图如图所示,假设得分的中位数为me,众数为m0,平均数为x,则( )
A.me=m0=x B.me=m0
5.9,所以m0”或“<”)
【答案】< >
【解析】 方法一:画出散点图,粗略估计回归直线的位置,再画出过点(4,3),(5,4)的直线,如图所示.由图易知a.
方法二:由公式可得=0.7,=0.35.由题意可得b=1,a=-1,所以a.
12.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1000户.从普通家庭中用简单随机抽样的方法抽取990户,从高收入家庭中用简单随机抽样的方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,请估计该地拥有3套或3套以上住房的家庭所占的比例是________.
【答案】5.7%
【解析】 该地拥有3套或3套以上住房的家庭估计有99 000×+1000×=5700(户),
所以所占比例约为=5.7%.
13.一个容量为20的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8且前4项和S4=28,则此样本数据的平均数和中位数分别是________.
【答案】23,23
14.某校在一次期末考试中,全校学生的数学成绩都介于60分到140分之间(满分150分),为了估计该校学生的数学考试情况,从该校2000名学生的数学成绩中随机抽取50名学生的数学成绩,将统计结果按如下方式分成八组:第一组60,70),第二组70,80),……,第八组130,140].该图是按照上述分组得到的频率分布直方图的一部分.
(1)求第七组的频率,并将频率分布直方图补充完整;
(2)估计该校2000名学生这次考试的数学成绩的平均分(同一组数据使用中间值作代表);
(3)估计该校在这次考试中数学成绩在100,140]的人数.
15.从某大学随机选取7名女大学生,其身高x(单位:cm)和体重y(单位:kg)的有关数据如下表:
编号
1
2
3
4
5
6
7
身高x
163
164
165
166
167
168
169
体重y
52
52
53
55
54
56
56
(1)求出回归方程;
(2)利用(1)中的回归方程,分析这7名女大学生的身高和体重的变化,并预测一名身高为172 cm的女大学生的体重.
【解析】:(1)易知x==166,
y==54.
设回归方程为=x+,代入公式,经计算得=0.75,
=y-x=54-0.75×166=-70.5,
所以回归方程为=0.75x-70.5.
16.在一次数学测验后,班级学委对选答题的选题情况进行统计,如下表:
几何证
明选讲
极坐标与
参数方程
不等式
选讲
合计
男同学
12
4
6
22
女同学
0
8
12
20
合计
12
12
18
42
(1)在统计结果中,如果把几何证明选讲和极坐标与参数方程称为“几何类”,把不等式选讲称为“代数类”,我们可以得到如下2×2列联表.
几何类
代数类
合计
男同学
16
6
22
女同学
8
12
20
合计
24
18
42
能否认为选做“几何类”或“代数类”与性别有关,若有关,你有多大的把握?
(2)在原始统计结果中,如果不考虑性别因素,按分层抽样的方法从选做不同选答题的同学中随机选出7名同学进行座谈.已知这名学委和2名数学课代表都在选做“不等式选讲”的同学中.
①求在这名学委被选中的条件下,2名数学课代表也被选中的概率;
②记抽取到数学课代表的人数为X,求X的分布列及数学期望E(X).
下面临界值表仅供参考:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【解析】:(1)由题意知K2的观测值k==≈4.582>3.841,
所以有95%的把握认为选做“几何类”或“代数类”与性别有关.
(2)由题可知在选做“不等式选讲”的18名同学中,要选取3名同学.
从而X的分布列为
X
0
1
2
P
所以E(X)=0×+1×+2×=.
17.某市积极倡导学生参与绿色环保活动,其中代号为“环保卫士——12369”的绿色环保活动小组对2014年全年的空气污染指数API进行监测,下表是在这一年内随机抽取的100天的统计结果.
API
0,50]
(50,100]
(100,150]
(150,200]
(200,250]
(250,300]
>300
空气
质量
优
良
轻微污染
轻度污染
中度污染
中重污染
重度
污染
天数
4
13
18
30
9
11
15
(1)若该市某企业每天由空气污染造成的经济损失P(单位:元)与空气污染指数API(记为t)的关系为P=在这一年内随机抽取一天,估计该天经济损失P在区间(200,600]内的概率;
(2)若本次抽取的样本数据有30天是在供暖季节,其中有8天为重度污染,完成2×2列联表,并判断是否有95%的把握认为该市本年度空气重度污染与供暖有关.
非重度污染
重度污染
合计
供暖季
非供暖季
合计
100
下面临界值表供参考:
P(K2≥k0)
0.15
0.10
0.05
k0
2.072
2.706
3.841
P(K2≥k0)
0.010
0.005
0.001
k0
6.635
7.879
10.828
参考公式:K2=
(2)2×2列联表为:
非重度污染
重度污染
合计
供暖季
22
8
30
非供暖季
63
7
70
合计
85
15
100
则K2的观测值k=≈4.575>3.841,
所以有95%的把握认为该市本年度空气重度污染与供暖有关.
18.某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:
年份x
2011
2012
2013
2014
2015
储蓄存款y(千亿元)
5
6
7
8
10
为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 010,z=y-5,得到下表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程;
(2)通过(1)中的方程,求出y关于x的回归方程;
(3)用所求回归方程预测到2020年年底,该地储蓄存款额可达多少?
附:对于线性回归方程=x+,其中=,=-.
19.某医院对治疗支气管肺炎的两种方案A,B进行比较研究,将志愿者分为两组,分别采用方案A和方案B进行治疗,统计结果如下:
有效
无效
合计
使用方案A组
96
120
使用方案B组
72
合计
32
(1)完成上述列联表,并比较两种治疗方案有效的频率;
(2)能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【解析】:(1)列联表如下:
有效
无效
合计
使用方案A组
96
24
120
使用方案B组
72
8
80
合计
168
32
200
使用方案A组有效的频率为=0.8;使用方案B组有效的频率为=0.9.方案B组更有效.
(2)K2=≈3.571<3.841,
所以,不能在犯错误的概率不超过0. 05的前提下认为治疗是否有效与方案选择有关.