【数学】2021届新高考一轮复习北师大版第十二章第一讲 随机抽样与用样本估计总体作业
第十二章 统计与统计案例
第一讲 随机抽样与用样本估计总体
1.[2020惠州市一调]某高校调查了320名学生每周的自习时间(单位:时),制成了如图12-1-1所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20],(20,22.5],(22.5,25],(25,27.5],(27.5,30].根据频率分布直方图,这320名学生中每周的自习时间不超过22.5时的人数是( )
图12-1-1
A.68 B.72 C.76 D.80
2.[2020江西红色七校第一次联考]高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地,这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( )
A.x1,x2,…,xn的标准差 B.x1,x2,…,xn的平均数
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
3.[2020河北衡水中学全国高三第一次联考]由我国引领的5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应和波及效应,间接带动国民经济的发展,创造出更多的经济增加值.图12-1-2是某单位结合近年数据对今后几年的5G经济产出所做的预测.
图12-1-2
结合图12-1-2,下列说法错误的是( )
A.5G的发展带动今后几年的总经济产出逐年增加
B.设备制造商的经济产出前期增长较快,后期放缓
C.信息服务商与运营商的经济产出的差距有逐步拉大的趋势
D.设备制造商在各年的总经济产出中一直处于领先地位
4.[2020开封高三一模]某省普通高中学业水平考试成绩由高分到低分按人数所占百分比依次分为A,B,C,D,E五个等级,A等级占15%,B等级占30%,C等级占30%,D,E等级共占25%.其中E等级为不合格,原则上所占百分比不超过5%.该省某校高二年级学生都参加学业水平考试,先从中随机抽取了部分学生的考试成绩进行统计,统计结果如图12-1-3(1)(2)所示.若该校高二年级共有1 000名学生,则估计该年级达到C等级及以上级别的学生人数为( )
(1) (2)
图12-1-3
A.45 B.660 C.880 D.900
5.[多选题]图12-1-4(1)(2)(3)(4)分别是四组数据的条形图,每组数据的样本容量都是9,则下列描述正确的是( )
图12-1-4
A.四组数据的平均数都是5
B.图12-1-4(1)中数据的方差为0
C.图12-1-4(4)中数据的方差为0
D.图12-1-4(3)中数据的方差最大
6.[2020广东七校联考]根据新高考改革方案,某地区高考由文理分科考试变为“3+3”模式考试.某学校为了解高一年级425名学生的选科情况,在高一年级下学期进行模拟选科,统计得到选科组合排名前4种的情况如下表所示,其中物理、化学、生物为理科,政治、历史、地理为文科,“√”表示选择该科,“×”表示未选择该科.
学科
人数
物理
化学
生物
政治
历史
地理
124
√
√
×
×
×
√
101
×
×
√
×
√
√
86
×
√
√
×
×
√
74
√
×
√
×
√
×
根据以上统计数据,下列判断错误的是( )
A.排名前4种的选科组合中,选择生物学科的学生更倾向选择两理一文组合
B.排名前4种的选科组合中,选择两理一文的人数多于选择两文一理的人数
C.整个高一年级,选择地理学科的人数多于选择其他任一学科的人数
D.整个高一年级,选择物理学科的人数多于选择生物学科的人数
7.[2019河北六校联考]某中学有高中生3 000人,初中生2 000人,男、女生所占的比例分别如图12-1-5(1)(2)所示.学校为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是( )
图12-1-5
A.12 B.15 C.20 D.21
8.[2019湖南四校联考]甲、乙两名同学6次考试的成绩(单位:分)如图12-1-6所示,且这6次成绩的平均分分别为x甲,x乙,标准差分别为σ甲,σ乙,则( )
图12-1-6
A.x甲
σ乙
C.x甲>x乙,σ甲<σ乙 D.x甲>x乙,σ甲>σ乙
9.[2020四省八校第二次联考][双空题]若a1,a2,…,a2 020的平均数、方差分别是2和1,bi=3ai+2(i=1,2,…,2 020),则b1,b2,…,b2 020的平均数为 ,方差为 .
10.[2019北京高三模拟][数学文化题]《九章算术》第三章“衰分”中有如下表述:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之.”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱.”则丙应出 钱(结果保留整数).
11.[2020长春市第一次质量监测]某部门要对所有的新车模型进行广泛测试,以确定它们的行车里程的等级,下表是对100个新车模型在一个耗油单位内行车里程(单位:千米)的测试结果.
分组
[30,32)
[32,34)
[34,36)
[36,38)
[38,40)
[40,42)
[42,44]
频数
6
10
20
30
18
12
4
(1)在图12-1-7中补全上述测试结果的频率分布直方图,并指出其中位数落在哪一组;
图12-1-7
(2)用分层抽样的方法从行车里程在区间[38,40)与[40,42)内的新车模型中任取5个,并从这5个中随机抽取2个,求其中恰有一个新车模型的行车里程在[40,42)内的概率.
12.[原创题]蹦床是一项将运动和美学完美结合的运动,随着全民健身时代的到来,蹦床越来越受人们的喜爱.某大型蹦床主题公园为吸引顾客,推出优惠活动,对首次消费的顾客,
先注册成为会员,首次按60元收费,对会员逐次消费给予相应优惠,标准如下:
消费次数
第1次
第2次
第3次
第4次
不少于5次
收费比例系数
1
0.95
0.90
0.85
0.80
该蹦床主题公园从注册的会员中随机抽取了100位,统计他们的消费次数,得到数据如下:
消费次数
1次
2次
3次
4次
不少于5次
频数
60
20
10
5
5
假设每人每消费一次,蹦床主题公园耗费成本30元.根据所给数据,解答下列问题:
(1)以频率估计概率,估计该蹦床主题公园的一位会员至少消费2次的概率;
(2)某会员消费6次,求这6次消费中,该蹦床主题公园获得的平均利润;
(3)以样本估计总体,假设从消费次数为3次和4次的会员中采用分层抽样的方法抽取6人进行满意度调查,再从这6人中随机选取2人进一步了解情况,求抽取的2人中恰有一人的消费次数为3次的概率.
13.[2019安徽示范高中高三测试]我国是一个缺水的国家.某市为了鼓励居民节约用水,拟确定一个合理的月用水量阶梯收费标准,规定一位居民月用水量不超过a吨的部分按平价收费,超出a吨的部分按议价收费.该市水利局为了解居民用水情况,通过随机抽样,获得了该年1 000位居民的月均用水量(单位:吨),将数据分成9组,具体情况见下表:
月均用
水量
[0,0.5)
[0.5,1)
[1,1.5)
[1.5,2)
[2,2.5)
[2.5,3)
[3,3.5)
[3.5,4)
[4,4.5]
居民数
50
80
5x
220
250
80
60
x
20
(1)求x的值,并在图12-1-8中画出频率分布直方图.
图12-1-8
(2)若该市希望使80%的居民月均用水量不超过a吨,试估计a的值.
(3)根据频率分布直方图估计该市居民月用水量的平均值.(同一组数据用该组数据的区间中点值作代表)
14.[开放题]某学校实施了一段时间的走班制教学,为了解本校高一学生在实施走班制前后的学习情况,随机调查了该校高一某班的30名学生,得到实施走班制教学前后这些学生的数学考试成绩的频数分布表如下.
分数段
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
实施走班
制教学前
人数
2
10
7
5
2
4
0
0
实施走班
制教学后
人数
2
4
5
5
6
5
1
2
(1)试估计实施走班制教学前这些学生的数学考试成绩的中位数,并分析实施走班制教学前后及格率的变化情况.(注:中位数保留整数,60分及其以上分数为及格)
(2)若数学考试平均成绩增长率达到20%,可看作实施走班制教学成功,试分析该校实施走班制教学是否成功.(同一组中的数据用该组区间的中点值为代表,结果精确到0.01)
15.[2020洛阳市第一次联考][交汇题]前些年有部分企业只重视经济效益而没有环保意识,把大量的污染物排放到空中与地下,严重影响了人们的正常生活.为此政府进行强制整治,对不合格企业进行关闭、整顿,同时通过大量的绿化来净化环境.通过几年的整治,环境得到明显改善,针对政府这一行为,老百姓大大点赞.
(1)某机构随机访问50名居民,这50名居民对政府的评分(满分为100分)如下表:
分数
[70,75)
[75,80)
[80,85)
[85,90)
[90,95)
[95,100]
频数
2
3
11
14
11
9
请在图12-1-9中作出居民对政府评分的频率分布直方图.
图12-1-9
(2)环境整治后,当地环保部门随机抽测了2019年某月(共30天)的空气质量指数,其数据如下表:
空气质量指数
0~50
51~100
101~150
151~200
天数
2
18
8
2
用空气质量指数的平均值作为判断该月空气质量指数级别的依据,则该月空气质量指数级别为几级?(同一组数据用该组数据的区间中点值作代表,将频率视为概率,相关知识参见附表)
(3)空气受到污染,呼吸系统疾病患者最易感染.根据以往经验,凡遇到空气污染,小李都会服用有关药品,遇到轻度污染,每天的服药费用为50元,遇到中度污染,每天的服药费用为100元.环境整治前的2015年11月份小李因空气污染而受到感染,服药花费了5 000元,试估计2019年11月份(参考(2)中表格数据)小李比2015年11月份少花费了多少元的药费.
附表:
空气质量
0~50
51~100
101~15
151~20
201~300
>300
指数
0
0
空气质量
指数级别
一级
二级
三级
四级
五级
六级
空气质量
指数类别
优
良
轻度
污染
中度
污染
重度
污染
严重
污染
第一讲 随机抽样与用样本估计总体
1.B 这320名学生中每周的自习时间不超过22.5时的人数是(0.07+0.02)×2.5×320=72,故选B.
2.A 因为平均数、中位数、众数描述样本数据的集中趋势,方差和标准差描述其波动大小,所以表示一组数据x1,x2,…,xn的稳定程度的是方差或标准差,故选A.
3.D 设备制造商的经济产出在2029年将被信息服务商超过.故选D.
4.D 由题图12- 1- 3(1)(2)可知,达到C等级的学生人数所占百分比为1210×20%=24%,所以达到C等级及以上级别的学生人数所占百分比为20%+24%+46%=90%,所以该年级达到C等级及以上级别的学生人数约为1 000×90%=900.故选D.
5.ABD 由题中条形图得到题图12- 1- 4(1)中的数据是5,5,5,5,5,5,5,5,5;题图12- 1- 4(2)中的数据是3,3,4,4,5,6,6,7,7;题图12- 1- 4(3)中的数据是2,2,2,2,5,8,8,8,8;题图12- 1- 4(4)中的数据是4,4,4,5,5,5,6,6,6.所以每组数据的平均数都是5,A正确;因为题图12- 1- 4(1)中9个数据全是5,故方差为0,B正确;易知题图12- 1- 4(4)中数据的方差为23,故C错误;题图12- 1- 4(3)中数据的波动最大,故方差最大,D正确.故选ABD.
6.D 对于A,排名前4种的选科组合中,选择生物学科的学生有三类:选“生物+历史+地理”的有
101人,选“生物+化学+地理”的有86人,选“生物+物理+历史”的有74人,选择两理一文的有86+74=160(人),选择两文一理的有101人,故选择生物学科的学生更倾向选择两理一文组合,故A正确.
对于B,排名前4种的选科组合中,选择两理一文的学生有三类:选“物理+化学+地理”的有124人,选“生物+化学+地理”的有86人,选“生物+物理+历史”的有74人,共计124+86+74=284(人).选择两文一理的学生有一类:选“生物+历史+地理”的有101人,284>101,故B正确.
对于C,整个高一年级,选择地理学科的学生总人数至少为124+101+86=311(人),选择物理学科的总人数至多为425- (101+86)=238(人),选择化学学科的总人数至多为425- (101+74)=250(人),选择生物学科的总人数至多为425- 124=301(人),选择政治学科的总人数至多为425- (124+101+86+74)=40(人),选择历史学科的总人数至多为425- (124+86)=215(人),故C正确.
对于D,整个高一年级,选择物理学科的总人数至少为124+74=198(人),至多为238人,选择生物学科的总人数至少为101+86+74=261(人),故D错误.
综上所述,选D.
7.A 由题图可知高中生中女生有3 000×70%=2 100(人),初中生中男生有2 000×60%=1 200(人),设从初中生中抽取的男生人数是x,则有2 1001 200=21x,解得x=12,故选A.
8.C 由题图可知,甲同学除第2次考试成绩略低于乙同学外,其余5次考试成绩都高于乙同学,所以x甲>x乙.又由题图中数据知甲同学的成绩波动没有乙同学的成绩波动大,所以甲同学的成绩更稳定,所以σ甲<σ乙,故选C.
9.8 9 因为bi=3ai+2(i=1,2,…,2 020),所以b1,b2,…,b2 020的平均数是3×2+2=8,方差是32×1=9.
10.17 因为依照钱的多少按比例出钱,所以丙应该出的钱为180560+350+180×100=1801 090×100≈17.
11.(1)由题意补全频率分布直方图,如图D 12- 1- 2所示:
图D 12- 1- 2
由图D 12- 1- 2可知,中位数在区间[36,38)内.
(2)由题意知,从[38,40)中选取的新车模型数为18×530=3,设这3个新车模型分别为A,B,C,从[40,42)中选取的新车模型数为12×530=2,设这2个新车模型分别为a,b,则从这5个新车模型中抽取2个的所有情况有10种,分别为AB,AC,Aa,Ab,BC,Ba,Bb,Ca,Cb,ab,其中符合条件的有6种,分别为Aa,Ab,Ba,Bb,Ca,Cb,所以所求事件的概率为35.
12. (1)随机抽取的100位会员中,至少消费2次的会员有20+10+5+5=40(位),
所以该蹦床主题公园的一位会员至少消费2次的概率P=40100=25.
(2)第1次消费时,蹦床主题公园获取的利润为60- 30=30(元),
第2次消费时,蹦床主题公园获取的利润为60×0.95- 30=27(元),
第3次消费时,蹦床主题公园获取的利润为60×0.90- 30=24(元),
第4次消费时,蹦床主题公园获取的利润为60×0.85- 30=21(元),
第5次或第6次消费时,蹦床主题公园获取的利润均为60×0.80- 30=18(元).
所以这6次消费中,该蹦床主题公园获得的平均利润为30+27+24+21+18+186=23(元).
(3)由题意知,从消费次数为3次和4次的会员中抽取的人数分别为4人,2人.
这6人中,将消费3次的会员分别记为a,b,c,d,消费4次的会员分别记为e,f.
从6人中随机抽取2人的情况有{a,b},{a,c},{a,d},{a,e},{a,f},{b,c},{b,d},{b,e},{b,f},{c,d},{c,e},{c,f},{d,e},{d,f},{e,f},共15种.
设“抽取的2人中恰有一人的消费次数为3次”为事件A,则事件A包含的情况有
{a,e},{a,f},{b,e},{b,f},{c,e},{c,f},{d,e},{d,f},共8种.
根据古典概型的概率计算公式可得P(A)=815.
13.(1)由已知得6x=1 000- (50+80+220+250+80+60+20),x=40.
则月均用水量的频率分布表为:
月均用
水量
[0,0.5)
[0.5,1)
[1,1.5)
[1.5,2)
[2,2.5)
[2.5,3)
[3,3.5)
[3.5,4)
[4,4.5]
频率
0.05
0.08
0.20
0.22
0.25
0.08
0.06
0.04
0.02
故频率分布直方图如图D 12- 1- 3:
图D 12- 1- 3
(2)由(1)知前5组的频率和为0.05+0.08+0.20+0.22+0.25=0.80,故可估计a的值为2.5.
(3)由样本估计总体,该市居民月用水量的平均值为0.25×0.05+0.75×0.08+1.25×0.20+1.75×0.22+2.25×0.25+2.75×0.08+3.25×0.06+3.75×0.04+4.25×0.02=1.92(吨).
14.(1)设实施走班制教学前这些学生的数学考试成绩的中位数为x,则根据频数分布表得230+1030+(x- 40)×730×110=12,
解得x=3107≈44.所以估计实施走班制教学前这些学生的数学考试成绩的中位数为44.
根据频数分布表可知实施走班制教学后及格率增长了14- 630≈0.27=27%.
(2)实施走班制教学前的数学考试平均成绩x1=130×(2×25+10×35+7×45+5×55+2×65+4×75)=1423.
实施走班制教学后的数学考试平均成绩x2=130×(2×25+4×35+5×45+5×55+6×65+5×75+1×85+2×95)=1733.
则实施走班制教学后的数学考试平均成绩有增长,增长率为x2- x1x1≈0.22=22%,22%>20%,
所以该校实施走班制教学是成功的.
15.(1)由评分表可知,相应区间频率组距的值分别为0.008,0.012,0.044,0.056,0.044,0.036,其频率分布直方图如图D 12- 1- 4所示:
图D 12- 1- 4
(2)由题意得,该月空气质量指数的平均值为2×25+18×75.5+8×125.5+2×175.530≈92.133<100.
对照附表可知,该月空气质量指数的级别为二级.
(3)估计2019年11月份轻度污染的有8天,中度污染的有2天,
所以小李花费的药费为8×50+2×100=600(元).
又5 000- 600=4 400(元),所以相比2015年11月份,
2019年11月份小李少花了4 400元的药费.