2021版高考数学一轮复习核心素养测评六十七统计图表、数据的数字特征、用样本估计总体理北师大版
核心素养测评六十七 统计图表、数据的数字特征、用样本估计总体
(30分钟 60分)
一、选择题(每小题5分,共25分)
1.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试成绩的极差与中位数之和为 ( )
A.117 B.118 C.118.5 D.119.5
【解析】选B.22次考试成绩最高为98分,最低为56分,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试成绩的极差与中位数之和为42+76=118.
2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是 ( )
A.56 B.60 C.120 D.140
【解析】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.
3.(2020·芜湖模拟)由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为 ( )
A. B.
C. D.
【解析】选C.因为x1
1.67,所以A种药的疗效更好.
(2)由观测结果可绘制如图茎叶图:
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.
(15分钟 35分)
1.(5分)(2020·福州模拟)某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数与平均数分别为
( )
A.20,22.5 B.22.5,25
- 11 -
C.22.5,22.75 D.22.75,22.75
【解析】选C.根据频率分布直方图,得平均数为5×(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)=22.75,
因为0.02×5+0.04×5=0.3<0.5,
0.3+0.08×5=0.7>0.5,所以中位数应在20~25内,
设中位数为x,则0.3+(x-20)×0.08=0.5,
解得x=22.5,所以这批产品的中位数是22.5.
【变式备选】
某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是 ( )
A.31.6岁 B.32.6岁
C.33.6岁 D.36.6岁
【解析】选C.在频率分布直方图中,所有矩形面积之和为1,所以,数据位于的频率为1-×5=0.2,
前两个矩形的面积之和为0.01×5+0.2=0.25,
前三个矩形的面积之和为0.25+0.07×5=0.6,
所以,中位数位于区间,设中位数为a,
则有0.25+×0.07=0.5,解得a≈33.6(岁).
2.(5分)(2020·阳泉模拟)气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)
①甲地5个数据的中位数为24,众数为22;
②乙地5个数据的中位数为27,总体均值为24;
③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.
- 11 -
则肯定进入夏季的地区有________________.(填序号)
【解析】①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22,22,24,25,26,其连续5天的日平均气温均不低于22;
②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27时,可知其连续5天的日平均温度有低于22 ℃的,故不确定;
③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22.
则肯定进入夏季的地区有甲、丙两地.
答案:①③
【变式备选】
已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,则 ( )
A.=70,s2<75 B.=70,s2>75
C.>70,s2<75 D.<70,s2>75
【解析】选A.由题意,可得==70,设收集的48个准确数据分别记为x1,x2,…,x48,则75=[++…++(60-70)2+(90-70)2]=[++…++500],
s2=[++…++(80-70)2+(70-70)2]
=[++…++100]<75,
所以s2<75.
3.(5分)(2020·郑州模拟)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则4x+2y的值是( )
- 11 -
A.12 B.14 C.16 D.18
【解析】选A.因为中位数为12,所以x+y=4,数据的平均数为×(2+2+3+4+x+y+20+19+19+20+21)=11.4,要使该总体的标准差最小,即方差最小,所以(10+x-11.4)2+(10+y-11.4)2=(x-1.4)2+(y-1.4)2≥2=0.72,当且仅当x-1.4=y-1.4,即x=y=2时取等号,此时总体标准差最小,4x+2y=12.
【变式备选】
(2020·驻马店模拟)已知样本9,10,11,x,y的平均数是10,方差是2,则xy的值为 ( )
A.88 B.96 C.108 D.110
【解析】选B.由于样本的平均数为10,
则有=10,得x+y=20,
由于样本的方差为2,
则有=2,得+=8,
即x2+y2-20+200=8,所以x2+y2=208,
因此xy==96.
4.(10分)(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
- 11 -
附:≈8.602.
【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni
=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.029 6,所以s==0.02×≈0.17,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
5.(10分)(2020·昆明模拟)栀子原产于中国,喜温暖湿润、阳光充足的环境,较耐寒.叶,四季常绿;花,芳香素雅.绿叶白花,格外清丽.某地区引种了一批栀子作为绿化景观植物,一段时间后,从该批栀子中随机抽取100棵测量植株高度,并以此测量数据作为样本,得到该样本的频率分布直方图,其中不高于1.50 m的植株高度茎叶图如图所示.
(1)求植株高度频率分布直方图中a,b,c的值.
(2)在植株高度频率分布直方图中,同一组中的数据用该区间的中点值代表,植株高度落入该区间的频率作为植株高度取该区间中点值的频率,估计这批栀子植株高度的平均值.
- 11 -
【解析】(1)由茎叶图知,a==0.5,b==1.
由频率分布直方图知(0.5+1+c+3+4)×0.1=1,所以c=1.5.
(2)这批栀子植株高度的平均值的估计值为
×0.1=1.60(m).
(2020·佛山模拟)某高中非毕业班学生人数分布情况如表,为了了解这2 000个学生的体重情况,从中随机抽取160个学生并测量其体重数据,根据测量数据制作了如图所示的频率分布直方图.
性别年级
男生
女生
合计
高一年级
550
650
1 200
高二年级
425
375
800
合计
975
1 025
2 000
(1)为了使抽取的160个样品更具代表性,宜采取分层抽样,请你给出一个你认为合适的分层抽样方案,并确定每层应抽取的样品个数.
(2)根据频率分布直方图,求x的值,并估计全体非毕业班学生中体重在[45,75)内的人数.
(3)已知高一全体学生的平均体重为58.50 kg,高二全体学生的平均体重为61.25 kg,试估计全体非毕业班学生的平均体重.
【解析】(1)方案一:考虑到体重应与年级及性别均有关,最合理的分层应分为以下四层:
高一男生、高一女生、高二男生、高二女生
- 11 -
高一男生:×160=44(人),高一女生:×160=52(人),
高二男生:×160=34(人),高二女生:×160=30(人),
方案二:按性别分为两层,男生与女生:
男生人数:×160=78(人),女生人数:×160=82(人).
方案三:按年级分为两层,高一学生与高二学生:
高一人数:×160=96(人),
高二人数:×160=64(人).
(2)体重在[70,80)内的学生人数的频率:
1-(0.075+0.2+0.275+0.225+0.05+0.025)=0.15,x==0.015,体重在[45,75)内人数的频率为:0.1+0.275+0.225+0.075=0.675,
所以估计全体非毕业班学生体重在[45,75)内的人数为:2 000×0.675=1 350(人).
(3)设高一全体学生的平均体重为=58.5 kg,频率为P1=×100%=60%.
高二全体学生的平均体重为=61.25 kg,频率为P2=×100%=40%,
则估计全体非毕业班学生的平均体重为·P1+·P2=58.50×60%+61.25×40%=59.6 (kg).
答:估计全校非毕业班学生的平均体重为59.6 kg.
- 11 -