2021届北师大版高考理科数一轮复习教师用书:第十一章 第2讲 用样本估计总体
第2讲 用样本估计总体
一、知识梳理
1.统计图表
(1)频率分布直方图的画法步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(2)频率分布折线图
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(3)茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s=
s2=[(x1-)2+(x2-)2+…+(xn-)2]
常用结论
1.频率分布直方图的特点
(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
二、教材衍化
1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4 B.8
C.12 D.16
解析:选B.设频数为n,则=0.25,所以n=32×=8.
2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
解析:选A.因为这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是=91.5,平均数==91.5.
3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人.
解析:由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25.
答案:25
4.甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲 0 1 0 2 2 0 3 1 2 4
乙 2 3 1 1 0 2 1 1 0 1
则机床性能较好的为________.
解析:因为甲=1.5,乙=1.2,s=1.65,s=0.76,所以s
0.5,
而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m<2.5.
所以0.50×(m-2)=0.5-0.47,解得m=2.06.
故可估计该社区退休老人每人每天的平均户外活动时间的中位数为2.06时.
(3)由题意得平均户外活动时间在[1,1.5),[1.5,2)内的人数分别为15,20.
按分层抽样的方法在[1,1.5),[1.5,2)内分别抽取3人,4人,从7人中随机抽取2人,共有C=21种方法,抽取的两人恰好都在同一个组有C+C=9种方法,故抽取的2人恰好在同一个组的概率P==.
频率、频数、样本容量的计算方法
=频率,=样本容量,样本容量×频率=频数.
[提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.
1.在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )
A.15 B.18
C.20 D.25
解析:选A.根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.故选A.
2.(2020·安徽淮南二模)某乡镇为了打赢脱贫攻坚战,决定盘活贫困村的各项经济发展要素,实施了产业、创业、就业“三业并举”工程.在实施过程中,引导某贫困村农户因地制宜开展种植某经济作物.该类经济作物的质量以其质量指标值来衡量,质量指标值越大表明质量越好,记其质量指标值为k,其质量指标的等级划分如表:
质量指标值k
产品等级
k≥90
优秀
80≤k<90
良好
75≤k<80
合格
k<75
不合格
为了解该类经济作物在当地的种植效益,当地引种了甲、乙两个品种.并随机抽取了甲、乙两个不同品种的各10 000件产品,测量了每件产品的质量指标值,得到下面产品质量指标值频率分布直方图(图甲和图乙).
(1)若将频率视为概率,从乙品种产品中有放回地随机抽取3件,记“抽出乙品种产品中至少有1件优等品(质量指标值k≥80为优等品)”为事件A,求事件A发生的概率P(A);(结果保留小数点后3位)
(2)若甲、乙两个品种的销售利润率y与质量指标值k满足下表:
质量指标值k
k≥90
80≤k<90
75≤k<80
k<75
销售利润率y
3t
5t2
t2
-t
其中s,可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
(1)众数、中位数、平均数及方差的意义
①平均数与方差都是重要的数字特征,是对总体的一种简明地描述;
②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)在计算平均数、方差时可利用平均数、方差的有关结论.
1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析:选C. 甲=(4+5+6+7+8)=6,
乙=(5×3+6+9)=6,
甲的成绩的方差为(22×2+12×2)=2,
乙的成绩的方差为(12×3+32×1)=2.4.
甲的成绩的中位数为6,乙的成绩的中位数为5,
甲的成绩的极差为4,乙的成绩的极差为4,故选C.
2.(2020·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.
解:学生甲的平均成绩甲==82,
学生乙的平均成绩乙==82,
又s=×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,
s=×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=,则甲=乙,s>s,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.
[基础题组练]
1.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
解析:选A.记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.
2.(2020·陕西商洛质检)在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩性为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为( )
A.95 B.96
C.97 D.98
解析:选C.由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为=97,故选C.
3.(2020·广东珠海摸底)某班级在一次数学竞赛中设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖20元,二等奖10元,三等奖5元,参与奖2元,获奖人数的分配情况如图所示,则以下说法不正确的是( )
A.获得参与奖的人数最多
B.各个奖项中三等奖的总费用最高
C.购买奖品的平均费用为9.25元
D.购买奖品的费用的中位数为2元
解析:选C.设全班人数为a.由扇形统计图可知.一等奖占5%,二等奖占10%,三等奖占30%,参与奖占55%,获得参与奖的人数最多,故A正确;一等奖的总费用为5%a×20=a.二等奖的总费用为10%a×10=a,三等奖的总费用为30%a×5=a,参与奖的总费用为55%a×2=a,所以各个奖项中三等奖的总费用最高,故B正确;购买奖品的平均费用为5%×20+10%×10+30%×5+55%×2=4.6(元),故C错误;参与奖占55%,所以购买奖品的费用的中位数为2元,故D正确.故选C.
4.(2020·安徽六安毛坦厂中学月考)某位教师2017年的家庭总收入为80 000元,各种用途占比统计如下面的折线图.2018年收入的各种用途占比统计如下面的条形图,已知2018年的就医费用比2017年增加了4 750元,则该教师2018年的家庭总收入为( )
A.100 000元 B.95 000元
C.90 000元 D.85 000元
解析:选D.由已知得,2017年的就医费用为80 000×10%=8 000(元).故2018年的就医费用为8 000+4 750=12 750(元),所以该教师2018年的家庭总收入为=85 000(元).故选D.
5.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为甲,乙,标准差分别为σ甲,σ乙,则( )
A.甲<乙,σ甲<σ乙 B.甲<乙,σ甲>σ乙
C.甲>乙,σ甲<σ乙 D.甲>乙,σ甲>σ乙
解析:选C.由题图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知甲>乙,题图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙.
6.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n-m的值是________.
解析:由甲组学生成绩的平均数是88,可得
=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n-m=6.
答案:6
7.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________、________.
解析:由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取的高中生的近视人数为40×50%=20.
答案:200 20
8.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.
解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,
第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n==60.
答案:60
9.我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,
解得a=0.30.
(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.
由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.
(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,
所以2.5≤x<3.
由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
10.有A,B,C,D,E五位工人参加技能竞赛培训.现分别从A,B二人在培训期间参加的若干次预赛成绩中随机抽取8次.用茎叶图表示这两组数据:
(1)A,B二人预赛成绩的中位数分别是多少?
(2)现要从A,B中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由;
(3)若从参加培训的5位工人中选2人参加技能竞赛,求A,B
二人中至少有一人参加技能竞赛的概率.
解:(1)A的中位数是=84,B的中位数是=83.
(2)派B参加比较合适.理由如下:
B=(78+79+81+82+84+88+93+95)=85,
A=(75+80+80+83+85+90+92+95)=85,
s=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,
s=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,
因为A=B,但s1 848,所以每天空运250支百合花,四月后20天总利润更大.
6.某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:
(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;
(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X的分布列和均值.
解:(1) 甲 =(7+9+11+13+13+16+23+28)=15,乙=(7+8+10+15+17+19+21+23)=15,
s=[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132]=44.75,
s=[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.
甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.
(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P1=,P2=,
两人失分均超过15分的概率为P1P2=,
X的所有可能取值为0,1,2.依题意,X~B,
P(X=k)=C,k=0,1,2,
则X的分布列为
X
0
1
2
P
X的均值EX=2×=.