【数学】2018届一轮复习苏教版(理)用样本估计总体教案(江苏专用)
第53课 用样本估计总体
[最新考纲]
内容
要求
A
B
C
总体分布的估计
√
总体特征数的估计
√
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.频率分布折线图和总体分布的密度曲线
(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.
(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫作茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
4.样本的数字特征
(1)众数、中位数、平均数
数字特征
定义与求法
优点与缺点
众数
一组数据中重复出现次数最多的数
众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征
中位数
把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2…,xn,那么这n个数的平均数=
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
(2)标准差、方差
①标准差:样本数据到平均数的一种平均距离,一般用s表示,s=.
②方差:标准差的平方s2
s2=[(x1-)2+(x2-)2+…+(xn-)2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,是样本平均数.
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中. ( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.
(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×=频率.
(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.
[答案] (1)√ (2)× (3)√ (4)×
2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图531所示,则这组数据的中位数和平均数分别是________.
图531
91.5和91.5 [这组数据由小到大排列为87,89,90,91,92,93,94,96.
∴中位数是=91.5,
平均数==91.5.]
3.如图532所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20]内的频数是________.
图532
30 [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30.]
4.(2016·江苏高考)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
0.1 [5个数的平均数==5.1,
所以它们的方差s2=[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]
5.(2017·南通模拟)某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图533,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为________.
图533
2 [170+×(1+2+x+4+5+10+11)=175,
则×(33+x)=5,即33+x=35,解得x=2.]
样本的数字特征
(1)(2015·广东高考)已知样本数据x1,x2,…,xn的均值=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________.
(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b).其中a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败.
若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平.
【导学号:62172293】
(1)11 [由条件知==5,则所求均值0==
=2+1=2×5+1=11.]
(2)甲组研发新产品的成绩为
1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,
其平均数为甲==.
方差s==.
乙组研发新产品的成绩为
1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,
其平均数为乙==.
方差s==.
因为甲>乙,s<s,
所以甲组的研发水平优于乙组.
[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.
2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.
[变式训练1] (2017·南京三模)甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:
选手
第1轮
第2轮
第3轮
第4轮
第5轮
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
9.8
则甲、乙两位选手中成绩最稳定的选手的方差是________.
0.02 [甲==10.
乙==10.
s=[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]
=(0.04+0.01+0.01+0.04)
=0.02.
s=[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]
=(0.36+0.09+0.64+0.09+0.04)
=0.244,
∴s
0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.
2.(1)例3-2中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.
[思想与方法]
1.用样本估计总体是统计的基本思想.
用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.
2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.
(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.
(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的.
[易错与防范]
1.使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义.
2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3.直方图与条形图不要搞混.
频率分布直方图的纵坐标为,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
课时分层训练(五十三)
A组 基础达标
(建议用时:30分钟)
一、填空题
1.(2016·苏锡常镇调研一)一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为________. 【导学号:62172295】
320 [因为样本容量=,所以n==320.]
2.(2017·苏州模拟)样本数据8,6,6,5,10的方差s2=________.
[∵==7,
∴s2=[(8-7)2+(6-7)2+(6-7)2+(5-7)2+(10-7)2]
=(1+1+1+4+9)
=.]
3.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
16 [已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×
8=16.]
4.(2017·苏北四市期末)交通部门对某路段公路上行驶的汽车速度实施监控,从速度在50~90 km/h的汽车中抽取150辆进行分析,得到数据的频率分布直方图(如图538所示),则速度在70 km/h以下的汽车有________辆.
图538
75 [由题图可知,速度在70 km/h以下的汽车有(0.02+0.03)×10×150=75辆.]
5.(2015·重庆高考改编)重庆市2013年各月的平均气温(℃)数据的茎叶图如图539,则这组数据的中位数是________.
图539
20 [由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为=20.]
6.某班的全体学生参加英语测试,成绩的频率分布直方图如图5310,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________. 【导学号:62172296】
图5310
50 [由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.
∴该班学生人数n==50.]
7.如图5311所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x+y=________.
图5311
10 [甲==85,x=6.
又∵乙同学的成绩众数为84,∴y=4.
∴x+y=10.]
8.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图5312所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
图5312
24 [底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.]
9.(2017·南通二调)为了解一批灯泡(共5 000只)的使用寿命,从中随机抽取了100只进行测试,其使用寿命(单位:h)如下表:
使用
寿命
[500,700)
[700,900)
[900,1 100)
[1 100,1 300)
[1 300,1 500]
只数
5
23
44
25
3
根据该样本的频数分布,估计该灯泡使用寿命不低于1 100 h的灯泡只数是________.
1 400 [抽样中不低于1 100h的灯泡共有25+3=28只,
故这批灯泡中使用寿命不低于1 100h的灯泡
有×5 000=1 400(只).]
10.为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图5313所示的茎叶图.考虑以下结论:
图5313
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的序号为________.
①④ [甲地5天的气温为:26,28,29,31,31,
其平均数为甲==29;
方差为s=[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;
标准差为s甲=.
乙地5天的气温为:28,29,30,31,32,
其平均数为乙==30;
方差为s=[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为s乙=.∴甲<乙,s甲>s乙.]
二、解答题
11.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图5314所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.
图5314
(1)求出m,n的值;
(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s和s,并由此分析两组技工的加工水平. 【导学号:62172297】
[解] (1)根据题意可知:甲=(7+8+10+12+10+m)=10,乙=(9+n+10+11+12)=10,
∴m=3,n=8.
(2)s=[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,
s=[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,
∵甲=乙,s>s,
∴甲、乙两组的整体水平相当,乙组更稳定一些.
12.(2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
图5315
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
[解] (1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,w至少定为3.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:
组号
1
2
3
4
5
6
7
8
分组
[2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,17]
(17,22]
(22,27]
频率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
B组 能力提升
(建议用时:15分钟)
1.(2017·扬州模拟)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
图5316
则7个剩余分数的方差为________.
[由题意知=91,
解得x=4.所以s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]
=(16+9+1+0+1+9+0)=.]
2.某电子商务公司对10 000名网络购物者2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图5317所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
图5317
(1)3 (2)6 000 [(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.
(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.
因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.]
3.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图5318.
图5318
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]
的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
[解] (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x=0.007 5,
∴直方图中x的值为0.007 5.
(2)月平均用电量的众数是=230.
∵(0.002+0.009 5+0.011)×20=0.45<0.5,
∴月平均用电量的中位数在[220,240)内,设中位数为a,则(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,解得a=224,即中位数为224.
(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300]的用户分别有15户、10户、5户,
故抽样比为=,
∴从月平均用电量在[220,240)的用户中应抽取25×=5(户).
4.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图5319,据此解答下列问题:
图5319
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.
[解] (1)分数在[50,60]的频率为0.008×10=0.08.
由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为=25.
(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中
[80,90]间的矩形的高为÷10=0.016.