【数学】2018届一轮复习人教A版专题3数据的数字特征用样本估计总体学案
专题3 数据的数字特征 用样本估计总体
1.中心位置特征:众数、中位数、平均数.
2.标准差、方差
标准差是样本数据到平均数的一种平均距离,一般用s表示.
其计算公式为
s= .
3.样本数据x1,x2,…,xn的标准差的算法
(1)算出样本数据的平均数x;(2)算出每个样本数据与样本数据平均数的差:xi-x(i=1,2,…,n);(3)算出(2)中xi-x(i=1,2,…,n)的平方;(4)算出(3)中n个平方数的平均数,即为样本方差;(5)算出(4)中平均数的算术平方根,即为样本标准差.
4.方差
从数学的角度考虑,人们有时用标准差的平方s2(即方差)来代替标准差,作为测量样本数据分散程度的工具:
s2=[(x1-x)2+(x2-x)2+…+(xn-x)2].
例1 在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表:
分组
频数
频率
[1.30,1.34)
4
[1.34,1.38)
25
[1.38,1.42)
30
[1.42,1.46)
29
[1.46,1.50)
10
[1.50,1.54]
2
合计
100
(1)完成频率分布表,并画出频率分布直方图;
(2)估计纤度落在[1.38,1.50)内的可能性及纤度小于1.42的可能性各是多少?
变式训练1 在某次法律知识竞赛中,将来自不同学校的学生的成绩绘制成如图所示的频率分布直方图.已知成绩在60~70的学生有40人,则成绩在70~90的有______人.
例2 甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列正确的是( )
A.x甲>x乙;乙比甲成绩稳定
B.x甲>x乙;甲比乙成绩稳定
C.x甲
s乙,∴乙比甲稳定,用乙较合适.
变式训练3 解 设第一组20名学生的成绩为xi(i=1,2,…,20),第二组20名学生的成绩为yi(i=1,2,…,20),依题意有:
=(x1+x2+…+x20)=90,=(y1+y2+…+y20)=80,
故全班平均成绩为:
=(x1+x2+…+x20+y1+y2+…+y20)
=(90×20+80×20)=85;
又设第一组学生成绩的标准差为s1,第二组学生成绩的标准差为s2,则s=(x+x+…+x-202),
s=(y+y+…+y-202),
(此处,=90,=80),又设全班40名学生的标准差为s,平均成绩为 (=85),
故有s2=(x+x+…+x+y+y+…+y-402)
=(20s+20s+202+202-402)
=(62+42+902+802-2×852)=51.
所以s=.
强化提高
1.D [本题考查的对象是80件产品的质量,故总体是80件产品的质量;个体是1件产品的质量;样本是所抽取的10件产品的质量,故样本容量是10.故选D.]
2.B [∵N==M,∴M∶N=1.]
3.B [根据所给的数据的分组和各组的频数知道,大于或等于31.5的数据有[31.5,35.5),12;[35.5,39.5),7;[39.5,43.5),3,可以得到共有12+7+3=22,∵本组数据共有66个,
∴大于或等于31.5的数据约占=,故选B.]
4.A [频率等于长方形的面积,所有长方形的面积和等于1,设中间长方形的面积等于S,则S=(1-S),S=,设中间一组的频数为x,则=,得x=32.]
5.0.1
解析 ==5.1,则方差s2=[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
6.30
解析 由s=
= ,
即2= ,
得x+x+…+x=30.
7.4s2
解析 根据题意可得,因为方差公式
s2=,
所以,s2==4s2.
8.C [由茎叶图可知,甲运动员的得分大部分集中在14~18分之间,而乙运动员的得分相对比较散且在低分区的较多,故甲篮球运动员比赛得分更稳定,甲运动员的成绩好.]
9.D [设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.]
10.60
解析 由已知,得×n=27,即×n=27,解得n=60.
11.96 92 乙
解析 由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在(60,80)内,乙班的成绩集中在(70,90)内,故乙班的平均成绩较高.
12.1,1,3,3
解析 假设这组数据按从小到大的顺序排列为x1,x2,x3,x4,
则
∴
又s=
=
==1,
∴(x1-2)2+(x2-2)2=2,
同理可求得(x3-2)2+(x4-2)2=2,
由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为圆(x-2)2+(y-2)2=2上的点,
分析知x1,x2,x3,x4应为1,1,3,3.
13.解 (1)根据系统抽样的定义可知,每隔30分钟抽取一包产品,抽取的时间间隔相同,满足系统抽样的定义,
∴这种抽样方法是系统抽样.
(2)将两组数据用茎叶图表示如图:
(3)甲的平均数为(102+101+99+98+103+98+99)=100.
乙的平均数为(110+115+90+85+75+115+110)=100.
由茎叶图中的数据可知甲的成绩主要集中在90和100附近,乙的成绩比较分散,∴甲比乙稳定.
14.解 依题意,甲乙得分情况如下表:
第1局
第2局
第3局
第4局
第5局
甲
2
0
3
2
6
乙
0
5
3
5
0
因为甲得分平均数=2.6,乙得分平均数=2.6,甲得分的标准差≈1.96,乙得分的标准差≈2.24,所以,甲得分平均数=乙得分平均数,甲得分的标准差<乙得分的标准差,故甲投篮的水平高.