- 2021-06-09 发布 |
- 37.5 KB |
- 7页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
人教A版数学必修三2-2-2标准差
第 2 课时 标准差 (一)导入新课 思路 1 平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区 的统计显示,该地区的中学生的平均身高为 176 cm,给我们的印象是该地区的中学生生长发育好,身高较高. 但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就 不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另 外的角度来考察样本数据的统计量——标准差.(教师板书课题) 思路 2 在一次射击选拔比赛中,甲、乙两名运动员各射击 10 次,命中环数如下﹕ 甲运动员:7,8,7,9,5,4,9,10,7,4; 乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比 赛? 我们知道,x 甲=7,x 乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢? 从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度 来考察这两组数据——标准差. (二)推进新课、新知探究、提出问题 (1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)? (2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算 发现,两个样本的平均数均为 125. 甲 110 120 130 125 120 125 135 125 135 125 乙 115 100 125 130 115 125 125 145 125 145 哪种钢筋的质量较好? (3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续 7 年的种植对比实验,年亩产 量分别如下:(千克) 甲:600, 880, 880, 620, 960, 570, 900(平均 773) 乙:800, 860, 850, 750, 750, 800, 700(平均 787) 请你用所学统计学的知识,说明选择哪种品种推广更好? (4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到 1.5 万元的家 庭即达到小康生活水平.民政局对该市 100 户家庭进行调查统计,它们的人均收入达到了 1.6 万元,民政局即 宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际? (5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程 度? 讨论结果: (1)利用频率分布直方图估计众数、中位数、平均数: 估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等. 估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2) 由上图可以看出,乙样本的最小值 100 低于甲样本的最小值 110,乙样本的最大值 145 高于甲样本的最大 值 135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定. 我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分 散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组 数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理. (4)不符合实际. 样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的 分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度. (5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的 附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的 统计量是方差和标准差. 标准差: 考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平 均数的一种平均距离,一般用 s 表示. 所谓“平均距离”,其含义可作如下理解: 假设样本数据是 x1,x2,…,xn, x 表示这组数据的平均数.xi 到 x 的距离是|xi- x |(i=1,2,…,n). 于是,样本数据 x1,x2,…,xn 到 x 的“平均距离”是 S= n xxxxxx n |||||| 21 . 由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s= ])()()[(1 22 2 2 1 xxxxxxn n . 意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程 度就越小,也就越稳定.从标准差的定义可以看出,标准差 s≥0,当 s=0 时,意味着所有的样本数据都等于样本平 均数. 标准差还可以用于对样本数据的另外一种解释.例如, 在关于居民月均用水量的例子中,平均数 x =1.973,标准差 s=0.868,所以 x +s=2.841, x +2s=3.709; x -s=1.105, x -2s=0.237. 这 100 个数据中,在区间[ x -2s, x +2s]=[0.237,3.709]外的只有 4 个,也就是说,[ x -2s, x +2s] 几乎包含了所有样本数据. 从数学的角度考虑,人们有时用标准差的平方 s2——方差来代替标准差,作为测量样本数据分散程度 的工具: s2= n 1 [(x1- x )2+(x2- x )2+…+(xn- x )2]. 显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差. 需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求 得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前 面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接 受的. 两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成 绩的标准差的计算器计算. 用计算器计算运动员甲的成绩的标准差的过程如下: 即 s 甲=2. 用类似的方法,可得 s 乙≈1.095. 由 s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.(三) (三)应用示例 思路 1 例 1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7; (4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每 一组数据的标准差. 解:四组样本数据的条形图如下: 四组数据的平均数都是 5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的. 例 2 甲、乙两人同时生产内径为 25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零 件中各抽出 20 件,量得其内径尺寸如下(单位:mm): 甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48 从生产的零件内径的尺寸看,谁生产的质量较高? 分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径 25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸 25.40 mm 的差 异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准 差大的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平 均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想, 我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之 间差异的估计值. 解:用计算器计算可得 甲x ≈25.401, 乙x ≈25.406; s 甲≈0.037,s 乙≈0.068. 从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于 s 甲查看更多