- 2021-06-11 发布 |
- 37.5 KB |
- 17页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2019届二轮复习第十章第2节 用样本估计总体学案(全国通用)
第2节 用样本估计总体 最新考纲 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 知 识 梳 理 1.频率分布直方图 (1)频率分布表的画法: 第一步:求极差,决定组数和组距,组距=; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图) 横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率. 2.茎叶图 统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 3.样本的数字特征 (1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:把称为a1,a2,…,an这n个数的平均数. (4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是 s= s2=[(x1-)2+(x2-)2+…+(xn-)2] [常用结论与微点提醒] 1.频率分布直方图中各小矩形的面积之和为1. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a. (2)数据x1,x2,…,xn的方差为s2. ①数据x1+a,x2+a,…,xn+a的方差也为s2; ②数据ax1,ax2,…,axn的方差为a2s2. 诊 断 自 测 1.思考辨析(在括号内打“√”或“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中.( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ) 解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积=组距×=频率. (4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误. 答案 (1)√ (2)× (3)√ (4)× 2.(必修3P70改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( ) A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92 解析 这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数是=91.5, 平均数==91.5. 答案 A 3.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数 解析 刻画评估这种农作物亩产量稳定程度的指标是标准差. 答案 B 4.(2018·长沙一中质检)某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测后所作的频率分布直方图,则从图中可以看出被处罚的汽车大约有( ) A.30辆 B.40辆 C.60辆 D.80辆 解析 从频率分布直方图知,车速大于或等于70 km/h的频率为0.02× 10=0.2.由于样本容量为200,故“超速”被罚的汽车约有200×0.2=40(辆). 答案 B 5.(2016·江苏卷)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 解析 易求=(4.7+4.8+5.1+5.4+5.5)=5.1, ∴方差s2=[(-0.4)2+(-0.3)2+02+0.32+0.42]=0.1. 答案 0.1 考点一 茎叶图及其应用 【例1】 (1)(2017·山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( ) A.3,5 B.5,5 C.3,7 D.5,7 (2)(2018·济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为( ) A.2 B.4 C.5 D.6 解析 (1)由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5. 由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66, 从而有=66,解得x=3. (2)由茎叶图可得,获“诗词达人”称号的有8人,据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为8×=2(人). 答案 (1)A (2)A 规律方法 1.茎叶图的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小. 2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息. 【训练1】 (1)(2018·广东广雅中学联考)某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是( ) A.10 B.11 C.12 D.13 (2)(2018·长沙模拟)空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0 50为优;51 100为良;101 150为轻度污染;151 200为中度污染;201 300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如下.根据该统计数据,估计此地该年AQI大于100的天数约为 (该年为365天). 解析 (1)∵甲组学生成绩的平均数是88, ∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3, ∵乙组学生成绩的中位数是89,∴n=9, ∴m+n=12. (2)该样本中AQI大于100的频数是4,频率为, 由此估计该地全年AQI大于100的频率为, 估计此地该年AQI大于100的天数约为365×=146. 答案 (1)C (2)146 考点二 频率分布直方图(易错警示) 【例2】 (2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图: (1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×=30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 规律方法 1.频率、频数、样本容量的计算方法 (1)×组距=频率. (2)=频率,=样本容量,样本容量×频率=频数. 2.例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键,并利用频率分布直方图可以估计总体分布. 易错警示 1.频率分布直方图的纵坐标是,而不是频率,切莫与条形图混淆. 2.制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确. 【训练2】 某校2018届高三文(1)班在一次数学测验中,全班N名学生的数学成绩的频率分布直方图如下,已知分数在110 120的学生有14人. (1)求总人数N和分数在120 125的人数n; (2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少? 解 (1)分数在110 120内的学生的频率为 P1=(0.04+0.03)×5=0.35, 所以该班总人数N==40. 分数在120 125内的学生的频率为 P2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10, 分数在120 125内的人数n=40×0.10=4. (2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,即为=107.5. 设中位数为a, ∵0.01×5+0.04×5+0.05×5=0.50,∴a=110. ∴众数和中位数分别是107.5,110. 考点三 样本的数字特征 【例3】 (1)(2018·济南一中质检)2017年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为( ) A.9 B.4 C.3 D.2 (2)(2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图. ①求直方图中a的值; ②设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; ③估计居民月均用水量的中位数. (1)解析 由茎叶图得该组数据的平均数=(87+89+90+91+93)=90. ∴方差为[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4. 答案 B (2)解 ①由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04. 同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02. 由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a, 解得a=0.30. ②由①知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. ③设中位数为x吨. 因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5. 又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5. 所以2≤x<2.5. 由0.50×(x-2)=0.5-0.48,解得x=2.04. 故可估计居民月均用水量的中位数为2.04吨. 规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定. 2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征. 【训练3】 (2018·北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下: 假设每名同学最近一周平均每天的锻炼时间是互相独立的. ①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; ②从平均值分析,男生每天锻炼的时间比女生多; ③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差; ④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大. 其中符合茎叶图所给数据的结论是( ) A.①②③ B.②③④ C.①②④ D.①③④ 解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确. 男生平均每天锻炼时间超过65分钟的概率P1==,女生平均每天锻炼时间超过65分钟的概率P2==,P1>P2,因此④正确. 设男生、女生两组数据的平均数分别为甲,乙,标准差分别为s甲,s乙. 易求甲=65.2,乙=61.8,知甲>乙,②正确. 又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, ∴s甲查看更多
相关文章
- 当前文档收益归属上传用户