【数学】2020届一轮复习人教版用样本估计总体及统计图表学案

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

【数学】2020届一轮复习人教版用样本估计总体及统计图表学案

第2节 用样本估计总体及统计图表 考试要求 1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义;3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义;4.了解样本估计总体的取值规律;5.能用样本估计百分位数,理解百分位数的统计含义.‎ 知 识 梳 理 ‎1.频率分布直方图 ‎(1)频率分布表的画法:‎ 第一步:求极差,决定组数和组距,组距=;‎ 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;‎ 第三步:登记频数,计算频率,列出频率分布表.‎ ‎(2)频率分布直方图:反映样本频率分布的直方图(如图)‎ 横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.‎ ‎2.频率分布折线图和总体密度曲线 ‎(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.‎ ‎(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.‎ ‎3.样本的数字特征 ‎(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.‎ ‎(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.‎ ‎(3)平均数:把称为a1,a2,…,an这n个数的平均数.‎ ‎(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是 s=,‎ s2=[(x1-)2+(x2-)2+…+(xn-)2].‎ ‎4.百分位数 如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:一组n个观测值按数值大小排列.如,处于p%位置的值称第p百分位数.‎ ‎[微点提醒]‎ ‎1.频率分布直方图与众数、中位数与平均数的关系 ‎(1)最高的小长方形底边中点的横坐标即是众数.‎ ‎(2)中位数左边和右边的小长方形的面积和是相等的.‎ ‎(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.‎ ‎2.平均数、方差的公式推广 ‎(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.‎ ‎(2)数据x1,x2,…,xn的方差为s2.‎ ‎①数据x1+a,x2+a,…,xn+a的方差也为s2;‎ ‎②数据ax1,ax2,…,axn的方差为a2s2.‎ ‎3.中位数相当于第50百分位数.‎ 基 础 自 测 ‎1.判断下列结论正误(在括号内打“√”或“×”)‎ ‎(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(  )‎ ‎(2)一组数据的方差越大,说明这组数据越集中.(  )‎ ‎(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.(  )‎ 解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.‎ ‎(2)错误.方差越大,这组数据越离散.‎ ‎(3)正确.小矩形的面积=组距×=频率.‎ 答案 (1)√ (2)× (3)√‎ ‎2.(必修3P1002(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为(  )‎ A.4 B.8 C.12 D.16‎ 解析 设频数为n,则=0.25,∴n=32×=8.‎ 答案 B ‎3.(必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是(  )‎ A.91.5和91.5 B.91.5和92‎ C.91和91.5 D.92和92‎ 解析 ∵这组数据为87,89,90,91,92,93,94,96,‎ ‎∴中位数是=91.5,‎ 平均数==91.5.‎ 答案 A ‎4.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:‎ 则下面结论中不正确的是(  )‎ A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.‎ 法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.‎ 答案 A ‎5.(2019·新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是(  )‎ A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关 C.倾向选择生育二胎的人员中,男性人数与女性人数相同 D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 解析 ‎ 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.‎ 答案 C ‎6.(2019·上海黄浦区质检)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的,则该组的频数为________.‎ 解析 设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为p,p+p=1,p=,则中间一个小矩形的面积等于p=,200×=50,即该组的频数为50.‎ 答案 50‎ 考点一 频率分布直方图 ‎【例1】 (2019·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.‎ ‎(1)求x;‎ ‎(2)求抽取的x人的年龄的中位数(结果保留整数);‎ ‎(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取 ‎6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.‎ ‎(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;‎ ‎(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.‎ 解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴=0.05,∴x=120.‎ ‎(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,‎ ‎∴a=≈32,则中位数为32.‎ ‎(3)(ⅰ)5个年龄组成绩的平均数为1=×(93+96+97+94+90)=94,方差为s=×[(-1)2+22+32+02+(-4)2]=6.‎ ‎5个职业组成绩的平均数为2=×(93+98+94+95+90)=94,方差为s=×[(-1)2+42+02+12+(-4)2]=6.8.‎ ‎(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).‎ 规律方法 1.频率分布直方图的性质.‎ ‎(1)小长方形的面积=组距×=频率;‎ ‎(2)各小长方形的面积之和等于1;‎ ‎(3)小长方形的高=,所有小长方形的高的和为.‎ ‎2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.‎ ‎【训练1】 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.‎ A地区用户满意度评分的频率分布直方图 图①‎ B地区用户满意度评分的频率分布表 满意度评分分组 ‎[50,60)‎ ‎[60,70)‎ ‎[70,80)‎ ‎[80,90)‎ ‎[90,100]‎ 频数 ‎2‎ ‎8‎ ‎14‎ ‎10‎ ‎6‎ ‎(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);‎ B地区用户满意度评分的频率分布直方图 图②‎ ‎(2)根据用户满意度评分,将用户和满意度分为三个等级:‎ 满意度评分 低于70分 ‎70分到89分 不低于90分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的概率大?说明理由.‎ 解 (1)作出频率分布直方图如图:‎ 通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.‎ ‎(2)A地区用户的满意度等级为不满意的概率大.‎ 记CA表示事件:“A地区用户的满意度等级为不满意”;‎ CB表示事件:“B地区用户的满意度等级为不满意”.‎ 由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,‎ P(CB)的估计值为(0.005+0.02)×10=0.25.‎ 所以A地区用户的满意度等级为不满意的概率大.‎ 考点二 样本的数字特征 ‎【例2】 (1)(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是(  )‎ A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数 ‎(2)(2019·聊城模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则(  )‎ A.=4,s2<2 B.=4,s2>2‎ C.>4,s2<2 D.>4,s2>2‎ 解析 (1)刻画评估这种农作物亩产量稳定程度的指标是标准差.‎ ‎(2)∵某7个数的平均数为4,‎ ‎∴这7个数的和为4×7=28,‎ ‎∵加入一个新数据4,∴==4.‎ 又∵这7个数的方差为2,且加入一个新数据4,‎ ‎∴这8个数的方差s2==<2,故选A.‎ 答案 (1)B (2)A 规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.‎ ‎2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.‎ ‎【训练2】 抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:‎ 运动员 第1次 第2次 第3次 第4次 第5次 甲 ‎87‎ ‎91‎ ‎90‎ ‎89‎ ‎93‎ 乙 ‎89‎ ‎90‎ ‎91‎ ‎88‎ ‎92‎ 则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.‎ 解析 甲=(87+91+90+89+93)=90,‎ 乙=(89+90+91+88+92)=90,‎ s=[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,‎ s=[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.‎ 答案 2‎ ‎[思维升华]‎ ‎1.用样本估计总体是统计的基本思想.‎ 用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.‎ ‎2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.‎ ‎(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.‎ ‎3.频率分布表和频率分布直方图都可直观描述样本数据的分布规律.‎ ‎[易错防范]‎ 直方图与条形图不要搞混 频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.‎ 数据分析——百分位数的统计含义 ‎1.数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.‎ 数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.‎ ‎2.数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科学、技术、工程和现代社会生活的各个方面.‎ ‎3.数据分析主要表现为:收集和整理数据,理解和处理数据,获得和解释结论,概括和形成知识.‎ ‎4.百分位数是统计学述语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围.但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.‎ ‎【案例】 阶梯电价的设计(此材料见2017版课程标准P130)‎ ‎[情境] 为了实现绿色发展,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:‎ ‎107 101 78 99 208 127 74 223 31 131‎ ‎214 135 89 66 60 115 189 135 146 127‎ ‎203 97 96 62 65 111 56 151 106 8‎ ‎162 91 67 93 212 159 61 63 178 194‎ ‎194 216 101 98 139 78 110 192 105 96‎ ‎22 50 138 251 120 112 100 201 98 84‎ ‎137 203 260 134 156 61 70 100 72 164‎ ‎174 131 93 100 163 80 76 95 152 182‎ ‎88 247 191 70 130 49 114 110 163 202‎ ‎265 18 94 146 149 147 177 339 57 109‎ ‎107 182 101 148 274 289 82 213 165 224‎ ‎142 61 108 137 90 254 201 83 253 113‎ ‎130 82 170 110 108 63 250 237 120 84‎ ‎154 288 170 123 172 319 62 133 130 127‎ ‎107 71 96 140 77 106 132 106 135 132‎ ‎167 82 258 542 51 107 69 98 72 48‎ ‎109 134 250 42 320 113 180 144 116 530‎ ‎200 174 135 160 462 139 133 304 191 283‎ ‎121 132 118 134 124 178 206 626 120 274‎ ‎141 80 187 88 324 136 498 169 77 57‎ 根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?‎ ‎[分析]选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.‎ 通过样本估计总体百分位数的要领是对样本数据进行排序,得到有序样本(在统计学中称之为顺序统计量).利用电子表格软件,对上面的样本数据进行排序,可以得到下面的结果:‎ ‎8 18 22 31 42 48 49 50 51 56‎ ‎57 57 60 61 61 61 62 62 63 63‎ ‎65 66 67 69 70 70 71 72 72 74‎ ‎76 77 77 78 78 80 80 82 82 82‎ ‎83 84 84 88 88 89 90 91 93 93‎ ‎94 95 96 96 96 97 98 98 98 99‎ ‎100 100 100 101 101 101 105 106 106 106‎ ‎107 107 107 107 108 108 109 109 110 110‎ ‎110 111 112 113 113 114 115 116 118 120‎ ‎120 120 121 123 124 127 127 127 130 130‎ ‎130 131 131 132 132 132 133 133 134 134‎ ‎134 135 135 135 135 136 137 137 138 139‎ ‎139 140 141 142 144 416 146 147 148 149‎ ‎151 152 154 156 159 160 162 163 163 164‎ ‎165 167 169 170 170 172 174 174 177 178‎ ‎178 180 182 182 187 189 191 191 192 194‎ ‎194 200 201 201 202 203 203 206 208 212‎ ‎213 214 216 223 224 237 247 250 250 251‎ ‎253 254 258 260 265 274 274 283 288 289‎ ‎304 319 320 324 339 462 498 530 542 626‎ 样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8 kW·h,最大用电量为626 kW·h,极差为618.初中统计内容中学过的中位数,相当于50%分位数.因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130 kW·h左右.‎ 下面确定75%和95%这两个电量临界值.类似中位数的计算,因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).‎ 依据确定了的电量临界值,阶梯电价可以规定如下:用户每月用电量不超过178 kW·h(或每年用电量不超过2 136 kW·h),按第一档电价标准缴费;每月用电量(单位:kW·h)在区间(178,297]内(或每年用电量在区间(2 136,3 564]内),其中的178 kW·h按第一档电价标准缴费,超过178 kW·h的部分按第二档电价标准缴费;每月用量超过297 kW·h(或每年用电量超过3 564 kW·h),其中的178 kW·h按第一档电价标准缴费,(297-178)=119 kW·h按第二档电价标准缴费,超过297 kW·h的部分按第三档电价标准缴费.‎ 社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.‎ 评析 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大.对第p百分位数,严格的定义如下:‎ 第p百分位数是这样一个值,它使得至少有p ‎%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.‎ ‎【案例应用1】 对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题.也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好.‎ ‎【案例应用2】 假设想为退休存够钱.可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%.所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%.‎ 基础巩固题组 ‎(建议用时:40分钟)‎ 一、选择题 ‎1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是(  )‎ ‎                  ‎ A.45 B.50 C.55 D.60‎ 解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.‎ ‎∴该班学生人数n==50.‎ 答案 B ‎2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:‎ 甲 乙 丙 丁 平均环数 ‎8.3‎ ‎8.8‎ ‎8.8‎ ‎8.7‎ 方差s2‎ ‎3.5‎ ‎3.6‎ ‎2.2‎ ‎5.4‎ 从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是(  )‎ A.甲 B.乙 C.丙 D.丁 解析 由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.‎ 答案 C ‎3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(  )‎ A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩的极差 解析 由图可得,甲==6,‎ 乙==6,A项错误;‎ 甲的成绩的中位数为6,乙的成绩的中位数为5,B项错误;‎ s==2,‎ s==2.4,C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项错误.‎ 答案 C ‎4.(2019·茂名联考)甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是(  )‎ A.极差 B.平均数 C.中位数 D.都不相同 解析 由题中数据的分布,可知极差不同,‎ 甲的中位数为=18.5,乙的中位数为=16,‎ 甲==,‎ 乙==,‎ 所以甲、乙的平均数相同.故选B.‎ 答案 B 二、填空题 ‎5.某校女子篮球队7名运动员身高(单位:cm)的数据分别为:171,172,17x,174,175,180,181,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为________.‎ 解析 170+×(1+2+x+4+5+10+11)=175,‎ ×(33+x)=5,即33+x=35,解得x=2.‎ 答案 2‎ ‎6.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:‎ ‎(1)[25,30)年龄组对应小矩形的高度为________;‎ ‎(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.‎ 解析 设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h ‎+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.‎ 答案 (1)0.04 (2)440‎ ‎7.已知样本数据x1,x2,…,xn的平均数=5,则样本数据2x1+1,2x2+1,…,2xn+1的平均数为________.‎ 解析 由x1,x2,…,xn的平均数=5,得2x1+1,2x2+1,…,2xn+1的平均数为2+1=2×5+1=11.‎ 答案 11‎ 三、解答题 ‎8.某校2019届高三文(1)班在一次数学测验中,全班N名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生有14人.‎ ‎(1)求总人数N和分数在120~125的人数n;‎ ‎(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?‎ 解 (1)分数在110~120内的学生的频率为 p1=(0.04+0.03)×5=0.35,‎ 所以该班总人数N==40.‎ 分数在120~125内的学生的频率为 p2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10,‎ 分数在120~125内的人数n=40×0.10=4.‎ ‎(2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,即为=107.5.‎ 设中位数为a,‎ ‎∵0.01×5+0.04×5+0.05×5=0.50,∴a=110.‎ ‎∴众数和中位数分别是107.5,110.‎ ‎9.(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:‎ ‎(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;‎ ‎(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;‎ ‎(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.‎ 解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,‎ 所以样本中分数小于70的频率为1-0.6=0.4.‎ 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.‎ ‎(2)根据题意,样本中分数不小于50的频率为 ‎(0.01+0.02+0.04+0.02)×10=0.9,‎ 分数在区间[40,50)内的人数为100-100×0.9-5=5.‎ 所以总体中分数在区间[40,50)内的人数估计为400×=20.‎ ‎(3)由题意可知,样本中分数不小于70的学生人数为 ‎(0.02+0.04)×10×100=60,‎ 所以样本中分数不小于70的男生人数为60×=30.‎ 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.‎ 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.‎ 能力提升题组 ‎(建议用时:20分钟)‎ ‎10.(2019·湖北部分重点中学模拟)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率是(  )‎ A. B. C. D. 解析 由题意知y= 即y= 当日销量不少于20个时,日利润不少于96元.‎ 当日销量为20个时,日利润为96元.‎ 当日销量为21个时,日利润为97元.‎ 日利润为96元的有3天,记为a,b,c,日利润为97元的有2天,记为A,B,从中任选2天有(a,A),(a,B),(a,b),(a,c),(b,A),(b,B),(b,c),(c,A),(c,B),(A,B)共10种情况,‎ 其中选出的这2天日利润都是97元的有(A,B)1种情况,‎ 故所求概率为.‎ 答案 B ‎11.(2019·北京海淀区模拟)已知样本x1,x2,…,xn的平均数为x;样本y1,y2,…,ym的平均数为y(x≠y),若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0m 解析 由题意得z=(nx+my)=x+y,∴a=,‎ ‎∵0
查看更多

相关文章