- 2021-06-16 发布 |
- 37.5 KB |
- 35页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
【数学】2019届一轮复习北师大版统计与古典概型(文)学案
透析高考数 23题对对碰【 精品】 第三篇 主题18 统计与概率(文) 【主题考法】本主题考题形式为解答题,以应用题为背景以茎叶图、频率分布直方图、条形图等统计数表为载体,考查抽样方法、总体估计、回归分析、独立性检验、古典概型、几何概型及互斥事件的概率求法等概率统计知识与方法,考查应用意识、运算求解能力,难度为中档试题,分值为12分. 【主题考前回扣】 1.抽样方法 简单随机抽样、分层抽样、系统抽样. ①从容量为N的总体中抽取容量为n的样本,则每个个体被抽到的概率都为; ②分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量. 2.统计中四个数据特征 ①众数 在样本数据中,出现次数最多的那个数据; ②中位数 在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数; ③平均数 样本数据的算术平均数, 即=(x1+x2+…xn); ④方差与标准差 方差 s2=[(x1-)2+(x2-)2+…+(xn-)2]. 标准差 s=. 3.直方图的三个结论 ①小长方形的面积=组距×=频率; ②各小长方形的面积之和等于1; ③小长方形的高=,所有小长方形高的和为. 4.回归分析(1)回归直线=x+经过样本点的中心点(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值. 5.独立性检验 对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d n 则 2=(其中n=a+b+c+d为样本容量). 利用随机变量 2 判断“两个分类变量有关系”的方法称为独立性检验.如果 2的观测值 越大,说明“两个分类变量有关系”的可能性越大. 6.古典概型的概率 (1)公式P(A)==. (2)古典概型的两个特点 所有可能出现的基本事件只有有限个;每个基本事件出现的可能性相等. 7.几何概型的概率 (1)P(A)=. (2)几何概型应满足两个条件 ①试验中所有可能出现的结果(基本事件)有无限多个;②每个基本事件出现的可能性相等. 8.概率的性质及互斥事件的概率 (1)概率的取值范围 0≤P(A)≤1. (2)必然事件的概率 P(A)=1. (3)不可能事件的概率 P(A)=0. (4)若A,B互斥,则P(A∪B)=P(A)+P(B),特别地P(A)+P()=1. 【易错点提醒】 1.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错. 2.利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义 (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 3.在独立性检验中, 2=(其中n=a+b+c+d)所给出的检验随机变量 2的观测值 ,并且 的值越大,说明“X与Y有关系”成立的可能性越大,可以利用数据 确定“X与Y有关系”的可信程度. 4.混淆直线方程y=ax+b与回归直线=x+系数的含义,导致回归分析中致误. 5.应用互斥事件的概率加法公式,一定要注意确定各事件是否彼此互斥,并且注意对立事件是互斥事件的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件. 6.几何概型的概率计算中,几何“测度”确定不准而导致计算错误 7.求古典概型的概率的关键是正确列举出基本事件的总数和待求事件包含的基本事件数,两点注意 (1)对于较复杂的题目,列出事件数时要正确分类,分类时应不重不漏. (2)当直接求解有困难时,可考虑求其对立事件的概率. 8..利用古典概型计算事件A的概率应注意的问题 ①本试验是否是等可能的;②本试验的基本事件有多少个;③事件A是什么,它包含的基本事件有多少个,回答好这三个方面的问题,解题才不会出错. 【主题考向】 考向一 抽样方法与总体估计 【解决法宝】1.分层抽样的本质是按比例确定每层抽取个体的个数。 2.解决总体分布估计问题,若利用频率分布直方图求众数,即最高的小长方形底边中点的横坐标即是众数;若利用频率分布直方图求为中位数,即利用中位数左边和右边的小长方形的面积和是相等的求解;若为利用频率分布直方图求平均数,即为频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和;若为估计某个范围上的概率或频数,根据频率分布直方图求出该范围上所有频率之和即为概率,频率乘以样本容量即为频数. . 3.给出样本的茎叶图,出现次数最多的样本数据即为众数,数据从小到大排成一列,若中间为一个数,该数为中位数,若中间为两个数,则中间两个数的平均值为中位数,均值和方差利用均值和方差公式计算出样本的均值和方差即为总体的均值与方差. 例1.【河南省郑州市2018年二质测】某市举行了一次初一 生调研考试,为了解本次考试 生的数 成绩情况,从中抽取部分 生的分数(满分为100分,得分取正整数,抽取 生的分数均在之内)作为样本(样本容量)进行统计,按照的分组方法作出频率分布直方图,并作出了样本分数的茎叶图(茎叶图中仅列出了得分在的数据]. (Ⅰ)求频率分布直方图中的的值,并估计 生分数的中位数; (Ⅱ)字在选取的样本中,从成绩在80分以上(含80分)的 生中随机抽取2名 生,求所抽取的2名 生中恰有一人得分在内的概率. 【分析】(Ⅰ)由题意可知,样本容量, ,再根据中位数的定义得到;(Ⅱ)根据古典概型的计算公式得到 总的事件个数为10件,满足情况的有2件,故得到概率为. 【解析】(Ⅰ)由题意可知,样本容量, , . 因为所以 生分数的中位数在内, 设中位数为, 得. 考向二 几何概型 【解决法宝】1.当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解; 2.利用几何概型求概率时,关键是构成试验的全部结果的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域. 例2.【福建省三明市二中2018届二模】设关于的一元二次方程. (1)若从, , , 四个数中任取的一个数, 是从, , 三个数中任取的一个数,求上述方程有实根的概率; (2)若是从区间上任取的一个数, 是从区间上任取的一个数,求上述方程有实根的概率. 【分析】(1)所有基本事件为从, , , 四个数中任取的一个数, 是从, , 三个数中任取的一个数;所求事件为方程有实根,即,分别列举出的组合,根据古典概型计算概率;(2)所有基本事件为从区间上任取的一个数, 是从区间上任取的一个数,所求事件为方程有实根, 即,分别列出不等式画出区域,根据几何概型求出概率. 【解析】若方程有实根,则,即. (1)设“方程有实根”为事件, ∵从四个数中任取的一个数, 是从三个数中任取的一个数, ∴记为所取两数的一个组合,则所有可能的取法有 , , , , , , , , , , , 共12种且每种均等可能被抽到,其中满足条件的有, , , , , , , , 共9种, ∴. = (2)设“方程有实根”为事件, ∵从区间上任取的一个数, 是从区间上任取的一个数, ∴记为所取两数的一个组合,则, , ∴点所在的区域为如图所示的矩形, 又条件可化为,即, ∴满足条件的点所在的区域为如图所示的阴影部分区域 ∴. 考向三 回归分析 【解决法宝】回归分析问题的处理步骤 先画出散点图,利用散点图判定两个变量是否先线性相关,若不线性相关,根据散点图选择合适的拟合函数,然后对拟合函数进行变换,化为线性相关问题;第二步,若样本数据较小,选第二个公式求,若样本数据较大但与样本均值差较小用第1个公式求,再利用回归直线过样本中心点求,得到回归直线方程;第三步,利用回归方程进行预测或对回归模型进行回归分析. 例3.【湖北省荆州中 等“四地七校2018届2月联考】已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度(单位),对某种鸡的时段产蛋量(单位 )和时段投入成本(单位 万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度和产蛋量的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值. 其中, . (1)根据散点图判断, 与哪一个更适宜作为该种鸡的时段产蛋量关于鸡舍时段控制温度的回归方程类型?(给判断即可,不必说明理由) (2)若用作为回归方程模型,根据表中数据,建立关于的回归方程; (3)已知时段投入成本与的关系为,当时段控制温度为时,鸡的时段产蛋量及时段投入成本的预报值分别是多少? 附 ①对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计分别为, ② 【分析】(1)由散点图可作出判断;(2)由得,令, , ,由图表中的数据可知, ,从而得到关于的回归方程;(3)根据回归直线方程得到时, , . 【解析】(1)适宜 (2)由得 令, , 由图表中的数据可知, ∴ ∴关于的回归方程为 (3)时,由回归方程得, 即鸡舍的温度为时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432. 考向四 独立性检验 【解题法宝】对独立性检验问题,根据条件列出2×2列联表,根据实际问题需要的可信度确定临界值;利用公式=,由观测数据计算得到随机变量的观测值;如果>,就以的把握认为“与有关系”;否则就说样本观测值没有提供“与有关系”的充分证据. 例4 【云南省保山市2018届二统测】某校进行文 、理 数 成绩对比,某次考试后,各随机抽取100名同 的数 考试成绩进行统计,其频率分布表如下. (Ⅰ)根据数 成绩的频率分布表,求理 数 成绩的中位数的估计值;(精确到0.01) (Ⅱ)请填写下面的列联表,并根据列联表判断是否有90 的把握认为数 成绩与文理 有关 参考公式与临界值表 0.100 0.050 0.025 0.010 0.001 2.706 3.841 5.024 6.635 10.828 【分析】(Ⅰ)中位数两边的概率值相等均为0.5,由此可得解; (Ⅱ)根据数 成绩的频率分布表可完成列联表,根据题中公式计算,查表下结论即可. 【解析】(Ⅰ)文 数 成绩的频率分布表中,成绩小于105分的频率为0.41<0.5, 成绩小于120分的频率为0.78>0.5, 故文 数 成绩的中位数的估计值为分. (Ⅱ)根据数 成绩的频率分布表得如下列联表 数 成绩分 数 成绩分 合计 理 25 75 100 文 22 78 100 合计 47 153 200 , 故没有90 的把握认为数 成绩与文理 有关. 考向五 古典概型 【解题法宝】1.求古典概型的概率的关键是正确列举出基本事件的总数和待求事件包含的基本事件数. 2..基本事件数的探求方法 ①列举法 适合于较简单的试验; ②树状图法 适合于较为复杂的问题中的基本事件的探求. ③列表法 适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化 例5 【湖南省郴州市2018届二质检】寒冷的冬天,某高中一组 生 到一大棚蔬菜基地,研究种子发芽与温度控制技术的关系,他们分别记录五组平均温度及种子的发芽数,得到如下数据 平均温度() 11 10 13 9 12 发芽数(颗) 25 23 30 16 26 (Ⅰ)若从五组数据中选取两组数据,求这两组数据平均温度相差不超过概率; (Ⅱ)求关于的线性回归方程; (Ⅲ)若由线性回归方程得到的估计数据与实际数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(Ⅱ)屮所得的线性回归方程是否可靠? (注 , ) 【分析】(Ⅰ)利用列举法可得五组数据中选取两组数据总事件数为 ,两组数据平均温度相差不超过的事件数为,由古典概型概率公式可得结果;(Ⅱ)根据表格中的数据及平均数公式可求出与的值可得样本中心点的坐标,从而求可得公式中所需数据,求出的值,再结合样本中心点的性质可得的值,进而可得关于的回归方程;(Ⅲ)将表格中所给的值代入回归方程求出的值与表格中对应值比较即可的结果. 【解析】(Ⅰ)设,则基本事件为, , , , , , , , , ,所以 (Ⅱ), 关于的线性回归方程 (Ⅲ)利用回归方程得到五组估计数据如图 平均温度 11 10 13 9 12 发芽数(颗) 25 23 30 16 26 估计发芽数 24 21 30 18 27 所以线性回归方程是可靠的. 【主题集训】 1.【江西省上饶市2018届二模】上饶某购物中心在开业之后,为了解消费者购物金额的分布,在当月的电脑消费小票中随机抽取张进行统计,将结果分成5组,分别是,制成如图所示的频率分布直方图(假设消费金额均在元的区间内). (1)若在消费金额为元区间内按分层抽样抽取6张电脑小票,再从中任选2张,求这2张小票均 自元区间的概率; (2)为做好五一劳动节期间的商场促销活动,策划人员设计了两种不同的促销方案 方案一 全场商品打8.5折; 方案二 全场购物满200元减20元,满400元减50元,满600元减80元,满800元减120元,以上减免只取最高优惠,不重复减免.利用直方图的信息分析哪种方案优惠力度更大,并说明理由(直方图中每个小组取中间值作为该组数据的替代值). 【解析】(1)由图可知, 中抽取2张,设为, 中抽取4张,设为, 共有15个基本事件 ,其中2张小票均 自的基本事件为,所以; (2)方案一 元. 方案二 ,所以方案二优惠力度更大. 2. 【山西省2018届一模】某快递公司收取快递费用的标准是 重量不超过的包裹收费10元;重量超过的包裹,除收费10元之外,超过的部分,每超出(不足,按计算)需再收5元. 该公司对近60天,每天揽件数量统计如下表 (1)某人打算将三件礼物随机分成两个包裹寄出,求该人支付的快递费不超过30元的概率; (2)该公司从收取的每件快递的费用中抽取5元作为前台工作人员的工资和公司利润,剩余的作为其他费用.前台工作人员每人每天揽件不超过150件,工资100元,目前前台有工作人员3人,那么,公司将前台工作人员裁员1人对提高公司利润是否更有利? 【解析】(1)由题意,寄出方式有以下三种可能 所有3种可能中,有1种可能快递费未超过30元,根据古典概型概率计算公式,所示概率为; (2)将题目中的天数转化为频率,得 若不裁员,则每天可揽件的上限为450件,公司每日揽件数情况如下 故公司平均每日利润的期望值为(元); 若裁员1人,则每天可揽件的上限为300件,公司每日揽件数情况如下 故公司平均每日利润的期望值为(元) 故公司将前台工作人员裁员1人对提高公司利润不利. 3.【天津市十二重点中 2018年联考】为进一步贯彻落实“十九”大精神,某高校组织了“歌颂祖国,紧跟党走”为主题的党史知识竞赛,从参加竞赛的 生中,随机抽取40名 生,将其成绩分为六段,,,得到如图所示的频率分布直方图. (1)求图中的值; (2)若从竞赛成绩在与两个分数段的 生中随机选取两名 生,设这两名 生的竞赛成绩之差的绝对值不大于分为事件,求事件发生的概率. 【解析】(1)由于图中所有小矩形的面积之和等于1, 所以, 解得. (2)成绩在分数段内的人数为人,分别记为, 成绩在分数段内的人数为人,分别记为, 在两个分数段内随机选取两名 生,所有的基本事件为 , 共15种. 事件包含的基本事件有 共7种. 事件发生的概率为. 4. 【广西桂林、贺州、崇左三市2018届二联考】 某地区积极发展电商,通过近些年工作的开展在新农村建设和扶贫过程中起到了非常重要的作用,促进了农民生活富裕,为了更好地了解本地区某一特色产品的宣传费 (千元)对销量 (千件)的影响,统计了近六年的数据如下 (1)若近6年的宣传费与销量呈线性分布,由前5年数据求线性回归直线方程,并写出的预测值; (2)若利润与宣传费的比值不低于20的年份称为“吉祥年”,在这6个年份中任意选2个年份,求这2个年份均为“吉祥年”的概率 附 回归方程的斜率与截距的最小二乘法估计分别为, ,其中, 为, 的平均数. 【解析】(1)由前5年数据可得 , , , ∴ ∴回归直线方程为,将代入得 ∴的预测值为82.5. (2)从6个年份中任取2个年份的情况为 , , , , , , , , , , , , , , ,共15种. 2个年份均为“吉祥年”的情况有 , , , , , ,共6种. ∴6个年份中任意选个2个年份均为“吉祥年”的概率为. 5.【江西省临川一中等九校2018届联考】进入高三,同 们的 习越 越紧张, 生休息和锻炼的时间也减少了. 校为了提高 生的 习效率,鼓励 生加强体育锻炼.某中 高三(3)班有 生50人.现调查该班 生每周平均体育锻炼时间的情况,得到如下频率分布直方图.其中数据的分组区间为 (1)求 生周平均体育锻炼时间的中位数(保留3位有效数字); (2)从每周平均体育锻炼时间在 的 生中,随机抽取2人进行调查,求此2人的每周平均体育锻炼时间都超过2小时的概率; (3)现全班 生中有40 是女生,其中3个女生的每周平均体育锻炼时间不超过4小时.若每周平均体育锻炼时间超过4小时称为经常锻炼,问 有没有90 的把握说明,经常锻炼与否与性别有关? 附 P( 2≥ 0) 0.100 0.050 0.010 0.001 0 2.706 3.841 6.635 10.828 【解析】(1)设中位数为a, 因为前三组的频率和为 (0.02+0.03+0.11)×2=0.32<0.5, 第四组的频率为 0.14×2=0.28,所以(a-6)×0.14=0.5-0.32,a= 生周平均体育锻炼时间的中位数是7.29 (3)由已知可知,不超过4小时的人数为 50×0.05×2=5人,其中女生有3人,所以男生有2人,因此经常锻炼的女生有50×40 -3=17人,男生有30-2=28人 所以2×2列联表为 男生 女生 小计 经常锻炼 28 17 45 不经常锻炼 2 3 5 小计 30 20 50 所以 所以没有90 的把握说明,经常锻炼与否与性别有关. 6.【河北省衡水中 2018届十模】一只药用昆虫的产卵数与一定范围内的温度有关,现收集了该种药用昆虫的组观测数据如下表 温度 产卵数 /个 经计算得 , , , , ,线性回归模型的残差平方和, ,其中, 分别为观测数据中的温差和产卵数, . (1)若用线性回归方程,求关于的回归方程(精确到); (2)若用非线性回归模型求得关于回归方程为,且相关指数. (i)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好. (ii)用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数). 附 一组数据, ,…, ,其回归直线的斜率和截距的最小二乘估计为, ;相关指数 【解析】(1)由题意得, , ∴, ∴关于的线性回归方程为. (2)(i)由所给数据求得的线性回归方程为,相关指数为 . 因为, 所以回归方程比线性回归方程拟合效果更好. (ii)由(i)得当温度时, . 又∵,∴(个). 即当温度时,该种药用昆虫的产卵数估计为个. 7.【四川省凉山州2018届二诊】为了解男性家长和女性家长对高中 生成人礼仪式的接受程度,某中 团委以问卷形式调查了位家长,得到如下统计表 男性家长 女性家长 合计 赞成 无所谓 合计 (1)据此样本,能否有的把握认为“接受程度”与家长性别有关?说明理由; (2) 校决定从男性家长中按分层抽样方法选出人参加今年的高中 生成人礼仪式,并从中选人交流发言,求发言人中至多一人持“赞成”态度的概率.. 参考数据 参考公式 【解析】(1)由题 , , , , ∴,所以,没有的把握认为“接受程度”与家长性别有关. (2)选出的人中持“赞成”态度的人数为 (人) 持“无所谓”态度的人数为 (人) 设持“赞成”态度的恩分别为, ;持“无所谓”态度的人分别为, , 基本事件总数为 , , , , , , , , 共种. 其中至多一人持“赞成”态度的有 种 ∴. 8.【山东省聊城市2018届高三一模】为促进农业发展,加快农村建设,某地政府扶持兴建了一批“超级蔬菜大棚”.为了解大棚的面积与年利润之间的关系,随机抽取了其中的7个大棚,并对当年的利润进行统计整理后得到了如下数据对比表 大棚面积(亩) 4.5 5.0 5.5 6.0 6.5 7.0 7.5 年利润(万元) 6 7 7.4 8.1 8.9 9.6 11.1 由所给数据的散点图可以看出,各样本点都分布在一条直线附近,并且与有很强的线性相关关系. (Ⅰ)求关于的线性回归方程; (Ⅱ)小明家的“超级蔬菜大棚”面积为8.0亩,估计小明家的大棚当年的利润为多少; (Ⅲ)另外调查了近5年的不同蔬菜亩平均利润(单位 万元),其中无丝豆为 1.5,1.7,2.1,2.2,2.5;彩椒为 1.8,1.9,1.9,2.2,2.2,请分析种植哪种蔬菜比较好? 参考数据 , . 参考公式 , . 【解析】(Ⅰ), , , , , 那么回归方程为 . (Ⅱ)将代入方程得 ,即小明家的“超级大棚”当年的利润大约为11.442万元. 9.【河北邯郸市2017届高三9月联考,18】某中 为了了解全校 生的上 情况,在全校采用随机抽样的方法抽取了40名 生(其中男女生人数恰好各占一半)进行问卷调查,并进行了统计,按男女分为两组,再将每组 生的月上 次数分为5组 ,,,,,得到如图所示的频率分布直方图 (Ⅰ)写出的值; (Ⅱ)求抽取的40名 生中月上 次数不少于15次的 生人数; (Ⅲ)在抽取的40名 生中,从月上 次数不少于20次的 生中随机抽取2人 ,求至少抽到1名女生的概率. 【解析】(Ⅰ). (Ⅱ)在所抽取的女生中,月上 次数不少于15次的 生频率为(0.05+0.02)×5=0.35,所以,在所抽取的女生中,月上 次数不少于15次的 生有0.03×20=7人. 在所抽取的男生中,月上 次数不少于15次的 生频率为(0.04+0.03)× 5=0.35,所以,在所抽取的男生中,月上 次数不少于15次的 生有0.03×20=7人. 故抽取的40名 生中月上 次数不少于15次的 生人数有7+7=14人. (Ⅲ)记“在抽取的40名 生中,从月上 次数不少于20次的 生中随机抽取2人,至少抽到1名女生”为事件,在抽取的女生中,月上 次数不少于20次的 生频率为0.02×5=0.1,人数为0.1×20=2人, 在抽取的男生中,月上 次数不少于20次的 生频率为0.03×5=0.15,人数为0.15×20=3人, 记这2名女生为,,这3名男生为,,, 则在抽取的40名 生中,从月上 次数不少于20次的 生中随机抽取2人,所有可能结果有10种,即,,,,,,,,,, 而事件包含的结果有7种,它们是,,,,,,, 所以. 10.【河北省衡水中 2018届七调】国内某知名大 有男生14000人,女生10000人.该校体育 院想了解本校 生的运动状况,根据性别采取分层抽样的方法从全校 生中抽取120人,统计他们平均每天运动的时间(已知该校 生平均每天运动的时间范围是 ),如下表所示. 男生平均每天运动的时间分布情况 女生平均每天运动的时间分布情况 (1)假设同组中的每个数据均可用该组区间的中间值代替,请根据样本估算该校男生平均每天运动的时间(结果精确到0.1). (2)若规定平均每天运动的时间不少于的 生为“运动达人”,低于的 生为“非运动达人”. (ⅰ)根据样本估算该校“运动达人”的数量; (ⅱ)请根据上述表格中的统计数据填写下面列联表,并通过计算判断能否在犯错误的概率不超过0.05的前提下认为“运动达人”与性别有关. 参考公式 ,其中. 参考数据 【解析】(1)由题意得,抽取的男生人数为(人),抽取的女生人数为(人),故, . 则估算该校男生平均每天运动的时间为, 所以该校男生平均每天运动的时间为. (2)(ⅰ)样本中“运动达人”所占的比例是, 故估算该校“运动达人”有(人). (ⅱ)由统计数据得 根据上表,可得. 故不能在犯错误的概率不超过0.05的前提下认为“运动达人”与性别有关. 11.【山东省垦利第一中 等四校2018届上 期期末】为研究某种图书每册的成本费 (元)与印刷数(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值. 15.25 3.63 0.269 2085.5 0.787 7.049 表中, . (1)根据散点图判断 与哪一个更适宜作为每册成本费(元)与印刷数(千册)的回归方程类型?(只要求给出判断,不必说明理由) (2)根据(1)的判断结果及表中数据,建立关于的回归方程(回归系数的结果精确到0.01); (3)若每册书定价为10元,则至少应该印刷多少册才能使销售利润不低于78840元?(假设能够全部售出,结果精确到1) (附 对于一组数据, ,…, ,其回归直线的斜率和截距的最小二乘估计分别为, ) (3)假设印刷千册,依题意, , 即, ∴, ∴至少印刷10千册. 12.【百校联盟2018届TOP202018届三月联考】某蛋糕店制作并销售一款蛋糕,当天每售出个利润为元,未售出的每个亏损元.根据以往天的统计资料,得到如下需求量表,元旦这天,此蛋糕店制作了个这种蛋糕.以(单位 个, )表示这天的市场需求量. (单位 元)表示这天售出该蛋糕的利润. 需求量/个 天数 10 20 30 25 15 (1)将表示为的函数,根据上表,求利润不少于元的概率; (2)估计这天的平均需求量(同一组数据用该区间的中点值作代表); (3)元旦这天,该店通过微信展示打分的方式随机抽取了名市民进行问卷调查,调查结果如下表所示,已知在购买意愿强的市民中,女性的占比为. 购买意愿强 购买意愿弱 合计 女性 28 男性 22 合计 28 22 50 完善上表,并根据上表,判断是否有的把握认为市民是否购买这种蛋糕与性别有关? 附 . 0.05 0.025 0.010 0.005 3.841 5.024 6.635 7.879 【解析】(1)当时, , 当时, ,所以 当时, ,∴,又,所以, 因此,利润不少于570元的概率为. (2)这100天的平均需求量为. (3)根据题意,购买意愿强市民中女性的人数为,男性为8人, 填表如下 购买意愿强 购买意愿弱 合计 女性 20 8 28 男性 8 14 22 合计 28 22 50 根据公式, , 故有的把握认为市民是否购买这种蛋糕与性别有关. 13.【广东省茂名市2018届一测】一只药用昆虫的产卵数y与一定范围内的温度x有关, 现收集了该种药用昆虫的6组观测数据如下表 温度x/°C 21 23 24 27 29 32 产卵数y/个 6 11 20 27 57 77 经计算得 , , , , ,线性回归模型的残差平方和,e8.0605≈3167,其中xi, yi分别为观测数据中的温度和产卵数,i=1, 2, 3, 4, 5, 6. (Ⅰ)若用线性回归模型,求y关于x的回归方程=x+(精确到0.1); (Ⅱ)若用非线性回归模型求得y关于x的回归方程为=0.06e0.2303x,且相关指数R2=0.9522. ( i )试与(Ⅰ)中的回归模型相比,用R2说明哪种模型的拟合效果更好. ( ii )用拟合效果好的模型预测温度为35°C时该种药用昆虫的产卵数(结果取整数). 附 一组数据(x1,y1), (x2,y2), ...,(xn,yn ), 其回归直线=x+的斜率和截距的最小二乘估计为 =−;相关指数R2=. 【解析】(Ⅰ)由题意得, ∴33−6.6´26=−138.6, ∴y关于x的线性回归方程为=6.6x−138.6. (Ⅱ) ( i )由所给数据求得的线性回归方程为=6.6x−138.6,相关指数为 R2= 因为0.9398<0.9522, 所以回归方程=0.06e0.2303x比线性回归方程=6.6x−138.6拟合效果更好. ( ii )由( i )得当温度x=35°C时, =0.06e0.2303´35=0.06´e8.0605. 又∵e8.0605≈3167, ∴≈0.06´3167≈190(个). 即当温度x=35°C时,该种药用昆虫的产卵数估计为190个. 14.【山东省烟台市2018届上 期期末】为了解一家企业生产的某类产品的使用寿命(单位 小时),现从中随机抽取一定数量的产品进行测试,绘制频率分布直方图如图所示. (1)假设同一组中的每个数据可用该组区间的中点值代替,估算这批产品的平均使用寿命; (2)已知该企业生产的这类产品有甲、乙两个系列,产品使用寿命不低于60小时为合格,合格产品中不低于90小时为优异,其余为一般.现从合格产品中,用分层抽样的方法抽取70件,其中甲系列有35件(1件优异).请完成下面的列联表,并根据列联表判断能否有的把握认为产品优异与系列有关? 甲系列 乙系列 合计 优异 一般 合计 参考数据 参考公式 ,其中. 【解析】(1)由题意, (2)产品使用寿命处在[60,70),[70,80),[80,90),[90,100]的频率之比为, 因此,产品使用寿命处于[90,100]的抽样件数为. 依题意,可得列联表 , 对照临界值表,没有95 的把握认为产品优异与产品系列有关. 15.【湖南永州市2017届高三第一次模拟,18】某 校为加强 生的交通安全教育,对 校旁边,两个路口进行了8天 的检测调查,得到每天各路口不按交通规则过马路的 生人数(如茎叶图所示),且路口数据的平均数 比路口数据的平均数小2. (1)求出路口8个数据中的中位数和茎叶图中的值; (2)在路口的数据中任取大于35的2个数据,求所抽取的两个数据中至少有一个不小于40的概率. 【解析】(1)路口8个数据的中位数为.……………………………………………3分 ∵路口8个数据的平均数为, ∴路口8个数据的平均数为36, ∴,.………………………………………………6分 (2)在路口的数据中任取2个大于35的数据,有如下10种可能结果 (36,37),(36,38),(36,42),(36,45),(37,38),(37,42),(37,45), (38,42),(38,45),(42,45). ………………………………………………………………………………9分 其中“至少有一次抽取的数据不小于40”的情况有如下7种 (36,42),(36,45),(37,42),(37,45),(38,42),(38,45),(42,45). 故所求的概率为.………………………………………………………………………………………12分 16.【广东省中山纪念等六校2018届三联考】随着社会的发展,终身 习成为必要,工人知识要更新, 习培训必不可少,现某工厂有工人1000名,其中250名工人参加短期培训(称为类工人),另外750名工人参加过长期培训(称为类工人),从该工厂的工人中共抽查了100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数)得到类工人生产能力的茎叶图(左图),类工人生产能力的频率分布直方图(右图). (1)问类、类工人各抽查了多少工人,并求出直方图中的; (2)求类工人生产能力的中位数,并估计类工人生产能力的平均数(同一组中的数据用该组区间的中点值作代表); (3)若规定生产能力在内为能力优秀,由以上统计数据在答题卡上完成下面的列联表,并判断是否可以在犯错误概率不超过0.1 的前提下,认为生产能力与培训时间长短有关.能力与培训时间列联表 短期培训 长期培训 合计 能力优秀 能力不优秀 合计 参考数据 0.15 0.10 0.05 0.025 0.010 0.005 0.001 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参考公式 ,其中. (3)由(1)及所给数据得能力与培训的2´2列联表, 短期培训 长期培训 合计 能力优秀 8 54 62 能力不优秀 17 21 38 合计 25 75 100 由上表得>10.828 因此,可以在犯错误概率不超过0.1 的前提下,认为生产能力与培训时间长短有关. 17.【湖北省武汉市2018届二调】从某工厂的一个车间抽取某种产品50件,产品尺寸(单位 )落在各个小组的频数分布如下表 数据分组 频数 3 8 9 12 10 5 3 (1)根据频数分布表,求该产品尺寸落在的概率; (2)求这50件产品尺寸的样本平均数.(同一组中的数据用该组区间的中点值作代表); (3)根据产品的频数分布,求出产品尺寸中位数的估计值. 【解析】(1)根据频数分布表可知,产品尺寸落在内的概率. (2)样本平均数 . (3) .中位数在区间上, 中位数为. 18.【广东珠海市2017届上 期调研测试(1),19】(本小题满分12分) 某商店计划每天购进某商品若干件,商店每销售一件该商品可获利润60元,若供大于求,剩余商品全部 退回,但每件商品亏损10元;若供不应求,则从外部调剂,此时每件调剂商品可获利40元. (1)若商品一天购进该商品10件,求当天的利润(单位 元)关于当天需求量(单位 件,) 的函数解析式; (2)商店记录了50天该商品的日需求量(单位 件,),整理得下表 若商店一天购进10件该商品,以50天记录的各需求量的频率作为各需求量发生的概率,求当天的利润 在区间内的概率. 【解析】(1)当日需求量时, 利润为; 当日需求量时,利润为. 所以利润关于需求量的函数解析式为 . (2)50天内有4天获得的利润为390元,有8天获得的利润为460元,有10元获得的利润为530元,有14天获得的利润为600元,有9天获得的利润为640元,有5天获得的利润为680元. 若利润在区间内,日需求量为9、10、11,其对应的频数分别为10、14、9. 则利润在区间内的概率为. 19.【广西陆川中 2018届开 考】对某校高三年级 生参加社区服务次数进行统计,随机抽取M名 生作为样本,得到这M名 生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如下 (1)求出表中M,p及图中a的值; (2)若该校高三 生有240人,试估计高三 生参加社区服务的次数在区间(10,15)内的人数; (3)在所取样本中,从参加社区服务的次数不少于20次的 生中任选2人,求至多一人参加社区服务次数在区间[25,30)内的概率. (3)这个样本参加社区服务的次数不少于20次的 生共有人,设在区间内的人为,在区间内的人为,则任选2人共有,,,,,,,,,,,,,,15种情况,而两人都在内只能是一种,所以所求概率为. 20.【山东省淄博市2018届高三3月模拟】响应“文化强国建设”号召,某市把社区图书阅览室建设增列为重要的民生工程.为了解市民阅读需求,随机抽取市民200人做调查,统计数据表明,样本中所有人每天用于阅读的时间(简称阅读用时)都不超过3小时,其频数分布表如下 (用时单位 小时) 用时分组 频数 10 20 50 60 40 20 (1)用样本估计总体,求该市市民每天阅读用时的平均值; (2)为引导市民积极参与阅读,有关部门牵头举办市读书经验交流会,从这200人中筛选出男女代表各3名,其中有2名男代表和1名女代表喜欢古典文 .现从这6名代表中任选2名男代表和2名女代表参加交流会,求参加交流会的4名代表中,喜欢古典文 的男代表多于喜欢古典文 的女代表的概率. 【解析】(1)根据阅读用时频数分布列表可求 ; 故该市市民每天阅读用时的平均值为1.65小时; (2)设参加交流会的男代表为,其中喜欢古典文 ,则男代表参加交流会的方式有 ,共3种; 设选出的女代表为 ,其中喜欢古典文 ,则女代表参加市交流会的方式有 ,共3种, 所以参加市交流会代表的组成方式有 共9种, 其中喜欢古典文 的男代表多于喜欢古典文 的女代表的是 共5种,所以,喜欢古典文 的男代表多于喜欢古典文 的女代表的概率是.查看更多