- 2021-06-15 发布 |
- 37.5 KB |
- 17页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2018届二轮复习(文) 概率与统计专题七第2讲学案(全国通用)
第 2 讲 统计与统计案例 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性 检验等. 2.在概率与统计的交汇处命题,以解答题中档难度出现. 热点一 抽样方法 1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少. 2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围: 总体中的个体数较多. 3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分 组成. 例 1 (1)(2017·山东省实验中学一模)用系统抽样的方法从 300 名学生中抽取容量为 20 的样 本,将 300 名学生从 1~300 编号,按编号顺序平均分组.若第 16 组应抽出的号码为 232, 则第一组中抽出的号码是( ) A.5 B.6 C.7 D.8 答案 C 解析 设第一组中抽出的号码是 x ,列方程有 x+300 20 ×15=232⇒x=7, 即第一组中抽出的号码是 7.故选 C. (2)某高级中学高一、高二、高三年级的学生人数分别为 600,700,700,为了解不同年级学生 的眼睛近视情况,现用分层抽样的方法抽取了容量为 100 的样本,则高三年级应抽取的学生 人数为________. 答案 35 解析 由题意结合抽样比可得,高三年级应抽取的学生人数为 100× 700 600+700+700 =35. 思维升华 (1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的. (2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同. (3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例. 跟踪演练 1 (1)(2017·葫芦岛协作体模拟)福利彩票“双色球”中红球的号码可以从 01,02,03,…,32,33 这 33 个二位号码中选取,小明利用如图所示的随机数表选取红色球的 6 个号码,选取方法是从第 1 行、第 9 列和第 10 列的数字开始从左到右依次选取两个数字, 则第四个被选中的红色球号码为( ) 81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 85 06 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49 A.12 B.33 C.06 D.16 答案 C 解析 被选中的红色球号码依次为 17,12,33,06,所以第四个被选中的红色球号码为 06,故 选 C. (2)(2017 届江西重点中学协作体联考)高三某班有学生 36 人,现将所有同学随机编号,用系 统抽样的方法,抽取一个容量为 4 的样本,已知 5 号、23 号、32 号学生在样本中,则样本 中还有一个学生的编号为( ) A.13 B.14 C.18 D.26 答案 B 解析 ∵高三某班有学生 36 人,用系统抽样的方法,抽取一个容量为 4 的样本, ∴样本组距为 36÷4=9,则 5+9=14, 即样本中还有一个学生的编号为 14,故选 B. 热点二 用样本估计总体 1.频率分布直方图中横坐标表示组距,纵坐标表示频率 组距 ,频率=组距×频率 组距. 2.频率分布直方图中各小长方形的面积之和为 1. 3.利用频率分布直方图求众数、中位数与平均数 利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直 方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以 小长方形底边中点的横坐标之和. 例 2 (1)(2017·全国Ⅰ)为评估一种农作物的种植效果,选了 n 块地作试验田.这 n 块地的亩 产量(单位:kg)分别为 x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量 稳定程度的是( ) A.x1,x2,…,xn 的平均数 B.x1,x2,…,xn 的标准差 C.x1,x2,…,xn 的最大值 D.x1,x2,…,xn 的中位数 答案 B 解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度, 应该用样本数据的极差、方差或标准差. 故选 B. (2)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方 图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25), [25,27.5),[27.5,30].根据直方图可知,这 200 名学生中每周的自习时间不足 22.5 小时的 人数是________. 答案 45 解析 阅读频率分布直方图可得,这 200 名学生中每周的自习时间不足 22.5 小时的人数是 200×(0.02+0.07)×2.5=45. 思维升华 (1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关 于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小, 高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率 分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差 等. (2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小. 跟踪演练 2 (1)(2017 届江西南昌二模)某人到甲、乙两市各 7 个小区调查空置房情况,调查 得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙 市空置房套数的中位数之差为( ) A.4 B.3 C.2 D.1 答案 B 解析 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是 79,76,因此其差是 79 -76=3,故选 B. (2)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为 n 的样本,其频率分 布直方图如图所示,其中支出在[50,60)元的同学有 30 人,则 n 的值为( ) A.300 B.200 C.150 D.100 答案 D 解析 根据频率分布直方图的面积和为 1,可得[50,60)的频率为 P=1-10×(0.01+0.024+ 0.036)=0.3, 又由 P=30 n =0.3,解得 n=100.故选 D. 热点三 统计案例 1.线性回归方程 方程y ^ =b ^ x+a ^ 称为线性回归方程,其中b ^ = ∑n i=1xiyi-n x y ∑n i=1x2i -n x 2 ,a ^ = y -b ^ x ,( x , y )称为 样本点的中心. 2.随机变量 K2= nad-bc2 a+bc+da+cb+d ,其中 n=a+b+c+d. 例 3 (1)(2017 届山西太原三模)已知某产品的广告费用 x(单位:万元)与销售额 y(单位:万 元)具有线性相关关系,其统计数据如下表: x 3 4 5 6 y 25 30 40 45 附:b ^ = ∑n i=1 xi- x yi- y ∑n i=1 xi- x 2 = ∑n i=1xiyi-n x y ∑n i=1x2i -n x 2 ,a ^ = y -b ^ x . 由上表可得线性回归方程y ^ =b ^ x+a ^ ,据此模型预测广告费用为 8 万元时的销售额是( ) A.59.5 万元 B.52.5 万元 C.56 万元 D.63.5 万元 答案 A 解析 由题意可得 x =3+4+5+6 4 =9 2 , y =25+30+40+45 4 =35, 则b ^ = ∑4 i=1xiyi-4 x y ∑4 i=1x2i -4 x 2 = 665-4×9 2 ×35 86-4× 9 2 2 =7, a ^ = y -b ^ x =3.5,所以线性回归方程为y ^ =7x+3.5, 据此模型预报广告费用为 8 万元时的销售额是 y=7×8+3.5=59.5(万元). 故选 A. (2)(2017·四川成都九校联考)某学校为了解该校学生对于某项运动的爱好是否与性别有关, 通过随机抽查 110 名学生,得到如下 2×2 的列联表: 喜欢该项运动 不喜欢该项运动 总计 男 40 20 60 女 20 30 50 总计 60 50 110 由公式 K2= nad-bc2 a+bc+da+cb+d ,得 K2≈7.82. 附表: P(K2≥k0) 0.025 0.01 0.005 k0 5.024 6.635 7.879 参照附表,以下结论正确是( ) A.有 99.5%以上的把握认为“爱好该项运动与性别有关” B.有 99.5%以上的把握认为“爱好该项运动与性别无关” C.有 99%以上的把握认为“爱好该项运动与性别有关” D.有 99%以上的把握认为“爱好该项运动与性别无关” 答案 C 解析 由题意知本题所给的观测值 K2≈7.82>6.635, ∴这个结论有 0.01 的机会出错,即有 99%以上的把握认为“爱好该项运动与性别有关”, 故选 C. 思维升华 (1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量 之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值; 回归直线过样本点的中心( x , y ),应引起关注. (2)独立性检验问题,要确定 2×2 列联表中的对应数据,然后代入公式求解 K2 即可. 跟踪演练 3 (1)(2017·雅安三诊)某小卖部为了解热茶销售量 y(杯)与气温 x(℃)之间的关系, 随机统计了某 4 天卖出的热茶的杯数与当天气温,并制作了对照表: 气温(℃) 18 13 10 -1 杯数 24 34 38 64 由表中数据算得线性回归方程y ^ =b ^ x+a ^ 中的b ^ =-2,预测当气温为-5℃时,热茶的销售量 为( ) A.70 B.50 C.60 D.80 答案 A 解析 由题意可知 x =18+13+10-1 4 =10, y =24+34+38+64 4 =40, 将b ^ =-2 及样本点中心(10,40)代入线性回归方程可得a ^ =60, ∴当 x=-5 时,y=(-2)×(-5)+60=70. 故选 A. (2)(2017·湛江二模)某同学利用课余时间做了一次社交软件使用习惯调查,得到 2×2 列联表 如下: 偏爱微信 偏爱 QQ 合计 30 岁以下 4 8 12 30 岁以上 16 2 18 合计 20 10 30 附表: P(K2≥k0) 0.01 0.005 0.001 k0 6.635 7.879 10.828 则下列结论正确的是( ) A.在犯错的概率不超过 0.005 的前提下认为社交软件使用习惯与年龄有关 B.在犯错的概率超过 0.005 的前提下认为社交软件使用习惯与年龄有关 C.在犯错的概率不超过 0.001 的前提下认为社交软件使用习惯与年龄有关 D.在犯错的概率超过 0.001 的前提下认为社交软件使用习惯与年龄有关 答案 A 解析 K2=30×4×2-16×82 20×10×12×18 =10,由于 7.879<10<10.828,可以认为在犯错的概率不超过 0.005 的前提下认为社交软件使用习惯与年龄有关,故选 A. 真题体验 1.(2017·山东改编)如图所示的茎叶图记录了甲、乙两组各 5 名工 人某日的产量数据(单位:件).若这两组数据的中位数相等,且平 均值也相等,则 x 和 y 的值分别为__________. 答案 3,5 解析 甲组数据的中位数为 65,由甲、乙两组数据的中位数相等得 y=5.又甲、乙两组数据 的平均值相等, ∴1 5 ×(56+65+62+74+70+x)=1 5 ×(59+61+67+65+78),∴x=3. 2.(2017·山东改编)为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系, 从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系, 设其线性回归方程为y ^ =b ^ x+a ^ .已知 ∑10 i=1xi=225,∑10 i=1yi=1 600,b ^ =4.该班某学生的脚长为 24, 据此估计其身高为________. 答案 166 解析 ∵∑10 i=1xi=225,∴ x = 1 10 ∑10 i=1xi=22.5. ∵∑10 i=1yi=1 600,∴ y = 1 10 ∑10 i=1yi=160. 又b ^ =4,∴a ^ = y -b ^ x =160-4×22.5=70. ∴线性回归方程为y ^ =4x+70. 将 x=24 代入上式,得y ^ =4×24+70=166. 3.(2016·全国Ⅲ改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最 高气温和平均最低气温的雷达图.图中 A 点表示十月的平均最高气温约为 15 ℃,B 点表示 四月的平均最低气温约为 5 ℃.下列叙述不正确的是________. ①各月的平均最低气温都在 0 ℃以上; ②七月的平均温差比一月的平均温差大; ③三月和十一月的平均最高气温基本相同; ④平均最高气温高于 20 ℃的月份有 5 个. 答案 ④ 解析 由题意知,平均最高气温高于 20 ℃的有七月,八月,故④不正确. 4.(2017·江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则 应从丙种型号的产品中抽取________件. 答案 18 解析 ∵样本容量 总体个数 = 60 200+400+300+100 = 3 50. ∴应从丙种型号的产品中抽取 3 50 ×300=18(件). 押题预测 1.某公司为了解用户对其产品的满意度,从甲、乙两地分别随机调查了 10 个用户,将满意 度的分数绘成茎叶图如图所示.设甲、乙两地的满意度分数的平均数分别为 x 甲, x 乙,中 位数分别为 m 甲,m 乙,则( ) A. x 甲< x 乙,m 甲>m 乙 B. x 甲> x 乙,m 甲>m 乙 C. x 甲> x 乙,m 甲查看更多