- 2021-06-17 发布 |
- 37.5 KB |
- 38页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2021届课标版高考文科数学大一轮复习精练:§10-2 统计及统计案例(试题部分)
§10.2 统计及统计案例 探考情 悟真题 【考情探究】 考点 内容解读 5年考情 预测热度 考题示例 考向 关联考点 抽样 方法 ①理解随机抽样的必要性和重要性;②会用简单随机抽样方法从总体中抽取样本 2019课标全国Ⅰ,6,5分 系统抽样 — ★★☆ 2018课标全国Ⅲ,14,5分 分层抽样 — 统计 图表 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点 2017课标全国Ⅲ,3,5分 认识折线图 — ★★☆ 2018课标全国Ⅰ,3,5分 认识扇形统计图 — 2018课标全国Ⅰ,19,12分 用频率分布直方图解决实际问题 平均数 样本的数 字特征 ①理解样本数据标准差的意义和作用,会计算数据标准差;②能从样本数据中提取基本的数字特征,并给出合理的解释;③会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;④会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题 2017课标全国Ⅰ,2,5分 理解方差或标准差 — ★★☆ 2019课标全国Ⅲ,4,5分 用样本估计总体 — 2019课标全国Ⅲ,17,12分 用频率分布直方图估计数字特征 频率分布直方图 2019课标全国Ⅱ,19,12分 频数分布表及数字特征 — 变量间的 相关性 ①会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系;②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程 2016课标全国Ⅲ,18,12分 相关系数与回归方程 折线统计图 ★★☆ 2017课标全国Ⅰ,19,12分 相关系数 数字特征 独立性 检验 了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度 2019课标全国Ⅰ,17,12分 独立性检验 用频率估计概率 ★★☆ 2017课标全国Ⅱ,19,12分 频率分布直方图与独立性检验 用频率估计概率 2018课标全国Ⅲ,18,12分 茎叶图与独立性检验 样本的数字特征 分析解读 从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义、频率分布直方图、平均数、方差的计算、识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的竖直方向的长度=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题. 破考点 练考向 【考点集训】 考点一 抽样方法 1.(2019河南部分省示范性高中1月份联考,7)某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2 400名学生中抽取30人进行调查.现将2 400名学生随机地从1~2 400编号,按编号顺序平均分成30组(1~80号,81~160号,……,2 321~2 400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是( ) A.416 B.432 C.448 D.464 答案 A 2.(2018安徽安庆一中、山西太原五中等五省六校(K12联盟)期末联考,3)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于( ) A.12 B.18 C.24 D.36 答案 D 考点二 统计图表 1.(2019广东东莞第二次调研考试,3)有24名投资者想到某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为1—24号,再用系统抽样方法抽出6名投资者,邀请他们到实地进行考察.其中年龄不超过55岁的人数为( ) 3 9 4 0 1 1 2 5 5 1 3 6 6 7 7 8 8 8 9 6 0 0 1 2 3 3 4 5 A.1 B.2 C.3 D.4 答案 B 2.(多选题)(2020届山东夏季高考模拟,9)下图为某地区2006年—2018年地方财政预算内收入、城乡居民储蓄年末余额折线图. 根据该折线图可知,该地区2006年—2018年( ) A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势 B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同 C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量 D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大 答案 AD 考点三 样本的数字特征 1.(2018湖北华师一附中月考,3)某人到甲、乙两市各7个小区调查空置房情况,将调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为( ) A.4 B.3 C.2 D.1 答案 B 2.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则( ) A.x=4,s2<2 B.x=4,s2>2 C.x>4,s2<2 D.x>4,s2>2 答案 A 考点四 变量间的相关性 1.(2018河南焦作四模,3)已知变量x和y的统计数据如下表: x 3 4 5 6 7 y 2.5 3 4 4.5 6 根据上表可得回归直线方程为y^=b^x-0.25,据此可以预测当x=8时,y^=( ) A.6.4 B.6.25 C.6.55 D.6.45 答案 C 2.(2018湖南张家界三模,4)已知变量x,y之间的线性回归方程为y^=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是( ) x 6 8 10 12 y 6 m 3 2 A.变量x,y之间成负相关关系 B.可以预测,当x=20时,y^=-3.7 C.m=4 D.该回归直线必过点(9,4) 答案 C 考点五 独立性检验 (2018贵州六校12月联考,18)海南大学某餐饮中心为了解新生的饮食习惯,在全校新生中进行了抽样调查,调查结果如下表所示: 喜欢甜品 不喜欢甜品 合计 南方学生 60 20 80 北方学生 10 10 20 合计 70 30 100 (1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”? (2)已知在被调查的北方学生中有5名中文系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. P(K2≥k0) 0.10 0.05 0.010 k0 2.706 3.841 6.635 附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d). 答案 (1)将2×2列联表中的数据代入公式计算,得K2=100×(60×10-20×10)270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. (2)从5名中文系学生中任取3人的所有可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}, 其中ai表示喜欢甜品的学生,i=1,2,bj表示不喜欢甜品的学生,j=1,2,3. Ω由10个基本事件组成,且这些基本事件的出现是等可能的. 用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}. 事件A由7个基本事件组成,因而P(A)=710. 炼技法 提能力 【方法集训】 方法1 解与频率分布直方图有关问题的方法 1.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) A.56 B.60 C.120 D.140 答案 D 2.(2020届广西桂林十八中模拟,18)某家电公司销售部门共有200名销售员,每年部门对每名销售员都有1 400万元的年度销售任务.已知这200名销售员去年完成的销售额在区间[2,22](单位:百万元)内,现将其分成5组:第1组、第2组、第3组、第4组、第5组对应的区间分别为[2,6),[6,10),[10,14),[14,18),[18,22),并绘制出频率分布直方图,如图. (1)若用分层抽样的方法从这200名销售员中抽取容量为25的样本,求a的值和样本中完成年度任务的销售员人数; (2)从(1)中样本内完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,求获得此奖励的2名销售员在同一组的概率. 答案 (1)∵(0.02+0.08+0.09+2a)×4=1,∴a=0.03.∴样本中完成年度任务的人数为200×0.03=6. (2)样本中完成年度任务的销售员中,第4组有3人,记这3人分别为A1,A2,A3;第5组有3人,记这3人分别为B1,B2,B3,从这6人中随机抽取2名,所有的基本事件为A1A2,A1A3,A1B1,A1B2,A1B3,A2A3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,B1B2,B1B3,B2B3, 共15个,获得此奖励的2名销售员在同一组的基本事件分别为A1A2,A1A3,A2A3,B1B2,B1B3,B2B3,共6个,故所求概率为615=25. 方法2 样本的数字特征的求解及其应用 1.(2015山东,6,5分)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A.①③ B.①④ C.②③ D.②④ 答案 B 2.(2018四川德阳模拟,13)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的频数分布直方图如图所示,如果得分的中位数为a,众数为b,平均数为c,则a、b、c中的最大者是 . 答案 c 方法3 回归直线方程的求解与运用 1.(2020届河南南阳第一中学模拟,1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-15x+1上,则这组样本数据的样本相关系数为( ) A.-1 B.1 C.-15 D.15 答案 A 2.(2018湘东五校12月联考,18)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料: 日期 1月10日 2月10日 3月10日 4月10日 5月10日 6月10日 昼夜温 差x(℃) 10 11 13 12 8 6 就诊人 数y 22 25 29 26 16 12 该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验. (1)求选取的2组数据恰好是相邻两个月数据的概率; (2)若选取的是1月与6月的两组数据,请根据2至5月份的数据求出y关于x的线性回归方程y^=b^x+a^; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想? 参考公式:b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2=∑i=1n(xi-x)(yi-y)∑i=1(xi-x)2,a^=y-b^x; 参考数据:11×25+13×29+12×26+8×16=1 092,112+132+122+82=498. 答案 (1)设抽到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P(A)=515=13. (2)由题表中数据求得x=11,y=24,由公式求得b^=187, 则a^=y-b^x=-307, 所以y关于x的线性回归方程为y^=187x-307. (3)由(2)知,当x=10时,y^=1507,1507-22<2,当x=6时,y^=787,787-12<2, 所以,该小组所得线性回归方程是理想的. 方法4 独立性检验的思想方法 (2018山西太原五中模拟,18)网购是当前民众购物的新方式,某公司为改进营销方式,随机调查了100名市民,统计其周平均网购的次数,并整理得到如图所示的频数直方图.这100名市民中,年龄不超过40岁的有65人.将所抽样中周平均网购次数不少于4次的市民称为网购迷,且已知其中有5名市民的年龄超过40岁. (1)根据已知条件完成下面的2×2列联表,能否在犯错的概率不超过0.10的前提条件下认为网购迷与年龄不超过40岁有关? 网购迷 非网购迷 合计 年龄不超过40岁 年龄超过40岁 合计 (2)现将所抽取样本中周平均网购次数不少于5次的市民称为超级网购迷,且已知超级网购迷中有2名年龄超过40岁,若从超级网购迷中任意挑选2名,求至少有1名市民年龄超过40岁的概率. 附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d). 答案 (1)根据已知条件完成2×2列联表如下: 网购迷 非网购迷 合计 年龄不超过40岁 20 45 65 年龄超过40岁 5 30 35 合计 25 75 100 K2=100×(20×30-5×45)225×75×65×35≈3.297,因为3.297>2.706,所以据此列联表判断,在犯错误的概率不超过0.10的前提下,认为网购迷与年龄不超过40岁有关. (2)由频数分布直方图知,超级网购迷共有10人,记其中年龄超过40岁的2名市民为A、B,其余8名市民记为c、d、e、f、g、h、m、n,现从10人中任取2人,基本事件有AB、Ac、Ad、Ae、Af、Ag、Ah、Am、An、Bc、Bd、Be、Bf、Bg、Bh、Bm、Bn、cd、ce、cf、cg、ch、cm、cn、de、df、dg、dh、dm、dn、ef、eg、eh、em、en、fg、fh、fm、fn、gh、gm、gn、hm、hn、mn,共有45种,其中至少有1名市民年龄超过40岁的基本事件有AB、Ac、Ad、Ae、Af、Ag、Ah、Am、An、Bc、Bd、Be、Bf、Bg、Bh、Bm、Bn,共17种, 故所求的概率P=1745. 【五年高考】 A组 统一命题·课标卷题组 考点一 抽样方法 1.(2019课标全国Ⅰ,6,5分)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是 ( ) A.8号学生 B.200号学生 C.616号学生 D.815号学生 答案 C 2.(2018课标全国Ⅲ,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 . 答案 分层抽样 考点二 统计图表 1.(2018课标全国Ⅰ,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图: 则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案 A 2.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 答案 A 3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 答案 D 4.(2018课标全国Ⅰ,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表 日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7) 频数 1 3 2 4 9 26 5 使用了节水龙头50天的日用水量频数分布表 日用水量 [0,0.1) [0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) 频数 1 5 13 10 16 5 (1)作出使用了节水龙头50天的日用水量数据的频率分布直方图; (2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表) 答案 (1) (2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48, 因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为 x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48. 该家庭使用了节水龙头后50天日用水量的平均数为 x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35. 估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3). 考点三 样本的数字特征 1.(2019课标全国Ⅲ,4,5分)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A.0.5 B.0.6 C.0.7 D.0.8 答案 C 2.(2017课标全国Ⅰ,2,5分)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数 答案 B 3.(2019课标全国Ⅲ,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图: 记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70. (1)求乙离子残留百分比直方图中a,b的值; (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 答案 本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识. (1)由已知得0.70=a+0.20+0.15,故a=0.35. b=1-0.05-0.15-0.70=0.10. (2)甲离子残留百分比的平均值的估计值为 2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为 3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00. 4.(2019课标全国Ⅱ,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表. y的分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80) 企业数 2 24 53 14 7 (1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 附:74≈8.602. 答案 本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力. (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21. 产值负增长的企业频率为2100=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)y=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30, s2=1100∑i=15ni(yi-y)2 =1100[2×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402]=0.029 6, s=0.029 6=0.02×74≈0.17. 所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%. 考点四 变量间的相关性 1.(2017课标全国Ⅰ,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 1 2 3 4 5 6 7 8 零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 抽取次序 9 10 11 12 13 14 15 16 零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得x=116∑i=116xi=9.97,s=116∑i=116(xi-x)2=116(∑i=116xi2-16x 2)≈0.212,∑i=116(i-8.5)2≈18.439,∑i=116(xi-x)(i-8.5)=-2.78, 其中xi为抽取的第i个零件的尺寸,i=1,2,…,16. (1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小); (2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (i)从这一天抽检的结果看,是否需对当天的生产过程进行检查? (ii)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01) 附:样本(xi,yi)(i=1,2,…,n)的相关系数 r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2. 0.008≈0.09. 答案 (1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为r=∑i=116(xi-x)(i-8.5)∑i=116(xi-x)2∑i=116(i-8.5)2 =-2.780.212×16×18.439≈-0.18. 由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小. (2)(i)由于x=9.97,s≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x-3s,x+3s)以外,因此需对当天的生产过程进行检查. (ii)剔除离群值,即第13个数据,剩下数据的平均数为115×(16×9.97-9.22)=10.02, 这条生产线当天生产的零件尺寸的均值的估计值为10.02. ∑i=116xi2=16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为 115×(1 591.134-9.222-15×10.022)≈0.008, 这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09. 2.(2016课标全国Ⅲ,18,12分)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:∑i=17yi=9.32,∑i=17tiyi=40.17,∑i=17(yi-y)2=0.55,7≈2.646. 参考公式:相关系数r=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2∑i=1n(i-y)2, 回归方程y^=a^+b^t中斜率和截距最小二乘估计公式分别为: b^=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2,a^=y-b^t. 答案 (1)由折线图中数据和附注中参考数据得 t=4,∑i=17(ti-t)2=28,∑i=17(yi-y)2=0.55, ∑i=17(ti-t)(yi-y)=∑i=17tiyi-t∑i=17yi=40.17-4×9.32=2.89, r≈2.890.55×2×2.646≈0.99.(4分) 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(6分) (2)由y=9.327≈1.331及(1)得b^=∑i=17(ti-t)(yi-y)∑i=17(ti-t)2=2.8928≈0.10, a^=y-b^t=1.331-0.10×4≈0.93. 所以y关于t的回归方程为y^=0.93+0.10t.(10分) 将2016年对应的t=9代入回归方程得:y^=0.93+0.10×9=1.83. 所以预测2016年我国生活垃圾无害化处理量将约为1.83亿吨.(12分) 考点五 独立性检验 1.(2019课标全国Ⅰ,17,12分)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表: 满意 不满意 男顾客 40 10 女顾客 30 20 (1)分别估计男、女顾客对该商场服务满意的概率; (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d). P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 答案 本题通过对概率与频率的关系、统计案例中两变量相关性检验考查学生的抽象概括能力与数据处理能力,重点考查数学抽象、数据分析、数学运算的核心素养;倡导学生关注生活,提高数学应用意识. (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K2=100×(40×20-30×10)250×50×70×30≈4.762. 由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异. 2.(2018课标全国Ⅲ,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高,并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表; 超过m 不超过m 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d), P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 . 答案 (1)第二种生产方式的效率更高. 理由如下: (i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高. (ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高. (iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知m=79+812=80. 列联表如下: 超过m 不超过m 第一种生产方式 15 5 第二种生产方式 5 15 (3)由于 K2=40×(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异. 3.(2017课标全国Ⅱ,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关; 箱产量<50 kg 箱产量≥50 kg 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附: P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 , K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d). 答案 (1)旧养殖法的箱产量低于50 kg的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62. 因此,事件A的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表: 箱产量<50 kg 箱产量≥50 kg 旧养殖法 62 38 新养殖法 34 66 K2=200×(62×66-34×38)2100×100×96×104≈15.705. 由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法. B组 自主命题·省(区、市)卷题组 考点一 抽样方法 1.(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A.3 B.4 C.5 D.6 答案 B 2.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件. 答案 18 考点二 统计图表 1.(2015湖北,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a= ; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为 . 答案 (1)3 (2)6 000 2.(2017北京,17,13分)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图: (1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. 答案 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30. 所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 考点三 样本的数字特征 1.(2017山东,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( ) A.3,5 B.5,5 C.3,7 D.5,7 答案 A 2.(2019江苏,5,5分)已知一组数据6,7,8,8,9,10,则该组数据的方差是 . 答案 53 3.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 . 8 9 9 9 0 1 1 答案 90 4.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 答案 0.1 考点四 变量间的相关性 1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关 答案 C 2.(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表: 年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y(千亿元) 5 6 7 8 10 (1)求y关于t的回归方程y^=b^t+a^; (2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款. 附:回归方程y^=b^t+a^中,b^=∑i=1ntiyi-nty∑i=1nti2-nt2,a^=y-b^t. 答案 (1)列表计算如下: i ti yi ti2 tiyi 1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 4 4 8 16 32 5 5 10 25 50 ∑ 15 36 55 120 这里n=5,t=1n∑i=1nti=155=3,y=1n∑i=1nyi=365=7.2. 又ltt=∑i=1nti2-nt2=55-5×32=10,lty=∑i=1ntiyi-nt y=120-5×3×7.2=12,从而b^=ltyltt=1210=1.2,a^=y-b^t=7.2-1.2×3=3.6, 故所求回归方程为y^=1.2t+3.6. (2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y^=1.2×6+3.6=10.8(千亿元). C组 教师专用题组 考点一 抽样方法 1.(2015湖北,2,5分)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( ) A.134石 B.169石 C.338石 D.1 365石 答案 B 2.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 类别 人数 老年教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 A.90 B.100 C.180 D.300 答案 C 3.(2014四川,2,5分)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( ) A.总体 B.个体 C.样本的容量 D.从总体中抽取的一个样本 答案 A 4.(2014重庆,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( ) A.100 B.150 C.200 D.250 答案 A 5.(2014广东,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20 答案 C 6.(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( ) A.p1=p2查看更多