【数学】2021届一轮复习人教A版(理)第十三章第二讲 变量间的相关关系与统计案例

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

【数学】2021届一轮复习人教A版(理)第十三章第二讲 变量间的相关关系与统计案例

第二讲 变量间的相关关系与统计案例 ‎                   ‎ ‎1.[2020衡水模拟]如图13 - 2 - 1,去掉D(3,10)后,下列说法错误的是(  )‎ A.相关系数r变大 ‎ B.残差平方和变大 C.相关指数R2变大 ‎ D.解释变量x与预报变量y的相关性变强 ‎2.[2020惠州二调]下列说法正确的是(  )‎ ‎①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标的检测,这样的抽样是分层抽样.‎ ‎②某地气象局预报:5月9日本地降水概率为90%.结果这天没下雨,这表明天气预报并不科学.‎ ‎③在回归分析模型中,残差平方和越小,说明模型的拟合效果越好.‎ ‎④在回归直线方程y‎^‎=0.1x+10中,解释变量x每增加1个单位,预报变量y‎^‎增加0.1个单位.‎ A.①② B.③④ C.①③ D.②④‎ ‎3.[2017山东,5,5分][理]为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y‎^‎‎=‎b‎^‎x+a‎^‎,已知‎∑‎i=1‎‎10‎xi=225,‎∑‎i=1‎‎10‎yi=1 600,b‎^‎=4.该班某学生的脚长为24,据此估计其身高为(  )‎ A.160 B.163 C.166 D.170‎ ‎4.[2015新课标全国Ⅱ,3,5分][理]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图(图13 - 2 - 2),以下结论中不正确的是(  )‎ 图13 - 2 - 2‎ A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 ‎5.[2020长沙一中第一次月考]通过随机询问100名大学生是否爱好踢毽子,得到如下列联表:‎ 男 女 总计 爱好 ‎10‎ ‎40‎ ‎50‎ 不爱好 ‎20‎ ‎30‎ ‎50‎ 总计 ‎30‎ ‎70‎ ‎100‎ 附:‎ P(K2≥k0)‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ ‎0.010‎ k0‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ K2=n(ad-bc‎)‎‎2‎‎(a+b)(c+d)(a+c)(b+d)‎,其中n=a+b+c+d. ‎ 下列结论正确的是(  )‎ A.在犯错误的概率不超过5%的前提下,认为“爱好踢毽子与性别有关”‎ B.在犯错误的概率不超过5%的前提下,认为“爱好踢毽子与性别无关”‎ C.有97.5%以上的把握认为“爱好踢毽子与性别有关”‎ D.有97.5%以上的把握认为“爱好踢毽子与性别无关”‎ ‎6.[2019四川成都二诊]节能降耗是企业的生存之本,所以要树立一种“点点滴滴降成本,分分秒秒增效益”的节能意识,以最好的管理来实现节能效益的最大化.为此某国企进行节能降耗技术改造,下面是该国企节能降耗技术改造后连续五年的生产利润:‎ 年份代号x ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ 年生产利润y/千万元 ‎0.7‎ ‎0.8‎ ‎1‎ ‎1.1‎ ‎1.4‎ ‎(参考公式及数据:回归直线y‎^‎‎=‎b‎^‎x+a‎^‎的斜率和截距的最小二乘估计分别为b‎^‎‎=‎∑‎i=1‎n‎(xi-x)(yi-y)‎‎∑‎i=1‎n‎(xi-x)‎‎2‎=‎‎∑‎i=1‎nxiyi‎-nxy‎∑‎i=1‎nxi‎2‎‎-nx‎2‎,a‎^‎‎=y-‎b‎^‎x,‎∑‎i=1‎‎5‎xiyi - 5x y=1.7,‎∑‎i=1‎‎5‎xi‎2‎ - 5x‎2‎=10)‎ 当x=8时,该国企的年生产利润约为(  )‎ A.1.88千万元 B.2.21千万元 C.1.85千万元 D.2.34千万元 ‎7.[2020成都高三模拟]某公司一种新产品的销售额y与宣传费用x之间的关系如下表:‎ x/万元 ‎0‎ ‎1‎ ‎2‎ ‎3‎ ‎4‎ y/万元 ‎10‎ ‎15‎ ‎20‎ ‎30‎ ‎35‎ 已知销售额y与宣传费用x具有线性相关关系,并求得其回归直线方程为y‎^‎=b‎^‎x+9,则b‎^‎的值为     . ‎ 考法1相关关系的判断       ‎ ‎1(1)观察图13 - 2 - 3所示的散点图,其中两个变量的相关关系判断正确的是 A.a为正相关,b为负相关,c为不相关 B.a为负相关,b为不相关,c为正相关 C.a为负相关,b为正相关,c为不相关 D.a为正相关,b为不相关,c为负相关 ‎(2)下列命题中正确的为 A.相关系数r越大,两个变量的线性相关性越强 B.相关系数r越小,两个变量的线性相关性越弱 C.残差平方和越小的模型,拟合的效果越好 D.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好 ‎(1)根据散点图确定.(2)用相关系数判断线性相关性的强弱;用残差平方和与相关指数判断拟合效果.‎ ‎(1)根据散点图,由相关性可知:‎ a中各点分布在从左下角到右上角的区域里,是正相关;‎ b中各点分布不是带状的,相关性不明确,所以不相关;‎ c中各点分布在从左上角到右下角的区域里,是负相关.‎ ‎(2)相关系数的绝对值|r|越接近于1,两个变量的线性相关性越强,所以A,B错误;残差平方和越小的模型,拟合的效果就越好,所以C正确;用相关指数R2来刻画回归效果,R2越大(接近1),说明模型的拟合效果就越好,所以D错误.‎ ‎(1)D (2)C 考点2回归分析 ‎2 [2020广东七校联考]某汽车销售公司对开业4年来某种型号的汽车“五一”优惠金额与销量之间的关系进行分析研究并做了记录,得到如下资料.‎ 第几年 ‎1‎ ‎2‎ ‎3‎ ‎4‎ 优惠金额x/万元 ‎1‎ ‎1.1‎ ‎1.3‎ ‎1.2‎ 销量y/辆 ‎22‎ ‎24‎ ‎31‎ ‎27‎ ‎(1)求出y关于x的线性回归方程y‎^‎‎=‎b‎^‎x+a‎^‎;‎ ‎(2)若第5年优惠金额为8 500元,估计第5年的销量y(单位:辆)的值.‎ 参考公式:b‎^‎‎=‎∑‎i=1‎n‎(xi-x)(yi-y)‎‎∑‎i=1‎n‎(xi-‎x‎)‎‎2‎=‎‎∑‎i=1‎nxiyi‎-nxy‎∑‎i=1‎nxi‎2‎‎-nx‎2‎,a‎^‎‎=y-‎b‎^‎x.‎ ‎(1)由题中数据可得x=1.15,y=26,‎∑‎i=1‎‎4‎xiyi=121.1,‎∑‎i=1‎‎4‎xi‎2‎=5.34,‎ 所以b‎^‎‎=‎∑‎i=1‎‎4‎xiyi‎-4‎xy‎∑‎i=1‎‎4‎xi‎2‎‎-4‎x‎-‎‎2‎=‎121.1-4×1.15×26‎‎5.34-4×1.1‎‎5‎‎2‎=‎‎1.5‎‎0.05‎=30,故a‎^‎‎=y-‎b‎^‎x=26 - 30×1.15= - 8.5,‎ 所以y关于x的线性回归方程为y‎^‎=30x - 8.5.‎ ‎(2)8 500元=0.85万元,由(1)得,当x=0.85时,y‎^‎=30×0.85 - 8.5=17,‎ 所以第5年优惠金额为8 500元时,销量约为17辆.‎ ‎1.[2019辽宁五校联考]近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表:‎ x ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ y ‎60‎ ‎110‎ ‎210‎ ‎340‎ ‎660‎ ‎1 010‎ ‎1 960‎ 根据以上数据,绘制了散点图,如图13 - 2 - 4.‎ 图13 - 2 - 4‎ 参考数据:‎ y v ‎∑‎i=1‎‎7‎xiyi ‎∑‎i=1‎‎7‎xivi ‎100.54‎ ‎621‎ ‎2.54‎ ‎25 350‎ ‎78.12‎ ‎3.47‎ 其中vi=lg yi,v‎=‎‎1‎‎7‎‎∑‎i=1‎‎7‎vi.‎ ‎(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个适宜作为使用扫码支付的人次y关于活动推出天数x的回归方程类型(给出判断即可,不必说明理由)?‎ ‎(2)根据(1)的判断结果及上表中数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.‎ 参考公式:‎ 对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v‎^‎=α+βu的斜率和截距的最小二乘估计公式分别为β=‎∑‎i=1‎nuivi‎-nuv‎∑‎i=1‎nui‎2‎‎-nu ‎‎ ‎‎2‎,α=v - βu.‎ 考法3独立性检验 ‎3 [2018全国卷Ⅲ,18,12分][理]某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如图13 - 2 - 5所示的茎叶图:‎ 图13 - 2 - 5‎ ‎(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;‎ ‎(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:‎ 超过m 不超过m 第一种生产方式 第二种生产方式 ‎ (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?‎ 附:K2=n(ad-bc‎)‎‎2‎‎(a+b)(c+d)(a+c)(b+d)‎,‎ P(K2≥k0)‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k0‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ ‎(1)根据茎叶图中的数据特征分析即可得出结论;(2)由茎叶图中的数据即可得出中位数,根据中位数补全列联表;(3)利用K2的观测值k进行判断.‎ ‎(1)第二种生产方式的效率更高.‎ 理由如下:‎ ‎(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少为80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多为79分钟.因此第二种生产方式的效率更高.‎ ‎(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.‎ ‎(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.‎ ‎(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.‎ ‎(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分)‎ ‎(2)由茎叶图知m=‎79+81‎‎2‎=80.‎ 列联表如下:‎ 超过m 不超过m 第一种生产方式 ‎15‎ ‎5‎ 第二种生产方式 ‎5‎ ‎15‎ ‎ (3)由于K2的观测值k=‎40×(15×15-5×5‎‎)‎‎2‎‎20×20×20×20‎=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.‎ ‎2.在2019年3月郑州市第二次模拟考试中,某校共有100名文科学生参加考试,其中语文考试成绩低于130分的占95%,数学成绩的频率分布直方图如图13 - 2 - 6所示.‎ 图13 - 2 - 6‎ ‎(1)如果成绩不低于130分的为特别优秀,这100名学生中本次考试语文、数学成绩特别优秀的大约各多少人?‎ ‎(2)如果语文和数学两科成绩都特别优秀的共有3人.‎ ‎(i)从(1)中的这些同学中随机抽取2人,求这2人两科成绩都特别优秀的概率.‎ ‎(ii)根据以上数据,完成下列列联表,并分析是否有99%的把握认为语文成绩特别优秀的同学,数学成绩也特别优秀.‎ 语文成绩特别优秀 语文成绩不特别优秀 合计 数学成绩特别优秀 数学成绩不特别优秀 合计 参考公式及数据:K2=n(ad-bc‎)‎‎2‎‎(a+b)(c+d)(a+c)(b+d)‎,其中n=a+b+c+d,‎ P(K2≥k0)‎ ‎0.50‎ ‎0.40‎ ‎…‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎0.455‎ ‎0.708‎ ‎…‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ 数学探究 回归分析与数学建模 ‎4 [2016全国卷Ⅲ,18,12分][理]图13 - 2 - 7是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.‎ 注:年份代码1~7分别对应年份2008~2014.‎ 图13 - 2 - 7‎ ‎(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;‎ ‎(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.‎ 附注:‎ 参考数据:‎∑‎i=1‎‎7‎yi=9.32,‎∑‎i=1‎‎7‎tiyi=40.17,‎∑‎i=1‎‎7‎‎(yi-‎y‎)‎‎2‎=0.55,‎7‎≈2.646.‎ 参考公式:相关系数r=‎∑‎i=1‎n‎(ti-t)(yi-y)‎‎∑‎i=1‎n‎(ti-t‎)‎‎2‎‎∑‎i=1‎n(yi-‎y‎)‎‎2‎,‎ 回归直线y‎^‎‎=a‎^‎+‎b‎^‎t的斜率和截距的最小二乘估计公式分别为b‎^‎‎=‎‎∑‎i=1‎n‎(ti-t)(yi-y)‎‎∑‎i=1‎n‎(ti-‎t‎)‎‎2‎,a‎^‎‎=y-‎b‎^‎t.‎ ‎(1)求出相关数据,代入公式即可求得r的值,最后根据其值大小回答即可;(2)求得相关数据,代入最小二乘估计公式,即可建立y关于t的回归方程,然后把t=9代入回归方程求得预测值.‎ ‎(1)由折线图中数据和附注中参考数据及公式得t=4,‎∑‎i=1‎‎7‎(ti - t)2=28,‎∑‎i=1‎‎7‎‎(yi-‎y‎)‎‎2‎=0.55,‎ ‎∑‎i=1‎‎7‎‎(ti - t)(yi - y‎-‎)=‎∑‎i=1‎‎7‎tiyi - t‎∑‎i=1‎‎7‎yi=40.17 - 4×9.32=2.89,‎ r=‎2.89‎‎0.55×2×2.646‎≈0.99.‎ 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.‎ ‎(2)由y‎=‎‎9.32‎‎7‎≈1.331及(1)得b‎^‎‎=‎∑‎i=1‎‎7‎‎(ti-t)(yi-y)‎‎∑‎i=1‎‎7‎‎(ti-‎t‎)‎‎2‎=‎‎2.89‎‎28‎≈0.103,‎ a‎^‎‎=y-‎b‎^‎t‎=1.331 - 0.103×4≈0.92.‎ 所以y关于t的回归方程为y‎^‎=0.92+0.10t.‎ ‎2016年对应的t的值为9,将t=9代入回归方程得y‎^‎=0.92+0.10×9=1.82.‎ 所以预测2016年我国生活垃圾无害化处理量为1.82亿吨.‎ 素养探源 ‎ 核心素养 考查途径 素养水平 数学建模 根据相关系数判断线性关系,建立回归模型.‎ 二 数据分析 根据题中条件及折线图,提取所需数据.‎ 二 数学运算 求回归方程.‎ 二 备考指导 ‎ 本题以生活垃圾无害化处理为背景,考查统计中的线性相关关系,要求学生先利用相关系数判断y与t是否具有线性相关关系,再求回归方程,最后利用所求的方程进行预测,基本上体现了数学建模的过程.考查相关关系的题是数学建模的范例,在高考中经常出现,要充分了解建模过程,把握建模的方法与步骤,学会应用建模解决实际问题.‎ ‎3.在红外线照射下,组织温度升高,毛细血管扩张,血流加快,物质代谢增强,组织细胞活力及再生能力提高,因此红外线治疗仪对某些疾病的治疗有着很好的作用.某药店兼营某红外线治疗仪,经过近5个月的营销,对销售状况进行相关数据分析,发现月销售量与销售价格有关,统计数据如下表:‎ 每台红外线治疗仪的销售价格x/元 ‎140‎ ‎150‎ ‎160‎ ‎170‎ ‎180‎ 红外线治疗仪的月销售量y/台 ‎64‎ ‎55‎ ‎45‎ ‎35‎ ‎26‎ ‎(1)根据表中数据求y关于x的线性回归方程;‎ ‎(2)(i)每台红外线治疗仪的价格为165元时,预测红外线治疗仪的月销售量;(四舍五入为整数)‎ ‎(ii)若该红外线治疗仪的成本为120元/台,要使每月获得最大的纯收益,利用(1)中结论,问每台红外线治疗仪的销售价格应定为多少?(四舍五入,精确到1元)‎ 参考公式:回归直线方程y‎^‎=b‎^‎x+a‎^‎,其中b‎^‎=‎∑‎i=1‎n‎(xi-x)(yi-y)‎‎∑‎i=1‎n‎(xi-‎x‎)‎‎2‎,a‎^‎‎=y - ‎b‎^‎x.‎ 数学应用 概率与统计和社会热点的交汇 ‎5 [2020湖南省株洲市高三统一检测(一)]某地区进行疾病普查,为此要检验每个人的血液,如果当地有N人,若逐个检验就需要检验N次,为了减少检验的工作量,把受检验者分组,假设每组有k个人,把这k个人的血液混合在一起检验.若检验结果为阴性,则这k个人的血液全为阴性,因而这k个人只要检验一次就够了;若检验结果为阳性,为了明确这k个人中究竟哪几个人为阳性,就要对这k个人再逐个进行检验,因而这k个人的检验次数为(k+1)次.假设在接受检验的人群中,每个人的检验结果是阳性还是阴性是相互独立的,且每个人的检验结果是阳性的概率为p.‎ ‎(1)为熟悉检验流程,先对3个人逐个进行检验,若p=0.1,求3人中恰好有1人检验结果为阳性的概率.‎ ‎(2)设ζ为k个人一组混合检验时每个人的血液需要检验的次数.‎ ‎(i)当k=5,p=0.1时,求ζ的分布列;‎ ‎(ii)运用统计概率的相关知识,求当k和p满足什么关系时,用分组的办法能减少检验次数.‎ ‎(1)由“每个人的检验结果是阳性还是阴性是相互独立的”,得该试验为独立重复试验,从而求得概率.(2)“每个人的检验次数”应理解为“平均检验次数”→确定ζ的取值情况→计算各取值的概率→列分布列→计算均值→将“减少检验次数”化为E(ζ)<1→k和p满足的关系.‎ ‎(1)对3人进行检验,每个人的检验结果是相互独立的.‎ 设事件A为“3人中恰有1人检验结果为阳性”,则其概率P(A)=C‎3‎‎1‎·0.1·0.92=0.243.‎ ‎(2)(i)当k=5,p=0.1时:5人一组混合检验结果为阴性的概率为0.95,每人所需检验的次数为‎1‎‎5‎次;混合检验结果为阳性的概率为1 - 0.95,每人所需检验的次数为‎6‎‎5‎次.‎ 故ζ的分布列为 ζ ‎1‎‎5‎ ‎6‎‎5‎ P ‎0.95‎ ‎1 - 0.95‎ ‎(ii)分组时:P(ζ=‎1‎k)=(1 - p)k,P(ζ=‎1‎k+1)=1 - (1 - p)k,‎ 所以E(ζ)=‎1‎k·(1 - p)k+(‎1‎k+1)[1 - (1 - p)k]=1 - (1 - p)k+‎1‎k.‎ 不分组时,每人所需检验的次数为1次.‎ 要使用分组的办法能减少检验次数,需1 - (1 - p)k+‎1‎k‎<‎1即1 - p>‎1‎kk,所以当1 - p>‎1‎kk时,用分组的办法能减少检验次数.‎ 素养探源 ‎ 核心素养 考查途径 素养水平 数学建模 将“检验次数”的实际问题用分布列、期望表达,确定概率模型.‎ 二 数学运算 求概率、分布列、期望.‎ 一 审题指导 ‎ 审题是解决实际应用题最难的一步,在解题过程中常出现以下问题:(1)弄不清问题的实际背景;(2)弄不清要解决的问题的实质;(3)对一些数学概念、语言文字等理解错误;(4)无法建立实际问题与数学知识的联系等.‎ 本题是一道典型例题,审题非常重要.它的背景是生活中的“血液检验问题”,需要联系的知识是“相互独立事件的概率、分布列、期望等知识”.第(2)问中的(ii)寻找p与k的关系,实际上是寻找一般的决策依据,有重要的实际意义,这也是数学建模思想的重要体现.‎ 本题审题的关键有以下几点:(1)把“每个人的血液需要的检验次数”理解为“每个人的血液需要的平均检验次数”;(2)平均检验次数与每个个体发生的概率有关,可联系相互独立事件的概率转化为分布列及期望问题;(3)求解“k与p满足什么关系时,用分组的办法能减少检验次数”时,需要对比用分组的办法对应的检验次数与不用分组的办法对应的检验次数;(4)分组时,检验次数的可能取值为‎1‎k,‎1‎k+1.‎ ‎4.[2020四省八校联考]为了调查民众对国家实行“新农村建设”政策的态度,现通过网络问卷随机调查了年龄在20岁至80岁的100人,他们年龄的频数分布和支持“新农村建设”的人数如下表:‎ 年龄/岁 ‎[20,30)‎ ‎[30,40)‎ ‎[40,50)‎ ‎[50,60)‎ ‎[60,70)‎ ‎[70,80]‎ 频数 ‎10‎ ‎20‎ ‎30‎ ‎20‎ ‎10‎ ‎10‎ 支持“新农村 建设”的人数 ‎3‎ ‎11‎ ‎26‎ ‎12‎ ‎6‎ ‎2‎ ‎ (1)根据上述统计数据填下面的2×2列联表,并判断是否有95%的把握认为年龄低于50岁的人和年龄不低于50岁的人对“新农村建设”政策的支持态度有差异.‎ 年龄低于50‎ 岁的人数 年龄不低于50‎ 岁的人数 合计 支持 不支持 合计 ‎(2)为了进一步推动“新农村建设”政策的实施,某电视台某节目对此进行了专题报道,并在节目最后利用随机拨号的形式在全国范围内选出4名幸运观众(假设年龄均在20岁至80岁)给予适当的奖励.若以频率估计概率,记选出的4名幸运观众中支持“新农村建设”的人数为ξ,试求随机变量ξ的分布列和数学期望.‎ 参考数据:‎ P(K2≥k0)‎ ‎0.150‎ ‎0.100‎ ‎0.050‎ ‎0.025‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎2.072‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ 参考公式:K2=n(ad-bc‎)‎‎2‎‎(a+b)(c+d)(a+c)(b+d)‎,其中n=a+b+c+d.‎ ‎1.B 去掉D(3,10)后,解释变量x与预报变量y的相关性变强,模型拟合效果变好,故残差平方和变小.故选B.‎ ‎2.B ①中的抽样属于系统抽样,故①错误;概率只说明事件发生的可能性,在某次试验中不一定发生,所以并不能说明天气预报不科学,故②错误;③④正确.故选B.‎ ‎3.C 由题意可知y‎^‎=4x+a‎^‎,又x=22.5,y=160,因此160=22.5×4+a‎^‎,故a‎^‎=70,因此y‎^‎=4x+70.当x=24时,y‎^‎=4×24+70=96+70=166.故选C.‎ ‎4.D 根据题图易得选项A,B,C正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D错误.故选D.‎ ‎5.A 由题意得K2的观测值k=‎100×‎‎(10×30 - 40×20)‎‎2‎‎30×70×50×50‎≈4.762>3.841,可得在犯错误的概率不超过5%的前提下,认为“爱好踢毽子与性别有关”,所以A正确,故选A.‎ ‎6.C 由已知可得x‎=‎‎1+2+3+4+5‎‎5‎=3,y‎=‎‎0.7+0.8+1+1.1+1.4‎‎5‎=1,b‎^‎‎=‎‎1.7‎‎10‎=0.17,则a‎^‎‎=y-‎b‎^‎x=1 - 0.17×3=0.49,所以年生产利润与年份代号的回归直线方程为y‎^‎=0.17x+0.49.当x=8时,y‎^‎=0.17×8+0.49=1.85,故选C.‎ ‎7.6.5 由题表得x‎=‎‎0+1+2+3+4‎‎5‎=2,y‎=‎‎10+15+20+30+35‎‎5‎=22,由22=2b‎^‎+9,解得b‎^‎=6.5.‎ ‎1.(1)根据题中散点图可以判断,y=c·dx适宜作为使用扫码支付的人次y关于活动推出天数x的回归方程类型.‎ ‎(2)将y=c·d x两边同时取常用对数,得lg y=lg(c·d x)=lg c+xlg d,设lg y=v,则v=lg c+xlg d.‎ ‎∵x=4,v=2.54,‎∑‎i=1‎‎7‎xi‎2‎=140,‎ ‎∴lg d=‎∑‎i=1‎‎7‎xivi‎ - 7‎xv‎∑‎i=1‎‎7‎xi‎2‎‎ - 7‎x‎ ‎‎2‎‎=‎78.12 - 7×4×2.54‎‎140 - 7×‎‎4‎‎2‎=‎‎7‎‎28‎=0.25,‎ 把(4,2.54)代入v=lg c+xlg d,得lg c=1.54,‎ ‎∴v‎^‎=1.54+0.25x,∴y‎^‎=101.54+0.25x=101.54·(100.25)x.‎ 把x=8代入上式,得y‎^‎=101.54+0.25×8=103.54=103×100.54=3 470.‎ ‎∴y关于x的回归方程为y‎^‎=101.54·(100.25)x,预测活动推出第8天使用扫码支付的人次为3 470.‎ ‎2.(1)该校共有100名文科学生参加考试,其中语文考试成绩低于130分的占95%,所以语文成绩特别优秀的概率p1=1 - 0.95=0.05,故语文成绩特别优秀的学生约有100×0.05=5(人).由题中频率分布直方图可知,数学成绩特别优秀的概率p2=0.002×20=0.04,故数学成绩特别优秀的学生约有100×0.04=4(人).‎ ‎(2)(i)语文和数学两科都特别优秀的有3人,单科特别优秀的有3人,‎ 记两科都特别优秀的3人分别为A1,A2,A3,单科特别优秀的3人分别为B1,B2,B3,从中随机抽取2人,所有可能结果为{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A1,B3},{A2,A3},{A2,B1},{A2,B2},{A2,B3},{A3,B1},{A3,B2},{A3,B3},{B1,B2},{B1,B3},{B2,B3},共15种.‎ 其中抽取的2人两科成绩都特别优秀的所有可能结果为{A1,A2},{A1,A3},{A2,A3},共3种.‎ 所以抽取的2人两科成绩都特别优秀的概率P=‎3‎‎15‎‎=‎‎1‎‎5‎.‎ ‎(ii)完成2×2列联表如下:‎ 语文成绩特别优秀 语文成绩不特别优秀 合计 数学成绩特别优秀 ‎3‎ ‎1‎ ‎4‎ 数学成绩不特别优秀 ‎2‎ ‎94‎ ‎96‎ 合计 ‎5‎ ‎95‎ ‎100‎ 因为K2的观测值k=‎100×(3×94 - 1×2‎‎)‎‎2‎‎4×96×5×95‎‎=‎‎2450‎‎57‎≈42.982>6.635,‎ 所以有99%的把握认为语文成绩特别优秀的同学,数学成绩也特别优秀.‎ ‎3.(1)x‎=‎‎140+150+160+170+180‎‎5‎=160,y‎=‎‎64+55+45+35+26‎‎5‎=45,‎ ‎∑‎i=1‎‎5‎‎(xi - x)2=(140 - 160)2+(150 - 160)2+(160 - 160)2+(170 - 160)2+(180 - 160)2=1 000,‎ ‎∑‎i=1‎‎5‎‎(xi - x)(yi - y)= - 20×19 - 10×10+0×0 - 10×10 - 20×19= - 960,‎ ‎∴b‎^‎=‎∑‎i=1‎‎5‎‎(xi - x)(yi - y)‎‎∑‎i=1‎‎5‎‎(xi - ‎x‎)‎‎2‎‎=‎‎ - 960‎‎1000‎= - 0.96,‎ ‎∴a‎^‎‎=‎y - b‎^‎x=45+0.96×160=198.6,‎ ‎∴y关于x的回归方程为y‎^‎= - 0.96x+198.6.‎ ‎(2)(i)由(1)知,当x=165时,y‎^‎= - 0.96×165+198.6=40.2≈40,即每台红外线治疗仪的价格为165元时,红外线治疗仪的月销售量为40台.‎ ‎(ii)药店每月获得的纯收益Q(x)=( - 0.96x+198.6)(x - 120)= - 0.96x2+313.8x - 23 832,‎ ‎∴当x=‎313.8‎‎2×0.96‎≈163时,Q(x)取得最大值,‎ 即要使每月获得最大的纯收益,每台红外线治疗仪的销售价格应定为163元.‎ ‎4.(1)2×2列联表为 年龄低于50岁的人数 年龄不低于50岁的人数 合计 支持 ‎40‎ ‎20‎ ‎60‎ 不支持 ‎20‎ ‎20‎ ‎40‎ 合计 ‎60‎ ‎40‎ ‎100‎ K2的观测值k=‎100×(40×20 - 20×20‎‎)‎‎2‎‎60×40×60×40‎≈2.778<3.841,‎ 所以没有95%的把握认为年龄低于50岁的人和年龄不低于50岁的人对“新农村建设”政策的支持态度有差异.‎ ‎(2)由题意可知,ξ可取0,1,2,3,4,且观众支持“新农村建设”的概率为‎60‎‎100‎‎=‎‎3‎‎5‎,因此ξ~B(4,‎3‎‎5‎),‎ 所以P(ξ=0)=C‎4‎‎0‎(‎2‎‎5‎)4=‎16‎‎625‎,‎ P(ξ=1)=C‎4‎‎1‎(‎3‎‎5‎)1(‎2‎‎5‎)3=‎96‎‎625‎,‎ P(ξ=2)=C‎4‎‎2‎(‎3‎‎5‎)2(‎2‎‎5‎)2=‎216‎‎625‎,‎ P(ξ=3)=C‎4‎‎3‎(‎3‎‎5‎)3(‎2‎‎5‎)1=‎216‎‎625‎,‎ P(ξ=4)=C‎4‎‎4‎(‎3‎‎5‎)4=‎81‎‎625‎.‎ ξ的分布列为 ξ ‎0‎ ‎1‎ ‎2‎ ‎3‎ ‎4‎ P ‎16‎‎625‎ ‎96‎‎625‎ ‎216‎‎625‎ ‎216‎‎625‎ ‎81‎‎625‎ 解法一 所以ξ的数学期望E(ξ)=0×‎16‎‎625‎+1×‎96‎‎625‎+2×‎216‎‎625‎+3×‎216‎‎625‎+4×‎81‎‎625‎‎=‎‎12‎‎5‎.‎ 解法二 所以ξ的数学期望E(ξ)=4×‎3‎‎5‎‎=‎‎12‎‎5‎.‎
查看更多

相关文章

您可能关注的文档