【数学】2020届一轮复习人教B版10-4变量间的相关关系、统计案例学案

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

【数学】2020届一轮复习人教B版10-4变量间的相关关系、统计案例学案

第四节 变量间的相关关系、统计案例 变量间的相关关系、统计案例 ‎1.变量间的相关关系 ‎(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系.‎ ‎(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.‎ ‎2.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.‎ ‎(1)独立性检验 了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.‎ ‎(2)回归分析 了解回归分析的基本思想、方法及其简单应用.‎ 知识点一 回归分析 ‎1.变量间的相关关系 ‎(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.‎ ‎(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.‎ ‎2.两个变量的线性相关 ‎(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.‎ ‎(2)回归方程为=x+,其中=,=-.‎ ‎(3)通过求Q= (yi-bxi-a)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.‎ ‎(4)相关系数:‎ 当r>0时,表明两个变量正相关;‎ 当r<0时,表明两个变量负相关.‎ r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,‎ 表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.‎ 易误提醒 ‎ ‎1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.‎ ‎2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上 .‎ ‎3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).‎ ‎[自测练习]‎ ‎1.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为=0.95x+,则=(  )‎ x ‎0‎ ‎1‎ ‎3‎ ‎4‎ y ‎2.2‎ ‎4.3‎ ‎4.8‎ ‎6.7‎ A.3.25    ‎‎      B.2.6‎ C.2.2 D.0‎ 解析:∵回归直线必过样本点的中心(,),又=2,=4.5,代入回归方程,得=2.6.‎ 答案:B ‎2.(2018·镇江模拟)如图所示,有A,B,C,D,E 5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.‎ 解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D.‎ 答案:D 知识点二 独立性检验 独立性检验 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:‎ y1‎ y2‎ 总计 x1‎ a b a+b x2‎ c d c+d 总计 a+c b+d a+b+c+d K2=(其中n=a+b+c+d为样本容量).‎ 易误提醒 (1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.‎ ‎(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.‎ ‎[自测练习]‎ ‎3.下面是2×2列联表:‎ y1‎ y2‎ 总计 x1‎ a ‎21‎ ‎73‎ x2‎ ‎22‎ ‎25‎ ‎47‎ 总计 b ‎46‎ ‎120‎ 则表中a,b的值分别为(  )‎ A.94,72        B.52,50‎ C.52,74 D.74,52‎ 解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.‎ 答案:C 考点一 相关关系的判断|‎ ‎1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是(  )‎ A.r27.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.‎ ‎(3)设常喝碳酸饮料的肥胖男生为A,B,C,D,女生为E,F,任取两人的取法有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女的取法有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=.‎ 解独立性检验的应用问题的关注点 ‎(1)两个明确:‎ ‎①明确两类主体;‎ ‎②明确研究的两个问题.‎ ‎(2)两个关键:‎ ‎①准确画出2×2列联表;‎ ‎②准确理解K2.‎ 提醒:准确计算K2的值是正确判断的前提.‎ ‎ ‎ ‎                                 ‎ ‎2.通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:‎ 男 女 总计 走天桥 ‎40‎ ‎20‎ ‎60‎ 走斑马线 ‎20‎ ‎30‎ ‎50‎ 总计 ‎60‎ ‎50‎ ‎110‎ K2=,n=a+b+c+d.‎ 附表:‎ P(K2≥k0)‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k0‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ 参照附表,得到的正确结论是(  )‎ A.有99%以上的把握认为“选择过马路的方式与性别有关”‎ B.有99%以上的把握认为“选择过马路的方式与性别无关”‎ C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”‎ D.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”‎ 解析:K2=≈7.8.‎ P(K2≥6.635)=0.01=1-99%,∴有99%以上的把握认为“选择过马路的方式与性别有关”,故选A.‎ 答案:A ‎  12.独立性检验与概率交汇综合问题的答题模板 ‎【典例】 (12分)(2018·保定调研)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:‎ 喜欢“应用统计”课程 不喜欢“应 用统计”课程 总计 男生 ‎20‎ ‎5‎ ‎25‎ 女生 ‎10‎ ‎20‎ ‎30‎ 总计 ‎30‎ ‎25‎ ‎55‎ ‎(1)判断是否有99.5%的把握认为喜欢“应用统计”课程与性别有关?‎ ‎(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.‎ 下面的临界值表供参考:‎ P(K2≥k0)‎ ‎0.15‎ ‎0.10‎ ‎0.05‎ ‎0.25‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎2.072‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ ‎(参考公式:K2=,其中n=a+b+c+d)‎ ‎[规范解答] (1)由公式K2=≈11.978>7.879,(3分)‎ 所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(6分)‎ ‎(2)设所抽样本中有m个男生,则=,得m=4,所以样本中有4个男生,2个女生,分别记作B1,B2,B3,B4,G1,G2.从中任选2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15个,(9分)‎ 其中恰有1个男生和1个女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8个.(11分)‎ 所以恰有1个男生和1个女生的概率为.(12分)‎ ‎[模板形成] ‎ ‎↓‎ ‎↓‎ ‎↓‎ ‎↓‎ ‎[跟踪练习] 某班主任对全班50名学生学习积极性和参加社团活动情况进行调查,统计数据见下表所示:‎ 参加社团活动 不参加社团活动 合计 学习积极性高 ‎17‎ ‎8‎ ‎25‎ 学习积极性一般 ‎5‎ ‎20‎ ‎25‎ 合计 ‎22‎ ‎28‎ ‎50‎ ‎(1)如果随机从该班抽查一名学生,抽到参加社团活动的学生的概率是多少?抽到不参加社团活动且学习积极性一般的学生的概率是多少?‎ ‎(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由.‎ 附:K2=;其中n=a+b+c+d.‎ P(K2≥k0)‎ ‎0.05‎ ‎0.01‎ ‎0.001‎ k0‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ 解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是=;‎ 抽到不参加社团活动且学习积极性一般的学生的概率是=.‎ ‎(2)因为K2==≈11.688>10.828,‎ 所以大约有99.9%的把握认为学生的学习积极性与参加社团活动情况有关系.‎ A组 考点能力演练 ‎1.根据如下样本数据得到的回归方程为=x+,则(  )‎ x ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ y ‎4.0‎ ‎2.5‎ ‎-0.5‎ ‎0.5‎ ‎-2.0‎ ‎-3.0‎ A.>0,>0       B.>0,<0‎ C.<0,>0 D.<0,<0‎ 解析:把样本数据中的x,y分别当作点的横、纵坐标,在平面直角坐标系xOy中作出散点图(图略),由图可知<0,>0.故选B.‎ 答案:B ‎2.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,‎ 则由该观测数据算得的线性回归方程可能为(  )‎ A.=0.4x+2.3 B.=2x-2.4‎ C.=-2x+9.5 D.=-0.3x+4.4‎ 解析:依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确.‎ 答案:A ‎3.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:‎ 做不到“光盘”‎ 能做到“光盘”‎ 男 ‎45‎ ‎10‎ 女 ‎30‎ ‎15‎ 附表及公式 P(K2≥k0)‎ ‎0.100‎ ‎0.050‎ ‎0.010‎ ‎0.001‎ k0‎ ‎2.706‎ ‎3.841‎ ‎6.635‎ ‎10.828‎ K2=,其中n=a+b+c+d.‎ 则下面的正确结论是(  )‎ A.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”‎ B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”‎ C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”‎ D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”‎ 解析:由2×2列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k0=≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,故选A.‎ 答案:A ‎4.根据如下样本数据:‎ x ‎3‎ ‎4‎ ‎5‎ ‎6‎ ‎7‎ y ‎4.0‎ a-5.4‎ ‎-0.5‎ ‎0.5‎ b-0.6‎ 得到的回归方程为=x+.若样本点的中心为(5,0.9),则当x每增加1个单位时,y就(  )‎ A.增加1.4个单位 B.减少1.4个单位 C.增加7.9个单位 D.减少7.9个单位 解析:依题意得,=0.9,故+=6.5①;又样本点的中心为(5,0.9),故0.9=5+②,联立①②,解得=-1.4,=7.9,则=-1.4x+7.9,可知当x每增加1个单位时,y就减少1.4个单位,故选B.‎ 答案:B ‎5.已知x与y之间的几组数据如下表:‎ x ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ y ‎0‎ ‎2‎ ‎1‎ ‎3‎ ‎3‎ ‎4‎ 假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是(  )‎ A.>b′,>a′ B.>b′,a′ D.a′.‎ 答案:C ‎6.(2018·忻州联考)已知x,y的取值如下表:‎ x ‎2‎ ‎3‎ ‎4‎ ‎5‎ y ‎2.2‎ ‎3.8‎ ‎5.5‎ ‎6.5‎ 从散点图分析,y与x线性相关,且回归方程为=1.46x+,则实数的值为________.‎ 解析:==3.5,==4.5,回归方程必过样本的中心点(,).把(3.5,4.5)代入回归方程,计算得=-0.61.‎ 答案:-0.61‎ ‎7.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:‎ 喜爱打篮球 不喜爱打篮球 总计 男生 ‎20‎ ‎5‎ ‎25‎ 女生 ‎10‎ ‎15‎ ‎25‎ 总计 ‎30‎ ‎20‎ ‎50‎ 则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关(请用百分数表示).‎ P(K2≥k0)‎ ‎0.10‎ ‎0.05‎ ‎0.025‎ ‎0.010‎ ‎0.005‎ ‎0.001‎ k0‎ ‎2.706‎ ‎3.841‎ ‎5.024‎ ‎6.635‎ ‎7.879‎ ‎10.828‎ 解析:K2= ‎=≈8.333>7.879.‎ 答案:0.5%‎ ‎8.已知下表所示数据的回归直线方程为=4x+242,则实数a=________.‎ x ‎2‎ ‎3‎ ‎4‎ ‎5‎ ‎6‎ y ‎251‎ ‎254‎ ‎257‎ a ‎266‎ 解析:回归直线=4x+242必过样本点的中心点(,),而==4,==,∴=4×4+242,解得a=262.‎ 答案:262‎ ‎9.(2018·东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)‎ ‎(1)根据以上数据完成下列2×2列联表:‎ 主食蔬菜 主食肉类 合计 ‎50岁以下 ‎50岁以上 合计 ‎(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?并写出简要分析.‎ 解:(1)2×2列联表如下:‎ 主食蔬菜 主食肉类 合计 ‎50岁以下 ‎4‎ ‎8‎ ‎12‎ ‎50岁以上 ‎16‎ ‎2‎ ‎18‎ 合计 ‎20‎ ‎10‎ ‎30‎ ‎(2)因为K2==10>6.635,‎ 所以有99%的把握认为其亲属的饮食习惯与年龄有关.‎ ‎10.(2018·高考重庆卷)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:‎ 年份 ‎2010‎ ‎2011‎ ‎2018‎ ‎2018‎ ‎2018‎ 时间代号t ‎1‎ ‎2‎ ‎3‎ ‎4‎ ‎5‎ 储蓄存款y(千亿元)‎ ‎5‎ ‎6‎ ‎7‎ ‎8‎ ‎10‎ ‎(1)求y关于t的回归方程=t+;‎ ‎(2)用所求回归方程预测该地区2018年(t=6)的人民币储蓄存款.‎ 附:回归方程=t+中,‎ =,=-.‎ 解:(1)列表计算如下 i ti yi t tiyi ‎1‎ ‎1‎ ‎5‎ ‎1‎ ‎5‎ ‎2‎ ‎2‎ ‎6‎ ‎4‎ ‎12‎ ‎3‎ ‎3‎ ‎7‎ ‎9‎ ‎21‎ ‎4‎ ‎5‎ ‎4‎ ‎5‎ ‎8‎ ‎10‎ ‎16‎ ‎25‎ ‎32‎ ‎50‎ ‎∑‎ ‎15‎ ‎36‎ ‎55‎ ‎120‎ 这里n=5,=ti==3,=yi==7.2.‎ 又ltt=t-n2=55-5×32=10,lty=tiyi-n =120-5×3×7.2=12,‎ 从而===1.2,=-=7.2-1.2×3=3.6,‎ 故所求回归方程为=1.2t+3.6.‎ ‎(2)将t=6代入回归方程可预测该地区2018年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).‎ B组 高考题型专练 ‎1.(2018·高考福建卷)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:‎ 收入x(万元)‎ ‎8.2‎ ‎8.6‎ ‎10.0‎ ‎11.3‎ ‎11.9‎ 支出y(万元)‎ ‎6.2‎ ‎7.5‎ ‎8.0‎ ‎8.5‎ ‎9.8‎ 根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为(  )‎ A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 解析:∵=10.0,=8.0,=0.76,∴=8-0.76×10=0.4,∴回归方程为=0.76x+0.4,把x=15代入上式得,=0.76×15+0.4=11.8(万元),故选B.‎ 答案:B ‎2.(2018·高考北京卷)高三年级267位学生参加期末考试,某班37位学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图所示,甲、乙、丙为该班三位学生.‎ 从这次考试成绩看,‎ ‎(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;‎ ‎(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.‎ 解析:(1)由题图分析乙的语文成绩名次略比甲的语文成绩名次靠前,但总成绩名次靠后,所以甲、乙两人中语文成绩名次比总成绩靠前的是乙;(2)丙同学的数学成绩名次位于中间稍微靠后,而总成绩名次相对靠后,所以丙同学的语文成绩名次比较靠后,所以丙同学的成绩名次靠前的科目是数学.‎ 答案:乙 数学
查看更多

相关文章

您可能关注的文档