- 2021-06-24 发布 |
- 37.5 KB |
- 16页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
【数学】2020届一轮复习人教B版10-4变量间的相关关系、统计案例学案
第四节 变量间的相关关系、统计案例 变量间的相关关系、统计案例 1.变量间的相关关系 (1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 2.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. (1)独立性检验 了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析 了解回归分析的基本思想、方法及其简单应用. 知识点一 回归分析 1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. (2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2.两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线. (2)回归方程为=x+,其中=,=-. (3)通过求Q= (yi-bxi-a)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法. (4)相关系数: 当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时, 表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性. 易误提醒 1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上 . 3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值). [自测练习] 1.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为=0.95x+,则=( ) x 0 1 3 4 y 2.2 4.3 4.8 6.7 A.3.25 B.2.6 C.2.2 D.0 解析:∵回归直线必过样本点的中心(,),又=2,=4.5,代入回归方程,得=2.6. 答案:B 2.(2018·镇江模拟)如图所示,有A,B,C,D,E 5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系. 解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D. 答案:D 知识点二 独立性检验 独立性检验 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d K2=(其中n=a+b+c+d为样本容量). 易误提醒 (1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断. (2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释. [自测练习] 3.下面是2×2列联表: y1 y2 总计 x1 a 21 73 x2 22 25 47 总计 b 46 120 则表中a,b的值分别为( ) A.94,72 B.52,50 C.52,74 D.74,52 解析:∵a+21=73,∴a=52,又a+22=b,∴b=74. 答案:C 考点一 相关关系的判断| 1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( ) A.r2查看更多