2021版高考数学一轮复习核心素养测评六十一变量的相关性与统计案例苏教版
核心素养测评六十一 变量的相关性与统计案例
(20分钟 50分)
一、选择题(每小题5分,共25分)
1.为了判定两个分类变量X和Y是否有关系,应用独立性检验法算得χ2的值为5,又已知P(χ2≥3.841)=0.05,P(χ2≥6.635)=0.01,则下列说法正确的是( )
A.有95%的把握认为“X和Y有关系”
B.有95%的把握认为“X和Y没有关系”
C.有99%的把握认为“X和Y有关系”
D.有99%的把握认为“X和Y没有关系”
【解析】选A.依题意χ2=5,且P(χ2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”.
2.下面四个图中反映出回归模型的拟合精度较高的为 ( )
A.图① B.图② C.图③ D.图④
【解析】选A.根据图中显示的分布情况即可看出,图①显示的点比较均匀地落在水平的带状区域中,所以拟合精度较高.
3.(多选)“吸烟有害健康,吸烟会对身体造成伤害”.美国癌症协会研究表明,开始吸烟年龄X分别为16岁、18岁、20岁和22岁者,其得肺癌的相对危险度Y依次为15.10,12.81,9.72,3.21;每天吸烟支数U分别为10,20,30者,其得肺癌的相对危险度V分别为7.5,9.5和16.6,用r1表示变量X与Y之间的线性相关系数,用r2表示变量U与V之间的线性相关系数,则下列说法错误的是 ( )
A.r1=r2 B.r1>r2>0
C.0
0.因此可得r1<00,r2>0 ②>
③=0.12 ④0<<0.68
【解析】由图可知两变量呈现正相关,故r1>0,r2>0,且r13,所以点(4,3)在回归直线=0.7x+0.35的下方;
当x=5时,=0.7×5+0.35=3.85<4,所以点(5,λ)在回归直线=0.7x+0.35的上方;
当x=6时,=0.7×6+0.35=4.55>4.5,所以点(6,4.5)在回归直线=0.7x+0.35的下方.
综上,三个样本点中落在回归直线=0.7x+0.35上方的有1个.
答案:1
三、解答题
9.(10分)(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
方法一:从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型
- 10 -
=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
方法二:从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.
(15分钟 35分)
1.(5分)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如表:
学生
编号
1
2
3
4
5
6
7
8
数学
成绩
60
65
70
75
80
85
90
95
物理
成绩
72
77
80
84
88
90
93
95
给出散点图如图:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为 ( )
A.0 B.1 C.2 D.3
【解析】选B.由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;
- 10 -
若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.
2.(5分)通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由χ2=算得,
χ2=≈7.8.
附表:
P(χ2≥k0)
0.05
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是 ( )
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
【解析】选A.根据独立性检验的定义,由χ2的观测值为k≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”.
3.(5分)在2019年3月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如表所示:
价格x
9
9.5
m
10.5
11
销售量y
11
n
8
6
5
由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n=________.
- 10 -
【解析】==8+,
==6+.
回归直线一定经过样本点的中心(,),
即6+=-3.2+40,
即3.2m+n=42.
又因为m+n=20,即解得
答案:10
4.(10分)已知某企业近3年的前7个月的月利润(单位:百万元)如折线图所示:
(1)试问这3年的前7个月中哪个月的月平均利润最高?
(2)通过计算判断这3年的前7个月的总利润的发展趋势.
(3)试以第3年的前4个月的数据(如表),用线性回归的拟合模式估计第3年8月份的利润.
月份x
1
2
3
4
利润y(单位:百万元)
4
4
6
6
相关公式:==,=-.
【解析】(1)由折线图可知5月和6月的月平均利润最高.
(2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元),
第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元).
- 10 -
第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元),所以这3年的前7个月的总利润呈上升趋势.
(3)因为=2.5,=5,12+22+32+42=30,1×4+2×4+3×6+4×6=54,
所以==0.8,所以=5-2.5×0.8=3.因此线性回归方程为=0.8x+3.
当x=8时,=0.8×8+3=9.4.
所以估计第3年8月份的利润为9.4百万元.
5.(10分)(2020·珠海模拟)某种仪器随着使用年限的增加,每年的维护费相应增加. 现对一批该仪器进行调查,得到这批仪器自购入使用之日起,前5年平均每台仪器每年的维护费用大致如表:
年份x(年)
1
2
3
4
5
维护费y(万元)
0.7
1.2
1.6
2.1
2.4
(1)根据表中所给数据,试建立y关于x的线性回归方程=x+.
(2)若该仪器的价格是每台12万元,你认为应该使用满五年换一次仪器,还是应该使用满八年换一次仪器?并说明理由.
参考公式:用最小二乘法求线性回归方程=x+的系数公式:== ,=-.
【解析】(1)=3,=1.6,=9, =4.8,
xiyi=0.7+2.4+4.8+8.4+12=28.3,
=1+4+9+16+25=55.
- 10 -
所以,===0.43,
=-=1.6-0.43×3=0.31.
所以回归方程为=0.43x+0.31.
(2)若满五年换一次仪器,则每年每台仪器的平均费用为:y1==4(万元)
若满八年换一次设备,则每年每台设备的平均费用为:
y2===3.745(万元).
因为y1>y2,所以应该使用满八年换一次仪器.
- 10 -