- 2021-06-30 发布 |
- 37.5 KB |
- 8页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
2020高中数学 专题强化训练1 统计案例 新人教A版选修1-2
专题强化训练(一) 统计案例 (建议用时:40分钟) [基础达标练] 一、选择题 1.如果在犯错误的概率不超过0.05的前提下认为事件A和B有关,那么具体算出的数据满足( ) A.K2>3.841 B.K2<3.841 C.K2>6.635 D.K2<6.635 A [对应P(K2≥k0)的临界值表可知,当K2>3.841时,在犯错误的概率不超过0.05的前提下认为事件A与B有关.] 2.对于线性回归方程=x+,下列说法中不正确的是( ) 【导学号:48662028】 A.直线必经过点(,) B.x增加1个单位时,y平均增加个单位 C.样本数据中x=0时,可能有y= D.样本数据中x=0时,一定有y= D [线性回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.] 3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元) 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 B [由题意知,==10, ==8, ∴=8-0.76×10=0.4, 8 ∴当x=15时,=0.76×15+0.4=11.8(万元).] 4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归方程,分别得到以下四个结论: ①y与x负相关且=2.347x-6.423; ②y与x负相关且=-3.476x+5.648; ③y与x正相关且=5.437x+8.493; ④y与x正相关且=-4.326x-4.578. 其中一定不正确的结论的序号是( ) 【导学号:48662029】 A.①② B.②③ C.③④ D.①④ D [由正负相关的定义及x、y之间的相关关系可知②③正确.] 5.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算K2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为( ) P(K2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 A.0.1% B.1% C.99% D.99.9% C [因为 K2=8.01>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.] 二、填空题 6.关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是________(填序号). (1)k的值越大,“X和Y有关系”可信程度越小; (2)k的值越小,“X和Y有关系”可信程度越小; (3)k的值越接近于0,“X和Y无关”程度越小; (4)k的值越大,“X和Y无关”程度越大. 【导学号:48662030】 (2) [k的值越大,X和Y有关系的可能性就越大,也就意味着X和Y无关系的可能性就越小.] 7.对于线性回归方程=x+,当x=3时,对应的y的估计值是17,当x=8时,对应的 8 y的估计值是22,那么,该线性回归方程是________,根据线性回归方程判断当x=________时,y的估计值是38. y=x+14 24 [由题意可知解得 ∴回归方程为y=x+14.由x+14=38得x=24.] 8.若对于变量y与x的10组统计数据的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,那么(yi-)2的值为________. 2 410.6 [∵R2=1-, 残差平方和(yi-i)2=120.53, ∴0.95=1-, ∴(yi-)2=2 410.6.] 三、解答题 9.某地区2011年到2017年农村居民家庭人均纯收入y(单位:千元)的数据如下表: 年份 2011 2012 2013 2014 2015 2016 2017 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2011年到2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为=,=- . 【导学号:48662031】 [解] (1)由所给数据计算得 =×(1+2+3+4+5+6+7)=4, =×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, 8 (ti-)2=9+4+1+0+1+4+9=28, (ti-)(yi-)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14, ===0.5, =- =4.3-0.5×4=2.3, 所以所求回归方程为=0.5t+2.3. (2)由(1)知=0.5>0,故2011年到2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2019年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8.故预测该地区2019年农村居民家庭人均纯收入为6.8千元. 10.某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图11所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.) 图11 (1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯. (2)根据以上数据完成如表所示的2×2列联表. 主食蔬菜 主食肉类 总计 50岁以下 50岁以上 总计 (3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”? 【导学号:48662032】 [解] 8 (1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉类为主. (2)2×2列联表如表所示: 主食蔬菜 主食肉类 总计 50岁以下 4 8 12 50岁以上 16 2 18 总计 20 10 30 (3)k===10>6.635, 故在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”. [能力提升练] 1.已知人的年龄x与人体脂肪含量的百分数y的回归方程为=0.577x-0.448,如果某人36岁,那么这个人的脂肪含量( ) 【导学号:48662033】 A.一定是20.3% B.在20.3%附近的可能性比较大 C.无任何参考数据 D.以上解释都无道理 B [将x=36代入回归方程得=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.] 2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1 成绩 性别 不及格 及格 总计 男 6 14 20 女 10 22 32 总计 16 36 52 表2 视力 性别 好 差 总计 男 4 16 20 女 12 20 32 8 总计 16 36 52 表3 智商 性别 偏高 正常 总计 男 8 12 20 女 8 24 32 总计 16 36 52 表4 阅读量 性别 丰富 不丰富 总计 男 14 6 20 女 2 30 32 总计 16 36 52 A.成绩 B.视力 C.智商 D.阅读量 注:K2=. D [A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52, k==. B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52, k==. C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52, k==. D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52, k==. ∵<<<, 8 ∴与性别有关联的可能性最大的变量是阅读量.] 3.在研究身高和体重的关系时,求得R2≈________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多. 【导学号:48662034】 0.64 [结合相关指数的计算公式R2=1-可知,当R2≈0.64时,身高解释了64%的体重变化.] 4.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示: 文艺节目 新闻节目 总计 20至40岁 40 18 58 大于40岁 15 27 42 总计 55 45 100 由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”). 是 [因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.] 5.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料: 日期 12月1日 12月2日 12月3日 12月4日 12月5日 温差x(℃) 10 11 13 12 8 发芽y(颗) 23 25 30 26 16 该农科所确定的研究方案是:先从这5组数据中选取3组数据求线性回归方程,剩下的2组数据用于回归方程检验. (1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=x+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? (3)请预测温差为14 ℃的发芽数. 【导学号:48662035】 8 [解] (1)由数据求得,=12,=27, =434,iyi=977. 由公式求得,=, =-=-3. 所以y关于x的线性回归方程为=x-3. (2)当x=10时,=×10-3=22,|22-23|<2; 当x=8时,=×8-3=17,|17-16|<2. 所以该研究所得到的线性回归方程是可靠的. (3)当x=14时,有=×14-3=35-3=32, 所以当温差为14 ℃时的发芽数约为32颗. 8查看更多