- 2021-05-13 发布 |
- 37.5 KB |
- 22页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
精选必修三统计高考真题
2017年04月19日的高中数学组卷 一.选择题(共11小题) 1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元) 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 2.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( ) A.=0.4x+2.3 B.=2x﹣2.4 C.=﹣2x+9.5 D.=﹣0.3x+4.4 3.根据如下样本数据,得到回归方程=bx+a,则( ) x 3 4 5 6 7 8 y 4.0 2.5 ﹣0.5 0.5 ﹣2.0 ﹣3.0 A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 4.某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A.抽签法 B.系统抽样法 C.分层抽样法 D.随机数法 5.根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 6.重庆市2013年各月的平均气温(℃)数据的茎叶图如,则这组数据的中位数是( ) A.19 B.20 C.21.5 D.23 7.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A.3 B.4 C.5 D.6 8.若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为( ) A.8 B.15 C.16 D.32 9.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( ) A.6 B.8 C.12 D.18 10.某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 11.一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( ) A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6 二.解答题(共7小题) 12.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi﹣)2 (wi﹣)2 (xi﹣)(yi﹣) (wi﹣)(yi﹣) 46.6 563 6.8 289.8 1.6 1469 108.8 表中wi=i,= (Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程; (Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1 v1),(u2 v2)…..(un vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=,=﹣. 13.如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1﹣7分别对应年份2008﹣2014. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646. 参考公式:r=, 回归方程=+t中斜率和截距的最小二乘估计公式分别为: =,=﹣. 14.某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 2.9 3.3 3.6 4.4 4.8 5.2 5.9 人均纯收入y (Ⅰ)求y关于t的线性回归方程; (Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=﹣. 15.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得,,,. (Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a; (Ⅱ)判断变量x与y之间是正相关还是负相关; (Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y=bx+a中,,,其中,为样本平均值,线性回归方程也可写为. 16.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图. (I)求直方图中的a值; (II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由; (Ⅲ)估计居民月均用水量的中位数. 17.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图. (1)求直方图中x的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 18.某工厂36名工人年龄数据如图: 工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄 1 2 40 44 10 11 36 31 19 20 27 43 28 29 34 39 3 4 5 6 7 8 9 40 41 33 40 45 42 43 12 13 14 15 16 17 18 38 39 43 45 39 38 36 21 22 23 24 25 26 27 41 37 34 42 37 44 42 30 31 32 33 34 35 36 43 38 42 53 37 49 39 (1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值和方差s2; (3)36名工人中年龄在﹣s和+s之间有多少人?所占百分比是多少(精确到0.01%)? 2017年04月19日的高中数学组卷 参考答案与试题解析 一.选择题(共11小题) 1.(2015•福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x(万元) 8.2 8.6 10.0 11.3 11.9 支出y(万元) 6.2 7.5 8.0 8.5 9.8 根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为( ) A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元 【解答】解:由题意可得=(8.2+8.6+10.0+11.3+11.9)=10, =(6.2+7.5+8.0+8.5+9.8)=8, 代入回归方程可得=8﹣0.76×10=0.4, ∴回归方程为=0.76x+0.4, 把x=15代入方程可得y=0.76×15+0.4=11.8, 故选:B. 2.(2014•重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( ) A.=0.4x+2.3 B.=2x﹣2.4 C.=﹣2x+9.5 D.=﹣0.3x+4.4 【解答】解:∵变量x与y正相关, ∴可以排除C,D; 样本平均数=3,=3.5,代入A符合,B不符合, 故选:A. 3.(2014•湖北)根据如下样本数据,得到回归方程=bx+a,则( ) x 3 4 5 6 7 8 y 4.0 2.5 ﹣0.5 0.5 ﹣2.0 ﹣3.0 A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0 【解答】解:由题意可知:回归方程经过的样本数据对应的点附近,是减函数,所以b<0,且回归方程经过(3,4)与(4,3.5)附近,所以a>0. 故选:B. 4.(2015•四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( ) A.抽签法 B.系统抽样法 C.分层抽样法 D.随机数法 【解答】解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样, 而事先已经了解到三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,这种方式具有代表性,比较合理. 故选:C. 5.(2015•新课标Ⅱ)根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 【解答】解:A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确; B2004﹣2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确; C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确; D2006年以来我国二氧化硫年排放量越来越少,而不是与年份正相关,故D错误. 故选:D 6.(2015•重庆)重庆市2013年各月的平均气温(℃)数据的茎叶图如,则这组数据的中位数是( ) A.19 B.20 C.21.5 D.23 【解答】解:样本数据有12个,位于中间的两个数为20,20, 则中位数为, 故选:B 7.(2015•湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1﹣35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( ) A.3 B.4 C.5 D.6 【解答】解:由已知,将个数据分为三个层次是[130,138],[139,151],[152,153],根据系统抽样方法从中抽取7人,得到抽取比例为, 所以成绩在区间[139,151]中共有20名运动员,抽取人数为20×=4; 故选B. 8.(2015•安徽)若样本数据x1,x2,…,x10的标准差为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的标准差为( ) A.8 B.15 C.16 D.32 【解答】解:∵样本数据x1,x2,…,x10的标准差为8, ∴=8,即DX=64, 数据2x1﹣1,2x2﹣1,…,2x10﹣1的方差为D(2X﹣1)=4DX=4×64, 则对应的标准差为==16, 故选:C. 9.(2014•山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( ) A.6 B.8 C.12 D.18 【解答】 解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人, 第三组中没有疗效的有6人, 第三组中有疗效的有12人. 故选:C. 10.(2013•陕西)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 【解答】解:使用系统抽样方法,从840人中抽取42人,即从20人抽取1人. 所以从编号1~480的人中,恰好抽取=24人,接着从编号481~720共240人中抽取=12人. 故:B. 11.(2010•四川)一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( ) A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6 【解答】解:因为=,故各层中依次抽取的人数分别是=8,=16,=10,=6, 故选D. 二.解答题(共7小题) 12.(2015•新课标Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi﹣)2 (wi﹣)2 (xi﹣)(yi﹣) (wi﹣)(yi﹣) 46.6 563 6.8 289.8 1.6 1469 108.8 表中wi=i,= (Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由) (Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程; (Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题: (i)年宣传费x=49时,年销售量及年利润的预报值是多少? (ii)年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1 v1),(u2 v2)…..(un vn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=,=﹣. 【解答】解:(Ⅰ)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型; (Ⅱ)令w=,先建立y关于w的线性回归方程,由于==68, =﹣=563﹣68×6.8=100.6, 所以y关于w的线性回归方程为=100.6+68w, 因此y关于x的回归方程为=100.6+68, (Ⅲ)(i)由(Ⅱ)知,当x=49时,年销售量y的预报值=100.6+68=576.6, 年利润z的预报值=576.6×0.2﹣49=66.32, (ii)根据(Ⅱ)的结果可知,年利润z的预报值=0.2(100.6+68)﹣x=﹣x+13.6+20.12, 当==6.8时,即当x=46.24时,年利润的预报值最大. 13.(2016•新课标Ⅲ)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1﹣7分别对应年份2008﹣2014. (1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明; (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646. 参考公式:r=, 回归方程=+t中斜率和截距的最小二乘估计公式分别为: =,=﹣. 【解答】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下: ∵r==≈≈≈0.993, ∵0.993>0.75, 故y与t之间存在较强的正相关关系; (2)==≈≈0.103, =﹣≈1.331﹣0.103×4≈0.92, ∴y关于t的回归方程=0.10t+0.92, 2016年对应的t值为9, 故=0.10×9+0.92=1.82, 预测2016年我国生活垃圾无害化处理量为1.82亿吨. 14.(2014•新课标Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (Ⅰ)求y关于t的线性回归方程; (Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=﹣. 【解答】解:(Ⅰ)由题意,=×(1+2+3+4+5+6+7)=4, =×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, ∴===0.5, =﹣=4.3﹣0.5×4=2.3. ∴y关于t的线性回归方程为=0.5t+2.3; (Ⅱ)由(Ⅰ)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元. 将2015年的年份代号t=9代入=0.5t+2.3,得: =0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元. 15.(2013•重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi (单位:千元)与月储蓄yi(单位:千元)的数据资料,算得,,,. (Ⅰ)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a; (Ⅱ)判断变量x与y之间是正相关还是负相关; (Ⅲ)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y=bx+a中,,,其中,为样本平均值,线性回归方程也可写为. 【解答】解:(Ⅰ)由题意可知n=10,===8,===2, 故lxx==720﹣10×82=80,lxy==184﹣10×8×2=24, 故可得b=═=0.3,a==2﹣0.3×8=﹣0.4, 故所求的回归方程为:y=0.3x﹣0.4; (Ⅱ)由(Ⅰ)可知b=0.3>0,即变量y随x的增加而增加,故x与y之间是正相关; (Ⅲ)把x=7代入回归方程可预测该家庭的月储蓄为y=0.3×7﹣0.4=1.7(千元). 16.(2016•四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…[4,4.5] 分成9组,制成了如图所示的频率分布直方图. (I)求直方图中的a值; (II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由; (Ⅲ)估计居民月均用水量的中位数. 【解答】解:(I)∵1=(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5,整理可得:2=1.4+2a, ∴解得:a=0.3. (II)估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下: 由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12, 又样本容量=30万, 则样本中月均用水量不低于3吨的户数为30×0.12=3.6万. (Ⅲ)根据频率分布直方图,得; 0.08×0.5+0.16×0.5+0.30×0.5+0.40×0.5=0.47<0.5, 0.47+0.5×0.52=0.73>0.5, ∴中位数应在(2,2.5]组内,设出未知数x, 令0.08×0.5+0.16×0.5+0.30×0.5+0.4×0.5+0.5×x=0.5, 解得x=0.06; ∴中位数是2+0.06=2.06. 17.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280), [280,300)分组的频率分布直方图如图. (1)求直方图中x的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为,[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 【解答】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1, 解方程可得x=0.0075,∴直方图中x的值为0.0075; (2)月平均用电量的众数是=230, ∵(0.002+0.0095+0.011)×20=0.45<0.5, ∴月平均用电量的中位数在[220,240)内, 设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a﹣220)=0.5可得a=224, ∴月平均用电量的中位数为224; (3)月平均用电量为[220,240)的用户有0.0125×20×100=25, 月平均用电量为[240,260)的用户有0.0075×20×100=15, 月平均用电量为[260,280)的用户有0.005×20×100=10, 月平均用电量为[280,300)的用户有0.0025×20×100=5, ∴抽取比例为=, ∴月平均用电量在[220,240)的用户中应抽取25×=5户. 18.(2015•广东)某工厂36名工人年龄数据如图: 工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄 1 2 3 4 5 6 7 8 9 40 44 40 41 33 40 45 42 43 10 11 12 13 14 15 16 17 18 36 31 38 39 43 45 39 38 36 19 20 21 22 23 24 25 26 27 27 43 41 37 34 42 37 44 42 28 29 30 31 32 33 34 35 36 34 39 43 38 42 53 37 49 39 (1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值和方差s2; (3)36名工人中年龄在﹣s和+s之间有多少人?所占百分比是多少(精确到0.01%)? 【解答】解:(1)由系统抽样知,36人分成9组,每组4人,其中第一组的工人年龄为44,所以其编号为2, ∴所有样本数据的编号为:4n﹣2,(n=1,2,…,9), 其数据为:44,40,36,43,36,37,44,43,37. (2)由平均值公式得=(44+40+36+43+36+37+44+43+37)=40. 由方差公式得s2=[(44﹣40)2+(40﹣40)2+…+(37﹣40)2]=. (3)∵s2=.∴s=∈(3,4), ∴36名工人中年龄在﹣s和+s之间的人数等于区间[37,43]的人数, 即40,40,41,…,39,共23人. ∴36名工人中年龄在﹣s和+s之间所占百分比为≈63.89%. 查看更多