- 2021-06-22 发布 |
- 37.5 KB |
- 14页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
新课标版高考数学复习题库考点26 随机抽样、用样本估计总体、变量间的相关关系、统计案例
考点26 随机抽样、用样本估计总体、 变量间的相关关系、统计案例 1.(2010·陕西高考文科·T4)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为,样本标准差分别为sA和sB,则( ) (A) >,sA>sB (B) <,sA>sB (C) >,sA<sB (D) <,sA<sB 【命题立意】本题考查样本平均数、标准差的概念的灵活应用,属保分题. 【思路点拨】直接观察图像易得结论,不用具体的运算. 【规范解答】选B 由图易得<,又A波动性大,B波动性小,所以sA>sB. 【方法技巧】统计内容有抽样方法、样本特征数(均值、方差,直方图等)、回归分析、预测(应用)等,弄清基本概念,原理,计算方法等. 2.(2010·山东高考理科·T6)样本中共有五个个体,其值分别为a,0,1,2,3,,若该样本的平均值为1,则样本方差为( ) (A) (B) (C) (D)2 【命题立意】本题考查用样本的平均数、方差,考查了考生的运算求解能力. 【思路点拨】先由平均值求出a,再利用方差的计算公式求解. 【规范解答】选D,由题意知,解得,所以样本方差为 =2,故选D. 3. (2010·山东高考文科·T6)在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 (A)92 , 2 (B) 92 , 2.8 (C) 93 , 2 (D) 93 , 2.8 【命题立意】本题考查样本数据的平均值和方差的概念及运算,考查了考生的运算求解能力. 【思路点拨】根据平均值和方差的公式直接计算即可,应注意去掉一个最高分和一个最低分后再计算. 【规范解答】选B.去掉一个最高分95一个最低分89,剩下5个数的平均值为 ,方差为. 4. (2010·福建高考文科·T9)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( ) (A)91.5和91.5 (B)91.5和92 (C)91和91.5 (D)92和92 【命题立意】本题考查中位数与平均数的求解. 【思路点拨】把数据从小到大排列后可得其中位数,平均数是把所有的数据加起来除以数据的个数. 【规范解答】选A,数据从小到大排列后可得其中位数为,平均数为. 【方法技巧】给出实际数据求解中位数和平均数等数据特征相对较为容易,但是同学也要理解“众数、中位数、平均数与频率分布直方图的关系”,会用频率分布直方图估计众数、中位数、平均数. 1. 众数:取最高小长方形底边中点的横坐标作为众数; 2. 中位数:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标称为中位数. 3. 平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 5.(2010·广东高考理科·T7)已知随机变量X服从正态分布N(3,1),且P (2 ≤X ≤4)=0.6826, 则P(X>4)=( ) (A)0.1588 (B)0.1587 (C)0.1586 (D)0.1585 【命题立意】本题考察随机变量的正态分布的意义. 【思路点拨】由已知条件先求出,再求出的值. 【规范解答】选. 6. (2010·湖南高考文科·T3) 某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( ) (A) (B) (C) (D) 【命题立意】以朴素的题材为背景,让学生感受线性回归的意义,变量之间的变化趋势. 【思路点拨】负相关说明斜率为负,而价格为0时,销量不能为负. 【规范解答】选A.∵商品销售量y(件)与销售价格x(元/件)负相关,∴a<0,排除B,D.又∵x=0时,y>0 排除C. 【方法技巧】回归问题主要研究变量之间的相关性,变化趋势,分为正相关和负相关,线性相关不是研究变量之间的确定性,而是相关性,即有关联.求斜率和截距常用给定的公式. 7.(2010·江苏高考·T4)某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有_____________根棉花纤维的长度小于20mm. 【命题立意】本题考查频率分布直方图及其相关知识. 【思路点拨】频率分布直方图的纵坐标为频率/组距,小矩形的面积为相应数据所占的频率. 【规范解答】由频率分布直方图观察得,棉花纤维的长度小于20mm的根数为 100×(0.01+0.01+0.04)×5=30. 【答案】30 【方法技巧】对于统计图表问题,求解时,最重要的就是认真观察图表,从中发现有用的信息和数据.对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积之和为1,当有两个小矩形的高相等时,说明数据落在这两个区间上的频率相等,在进行计算时,不能漏掉其中的任何一个. 8.(2010·浙江高考文科·T11)在如图所示的茎叶图中,甲、乙两组数据的中位数分别是 . 8 9 1 2 5 7 8 5 6 9 4 5 8 2 6 3 5 7 2 3 4 5 6 甲乙 【命题立意】本题主要考察了茎叶图所表达的含义,以及从样本数据中提取数字特征的能力,属容易题. 【思路点拨】把甲、乙两组数据从小到大排序后,找位于中间的数或中间两数的平均数. 【规范解答】甲位于中间的数是45,把乙的数据排序后,位于中间的数是46. 【答案】45,46 9.(2010·福建高考文科·T14)将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于 . 【命题立意】本题考查频率分布直方图中频数与频率的关系. 【思路点拨】频率之比即为频数之比,按比例设六组的频数,可解. 【规范解答】设第一组到第六组的频数分别为,. 【答案】60 10.(2010·北京高考理科·T11)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a= .若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取18人参 加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为 . 【命题立意】本题考查频率颁布直方图,抽样方法中的分层抽样.熟练掌握频率颁布直方图的性质,分层抽样的原理是解决本题的关键. 【思路点拨】利用各矩形的面积之和为1可解出.分层抽样时,选算出身高在[140 ,150]内的学生在三组学生中所占比例,再从18人中抽取相应比例的人数. 【规范解答】各矩形的面积和为:,解得.身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生人数分别为:30,20,10,人数的比为3:2:1,因此从身高在[140 ,150]内的学生中选取的人数应为18=3人. 【答案】0.030 3 11.(2010·广东高考文科·T12)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示: 根据统计资料,居民家庭年平均收入的中位数是 ,家庭年平均收入与年平均支出有 _________线性相关关系. 【命题立意】本题考察统计中基本特征量的意义以及变量间的关系. 【思路点拨】按大小排列出收入数据的顺序,找出中间的那个数据. 【规范解答】收入数据按大小排列为:,,,,,所以中位数为13. 【参考答案】 正向 12.(2010·安徽高考文科·T14)某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收人家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是 . 【命题立意】本题主要考查分层抽样原理,考查考生用样本估计总体的基本思想. 【思路点拨】根据分层抽样原理,分别估计普通家庭和高收入家庭拥有3套或3套以上住房的户数, 进而得出100 000户居民中拥有3套或3套以上住房的户数,用它除以100 000即可得到结果. 【规范解答】该地拥有3套或3套以上住房的家庭估计约有: 户, 所以所占比例的合理估计约是. 【参考答案】 13.(2010·陕西高考理科·T19)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如下: (Ⅰ)估计该校男生的人数; (Ⅱ)估计该校学生身高在170~185cm之间的概率; (Ⅲ)从样本中身高在165~180cm之间的女生中任选2人,求至少有1人身高在170~180cm之间的概率. 【命题立意】本题考查了分层抽样的概念、条形图的识别、概率的简单求法等基础知识,考查了同学们利用所学知识解决实际问题的能力. 【思路点拨】读懂频数条形图是解题的关键 【规范解答】(Ⅰ)样本中男生人数为40 ,由分层抽样比例为10%估计全校男生人数为400. (Ⅱ)由统计图知,样本中身高在170~185cm之间的学生有14+13+4+3+1=35人,样本容量为70,所以样本中学生身高在170~185cm之间的频率故由估计该校学生身高在170~180cm之间的概率 (Ⅲ)样本中女生身高在165~180cm之间的人数为10,身高在170~180cm之间的人数为4. 设A表示事件“从样本中身高在165~180cm之间的女生中任选2人,至少有1人身高在170~180cm 之间”,则 14. (2010·陕西高考文科·T19)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如下: (Ⅰ)估计该校男生的人数; (Ⅱ)估计该校学生身高在170~185cm之间的概率; (Ⅲ)从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm之间的概率. 【命题意图】本题考查了分层抽样的概念、条形图的识别、概率的简单求法等基础知识,考查了同学们利用所学知识解决实际问题的能力. 【思路点拨】读懂频数条形图是解题的关键 【规范解答】(Ⅰ)(Ⅱ)同理科 (Ⅲ)样本中身高在180~185cm之间的男生有4人,设其编号为①,②,③,④,样本中身高 185~190cm之间的男生有2人,设其编号为⑤,⑥ 从上述6人中任取2人的树状图为: 故从样本中身高在180~190cm之间的6名男生中任选2人的所有可能结果数为15,至少有1人身高在 185~190cm之间的可能结果数为9,因此,所求概率 15. (2010·辽宁高考文科·T18)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B的试验结果.(疱疹面积单位:mm2) 表1:注射药物A后皮肤疱疹面积的频数分布表 疱疹面积 [60,65) [65,70) [70,75) [75,80) 频数 30 40 20 10 表2:注射药物B后皮肤疱疹面积的频数分布表 疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85) 频数 10 25 20 30 15 (Ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小; (Ⅱ)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”. 表3 疱疹面积小于70mm2 疱疹面积不小于70mm2 合计 注射药物A a= b= 注射药物B c= d= 合计 n= 附:K2= P(K2≥k) 0.100 0.050 0.025 0.010 0.001 k 2.706 3.841 5.024 6.635 10.828 【命题立意】考查了频率分布直方图、中位数、独立性检验的知识. 【思路点拨】(I)根据频率分布直方图,估计中位的范围,比较中位数的大小. (II)将各数据代入公式计算,比较. 【规范解答】(I) 可以看出注射药物A后的疱疹面的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后的疱疹面积的中位数小于注射药物B后疱疹面积的中位数. (II) 疱疹面积小于70mm2 疱疹面积不小于70mm2 合计 注射药物A a=70 b=30 100 注射药物B c=35 d=65 100 合计 105 95 n=200 . 由于所以有99%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”. 【方法技巧】 1.在做频率分布直方图时,一定要注意,小长方形的高表示的是频率与组距的比,不要当成了频率. 2.根据频率分布直方图确定中位所在的大致区间,就是在直方图中做一条垂直于横轴的直线,使直线两侧的小长方形的面积大致相等,则直线的垂足所在区间就是中位数所在的区间. 3.P(K2>10.828)=0.01是“指注射药物A后的疱疹面积于注射药物B后的疱疹面积没有差异”的概率,所以有关的概率是1- P(K2>10.828)=99.9%. 16. (2010·辽宁高考理科·T18)为了比较注射A, B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B. (Ⅰ)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率; (Ⅱ)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2) 表1:注射药物A后皮 肤疱疹面积的频数分布表 疱疹面积 [60,65) [65,70) [70,75) [75,80) 频数 30 40 20 10 表2:注射药物B后皮肤疱疹面积的频数分布表 疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85) 频数 10 25 20 30 15 (ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小; (ⅱ)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”. 表3 疱疹面积小于70mm2 疱疹面积不小于70mm2 合计 注射药物A a= b= 注射药物B c= d= 合计 n= 附:K2= 【命题立意】本题考查了古典概型、频率分布直方图、独立性检验等知识. 【思路点拨】(I) 所有可能的基本事件总数 满足条件的基本事件数 求概率 (II)计算小长方形的高,作图 【规范解答】(Ⅰ)甲、乙两只家兔分在不同组的概率为 (Ⅱ)(i) 图Ⅰ注射药物A后皮肤疱疹面积的频率分布直方图 图Ⅱ注射药物B后皮肤疱疹面积的频率分布直方图 可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数. (ii)表3: 由于K2>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积于注射药物B后的疱疹面积有差异”. 【方法技巧】 1.在频率分布直方图中,小长方形的高是频率与组距的比值,不要当成了频率. 2.根据频率分布直方图确定中位所在的大致区间,就是在直方图中做一条垂直于横轴的直线,使直线两侧的小长方形的面积大致相等,则直线的垂足所在区间就是中位数所在的区间. 3.P(K2>10.828)=0.01是“指注射药物A后的疱疹面积于注射药物B后的疱疹面积没有差异”的概率,所以有关的概率是1- P(K2>10.828)=99.9% 17. (2010·广东高考理科·T17)某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上40件产品作为样本算出他们的质量(单位:克),质量的分组区间为(490,,(495,,……(510,,由此得到样本的频率分布直方图,如图4所示. (1) 根据频率分布直方图,求质量超过505克的产品数量. (2) 在上述抽取的40件产品中任取2件,设Y为质量超过505克的产品数量,求Y的分布列. (3) 从流水线上任取5件产品,求恰有2件产品的质量超过505克的概率. 【命题立意】本题考察统计中的频率分布直方图的意义、随机变量的分布列以及概率中古典概型的计算. 【思路点拨】直方图中小矩形的面积等于样本在该范围的频率. 【规范解答】(1)质量超过505克的产品分布在最右边的两个直方内,由频率分布直方图得其数量为: 件. (2)的所有可能取值为,,. 其中,, 所以,的分布列为 0 1 2 (3) 从流水线上任取5件产品,恰有2件产品的质量超过505克的概率为: 【方法技巧】求随机变量的分布列,首先要明确变量的所有可能取值,在计算相应的概率. 18. (2010·广东高考文科·T17)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示: (1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关? (2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名? (3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率. 【命题立意】本题是一道应用题,主要考察统计的意义以及分层抽样的方法和概率的基本计算. 【思路点拨】在计算概率是,要列出所有基本事件,从而求解. 【规范解答】解:(1)假设收看新闻节目的观众与年龄无关,则 ,即,这是矛盾的,所以收看新闻节目的观众与年龄有关. (2)设应该抽取大于40岁的观众名,则有: ,解得 所以大于40岁的观众应该抽取3名. (3)设所抽取的5名观众中,,两人为20至40岁;,, 三人为40岁以上,从中任抽取2人,所有抽法有:,,,,,,,,,共10种,其中恰有1名观众的年龄为20至40岁的抽法有,,,,,共6种,所以恰有1名观众的年龄为20至40岁的概率为: 【方法技巧】在计算基本事件数时,可用字母把基本事件一一列出. 19. (2010·安徽高考文科·T18)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91, 77,86,81,83,82,82,64,79,86,85,75,71,49,45. (Ⅰ) 完成频率分布表; (Ⅱ)作出频率分布直方图; (Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染. 请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价. 【命题立意】本题主要考查频率分布直方图,用样本估计总体的思想,考查学生运用统计知识解决简单实际问题的能力,数据处理能力和应用意识. 【思路点拨】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、轻微污染、轻度污染的天数. 【规范解答】 (Ⅲ)答对下述两条中的一条即可: (1) 该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好. (1) 轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善. 【方法技巧】1在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量. 2在频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率. 3对于开放性问题的回答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论. 20.(2010 海南高考理科T19)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下: (Ⅰ)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (Ⅱ)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (Ⅲ)根据(Ⅱ)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由. 【命题立意】本题重点考查了统计中独立性检验的相关知识,要求学生能够熟练的利用图表中的数据来进行分析,进而得出相应的结论. 【思路点拨】利用古典概型的计算公式以及列联表的相关知识求解. 【规范解答】(Ⅰ) 调查的500位老年人中有70为需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例的估计值为. (Ⅱ) 因为,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关. (Ⅲ)根据(Ⅱ)的结论可知,该地区的老年人是否需要志愿者提供帮助与性别有关,并且从样本数据能够看出该地区男性老年人与女性老年人中需要帮助的比列有明显差异,因此在调查时,先确定该地区老年人中男女的比例,在把老年人分成男女两层,并采用分层抽样方法比简单随机抽样方法更好.查看更多