- 2021-06-11 发布 |
- 37.5 KB |
- 16页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
高考文科数学专题复习练习10.1随机抽样
第十章统计与统计案例 10.1 随机抽样 148 系统抽 样 1.(2015 广西柳州一模,文 3,系统抽样,选择题)采用系统抽样方法从 1 000 人中抽取 50 人做问卷调查, 为此将他们随机编号为 1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为 8. 抽到的 50 人中,编号落入区间[1,400]的人做问卷 A,编号落入区间[401,750]的人做问卷 B,其余的人做 问卷 C.则抽到的人中,做问卷 C 的人数为( ) A.12 B.13 C.14 D.15 解析:由 1 000÷50=20,故由题意可得抽到的号码构成以 8 为首项、以 20 为公差的等差数列,且此等 差数列的通项公式为 an=8+(n-1)20=20n-12. 由 751≤20n-12≤1 000,解得 38.2≤n≤50.6. 再由 n 为正整数可得 39≤n≤50,且 n∈Z, 故做问卷 C 的人数为 12. 答案:A 2.(2015 黑龙江绥化重点中学二模,文 14,系统抽样,填空题)将高一(9)班参加社会实践编号分别 为:1,2,3,…48 的 48 名学生,采用系统抽样的方法抽取一个容量为 4 的样本,已知 5 号,29 号,41 号学生 在样本中,则样本中还有一名学生的编号是 . 解析:样本间距为 48÷4=12,则另外一个编号为 5+12=17. 答案:17 3.(2015 江西景德镇二模,文 3,系统抽样,选择题)某次考试结束后,从考号为 1~1 000 号的 1 000 份试卷 中,采用系统抽样法抽取 50 份试卷进行试评,则在考号区间[850,949]之中被抽到的试卷份数为( ) A.一定是 5 份 B.可能是 4 份 C.可能会有 10 份 D.不能具体确定 解析:样本间隔为 1 000÷50=20,考号区间[850,949]的个数为 949-850+1=100,则 100÷20=5,即一定是 5 份. 答案:A 13.(2015 甘肃兰州一中模拟,文 13,系统抽样,填空题)采用系统抽样方法从 600 人中抽取 50 人做问卷 调查,为此将他们随机编号为 001,002,…,600,分组后在第一组采用简单随机抽样的方法抽得的号码 为 003,抽到的 50 人中,编号落入区间[001,300]的人做问卷 A,编号落入区间[301,495]的人做问卷 B,编 号落入区间[496,600]的人做问卷 C,则抽到的人中,做问卷 C 的人数为 . 解析:∵600÷50=12,∴由题意可得抽到的号码构成以 3 为首项、以 12 为公差的等差数列,且此等差 数列的通项公式为 an=3+12(n-1)=12n-9. 落入区间[496,600]的人做问卷 C, 由 496≤12n-9≤600,即 505≤12n≤609, 解得 42 1 12≤n≤503 4. 再由 n 为正整数可得 43≤n≤50, ∴做问卷 C 的人数为 50-43+1=8. 答案:8 149 分层抽 样 1.(2015 广西玉林、贵港 4 月模拟,文 4,分层抽样,选择题)某市修建经济适用房,已知 A,B,C 三个社区 分别有低收入家庭 400 户、300 户、200 户,若首批有 90 套经济适用房用于解决住房紧张问题,采用 分层抽样的方法决定各社区买房的户数,则应从 A 社区中抽取低收入家庭的户数为 ( ) A.40 B.36 C.30 D.20 解析:设从 A 社区抽取 n 户,则 400 400 + 300 + 200 = 푛 90, 解得 n=40. 答案:A 2.(2015 广西桂林、防城港联合调研,文 14,分层抽样,填空题)某校参加某项课外活动的四个小组的学 生人数依次为 300 人,300 人,600 人,900 人,现用分层抽样的方法从四个小组学生中抽取容量为 35 的 样本,则第三组中应抽取的学生人数是 . 解析:根据分层抽样的定义可知第三组中应抽取的学生人数是 600 300 + 300 + 600 + 900×35=10. 答案:10 13.(2015 江西鹰潭一模,文 13,分层抽样,填空题)某校对全校男女学生共 1 600 名进行健康调查,选用 分层抽样法抽取一个容量为 200 的样本.已知女生比男生少抽了 10 人,则该校的女生人数应是 人. 解析:由题意知样本和总体比为 200∶1 600=1∶8. 设抽取女生为 x 人,则男生为 x+10. 因为 x+x+10=2x+10=200,解得 x=95 人. 所以该校的女生人数为 95×8=760 人. 答案:760 4.(2015 吉林三模,文 4,分层抽样,选择题)某学校共有师生 2 400 人,现用分层抽样的方法,从所有师生 中抽取一个容量为 150 的样本,已知从学生中抽取的人数为 135,那么该学校的教师人数是( ) A.15 B.200 C.240 D.2 160 解析:∵抽取样本为 150 人, ∴抽取比例为 2 400∶150=16∶1. ∵从学生中抽取的人数为 135 人, ∴从老师抽取 150-135=15(人). 则教师人数为 15×16=240(人). 答案:C 13.(2015 江西鹰潭二模,文 13,分层抽样,填空题)现在所有旅客购买火车票必须实行实名制,据不完全 统计共有 28 种有效证件可用于窗口的实名购票,常用的有效证件有:身份证,户口簿,军人证,教师证等, 对 2015 年春运期间 120 名购票的旅客进行调查后得到下表: 购买火 车 票方式 身份 证 户口 簿 军人 证 教师 证 其他证 件 旅客人 数 a 6 8 b 19 已知 a-b=57,则使用教师证购票的旅客的频率大约为 . 解析:由表格值 a+b=120-6-8-19=87, ∵a-b=57,∴a=72,b=15. 则使用教师证购票的旅客的频率大约为 15 120=0.125. 答案:0.125 13.(2015 广西南宁一模,文 13,分层抽样,填空题)某班某次数学考试成绩好,中,差的学生人数之比为 3 ∶ 5∶2,现在用分层抽样方法从中抽取容量为 20 的样本,则应从成绩好的学生中抽取 名学 生. 解析:由题意应从成绩好的学生中抽取的人数为 3 10×20=6(人). 答案:6 18.(2015 山西太原五中二模,文 18,分层抽样,解答题)某高中三年级有一个实验班和一个对比班,各有 50 名同学.根据这两个班二模考试的数学科目成绩(规定考试成绩在[120,150]内为优秀),统计结果如 下: 实验班数学成绩的频数分布表: 分 组 [70 , 80) [80 , 90) [90, 100 ) [100 , 110) [110 , 120) [120 , 130) [130 , 140) [140 , 150] 频 数1 2 12 13 12 9 1 0 对比两班数学成绩的频数分布表: 分 组 [70 , 80) [80 , 90) [90, 100 ) [100 , 110) [110 , 120) [120 , 130) [130 , 140) [140 , 150] 频 数2 3 13 11 9 10 1 1 (1)分别求这两个班数学成绩的优秀率;若采用分层抽样从实验班中抽取 15 位同学的数学试卷,进行 试卷分析,则从该班数学成绩为优秀的试卷中应抽取多少份? (2)统计学中常用 M 值作为衡量总体水平的一种指标,已知 M 与分数 t 的关系式为:M= { -2(푡 < 90) 2(90 ≤ 푡 < 120), 4(푡 ≥ 120), 分别求这两个班学生数学成绩的 M 总值,并据此对这两个班数学成绩总体水平作一 简单评价. 解:(1)实验班优秀率为10 50=0.2, 对比班优秀率为12 50=0.24. 数学成绩为优秀的试卷中应抽取 15×10 50=3(份). (2)实验班数学成绩的 M 总值为 3×(-2)+37×2+10×4=108, 对比班数学成绩的 M 总值为 5×(-2)+33×2+12×4=104. 所以,本次市二模考试实验班数学成绩总体水平略高于对比班. 10.2 用样本估计总体 150 频率分布直方 图 1.(2015 江西上饶重点中学一模,文 14,频率分布直方图,填空题)某校从参加高三年级期末考试的学生 中随机抽取 100 名学生,将其数学成绩分成五段:[50,70),[70,90),[90,110),[110,130),[130,150],它的频率 分布直方图如图所示,则该批学生中成绩不低于 90 分的人数是 . 解析:根据频率分布直方图,得 该批学生中成绩低于 90 分的频率是(0.002 5+0.015 0)×20=0.35, ∴该批学生中成绩不低于 90 分的频率是 1-0.35=0.65,∴该批学生中成绩不低于 90 分的人数是 100×0.65=65. 答案:65 19.(2015 江西六校联考二模,文 19,频率分布直方图,解答题)某校 50 名学生参加 2013 年全国数学联 赛初赛,成绩全部介于 90 分到 140 分之间.将成绩结果按如下方式分成五组:第一组[90,100),第二组 [100,110),第三组[110,120),第四组[120,130),第五组[130,140].按上述分组方法得到的频率分布直方图 如图所示. (1)若成绩大于或等于 100 分且小于 120 分认为是良好的,求该校参赛学生在这次数学联赛中成绩良 好的人数; (2)若从第一、五组中共随机取出两个同学的成绩,求这两个成绩差的绝对值大于 30 分的概率. 解:(1)由频率分布直方图知,成绩在[100,120)内的人数为:50×0.16+50×0.38=27(人), ∴该班成绩良好的人数为 27 人. (2)由频率分布直方图知,成绩在[90,100)的人数为 50×0.06=3(人),设为 x,y,z. 成绩在[130,140]的人数为 50×0.08=4(人),设为 A,B,C,D; 若 m,n∈[90,100)时,有 xy,xz,yz 3 种情况; 若 m,n∈[130,140]时,有 AB,AC,AD,BC,BD,CD 6 种情况; 若 m,n 分别在[90,100)和[130,140]内时, 有 xA,xB,xC,xD,yA,yB,yC,yD,zA,zB,zC,zD 12 种情况; ∴基本事件总数为 21,事件“|m-n|>30”所包含的基本事件个数为 12; ∴概率为 P(|m-n|>30)=12 21 = 4 7. 14.(2015 广西梧州一模,文 14,频率分布直方图,填空题)某校学生在一次学业水平测试中的数学成绩 制成如图所示频率分布直方图,60 分以下的人要补考,已知 90 分以上的有 80 人,则该校需要补考的人 数为 . 解析:根据频率分布直方图,得 90 分以上的频率是 0.010×10=0.10,对应的频数为 80, ∴样本容量是80 0.1=800. ∴60 分以下的频率为(0.005+0.010)×10=0.15, ∴对应的频数为 800×0.15=120. ∴该校需要补考的人数为 120. 答案:120 13.(2015 江西南昌零模,文 13,频率分布直方图,填空题)一所中学共有 4 000 名学生,为了引导学生树 立正确的消费观,需抽样调查学生每天使用零花钱的数量(取整数元)情况,分层抽取容量为 300 的样 本,作出频率分布直方图如图所示,请估计在全校所有学生中,一天使用零花钱在 6 元~14 元的学生大 约有 人. 解析:根据频率分布直方图得,一天使用零花钱在 6 元~14 元的学生频率是 1-(0.02+0.03+0.03)×4=1- 0.32=0.68,∴对应的频数是 4 000×0.68=2 720. ∴估计全校学生中,一天使用零花钱在 6 元~14 元的大约有 2 720 人. 答案:2 720 19.(2015 甘肃兰州一中三模,文 19,频率分布直方图,解答题)为了调查高一新生中女生的体重情况,校 卫生室随机选取 20 名女生作为样本测量她们的体重(单位:kg),获得的所有数据按照区间 (40,45],(45,50],(50,55],(55,60]进行分组,得到频率分布直方图如图所示.已知样本中体重在区间(45,50] 上的女生数与体重在区间(55,60]上的女生数之比为 4∶3. (1)求 a,b 的值; (2)从样本中体重在区间(50,60]上的女生中随机抽取两人,求体重在区间(55,60]上的女生至少有一人 被抽中的概率. 解:(1)样本中体重在区间(45,50]上的女生有 a×5×20=100a(人), 样本中体重在区间(50,60]上的女生有(b+0.02)×5×20=100(b+0.02)(人), 依题意,有 100a=4 3×100(b+0.02), 即 a=4 3×(b+0.02). ① 根据频率分布直方图可知(0.02+b+0.06+a)×5=1, ② 解①②得 a=0.08,b=0.04. (2)样本中体重在区间(50,55]上的女生有 0.04×5×20=4 人,分别记为 A1,A2,A3,A4, 体重在区间(55,60]上的女生有 0.02×5×20=2 人,分别记为 B1,B2. 从这 6 名女生中随机抽取两人共有 15 种情 况:(A1,A2),(A1,A3),(A1,A4),(A1,B1),(A1,B2),(A2,A3),(A2,A4),(A2,B1),(A2,B2),(A3,A4),(A3,B1),(A3,B2),(A4,B1),(A4, B2),(B1,B2). 其中体重在(55,60]上的女生至少有一人共有 9 种情 况:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2). 记“从样本中体重在区间(50,60]上的女生中随机抽取两人,体重在区间(55,60]上的女生至少有一 人被抽中”为事件 M,则 P(M)= 9 15 = 3 5. 19.(2015 甘肃兰州二诊,文 19,频率分布直方图,解答题)据统计某校学生在上学路上所需时间最多不 超过 120 分钟.该校随机抽取部分新生在上学路上所需时间(单位:分钟)进行调查,并将所得数据绘制 成频率分布直方图. (1)求频率分布直方图中 a 的值; (2)为减轻学生负担,学校规定在上学路上所需时间不少于 1 小时的学生可申请在校内住宿.请根据抽 样数据估计该校 600 名新生中有多少学生可申请在校内住宿. 解:(1)由频率直方图可得(0.003 0+0.002 1+0.001 4+0.006 0+a+0.025)×20=1,a=0.012 5. (2)新生上学所需时间不少于 1 小时的频率为(0.003 0+0.002 1+0.001 4)×20=0.13, 所以该校 600 名新生中可申请在校内住宿的人数估计为 600×0.13=78. 6.(2015 甘肃庆阳一诊,文 6,频率分布直方图,选择题)为了了解某学校 1 500 名高中男生的身体发育情 况,抽查了该校 100 名高中男生的体重情况.根据所得数据画出样本的频率分布直方图,据此估计该校 高中男生体重在 70~78 kg 的人数为( ) A.240 B.210 C.180 D.60 解析:由频率分布直方图得到体重在 70~78 kg 的男生的频率为(0.02+0.01)×4=0.12,∴该校 1 500 名高 中男生中体重在 70~78 kg 的人数大约为 0.12×1 500=180. 答案:C 151 茎叶 图 7.(2015 黑龙江哈尔滨三中四模,文 7,茎叶图,选择题)PM2.5 是指大气中直径小于或等于 2.5 微米的颗 粒物,也称为可入肺颗粒物.如图是根据哈尔滨三中学生社团某日早 6 点至晚 9 点在南岗、群力两个 校区附近的 PM2.5 监测点统计的数据(单位:毫克/立方米)列出的茎叶图,南岗、群力两个校区浓度的 方差较小的是( ) A.南岗校区 B.群力校区 C.南岗、群力两个校区相等 D.无法确定 解析:根据茎叶图中的数据可知,南岗校区的数据大部分集中在 0.06 和 0.07 之间,数据分布比较稳定, 而群力校区的数据分布比较分散,不如南岗校区数据集中,∴南岗校区的方差较小. 答案:A 152 样本的数字特 征 18.(2015 山西太原二模,文 18,样本的数字特征,解答题)某网络广告 A 公司计划从甲、乙两个网站选 择一个网站拓展广告业务,为此 A 公司随机抽取了甲、乙两个网站某月中 10 天的日访问量 n(单位: 万次),整理后得到如图茎叶图,已知 A 公司要从网站日访问量的平均值和稳定性两方面进行考虑选 择. (1)请说明 A 公司应选择哪个网站; (2)现将抽取的样本分布近似看作总体分布,A 公司根据所选网站的日访问量 n 进行付费,其付费标准 如下: 选定网站的日访 问量 n(单位:万 次) A 公司的付费 标准(单位:元/ 日) n<25 500 25≤n≤35 700 n>35 1 000 求 A 公司每月(按 30 天计)应付给选定网站的费用 S. 解:(1)根据茎叶图,得 푥甲=(15+24+28+25+30+36+30+32+35+45)÷10=30, 푠2甲 = 1 10[(15-30)2+(24-30)2+(28-30)2+(25-30)2+(30-30)2+(36-30)2+(30-30)2+(32-30)2+(35- 30)2+(45-30)2]=58; 푥乙=(18+25+22+24+32+38+30+36+35+40)÷10=30, 푠2乙 = 1 10[(18-30)2+(25-30)2+(22-30)2+(24-30)2+(32-30)2+(38-30)2+(30-30)2+(36-30)2+(35- 30)2+(40-30)2]=49.8; ∵푥甲 = 푥乙,푠2甲 > 푠2乙, ∴A 公司应选择乙网站. (2)由(1)得 A 公司应选择乙网站,根据题意得,乙网站日访问量 n<25 的概率为 0.3,日访问量 25≤n≤35 的概率为 0.4,日访问量 n>35 的概率为 0.3, ∴A 公司每月应付给乙网站的费用为 S=30×(500×0.3+700×0.4+1 000×0.3)=21 900 元. 5.(2015 江西红色六校一模,文 5,样本的数字特征,选择题)若样本 a1,a2,a3 的方差是 a,则样本 3a1+1,3a2+1,3a3+1 的方差为( ) A.3a+1 B.9a+1 C.9a+3 D.9a 解析:∵样本 a1,a2,a3 的方差是 a, ∴样本 3a1+1,3a2+1,3a3+1 方差为 32×a=9a. 答案:D 13.(2015 贵州贵阳二模,文 13,样本的数字特征,填空题)数组 1,2,3,4,a 的平均数是 2,则它的方差 是 . 解析:∵5 个数 1,2,3,4,a 的平均数是 2, ∴1 + 2 + 3 + 4 + 푎 5 =2,∴a=0. ∴这组数据的方差是1 5×(1+0+1+4+4)=2. 答案:2 5.(2015 江西上饶重点中学二模,文 5,样本的数字特征,选择题)已知样本:8,6,4,7,11,6,8,9,10,5,则样本的 平均值푥和中位数 a 的值是( ) A.푥=7.3,a=7.5 B.푥=7.4,a=7.5 C.푥=7.3,a=7 和 8 D.푥=7.4,a=7 和 8 解析:푥 = 1 10×(8+6+4+7+11+6+8+9+10+5)=7.4, 样本从小到大的顺序为:4,5,6,6,7,8,8,9,10,11, 所以中位数 a=1 2×(7+8)=7.5. 答案:B 153 用样本估计总 体 18.(2015 黑龙江哈尔滨六中四模,文 18,用样本估计总体,解答题)某商场为了了解顾客的购物信息,随 机的在商场收集了 100 位顾客购物的相关数据,整理如下: 一次购 物款 (单位: 元) [0,50)[50,100)[100,150)[150,200)[200,+∞) 顾客人 数 m 20 30 n 10 统计结果显示 100 位顾客中购物款不低于 100 元的顾客占 60%,据统计该商场每日大约有 5 000 名顾 客,为了增加商场销售额度,对一次性购物不低于 100 元的顾客发放纪念品(每人一件).(注:视频率为概 率) (1)试确定 m,n 的值,并估计该商场每日应准备纪念品的数量; (2)为了迎接店庆,商场进行让利活动,一次性购物款 200 元及以上的一次返利 30 元;一次性购物款小 于 200 元的按购物款的百分比返利,具体见下表: 一次购 物款 (单位: 元) [0,50)[50,100)[100,150)[150,200) 返利百 分比 0 6% 8% 10% 请估计该商场日均让利多少元? 解:(1)由已知,100 位顾客中购物款不低于 100 元的顾客有 n+10+30=100×60%,解得 n=20.∴m=100- (20+30+20+10)=20. 该商场每日应准备纪念品的数量大约为 5 000× 60 100=3 000. (2)设购物款为 a 元, 当 a∈[50,100)时,顾客有 5 000×20%=1 000 人, 当 a∈[100,150)时,顾客有 5 000×30%=1 500 人, 当 a∈[150,200)时,顾客有 5 000×20%=1 000 人, 当 a∈[200,+∞)时,顾客有 5 000×10%=500 人, ∴估计日均让利为 75×6%×1 000+125×8%×1 500+175×10%×1 000+30×500=52 000 元. 10.3 变量间的相关关系、统计案例 155 回归方程的求法及回归 分析 4.(2015 广西梧州一模,文 4,回归方程的求法及回归分析,选择题)根据如下样本数据: x345 67 8 y42- 1 1- 2 - 3 得到的回归方程为 ^ 푦 = ^ bx+ ^ 푎,则( ) A. ^ 푎>0, ^ 푏<0 B. ^ 푎>0, ^ 푏>0 C. ^ 푎<0, ^ 푏<0 D. ^ 푎<0, ^ 푏>0 解析:由题意可知:回归方程经过的样本数据对应的点附近,是减函数,所以 ^ 푏<0,且回归方程经过(3,4) 与(4,2)附近,所以 ^ 푎>0. 答案:A 4.(2015 江西重点中学协作体一模,文 4,回归方程的求法及回归分析,选择题)根据如下样本数据 x3 4 5 6 7 8 y- 4.0 - 2.50.5- 0.52.03. 0 得到的回归方程为 ^ 푦 = ^ bx+ ^ 푎,则( ) A. ^ 푎>0, ^ 푏<0 B. ^ 푎>0, ^ 푏>0 C. ^ 푎<0, ^ 푏<0 D. ^ 푎<0, ^ 푏>0 解析:样本平均数푥=5.5,푦=-0.25, ∴ 6 ∑ 푖 = 1 (xi-x)(yi-y)=23, 6 ∑ i = 1 (xi-푥)2=17.5, ∴ ^ 푏 = 23 17.5 = 46 35>0. ∴ ^ 푎=-0.25-46 35·5.5<0. 答案:D 5.(2015 江西重点中学协作体二模,文 5,回归方程的求法及回归分析,选择题)对于下列表格所示的五 个散点,已知求得的线性回归方程为 ^ 푦=0.76x-71. x989910010110 2 y2 3 5 m 8 则实数 m 的值为( ) A.6.8 B.7 C.7.2 D.7.4 解析:由题意可得푥 = 1 5×(98+99+100+101+102)=100,同理可得푦 = 1 5×(2+3+5+m+8)=18 + 푚 5 , 代入回归方程可得18 + 푚 5 =0.76×100-71, 解得 m=7. 答案:B 14.(2015 广西防城港、桂林一模,文 14,回归方程的求法及回归分析,填空题)某产品的广告费用 x 与 销售额 y 的统计数据如下表 广告费用 x(万 元) 4 2 3 5 销售额 y(万 元) 49263954 根据上表可得回归方程 ^ 푦 = ^ bx+ ^ 푎中的 ^ 푏为 9.4,据此模型预报广告费用为 6 万元时销售额 为 . 解析:∵푥 = 4 + 2 + 3 + 5 4 =3.5, 푦 = 49 + 26 + 39 + 54 4 =42, ∵数据的样本中心点在线性回归直线上, 回归方程 ^ 푦 = ^ 푏x+ ^ 푎中的 ^ 푏为 9.4, ∴42=9.4×3.5+ ^ 푎,∴ ^ 푎=9.1. ∴线性回归方程是 y=9.4x+9.1, ∴广告费用为 6 万元时销售额为 9.4×6+9.1=65.5. 答案:65.5 万元 19.(2015 江西三县部分高中一模,文 19,回归方程的求法及回归分析,解答题)为了研究某种细菌在特 定环境下,随时间变化的繁殖情况,得如下实验数据: 天数 t(天) 3 456 7 繁殖个数 y(千 个) 2.5344.56 (1)求 y 关于 t 的线性回归方程; (2)利用(1)中的回归方程,预测 t=8 时,细菌繁殖个数. 附:回归直线的斜率和截距的最小二乘法估计公式分别为: ^ 푏 = n ∑ i = 1 (푡푖 - 푡)(푦푖 - 푦) 푛 ∑ 푖 = 1 (푡푖 - 푡)2 , ^ 푎 = 푦 ― ^ 푏 푡. 解:(1)由表中数据计算得,푡=5,푦=4, 푛 ∑ 푖 = 1 (ti-t)(yi-y)=8.5, n ∑ i = 1 (ti-푡)2=10, 所以 ^ 푏=0.85, ^ 푎=-0.25. 所以回归方程为 y=0.85t-0.25. (2)将 t=8 代入(1)的回归方程中得 ^ 푦=0.85×8-0.25=6.55. 故预测 t=8 时,细菌繁殖个数为 6.55 千个. 4.(2015 山西太原外国语学校 4 月模拟,文 4,回归方程的求法及回归分析,选择题)从某高中随机选取 5 名高三男生,其身高和体重的数据如下表所示: 身高 x(cm) 160165170175180 体重 y(kg) 63 66 70 72 74 根据上表可得回归直线方程 ^ 푦=0.56x+ ^ a,据此模型预报身高为 172 cm 的高三男生的体重为( ) A.70.09 kg B.70.12 kg C.70.55 kg D.71.05 kg 解析:由表中数据可得푥 = 160 + 165 + 170 + 175 + 180 5 =170,푦 = 63 + 66 + 70 + 72 + 74 5 =69, ∵(푥,푦)一定在回归直线方程 ^ 푦=0.56x+ ^ 푎上, 故 69=0.56×170+ ^ 푎,解得 ^ 푎=-26.2, 故 ^ 푦=0.56x-26.2, 当 x=172 时, ^ 푦=0.56×172-26.2=70.12. 答案:B 156 独立性检 验 1.(2015 广西玉林、贵港 4 月模拟,文 18,独立性检验,解答题)某市地铁于 2013 年 12 月开始运营,运营 前召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了 50 人,他们月收入与态度如下: 月收 入 (单位 百元) [15,25)[25,35)[35,45)[45,55)[55,65)[65,75] 赞成 定价 者人 数 1 2 3 5 3 4 认为 价格 偏高 者人 数 4 8 12 5 2 1 (1)若以区间的中点为该区间的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者” 的月平均收入的差距是多少(结果保留 2 位小数); (2)由以上统计数据填下面 2 乘 2 列联表并分析是否有 99%把握认为“月收入以 5 500 为分界点对地 铁定价的态度有差异”. 月收入不低 于 55 百元的人 数 月收入低于 55 百元的人 数 合 计 认为价 格 偏高者 a= c= 赞成 定价者 b= d= 合计 参考数据:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑), P(x2≥k ) 0.05 0.01 k 3.8416.63 5 解:(1)赞成定价者月平均收入 1 18×(20×1+30×2+40×3+50×5+60×3+70×4)=940 18 , 认为价格偏高者月平均收入 1 32×(20×4+30×8+40×12+50×5+60×2+70×1)=1 240 32 , ∴940 18 ― 1 240 32 =13.47. (2)2 乘 2 列联表 月收入不低 于 55 百元人数 月收入低 于 55 百元人 数 合 计 不赞 成 3 29 32 赞成 7 11 18 合计 10 40 50 K2 的观测值 k=50 × (3 × 11 - 7 × 29)2 10 × 40 × 32 × 18 ≈6.27<6.635. 所以没有 99%的把握认为月收入以 5 500 为分界点对地铁定价的态度有差异. 2.(2015 广西柳州一中一模,文 19,独立性检验,解答题)某班主任对全班 50 名学生学习积极性和参加 社团活动情况进行调查,统计数据如下表: 参加社团活 动 不参加社团活 动 合 计 学习积极性高 17 8 25 学习积极性一 般 5 20 25 合计 22 28 50 (1)如果随机从该班抽查一名学生,抽到参加社团活动的学生的概率是多少?抽到不参加社团活动且学 习积极性一般的学生的概率是多少? (2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由. P(K2≥k ) 0.05 0.01 0.001 k 3.8416.63510.82 8 解:(1)随机从该班抽查一名学生,抽到参加社团活动的学生的概率是22 50 = 11 25,抽到不参加社团活动且学 习积极性一般的学生的概率是20 50 = 2 5. (2)∵K2 的观测值 k=50 × (17 × 20 - 5 × 8)2 25 × 25 × 22 × 28 ≈11.688>10.828,∴有 99.9%的把握认为学生的学习积极 性与参加社团活动的态度有关系. 18.(2015 江西鹰潭一模,文 18,独立性检验,解答题)某市调研考试后,某校对甲、乙两个文科班的数学 考试成绩进行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀.统计成绩后,得到如下的 2×2 列联表: 优 秀 非优 秀 合 计 甲 班 10 50 60 乙 班 20 30 50 合 30 80 110 计 (1)根据列联表的数据,若按 99.9%的可靠性要求,能否认为“成绩与班级有关系”; (2)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从 2 到 11 进行编号,先后 两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到 9 号或 10 号的概率. 参考公式与临界值表: K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑). P(K2≥k ) 0.1000.0500.0250.0100.001 k 2.7063.8415.0246.63510.82 8 解:(1)假设成绩与班级无关, 则 K2 的观测值 k=110 × (10 × 30 - 20 × 50)2 30 × 80 × 50 × 60 ≈7.5>6.635 但小于 10.828,则查表得相关的概率为 99%, 故没达到可靠性要求. (2)设“抽到 9 或 10 号”为事件 A,先后两次抛掷一枚均匀的骰子,所有的基本事件有:6×6=36 个. 事件 A 包含的基本事件有:(3,6),(4,5),(5,4),(6,3),(5,5),(4,6),(6,4)共 7 个. 所以 P(A)= 7 36,即抽到 9 号或 10 号的概率为 7 36. 18.(2015 吉林三模,文 18,独立性检验,解答题)某学校研究性学习小组对该校高三学生视力情况进行 调查,在高三的全体 1 000 名学生中随机抽取了若干名学生的体检表,并得到如图直方图: (1)若直方图中前三组的频率成等比数列,后四组的频率成等差数列,试估计全年级视力在 5.0 以下的 人数; (2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关 系,对年级名次在 1~50 名和 951~1 000 名的学生进行了调查,得到如下数据: 年级 名次 是否近视 1~50951~1 000 近视 41 32 不近视 9 18 根据表中的数据,能否在犯错的概率不超过 0.05 的前提下认为视力与学习成绩有关系?附: K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑) P(K2≥k ) 0.10 0.05 0.0250.0100.00 5 k 2.7063.8415.0246.6357.87 9 解:(1)设各组的频率为 fi(i=1,2,3,4,5,6), 依题意,前三组的频率成等比数列,后四组的频率成等差数列,故 f1=0.15×0.2=0.03,f2=0.45×0.2=0.09,f3= 푓2 2 푓1 =0.27, 所以由(푓3 + 푓6) × 4 2 =1-(0.03+0.09),得 f6=0.17. 所以视力在 5.0 以下的频率为 1-0.17=0.83, 故全年级视力在 5.0 以下的人数约为 1 000×0.83=830. (2)K2 的观测值 k=100 × (41 × 18 - 32 × 9)2 50 × 50 × 73 × 27 ≈4.110>3.841. 因此能在犯错误的概率不超过 0.05 的前提下认为视力与学习成绩有关系. 18.(2015 广西防城港、桂林一模,文 18,独立性检验,解答题)在北方某城市随机选取一年内 40 天的空 气污染指数(API)的监测数据,统计结果如下: AP I [0, 50 ] (50, 100 ] (100 , 150] (150 , 200] (200 , 250] (250 , 300] (300 , +∞) 天 数 3 5 8 10 8 4 2 (1)已知污染指数 API 大于 250 为重度污染,若本次抽取样本数据有 9 天是在供暖季,其中有 3 天为重 度污染,完成下面的 2×2 列联表,问有多大把握认为该城市空气重度污染与供暖有关? 非重度污 染 重度污 染 合 计 供暖季 非供暖 季 合计 40 (2)在样本中,从污染指数 API 大于 250 的 6 天中任取 2 天,求至少有 1 天 API 大于 300 的概率. 附注:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),n=a+b+c+d. P(K2≥k ) 0.25 0.15 0.10 0.05 0.0250.01 0.0050.001 k 1.3232.0722.7063.8415.0256.6357.87910.82 8 解:(1)根据以上数据得到下表: 非重度污 染 重度污 染 合 计 供暖季 6 3 9 非供暖 季 28 3 31 合计 34 6 40 K2 的观测值 k=40 × (6 × 3 - 28 × 3)2 34 × 6 × 31 × 9 ≈3.061>2.706,所以有 90%的把握认为空气重度污染与供暖有 关. (2)污染指数 API 在(250,300)有 4 天,污染指数 API 大于 300 有 2 天,6 天中任取 2 天,共有C26=15 种,至少有 1 天 API 大于 300,共有 15-C24=9 种, 所以在样本中,从污染指数 API 大于 250 的 6 天中任取 2 天,至少有 1 天 API 大于 300 的概率为 9 15 = 3 5. 18.(2015 黑龙江哈尔滨九中三模,文 18,独立性检验,解答题)“开门大吉”是某电视台推出的游戏节目. 选手面对 1~8 号 8 扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色 旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场 外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如 图所示. (1)写出 2×2 列联表;判断是否有 90%的把握认为猜对歌曲名称是否与年龄有关;说明你的理由;(下面 的临界值表供参考) P(K2≥k0 ) 0.10 0.05 0.0100.00 5 k0 2.7063.8416.6357.87 9 (2)现计划在这次场外调查中按年龄段用分层抽样的方法选取 6 名选手,并抽取 3 名幸运选手,求 3 名 幸运选手中至少有一人在 20~30 岁之间的概率. ( 参考公式:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d ) 解:(1)根据所给的二维条形图得到列联表, 正 确 错 误 合 计 20~30(岁)10 30 40 30~40(岁)10 70 80 合计 20 100 120 根据列联表所给的数据代入观测值的公式得到 K2 的观测值 k=120 × (10 × 70 - 10 × 30)2 20 × 100 × 40 × 80 =3, ∵3>2.706. ∴有 1-0.10=90%的把握认为猜对歌曲名称与否与年龄有关. (2)按照分层抽样方法可知:20~30(岁)抽取:6× 40 120=2(人);30~40(岁)抽取:6× 80 120=4(人). 在上述抽取的 6 名选手中,年龄在 20~30(岁)有 2 人,年龄在 30~40(岁)有 4 人. 年龄在 20~30(岁)记为(A,B); 年龄在 30~40(岁)记为(a,b,c,d), 则从 6 名选手中任取 3 名的所有情况 为:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b, c),(B,b,d),(B,c,d),(a,b,c),(a,b,d),(a,c,d),(b,c,d),共 20 种情况, 其中至少有一人年龄在 20~30 岁情况 有:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b, c),(B,b,d),(B,c,d),共 16 种情况. 记至少有一人年龄在 20~30 岁为事件 A, 则 P(A)=16 20 = 4 5. ∴至少有一人年龄在 20~30 岁之间的概率为4 5. 18.(2015 吉林实验中学六模,文 18,独立性检验,解答题)为了解少年儿童的肥胖是否与常喝碳酸饮料 有关,现对 30 名六年级学生进行了问卷调查得到如下列联表:平均每天喝 500 ml 以上为常喝,体重超 过 50 kg 为肥胖. 常 喝 不常 喝 合 计 肥胖 2 不肥 胖 18 合计 30 已知在全部 30 人中随机抽取 1 人,抽到肥胖的学生的概率为 4 15. (1)请将上面的列联表补充完整; (2)是否有 99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由; (3)现从常喝碳酸饮料且肥胖的学生中(其中有 2 名女生),抽取 2 人参加电视节目,则正好抽到一男一 女的概率是多少? 参考数据: P(K2>k)0.15 0.10 0.05 0.0250.0100.0050.001 k 2.0722.7063.8415.0246.6357.87910.82 8 ( 参考公式:K2= 푛(푎푑 - 푏푐)2 (푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d ) 解:(1)设常喝碳酸饮料肥胖的学生有 x 人,푥 + 3 30 = 4 15, ∴x=6. 常 喝 不常 喝 合 计 肥 胖 6 2 8 不 胖 4 18 22 合 计 10 20 30 (2)由已知数据可求得:K2 的观测值 k=30 × (6 × 18 - 2 × 4)2 10 × 20 × 8 × 22 ≈8.522>7.879,因此有 99.5%的把握认为 肥胖与常喝碳酸饮料有关. (3)设常喝碳酸饮料的肥胖者男生为 A,B,C,D,女生为 E,F,则任取两人有 AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共 15 种.其中一男一女有 AE,AF,BE,BF,CE,CF,DE,DF.故抽出一男一女的概率是 P= 8 15.查看更多