统计学基础(六套卷)

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学基础(六套卷)

第一套一、填空1.统计数据的直接來源主要有两个渠道:一•是;二是。2.统计的含义包括三个方而,它们是。3.按照计量层次分类,统计数据可以分为:。4.按照时间状况分类,统计数据可以分为:。5.按照收集方法分类,统计数据可以分为:。6.8.9、12、7、11、13、9、11、8>10以上10个数据的平均数是,屮位数是,方差是。7.在人样木的检验方法中,当总体方差b?未知时,可以用样木方羌〃来近似代替总体方差,此时总体均值检验的统计量为:o&判定系数(请用SSR、SSE、SS了表示)。9.--般将时间序列的构成要素分成四种,即。10.已知门引为报告期的销售额,p、/几是对个体的价格指数,则价格指数的加权平均调和形式的计算公式为:。二、单项选择1.下列数据属于品质数据的是()A.顺序数据B.截血数据C.观测数据D.实验数据2.对一批小麦种子进行发芽率试验,这时总休是()A该批小麦种了B该批小麦的发芽率C该批小麦中发芽的种子D该批小麦的发芽率3.己知均值为“,方差为(J?的总体中,抽取容量为料的随机样木,当/?充分大时,样木的均值和方差近似等于()A.—n(T2B.—cr2C.“(y~D.“—nnn4•下列散点图中表示非线性相关的图为()AB\n5.在右侧检验中,利用P值进行检验时,拒绝原假设的条件是()A.P值>QB.P值〉0C.P值VQD.P值V0三、判断题1.分层抽样除了可以对总体进行估计外,还可以对各层的子总体进行估计。2.平均指标反映了现象总体的规模和一般水平,但掩盖了总体各单位的差异情况,因此通过平均指标不能全而认识总体的特征。()3.总体分布为非正态分布而样本均值可能为正态分布。()4•抽样谋差由于事先可以进行控制或计算的,所以这类谋茅通常是可以消除的。()£(兀-元)'S=\/s|5.4Y匚二'二]在单独求一组数据计算标准差时,公式下方虚线处应为n-1四、简答题1.河南大学数学院为了增加学生们的学习积极性,推行了一套新的制度,通过一学期的试行,由最终的成绩决定是否继续执行。(1)发生第一类错误是指什么,造成什么影响?(2)发生第二类错误是指什么,造成什么影响?2.请简述样本容量为"的数据的四分位数的计算方法。五、计算题1.某车间工人LI生产零件分组资料如下:零件分组(个)工人数(人)40-502050—604060-708070-805080-9010合计200试计算零件的平均口产量.2.某车间有甲、乙两个主产组,甲组平均每个工人的FI产量为36件,标准差为9.6件;乙纽工人日产蜃资料如下:口产虽(件)工人数(人)151525383534\n4513要求:⑴计算乙组平均每个工人的日产量和标准差;⑵比较甲、乙两生产小组哪个组的FI产量更有代表性?1.某居民小区为研究职工上班从家到单位的距离,抽取16个人纽成随机样本,他们的样本分别为:10、3、14、8、6、9、12、11、7、5、10、15、9、16、13、2假定总体服从正态分布,求职工从家到单位的平均距离的95%的置信区间。(仏(16)=1.746;rO5(15)=1.753;rO25(16)=2.120;r0025(15)=2.131)4•己知某种机器的使川寿命服从正太分布,现从一批机器屮随机抽取16台,测得具使用寿命(单位:天)如下:1510145014801460152014801490146014801510153014701500152015101470试建立该批机器平均使用寿命的95%的置信区间(怙5(16)=1.746;r005(15)=1.753;仏5(16)=2.120(15)=2.131)。5.2012年河南大学百年校庆所制作的校徽,毎个的直径为30inm,标准差为3mm,为检验每个校徽是否符合标准要求,学校负责检查的老师从这一批校徽中随机抽取了50个进行测量,测得每个平均值为31mm,去显著水平a=0.05,检验该批次校徽是否符合标准。\n参考答案一、填空实验1•调杳或观察2.统计实践、统计资料、统计科学3.分类数据、顺序数据、数值型数据4.截面数据、时间序列数据5.观测数据、实验数据6.9.89.53.36SSR~SST或者1-空ISST)9.趋势性、季节性、周期性、随机性10.Ip=-ZPi/Po二.单项选择1.A2.A3.D4.A5.C三、判断题1.72.V374.X5.X四、简答题1.答:(1)笫一类错误是成绩未提高,但是误以为提高了,不能提高成绩。(2)第二类错误是成绩提高了,误以为没冇提高,不能用新制度來提高成绩计算。2.答:①针对未分组数值型数据:n+1下四分位数Q在一位4+1中四分位数02在一位上四分位数@3在""「"I位②针对顺序型数据和分纽数据下四分位数Q在才位中四分位数Q?在一位2\n上四分位数!23在才位五、计算题1•解:零件分纟F1(个)工人数(人)纽•屮值X标志总量xf40-50204590050-604055220060-708065520070-805075375080-901085850合计200—1290012900200=64.5(个)2解:(1)工#_15x15+25x38+35x34+45x13_295015+38+34+13-100=29.5(2)玉=空制267/=生=12^!=0.3046|鬲36乙心29.5吟<吃.••甲组更有代表性。3解:由样本数据得:%=—=9.37516vn=16<30・•・该样本为小样本•••1-4=95%/.6z=0.05,7-1)=仏5(15)=2.1312I16元)2=4.113y41139.375±2.191元±0・f=9・375±2・131x—I4.•.职工从家到单位的平均距离的95%的置信区间为:(7.184,11.566)1.解:由样本数据得:元=竺竺=1490•/H=16<30/.该样本为小样本•••l-a=95%\nq=0.05妆"-1)=仏5(15)=2・1312wJ£D2=24.77v2477x±re^==1490±2.131x^—=1490±13.2T長4职工从家到单位的平均距离的95%的置信区间为:(1476.8,1503.2)1.解:H。://=30//]:“工30牛竺如=21評=2.36<73乔V50给定显著性水平q=0.05可知%.025=1・96vz=3.36>z0,025=1.96,所以拒绝原假设,认为产品不符合标准。第二套一、填空题。1•统计学是、、、、并从数据中得出结论的科学。2.数据的预处理包括数据的、、和目的是通过对数据的初步加工为进一步整理奠定基础。3.数据分布的特征主要从三个方面进行测度和描述:一是二是三是yMM4.对于大量的数据而言,平均数九,中位数('“€),众数Cl°\如果该数据存在XMM明显的左偏分布,此时儿e。之间的位置代表值的大小关系为O5.己知样木容量为2的样本,兀~N(2,4),则X的均值等于b无=_。6.—个n>3°的样本总体%,近似服从期望为",方差为"2的正态分布,当总体方差\n未知时,总体均值"在1一°的置信水平下的置信区间为。2.一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试屮的了115分,在B向测试中得了425分。与平均分数比,这位应试者项成绩更为理想。3.区间估计的类型有、。4.时间序列的构成要素:、、、。5.加权指数因所采用的权数不同可以分为、等不同的形式。二、单项选择题。1.下列哪一个是分类变量()A.年龄B.性别C.汽车产量D.员工对企业某项改革措施的态度(赞成、小立、反对)2.按连续型变量分组,其末组为开口组,下限为2000o已知相邻组的组屮值为1750,则末组组中值为(C)A.2100B.2200C.2250D.25003.根据以往的生产统计,某种产品的合格率为龙,佔计误差E求在95%的置信区间内抽取的样本量“二()a.1.962兀(1—龙)/Eb.1.962(1一巧/Ec.1.962(1-兀亍/ed.1.962/龙(1一兀)E4.某工厂生产一种灯泡,这种灯泡的使用年限不超过8年,现产品开发小组研究了一种新的生产方案,他们认为灯泡的使用年限得到了提高,在対新产品进行检验时,应采取哪种形式的假设?()A.H()://<8H]:“>8b.://>8H]:“<8c.Hq://=8:“工8D.以上都不对5.从某种瓶装饮料中随机抽取十瓶,测得每瓶的平均净含量为355毫升。已知该饮料的净含量服从正态分布,并且标准差为5毫升。则该种饮料平均净含量的90%的置信区间为()\n三、判断题。1.直方图可以看出数据的分类,乂能给出每一个原始数值()2.根据对四分位的理解四分位的位置的是——-()43.相关系数为+1时,说明两变虽完全相关,相关系数为-1时,说明两个变量不相关。()Y4.定基增长率的计算公式为G,•二丄一1()5.在假设检验中,如來样木容量一定,则犯第一类错误和犯第二类错误的概率不可能同时减小。()四、简答题。1•简述数值型数据的分组步骤,并说明在不同的情况下我们分别使用哪些图來显示数值型数据的分布特征。2.某一小麦品种的平均产量为5200kg/hnT2,—家研究机构希望对小麦品种进行改良,通过试验的产虽数据来判断改良是否冇效进而决定是否推行改良后品种(1)在这种情况下,发生笫I类错误指的是什么,将导致什么后果?(2)在这种情形下,发牛笫II类错误指的是什么?将会导致什么后果?五、计算题。1•将某邮局中外发邮包样木的重蜃近似到盎司为:2,4,7,10,10,10,12,12,14,15。①.计算这组数据的小位数和四分位数。②.根据定义公式计算样本的标准差。③.并根据所计算的数值判断该数据的分布情况。2.从一批零件中抽取9件,测得具直径为19.720.119.819.920.220.019.920.220.3假设零件的直径服从正态分布N〜(b?),试估计该批零件直径均值“的置信区间,置信水平为95%。3.据统计,某大学教师屮女教师所占的比例为65%,现要求佔计课差为5%,在求95%的直信区间时,应抽取多少名教师作为样本。4.按规定,某种绳了的平均拉断力必须大于18.3kg才算合格,现买了一部新机器来制造这种绳子,从其产品中抽111100件,测得平均拉断力为1&lkg,假设绳子的拉断力服从标准差为b=L2kg的正态分布,问这部机器生产的产品合格吗?(4=0.01)5.某校声称高屮生考入木科院校的比例为80%,为此教冇部对2013年该校200名毕业生的升学情况做了调查,其中,冇146人顺利考入木科院校,对于该校的论断,你冇什么看法?(Q=0.01)\n参考答案一、填空题。1•收集、处理、分析、解样数据2.审核筛选排序分布的形状3.分布的集中趋势分布的离散程度4.x18.3H}:“vl&3X—LI检验统计量为:Z=~r=c/yjnZ=-1.673>-2.33故接受认为该部机器生产的产品合格2.77°:兀=0.80H「・兀工0.80V)—JI检验统计量为:Z—―I\n兀(1_7T)\n第三套(无答案)一填空题1.只能归于某一类别的非数字型数据,称为()2.条形图主要用于展示(),而直方图主要用于展示()3.在一个企业中随机抽取8名员工得到每个员工的月工资收入数据如下(单位:元):1600750760108085096012501500该组数据75%四分位数的位置为()75%四分位数的值为()4.设总体X的方差为1,从总体中随机取容量为36的样木,得样木均值X=4,则总休均值的宜信水平为95%的置信区间()5.某市2000-2005年间玉米产量(力吨)配合的肓•线趋势方程Y=800+5.5t式屮时间变量仁一5、一3、一1、1、3、5根据上面的直线趋势方程预测2006年玉米产量为()6.某企业07年与06年相比各种产品产量增长了8%,总生产费用增长了15%,则该企业07年单位成本指数()7.周期超市营业额常常会大大高于平FI数额,这种波动属于()8.时间序列分为()和()两大类2、9.设总体X〜b),元为样本均值,S为样本标准差,当”未知,且为小样本吋,则"亦服从H由度为n-l的()分布10.若吋间序列有20年的数据,采用5年移动平均,修匀后的吋间序列中剩下的数据有()个二.选择题1•茁某总体次数分布呈左解分彳j,则成立的有1_Ax>Me>M(tBxM()>McDx10H1W10样本数据x平均数等于9.895Z二兰二上二鸞工21二磐琴—二1.20460.39/._0.39/_//V20/V20Z=1.204〈Z(Q/2)=1.645所以接受原假设,所以Q105.(1):已知n=50P二32/50=0.64,a=0.05,Z0.05/2=1.96总体中赞成该项改革的户数比例的95%的置信区间为;【0.51,0.77](2):已知:TT二0.08,a=0.05,Z0.05/2=1.96.应抽取的样本量为:n=(Z0.05/2)•(Z0.05/2)•tt(I-tt)/E0.25如果np°和n(1-p0)都大于等于5.US.(2)z=-^4==1.390C.Ho:rirIL=0,Hi:□1-口2工0D.Ho:IIr-口2<0,Hu口厂口2$0四、判断1.当原假设为真时舍弃原假设,称为假设检验中的第一类错误。(t)2.利用最小二乘估计法计算的回归系数的估计值比用其他任何方法求得的估计值更接近总体回归系数的真值。(f)3.如果甲乙丙三个企业今年产量计划完成程度是95%、100%和105%,则这三个企业产量的平均计划完成程度为100%o(f)4.某地GDP2007年、2008年分别比上年增长6%、9%,则两年总共增长了15.54%(t)。5.在样本容量不变的前提下,假设检验的两类错误可以同吋减少。(f)6•回归系数b的符号与相关系数r的符号,可以和同也可以不同。(f)7.当口变量增大而因变量却减少时,这种相关关系称为负相关(t)&在简单随机重复抽样的条件下,如果抽样单位数扩人为9倍,则抽样平均课爰缩小为原来的1/3(t)1.当和关系数r=+l吋,两变量完全相关;当r=-1吋,两变量无关。(f)10•变异指标越大,平均数的代表性越大。(f)五、计算1.请从经济、社会、口然、人文等几个方面至少列举2个需要应用到假设检验方法分析的实例,给予适当说明。质量检验;人口调查;\n2.试举例说明生活中用到简单随机抽样的列子,并说明适用条件。调查一个学院学生中电脑的拥有数量可以用到简单随机抽样;简单随机抽样要求(1)抽样框完整;(2)总体相对比较集屮;(3)总体规模比较小。按成绩分组(分)学生人数甲班乙班50——602460——706870——80211780——90161290以上59合计50501、某校甲、乙两班学牛的统计学基础考试成绩分组情况如下:要求:(1)计算各班学生的平均成绩(2)比较甲乙两个班哪个班考试成绩的离散程度大?2、某院有学生4000人,随机抽取200人进行调杏,测得结果如下:平均每月人情支出300元,抽样总体的标准差为6元。试在95%的概率保证下,估计该院学生平均每月人情支出的可能范围。3、根据2003年资料,某校学生平均每周自习时间为20.8h,标准差为1.6h。在2013年有一家考研机构宣称,H前某校学生周平均自习时间增加了3h。为了检验这个说法是否正确,收集到一组某校学生每周自习时间(单位:h)为:26.7,22.0,24.1,21.0,27.2,25.0,23.4。试问:从这组数据能否说明考研机构的正确(0=0.05)。.答:(1)依据题意建立的原假设和备择假设分别为:Ho:卩=23.8Hi:uH23.8(2)根据样木数据计算而得(2分)兀二24.2,s=2.295计算检验统计量心斗=0.46S/yjn(6分)根据显著性水平a=0.05,ta/2(n-1)=r0025(6)=2.4469。由于t二0.46<2.4469,不拒绝原假设。(2分)3.一项针对河南大学学生的调查显示,85%的受调查者曾经逃课。为验证这一说法是否属实,某研究部门抽取了240人组成的一个随机样本,发现有200个学生承认其逃过课。収显著性水平。=0.05,检验该校学牛逃课的比例是否为85%。3.答:H.:”=85%H}:tth85%(1分)根据抽样结果计算得:\n=83%(2分)检验统计量为:p-717T(1-7T)(0・83-0$5)(0.85(1-0.8另V240=-2.24(5分)显著性水平Q=005时对•应的临界值分别为1.96和-1.96,由于Z=2.24>・/2=1.96拒绝原假设,在显著性水平为0.05的条件下,样木提供的证据表明该调查的说法并不属实。(2分)某高校有3000名走读生,该校拟估计这些学生每天來回的平均时间。已知总体的标准差为4.8分钟。现要求进行置信度为95%抽样极限谋差为1分钟的区间估计,试问按照重复抽样的方式,应抽取多大的样本?(引.05/2“・96)解:按重复捕样方式有:nd2二1・96・4・821=88.51取整数,即抽取89位同学进行调查。
查看更多

相关文章

您可能关注的文档