- 2022-09-01 发布 |
- 37.5 KB |
- 27页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学基础(六套卷)
第一套一、填空1.统计数据的直接來源主要有两个渠道:一•是;二是。2.统计的含义包括三个方而,它们是。3.按照计量层次分类,统计数据可以分为:。4.按照时间状况分类,统计数据可以分为:。5.按照收集方法分类,统计数据可以分为:。6.8.9、12、7、11、13、9、11、8>10以上10个数据的平均数是,屮位数是,方差是。7.在人样木的检验方法中,当总体方差b?未知时,可以用样木方羌〃来近似代替总体方差,此时总体均值检验的统计量为:o&判定系数(请用SSR、SSE、SS了表示)。9.--般将时间序列的构成要素分成四种,即。10.已知门引为报告期的销售额,p、/几是对个体的价格指数,则价格指数的加权平均调和形式的计算公式为:。二、单项选择1.下列数据属于品质数据的是()A.顺序数据B.截血数据C.观测数据D.实验数据2.对一批小麦种子进行发芽率试验,这时总休是()A该批小麦种了B该批小麦的发芽率C该批小麦中发芽的种子D该批小麦的发芽率3.己知均值为“,方差为(J?的总体中,抽取容量为料的随机样木,当/?充分大时,样木的均值和方差近似等于()A.—n(T2B.—cr2C.“(y~D.“—nnn4•下列散点图中表示非线性相关的图为()AB\n5.在右侧检验中,利用P值进行检验时,拒绝原假设的条件是()A.P值>QB.P值〉0C.P值VQD.P值V0三、判断题1.分层抽样除了可以对总体进行估计外,还可以对各层的子总体进行估计。2.平均指标反映了现象总体的规模和一般水平,但掩盖了总体各单位的差异情况,因此通过平均指标不能全而认识总体的特征。()3.总体分布为非正态分布而样本均值可能为正态分布。()4•抽样谋差由于事先可以进行控制或计算的,所以这类谋茅通常是可以消除的。()£(兀-元)'S=\/s|5.4Y匚二'二]在单独求一组数据计算标准差时,公式下方虚线处应为n-1四、简答题1.河南大学数学院为了增加学生们的学习积极性,推行了一套新的制度,通过一学期的试行,由最终的成绩决定是否继续执行。(1)发生第一类错误是指什么,造成什么影响?(2)发生第二类错误是指什么,造成什么影响?2.请简述样本容量为"的数据的四分位数的计算方法。五、计算题1.某车间工人LI生产零件分组资料如下:零件分组(个)工人数(人)40-502050—604060-708070-805080-9010合计200试计算零件的平均口产量.2.某车间有甲、乙两个主产组,甲组平均每个工人的FI产量为36件,标准差为9.6件;乙纽工人日产蜃资料如下:口产虽(件)工人数(人)151525383534\n4513要求:⑴计算乙组平均每个工人的日产量和标准差;⑵比较甲、乙两生产小组哪个组的FI产量更有代表性?1.某居民小区为研究职工上班从家到单位的距离,抽取16个人纽成随机样本,他们的样本分别为:10、3、14、8、6、9、12、11、7、5、10、15、9、16、13、2假定总体服从正态分布,求职工从家到单位的平均距离的95%的置信区间。(仏(16)=1.746;rO5(15)=1.753;rO25(16)=2.120;r0025(15)=2.131)4•己知某种机器的使川寿命服从正太分布,现从一批机器屮随机抽取16台,测得具使用寿命(单位:天)如下:1510145014801460152014801490146014801510153014701500152015101470试建立该批机器平均使用寿命的95%的置信区间(怙5(16)=1.746;r005(15)=1.753;仏5(16)=2.120(15)=2.131)。5.2012年河南大学百年校庆所制作的校徽,毎个的直径为30inm,标准差为3mm,为检验每个校徽是否符合标准要求,学校负责检查的老师从这一批校徽中随机抽取了50个进行测量,测得每个平均值为31mm,去显著水平a=0.05,检验该批次校徽是否符合标准。\n参考答案一、填空实验1•调杳或观察2.统计实践、统计资料、统计科学3.分类数据、顺序数据、数值型数据4.截面数据、时间序列数据5.观测数据、实验数据6.9.89.53.36SSR~SST或者1-空ISST)9.趋势性、季节性、周期性、随机性10.Ip=-ZPi/Po二.单项选择1.A2.A3.D4.A5.C三、判断题1.72.V374.X5.X四、简答题1.答:(1)笫一类错误是成绩未提高,但是误以为提高了,不能提高成绩。(2)第二类错误是成绩提高了,误以为没冇提高,不能用新制度來提高成绩计算。2.答:①针对未分组数值型数据:n+1下四分位数Q在一位4+1中四分位数02在一位上四分位数@3在""「"I位②针对顺序型数据和分纽数据下四分位数Q在才位中四分位数Q?在一位2\n上四分位数!23在才位五、计算题1•解:零件分纟F1(个)工人数(人)纽•屮值X标志总量xf40-50204590050-604055220060-708065520070-805075375080-901085850合计200—1290012900200=64.5(个)2解:(1)工#_15x15+25x38+35x34+45x13_295015+38+34+13-100=29.5(2)玉=空制267/=生=12^!=0.3046|鬲36乙心29.5吟<吃.••甲组更有代表性。3解:由样本数据得:%=—=9.37516vn=16<30・•・该样本为小样本•••1-4=95%/.6z=0.05,7-1)=仏5(15)=2.1312I16元)2=4.113y41139.375±2.191元±0・f=9・375±2・131x—I4.•.职工从家到单位的平均距离的95%的置信区间为:(7.184,11.566)1.解:由样本数据得:元=竺竺=1490•/H=16<30/.该样本为小样本•••l-a=95%\nq=0.05妆"-1)=仏5(15)=2・1312wJ£D2=24.77v2477x±re^==1490±2.131x^—=1490±13.2T長4职工从家到单位的平均距离的95%的置信区间为:(1476.8,1503.2)1.解:H。://=30//]:“工30牛竺如=21評=2.36<73乔V50给定显著性水平q=0.05可知%.025=1・96vz=3.36>z0,025=1.96,所以拒绝原假设,认为产品不符合标准。第二套一、填空题。1•统计学是、、、、并从数据中得出结论的科学。2.数据的预处理包括数据的、、和目的是通过对数据的初步加工为进一步整理奠定基础。3.数据分布的特征主要从三个方面进行测度和描述:一是二是三是yMM4.对于大量的数据而言,平均数九,中位数('“€),众数Cl°\如果该数据存在XMM明显的左偏分布,此时儿e。之间的位置代表值的大小关系为O5.己知样木容量为2的样本,兀~N(2,4),则X的均值等于b无=_。6.—个n>3°的样本总体%,近似服从期望为",方差为"2的正态分布,当总体方差\n未知时,总体均值"在1一°的置信水平下的置信区间为。2.一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试屮的了115分,在B向测试中得了425分。与平均分数比,这位应试者项成绩更为理想。3.区间估计的类型有、。4.时间序列的构成要素:、、、。5.加权指数因所采用的权数不同可以分为、等不同的形式。二、单项选择题。1.下列哪一个是分类变量()A.年龄B.性别C.汽车产量D.员工对企业某项改革措施的态度(赞成、小立、反对)2.按连续型变量分组,其末组为开口组,下限为2000o已知相邻组的组屮值为1750,则末组组中值为(C)A.2100B.2200C.2250D.25003.根据以往的生产统计,某种产品的合格率为龙,佔计误差E求在95%的置信区间内抽取的样本量“二()a.1.962兀(1—龙)/Eb.1.962(1一巧/Ec.1.962(1-兀亍/ed.1.962/龙(1一兀)E4.某工厂生产一种灯泡,这种灯泡的使用年限不超过8年,现产品开发小组研究了一种新的生产方案,他们认为灯泡的使用年限得到了提高,在対新产品进行检验时,应采取哪种形式的假设?()A.H()://<8H]:“>8b.://>8H]:“<8c.Hq://=8:“工8D.以上都不对5.从某种瓶装饮料中随机抽取十瓶,测得每瓶的平均净含量为355毫升。已知该饮料的净含量服从正态分布,并且标准差为5毫升。则该种饮料平均净含量的90%的置信区间为()\n三、判断题。1.直方图可以看出数据的分类,乂能给出每一个原始数值()2.根据对四分位的理解四分位的位置的是——-()43.相关系数为+1时,说明两变虽完全相关,相关系数为-1时,说明两个变量不相关。()Y4.定基增长率的计算公式为G,•二丄一1()5.在假设检验中,如來样木容量一定,则犯第一类错误和犯第二类错误的概率不可能同时减小。()四、简答题。1•简述数值型数据的分组步骤,并说明在不同的情况下我们分别使用哪些图來显示数值型数据的分布特征。2.某一小麦品种的平均产量为5200kg/hnT2,—家研究机构希望对小麦品种进行改良,通过试验的产虽数据来判断改良是否冇效进而决定是否推行改良后品种(1)在这种情况下,发生笫I类错误指的是什么,将导致什么后果?(2)在这种情形下,发牛笫II类错误指的是什么?将会导致什么后果?五、计算题。1•将某邮局中外发邮包样木的重蜃近似到盎司为:2,4,7,10,10,10,12,12,14,15。①.计算这组数据的小位数和四分位数。②.根据定义公式计算样本的标准差。③.并根据所计算的数值判断该数据的分布情况。2.从一批零件中抽取9件,测得具直径为19.720.119.819.920.220.019.920.220.3假设零件的直径服从正态分布N〜(b?),试估计该批零件直径均值“的置信区间,置信水平为95%。3.据统计,某大学教师屮女教师所占的比例为65%,现要求佔计课差为5%,在求95%的直信区间时,应抽取多少名教师作为样本。4.按规定,某种绳了的平均拉断力必须大于18.3kg才算合格,现买了一部新机器来制造这种绳子,从其产品中抽111100件,测得平均拉断力为1&lkg,假设绳子的拉断力服从标准差为b=L2kg的正态分布,问这部机器生产的产品合格吗?(4=0.01)5.某校声称高屮生考入木科院校的比例为80%,为此教冇部对2013年该校200名毕业生的升学情况做了调查,其中,冇146人顺利考入木科院校,对于该校的论断,你冇什么看法?(Q=0.01)\n参考答案一、填空题。1•收集、处理、分析、解样数据2.审核筛选排序分布的形状3.分布的集中趋势分布的离散程度4.x查看更多