- 2021-05-17 发布 |
- 37.5 KB |
- 22页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
(2021更新)国家开放大学电大专科《统计学原理》期末试题标准题库及答案试卷号:
(2020更新)国家开放大学电大专科《统计学原理》期末试题标准题库及答案(试卷号:2019) 第一套 一、单项选择(每题 2分,共计 20分) 1. 在某个或某些属性上的属性表现相同的诸多实体构成的集合称为()。 A. 同类实体 B. 异类实体 C. 总体 D. 同类集合 2. 不能自然地直接使用数字表示的属性称为()属性。 A. 数量属性 B. 质量属性 C. 水平属性 D. 特征属性 3. 属于总体边界清晰,个体不清晰的变量是()。 A. 一列车的煤炭 B. 滇金丝猴种群 C. 大兴安岭的树 D. 工业流水线的一批产品 4. ()是选择个体及采集个体属性值的途径。 A. 调查方法 B. 调查工具 C. 调查准则 D. 调查程序 5. 从某生产线上每隔 25分钟抽取 5分钟的产品进行检验,这种抽样方式属于() A. 简单随机抽样 B. 等距抽样 C. 整群抽样 D. 分层抽样 6. 抽样调查和重点调查都是非全而调查,二者的根本区别是() A. 灵活程度不同 B. 组织方式不同 C. 作用不同 D.抽取样本的方式不同 7.按随机原则进行抽样的抽样称为() A.问卷设计 B.调查 C.抽样设计 D.随机抽样 8.统计学将由许多个小实体构成的同类实体看作集合,称之为() A.总体 B.个体 C.总量 D.变量 9.根据总体的形态,总体可以分为() A.时间总体和空间总体 B.实在总体和想象总体 C.时点总体和时期总体 D.平面总体和线性总体 10. 统计工作过程由()两个步骤构成。 A.统计设计和统计实施 B.统计实施和调查设计 C.现场调查和调查设计 D.统计设计和调查设计 二、多项选择(每题 2分,共计 10分) 1.按照信息科学和数据库理论,信息的构成要素主要包括() A.实体 B.属性 C.调查 D.情况 2.属性的基本类别包括()。 A.数量属性 B.质量属性 C.水平属性 D.特征属性 3.下列属于总体边界清晰,个体边界不清晰的是() A.一艘石油巨轮的石油 B.一列车的煤炭 C.公园一片草地 D.大兴安岭的树 4.现场调查方法包括的方式有() A.访问 B.观察 C.实验 D.测量 5.按照调查的范围划分,调查分为() A.全而调查 B.非全面调查 C.概率调查 D.非概率调查 三、 判断题(每题 2分,共计 20分) 1.文字是一种数据。(") 2.特性可以独立存在,不依赖于观察者的主观视角。(X) 3.信息构成要素中的实体,只能是通过普通感官直接感知的内容。(X) 4.所谓组件构成实体不可缺少的一部分,是客观存在,不依赖于观察者的主观视角,一旦缺少了组件, 实体便不完整。(") 5.数量属性与质量属性是属性的基本分类,也是最重要的分类。(J) 6.统计学将由许多个小实体构成的同类实体看作集合,称之为总体;将构成总体的许多小实体看成集合的 元素,特别的,如果小实体都不可再分则称为个体。(X) 7.统计调查都是对样本中的个体进行的,故其结果可称之为个体数据,但统计调查的最终目标却是要获 得总体数据所包含的信息。(J) 8.统计数据的获取过程包含调查和汇总两个阶段。(V ) 9. 数据一般只包括文字、符号、数码、数字、数值等类型,个体信息量巨大的音频、视频、图像并不包 括 在内 O ( V ) 10.如在总体的每个层里独立进行抽样,则称为分层抽样。(X) 四、 简答题(每题 10分,共计 50分) 1.简述分类变量与数值变量的根本区别。 答:数值型变量是指值可以取一系列的数,这些值对于加法、减法、求平均值等操作是有意义的,而分类 变 量对于上述的操作是没有意义的。 由于属性可以分为数量属性和质量属性,因此,可以分为数量变量和分类变量。数量变量是指可以白然地 直 接使用数值表示其变量值的变量。分变量是指不可以白然地可直接使用数字表示其变量值。 2. 简述信息与数据的异同。举例说明有些信息不是数据。 答:数据和信息是不可分割的两个术语,但它们又有一定的区别。首先是概念不同,数据是对客观事物记 录 下来的可以鉴别的符号。这些符号不仅指数字,旦包括回字符、字图形等;信息是经过加工后并对客观 世 界产生影响的数答据。其次,数据只有经过加工处理后才能成为信息。例如,〃0、1、2.. ”、〃阴、雨、下 降、气温” ”学生的档案记录、货物的运输情况”等都是数据。数据经过加工后就成为信息。 3. 请分别指出下列描述中的实体与属性。 1)汽车的颜色 2)家庭的人口数 3)国内生产总值最多的国家 4)人的身高 答: (1) 汽车是实体、颜色是属性 (2) 家庭人口数实体 (3)国内生产总值最高的国家是实体 (4)人的身高是实体 4. 统计调查的八要素有哪些? 答:统计调查具有八个要素:调查主体、调查客体、调查内容(项目)、调查方法、调查工具、调查准则、调 查程序、调查结果。 5. 简述抽样设计的内容和抽样的一般步骤。 答:抽样设计的内容: ⑴定义目标总体 ⑵决定抽样框 ⑶抽样调查的组织形式和抽样方法的选择 ⑷精度的确定 ⑸确定样本量 ⑹经费核算抽样的一般步骤:①界定总体②指定抽样框③实施抽样调查并推测总体④分割总体⑤决定样 本 规模⑥决定抽样方式⑦确定调查的信度和效度 第二套 一、单项选择(每题 2分,共计 30分) 1.对一个变量而言,其()指的是全面调查获得的所有变量值(或组)与其对应频率的一揽子表示。 A.分布 B. 总体分布 C. 样本分布 D. 频数 2. ()指的是抽样调查获得的所有变量值(或组)与其对应频率的一揽子表示。 A. 分布 B. 总体分布 C. 样本分布 D. 联合总体分布 3. 以文字叙述方式表达简单变量的分布,一般用于变量值极少的场合(如性别)的分布的表达方法是()。 A. 语示法 B. 表示法 C. 图示法 D. 函数法 4. 以表格陈列的方式表达较复杂变量的分布,用于变量值较少的场合(如年龄段)的分布的表达方法是 ()o A. 语示法 B. 表示法 C. 图示法 D. 函数法 5. 以图形方式表达复杂变量的分布的表达方法是()。 A. 语示法 B. 表示法 C. 图示法 D. 函数法 6. ()既可以反映较少类数也可以反映较多类数的分类变量分布,甚至也能反映分组化的数值变量分布, 居于优先选择地位。 A. 饼形图 B. 柱形图 C. 条形图 D. 直方图 7. 在变量值极少的场合,在一个圆形内,以顶点在圆心的扇形的相对而积(即占整个圆形面积的比例)表 示概率大小,以扇形的颜色或其他标记表示对应变量值(既可是分类变量也可是数值变量的)。这样的 图称为()o A. 饼形图 B. 柱形图 C. 条形图 D. 直方图 8. 在所有总体分布特征中,最重要的分布特征是()。 A. 中位数 B. 众数 C. 标准差 D. 均值 9. 某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 10.总量指标数值大小() A.随总体范围扩大而增大 B.随总体范围扩大而减小 C.随总体范围缩小而增大 D.与总体范围大小无关 11.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和() A.小于 100% B.大于 100% C.等于 100% D.小于或大于 100% 12.众数是()。 A. 出现次数最少的次数 B. 出现次数最少的标志值 C. 出现次数最多的变量值 D. 出现次数最多的频数 13. 在一组数据中,每个数据类型出现的次数称为()。 A.参数 B. 频数 C. 众数 D. 组数 14.集中趋势最主要的测度值是()。 A. 几何平均数 B. 算术平均数 C. 众数 D. 中位数 15. 以下分布中不属于离散型随机变量分布的是()。 A. 超几何分布 B. 伯努利分布 C. 几何分布 D. 正态分布 二、多项选择(每题 2分,共计 10分) 1. 分布的表达方法有()。 A. 语示法 B. 表示法 C. 图示法 D. 函数法 2. 分布图的主要形式包括()o A. 饼形图 B. 柱形图 C. 条形图 D. 直方图 3. 均值的计算方式包括()o A. 算术平均数 B. 加权平均数 C. 中位数 D. 方差 4. 可以反映数值变量离散程度分布特征的是() A. 中数 B. 四分位差 C.偏度 D.标准差 5.以下分布中属于连续型随机变量分布的是()。 A. 超几何分布 B. 指数分布 C. 几何分布 D正态分布 三、计算分析题(每题 10分,共计 60分) 1 ・某技术小组有 12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几 种 可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间 有何关系? 解:设 X =女性.8=工程俑,.48=女工程俑,女性或工程帝 (1) P间=4/12=1/3 (2) P问=4/12=1/3 (3) 可=2/12= 1/6 (4) P(A-bB)=P{A) -bP(B) ~P(AB) =1/3+1/3-1/6=1/2 2. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分 别 为 0.2, 0.1, 0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。 解:求这种零件的次兵率,等于计算“任寂一个零件为次品”(记为 0)的柢率尸(』)・ 考虑逆事件云=“任职一个零件为正品)表示通过三道工序新台恪’症题萱,W: P(J) = (1一 02)(1- 0.1X1 -0.1) = 0.64S 于是 P(A) = 1 - P(J) = 1 -0.648 = 0352 3. 已知参加某项考试的全部人员合格的占 80%,在合格人员中成绩优秀只占 15%。试求任一参考人员 成绩 优秀的概率。 解:设,表示“台格“,B表示“优秀 I主于 8 AB,于是 P(B)=P(A)P(B A) =0.8X0.15=0.12 4.某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击 选手第一发命中的可能性是 80%,第二发命中的可能性为 50%。求该选手两发都脱靶的概率。 解:设 4=第 1发命中.8 =命中硬 W.求命中概率是一个全概率的计算问题,再利用对立事 件的概 M 即可求 博原睽的概军, P(B)=P(.4)P(B | .4)+ P(0P(31 A) =0.8x14-0.2x0.5=0.9 股况的概至=1一 0.9=0.1 成(解法二* P(脱靶)=P(第 1次脱靶)对(第 2次脱靶)=0.2*0 ・ 5=0.1 5.已知某地区男子寿命超过 55岁的概率为 84%,超过 70岁以上的概率为 63%O试求任一刚过 55岁 生日的男子将会活到 70岁以上的概率为多少? 解:设点=活到 55岁,目=活到 70岁,所求槌率为, P㈤止界=嚣嘿=0 75 6.某班级 25名学生的统计学考试成绩数据如下:89, 95, 98, 95, 73, 86, 78, 67, 69, 82, 84, 89, 93, 91, 75, 86, 88, 82, 53, 80, 79, 81, 70, 87, 60 试计算:(1)该班统计学成绩的均值、中位数和四分位数; 答:X=81. 2 Me=82 Q=74 Q«=89 (2)该班统计学成绩的方差、标准差。 答:S=U. 18 S:=124. 92 <3)洁根据 60分以下,60-70分,70-30分,80-90分.90分及以上的分螳标;隹编制考试 成绩的分布表 答 : 成嫌 濒数 续率 60分以下 1 4% 60-70# 您 12* 70-80分 5- 20* 80-90分 11 44* 90分及以上 5 20* 合计 25 100% 第三套 一、单项选择(每题 2分,共计 40分) 1.估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2.根据一个具体的样本求出的总体均值的 95%的置信区间()。 A.以 95%的概率包含总体均值 B.有 5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 3.无偏估计是指() A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 4.总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以 () A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 5.当样本量一定时,置信区间的宽度() A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 6.当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 7.一个 95%的置信区间是指() A.总体参数中有 95%的概率落在这一区间内 B.总体参数中有 5%的概率落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有 95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有 95%的区间不包含该总体参数 8. 95%的置信水平是指() A.总体参数落在一个特定的样本所构造的区间内的概率为 95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为 95% C.总体参数落在一个特定的样本所构造的区间内的概率为 5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为 5% 9.一个估计量的有效性是指() A.该估计量的数学期望等于被估计的总体参数 B.该估计量的一个具体数值等于被估计的总体参数 C.该估计量的方差比其他估计量大 D.该估计量的方差比其他估计量小 10.一个估计量的一致性是指() A.该估计量的数学期望等于被估计的总体参数 B.该估计量的方差比其他估计量小 C.随着样本量的增大该估计量的值越来越接近被估计的总体参数 D.该估计量的方差比其他估计量大 11.置信系数(l-a )表达了置信区间的() A.准确性 B.精确性 C.显著性 D.可靠性 12.在置信水平不变的条件下,要缩小置信区间,则() A.需要增加样本量 B.需要减小样本量 C.需要保持样本量不变 D.需要改变统计量的抽样标准差 13.在其它条件不变的情况下,总体数据的方差越大,估计时所需的样本量() A.越大 B.越小 C.可能大也可能小 D.不变 14.在其它条件相同的情况下,95%的置信区间比 90%的置信区间() A. 要宽 B. 要窄 C. 相同 D. 可能宽也可能窄 15.指出下而的说法中哪一个是正确的() A. 样本量越大,样本均值的抽样标准差就越小 B. 样本量越大,样本均值的抽样标准差就越大 C. 样本量越小,样本均值的抽样标准差就越小 D. 样本均值的抽样标准差与样本量无关 16.指出下而的说法中哪一个是正确的() A. 置信水平越大,估计的可靠性就越大 B. 置信水平越大,估计的可靠性就越小 C. 置信水平越小,估计的可靠性就越大 D. 置信水平的大小与估计的可靠性无关 17.指出下面的说法中哪一个是正确的() A. 在置信水平一定的条件下,要提高估计的可靠性,就应缩小样本量 B. 在置信水平一定的条件下,要提高估计的可靠性,就应增大样本量 C. 在样本量一定的条件下,要提高估计的可靠性,就降低置信水平 D. 在样本量一定的条件下,要提高估计的准确性,就提高置信水平 18.在一项对学生资助贷款的研究中,随机抽取 480名学生作为样本,得到毕业前的平均欠 款余额为 12168元,标准差为 2200元。则贷款学生总体中平均欠款额的 95%的置信区间为() A. (11971, 12365) B. (11971, 13365) C. (11971, 14365) D. (11971, 15365) 19.从一个正态总体中随机抽取 n=20的一个随机样本, 样本均值为 17. 25,样本标准差为 3. 3o则总体均 值的 95%的置信区间为() A. (15. 97, 18. 53) B. (15.71, 18.79) C. (15. 14, 19. 36) D. (14. 89, 20. 45) 20.某地区的写字楼月租金的标准差为 80元,要估计总体均值的 95%的置信区间,希望的边际误差为 25 元,应抽取的样本量为() A. 20 B. 30 C. 40 D. 50 二、 多项选择(每题 2分,共计 10分) 1.在抽样推断中() A.抽样指标的数值不是唯一的 B.总体指标是一个随机变量 C.可能抽取许多个样本 D.统计量是样本变量的涵数 2.从全及总体中抽取样本单位的方法有() A.简单随机抽样 B.重复抽样 C.不重复抽样 D.概率抽样 3.在抽样推断中,样本单位数的多少取决于() A.总体标准差的大小 B.允许误差的大小 C.抽样估计的把握程度 D.总体参数的大小 4.区间估计和点估计的理论其核心分别是()。 A. 中心极限定理 B. 大数定理 C. 切比雪夫大数定理 D. 辛钦大数定理 5.简单随机抽样() A、 试用于总体各单位呈均匀分布的总体; B、 适用于总体各单位标志变异较大的总体 C、 在抽样之前要求对总体各单位加以编号 D、 最符合随机原则 三、 简答题(每题 10分,共计 20分) 1.简述以样本均值估计总体均值的理由? 答:样本均值估计总体均值的理由:①对于待估参数总体均值而言,样木均值作为估计量随着样本量的增 大 可以非常接近、需要时可以无限接近总体均值;②样木均值几乎符合所有估计量的优良标准;③区间估 计 能够可靠地实现以样本均值估计总体均值的目标。 2.随机试验满足三个条件是什么? 答:随机试验需要满足的三个条件:①所有可能结果已经知道为(Nn)个;②试验当然是可重复进行的(尽 管这是在想象力进行,所有的条件环境均可严格地受到控制);③具体试验之前无从知晓具体结果。 五、计算分析题(每题 15分,共计 30分) 1.在一项家电市场调查中,随机抽取了 200个居民户,调查他们是否拥有某一品牌的电视机。其中拥 有该品牌电视机的家庭占 23%。求总体比率的置信区间,置信水平分别为 90%和 95%。 解,己知样本容量"=200,为大样本,拥有该品理电祝机的家庭比率 p=23%, 拥有该品耗电视机的家庭比逐的抽样标准谩差为 ⑴双侧置信水平为 90%时,通过 2M一 1=0. 90挨算为里侧正态分布的置悟水平 P =0.95, 查逾则正杏分布袤俾 Zt 2=1.64, 27.89% 18.11% 可知.当置信水平为 90%打,控有该晶悴电视机的豪暨它惨比童的置(S区冏为(18.11%, 27 89%). ⑵双倒置信水平为 95%时,傅 Z“广 1.96, 可知.当置信水平为 95%时,拥有该品裨电视机的空庭总体比率的置信区间为 :<17 16%. 2884%). 2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3周的时间里选取 49名顾客组成了一个简 单 随机样本。假定总体标准差为 15元,求样本均值的抽样标准误差;在 95%的置信水平下,求允许误差;如 果样本均值为 120元,求总体均值 95%的置信区间。 <1)己很定总体标淮差为° =15元, 则样本均值的抽样标准误差为气=* =焉=2«9 (2) 己知置信水平 1 —)=95%,得 Z ?:=1.96f 于是,允许误差是 E = Z3 2^^ 96X2.1429=4.2000, =2.98% 此时的置信区间为 此时的置信区冏为 p±Z =23%± 1.98X2. 98%= 28.8408% 17.1592% /0.23x0.77 V -200~ =23%± 1.64X2.98V (3)己知样本切富为 A =17。元.容信水平 1一 ms鼠 但 L查看更多