- 2022-08-24 发布 |
- 37.5 KB |
- 31页
文档介绍
统计学教学资料(广东外语外贸大学)统计学综合练习题
第一章绪论标志是说明(A)总体单位特征的总体特征的单位量的特征的名称单位值的特征的名称D统计总体的特征是(B、D、E)A科学性B大量性C实用性D同质性E变异性总体、总体单位、标志、指标、这几个概念间的相互关系表现为(A、B、C、D)A没有总体单位就没有总体,总体单位也离不开总体而独立存在B指标是说明总体特征的,标志是说明总体单位特征的C总体单位是标志的承担者D统计指标的数值来源于标志二填空1统计一词有三种涵义,即(统计学工作)(统计数据)(统计学)\n2被马克思称为统计学的创始人是(威廉•配第)3、政治经济学之父是(威廉•配第)4、被誉为“现代统计学之父”的是(凯特勒)第二章数据的描述练习题:_选择1如果数据分布很不均匀,则应编制(D)A开口组B闭口组C等距数列D异距数列2计算总量指标的基本原则是:(C)A总体性B全面性C同质性D可比性3某企业的职工工资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为(C)A1500元B1600元C1750元D2000元4统计分组的首要问题是(A)A选择分组变量和确定组限B按品质标志分组C运用多个标志进行分组,形成一个分组体系D善于运用复合分组5某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为(A)\nA230B260C185D2156分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是(B)\nA钟型分布BU型分布CJ型分布D倒J型分布7、要了解上海市居民家庭的开支情况,最合适的调查方式是:(B)A普查B抽样调查C典型调查D重点调查8>已知两个同类企业的职工平均工资的标准差分别为5元和6元,而平均工资分别为3000元,3500元则两企业的工资离散程度为(B)A甲大于乙B乙大于甲C一样的D无法判断9加权算术平均数的大小取决于(C)A变量值B频数C变量值和频数D频率10如果所有标志值的频数都减少为原来的1/5,而标志值仍然不变•那么算术平均数(A)A不变B扩大到5倍C减少为原来的1/5D不能预测其变化11计算平均比率最好用(CA算术平均数B调和平均数C几何平均数D中位数12若两数列的标准差相等而平均数不同,在比较两数列的离散程度大小时,应采用(D)A全距B平均差C标准差D标准差系数\n13若n=20,Xx=200’工X=2080,标准差为(A)A2B4C1.5D314已知某总体M()=3256,M严3215,则数据的分布形态为(A)A左偏分布B正态分布C右偏分布DU型分布15一次小型出口商品洽谈会,所有厂商的平均成交额的方差为156.25万元,标准差系数为14.2%,则平均成交额为(D)万元AllB177.5C22.19D16、欲粗略了解我国钢铁生产的基本情况,调查了上钢、鞍钢等十几个大型的钢铁企业,这是(B)A普查B重点调查C典型调查D抽样调查判断题:1某音乐会门票标明”1・2米以下半票”,一小朋友1.2米,应买全票(V)2各变量值与其算术平均数离差之和为最小值(X)3某投资方案的平均受益为300万元,方差为25万元爲则离散系数为1.7%(V)4描述统计和推断统计都是研究总体内在数量规律的\n5、抽样的样本指标是随机的,则总体也是不能确定的(X)6各变量值与其算术平均数离差平方和为最小值(M)7、平均指标反映了总体的一般水平(M)8、统计调查主要是针对时期现象进行的(X)9>某学校2006年底教工人数为2031人时时期指标(X)\n三计算题中位数按出口总值分组(亿美元)企业个数(个)40-6060-8080-100100-120120-140140-160合计3124054291750x3+70x12+90x40十110x54+130x29+150x173+12+40+54+29+17=10&71众数所在组为100-120\nf-f54-40=L+—丄—“—xd=100+x20=107J792—仁\54x2-40-29因为N/2二77.5,所以众数所在组为100-120故:理-SC°me-\他=厶+xd=100+3+12+40+54+29+17_(3+]2+40)x20=10&33me54有两个生产小组,都有5个工人,某天的日生产量件数如下:要求:计算各组的算术平均数,全距,标准差系数甲组10111315乙组10121415163、某乡两种水稻种资料如下:甲稻种乙稻种播种面积(亩)2025亩产量(斤)0050播种面积(亩)1522亩产量(斤)703590026960\n1020303试比较哪种水稻种的稳定性比较好.1000计算标准差系数v=±xl00%X-Dr•y*■■■800x20+850x25+900x25+1020x38““==911.1020+25+35+38一无)2•拆VZz-1((800—911.10)2x20+(850—911.10)2x25+(900-911.10)2x35+(1020—911」0)、3:V(20+25+35+38)-1=82.44Sfh82.44门“a<'11卩甲__-兀甲二=0.0904911.10=929.0315+22+26+30820x15+870x22+960x26+1000x30I(820—929.03)?x15+(870—929.03)2x22+(960—929・03尸x26+(1000—929.03)2x3C\(15+22+26+30)-1=68.45s乙_6&45冗一929.03=0.0737因为吃vu甲所以乙的稳定性好第四章抽样分布一单项选择:1重复抽样的抽样误差(A)A大于不重复抽样的抽样误差\nB小于不重复抽样的抽样误差C等于不重复抽样的抽样误差D不一定2在简单重复抽样下,若总体方差不变,要使抽样平均误差变为原来的一半,则样本单位数必须(C)A扩大为原来的2倍B减少为原来的一半C扩大为原来的4倍D减少为原来的四分之一3在抽样之前对每一个单位先进行编号,然后使用随机数字表抽取样本单位,这种方式是(C)A等距抽样B分层抽样C简单随机抽样D整群抽样4一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做检验,这是(BA简单随机抽样B整群抽样C系统抽样(即机械抽样)D分层抽样\n7有限总体修正系数可以省略的前提是(A)A.n/N<0.05B.n/N>0.5C>n/N>0.05D、n/N<0.5二判断1抽样推断是利用全体中的一部分进行推断,就不可能避免会出现误差(V)2抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的,唯一的.(X)3中心极限定理告诉我们:无论总体服从什么分布,抽样分布均服从正态分布(X)4抽样误差是由于抽样的偶然性因素而产生的误差,这种误差即可以避免,也可以控制其大小。(X)三计算题1某县欲统计今年小麦产量,调查了全县100个村子的小麦产量,测得全县每个村子小麦产量的平均值为1700(百斤),标准差为200(百斤)•若从全县的100个村子中按重复抽样的方法随机抽取10个村子,则由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?若采用的是不重复抽\n样的方法,那么由10个村子组成的样本平均产量的\n期望值是多少?平均产量的标准差又是多少?〃=A=1700(公斤)重复抽样:,200(T-==63.25JnV10“=“=1700(公斤)不重复抽样:(J\N-n200/100-10—、乐=-?=J=-t=J=60.30EN_\710V100-12、某地有200家外贸企业,年平均出口额为90万美元,标准差为27万美元,随机抽取36家企业调查,问其年平均出口额在100万美元以上的概率是多大?元_9()1()()-90p(x>100)=)=l-p(z<2.2)=1-0.986097=0.0139034.54.53、工厂在正常情况下产品次品率为8%,若产品批量较大,随机抽取100个产品进行检验,求次品率在7%-9%之间的概率.(见作业)p〜Ng)即〃〜N(8%,(8%(1-8%)VFoo),即p~N(0.0&0.027)解:#(7%0.05(X)三计算题1某小型汽车轮胎厂要估计其轮胎的平均行驶里程,随机抽取400个轮胎,其平均行驶里程为20000公里,标准差为6000公里,试在95%的置信度下,对小汽车轮胎的平均使用寿命做一个区间估计.解:大样本,总体方差未知,用正态分布20000±1.96x60007400=(19412,20588)2某企业欲实行一项改革,在职工中征求意见,随机抽取了200人,其中有120人表示同意,80人表示反对.(1)同意改革的职工占总职工人数的点估计(2)以95%的置信系数确定同意人数比例的置信区间:解:120200=0.6解:p±za^p([~p}=0.6±1,96x^|ia6(^0,6)=(0.532104,0.667896)3为调查某单位每个家庭每天看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时.(1)试对家庭每天平均看电视时间进行区间估计\n解:小样本,总体方差未知,用t分布\n(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制再第一问的水平上,问此时需调查多少户才能满足要求?©=0.05)解:第一题中边际误差E=『().0252.25V16=2.1315x2.25V161.198969=/0025(16-1)x2.5=2.1315x2.5h=19.75=20所以,样本容量n取204据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房者中本地人购房比例p的区间估计,在Q=0.10下其边际误差E=0・08•则:(1)这80名受访者样本中为本地购房者的比例p是多少?解:E=梓尹=2.58X径評=0.08・•・“2一“+0.0769=0・・・p=0.0839⑵若。=0.05,则要保持同样的精度进行区间估计,需要调查多少名购房者.解:E=如、弹S=1.96x鬥39(—0隔9)=°VnVn/./?=46.135=47所以样本容量n取47\n第六章假设检验一单项选择:1企业推广一项新工艺,企业管理者关心的是产品质量是否有显著提高,釆用假设检验方法是(C)A双侧检验B单侧检验C右侧检验D左侧检验2在双侧t检验中,给定显著性水平,其临界值为(D)A±gBC-taD士Z3在双侧检验中,如果实际的t值小于一乙则(A)2A拒绝原假设B接受原假设C拒绝备择假设D不能确定4°错误即弃真错误是指(B)A否定了不真实的假设B否定了真实的原假设C接受了不在真实的原假设D接受了真实的原假设5如果是右侧检验,计算出的P值为0.0152,0=0.015的情况,则(D)\nA接受:=“oC接受比:〃v“ob接受a:〃〉“oD推断理由不充分6对一批进口商品的质量进行假设检验,在显著性水平为O.Ol^o被拒绝时,如果使用了0.05的显著性水平则(A)HoA一定会被拒绝B可能会被拒绝C一定会被接受D必须重新假设检验7做假设检验时犯一类错误和犯二类错误的关系是(A)A此消彼长B不确定C同步增减D互相独立二判断题1假设检验是统计推断的一项重要内容(V)2当要检验样本平均数和总体平均数,或样本成数与总体成数是否存在显著差异时,要采用右单侧检验・(X)3如果所要检验的是样本所取自的总体参数是否小于某个特定值,应采用右单侧检验•(X)4在假设检验中,当接受了未知的不真实状态,把假的\n当真的接受了,称为取伪错误•(V)三计算题\n=11学者认为早期教育对儿童智力发展有影响.现在从受过良好教育的儿童中随机抽取70人进行韦氏智力测验,结果平均数为103.3分.若总体平均分为100分,总体标准差为15分,能否认为受过良好教育的儿童智力高于一般水平?另外:要求显著性水平为0.05103.3-10015=1.84Za=Z0.05=1・645.••Z落在拒绝域内,所以拒绝原假设。即受过良好教育的儿童智力高于一般水平。2据统计资料显示,彩电的无故障工作时间服从正态分布,平均无故障工作时间为10000小时.为了提高彩电的质量水平,延长无故障工作时间,生产厂家采取了改进措施.现抽取100台改进后生产的彩电,得出平均无故障工作时间是10900小时,标准差为500小时.问在显著性水平0.02的情况下,能否据此认为彩电的平均无故障工作时间有显著增加?(右侧z检验,答案略)3已知某市青年的初婚年龄服从正态分布,资料显示,该地区初婚年龄平均为25岁.为验证这一结论,现抽取1000对初婚青年,发现平均年龄为24.5,标准差为3岁,问在显著性水平为0.05的情况下,能否认为初婚平均\n年龄无显著变化?(双侧Z检验,答案略)第八章相关和回归分析思考题:回归直线方程中的参数a和b的几何及经济含义是什么?可决系数的意义是什么,如何计算可决系数?二单项选择1相关分析是(C)A研究变量之间的变动关系B研究变量之间的数量关系C研究变量之间相互关系的密切程度D研究变量之间的因果关系2、两个变量之间的关系叫(A)三个变量之间的关系叫(B)A简单相关B复相关C正相关D负相关3、相关系数的取值范围是(C)A[0,1]B(-1,1)C[一1,1]D[-l,0]4、每一吨铸铁成本(元)依铸件废品率(%)变动的回归方程为:y=56+Sx则(C)A废品率每增加1%,成本每吨增加64元B废品率每增加1%,成本每吨增加8%C废品率每增加1%,成本每吨增加8元\nD废品率每增加1%,成本每吨增加56元5、如果回归方程可以解释因变量的49%,则相关系数是()A±0.7B0.7C-0.7D以上都不对填空1、工资(元)依劳动生产率(千元)的回归方程为:y=10+80x,因此当劳动生产率每增加1千元,工资就平均增加(80(千元))2、现象之间的相关关系按相关的程度分为(不)相关,(完全)相关和(不完全)相关;按相关的方向分为(正)相关和(负)相关;按影响因量相关关系的表现形式分为(线性)相关和(非素的多少分为(单)相关和()相关;按变线性)相关计算1检查五位学生统计学的学习时间与学习成绩如下表所示:学习时数(小时)学习成绩(分)440\n6710605070要求:根据上述资料:(1)计算学习成绩与学习时间的相关系数(代入样本相关系数公式计算即可,答案略)(2)建立学习成绩(y)依学习时间(x)的直线回归方程;(代入回归系数公式计算即可,答案略)(3)计算可决系数。(第一问中相关系数的平方即为可决系数)2根据某地区历年人均收入(元)与商品销售额(万元)资料的有关数据如下:x代表人均收入,y代表商品销售额n=90工兀=5460=260=34362工心=16918根据以上资料,要求:(1)\n建立以商品销售额为因变\n(2)若1996年人均收入为400元,试推算该年商品销售额(答案略)计算题1、根据以下数据,分别计算:算术平均数、中位数、众数并指出其次数分布形态。(共12分)某零售集团公司,全国有105家分店,其销售收入如年销售额(万元)分销店(个)1001次下15100--15019150--20026200--25020250--30014300以上11下表:1、均值191.525191.53中位数\n位置在¥=譽59\nWs0°/n-lM,=厶+xzfJm59-37=150+x5026=150+42.3077=192.308-192.31众数Mo在200〜250这一组A.+A.Mn=£+—xzA.200+(30—26)+(30—14)X5°30-26=200+^—x504+16=210.00样本标准差=73.6865-73.69分布形态vx=191.53,=192.31,=210.00Mo>Me>x・•・该次数分布的形态为左偏(负偏)2、某小汽车轮胎厂要估计其轮胎的平均行驶里程,随机抽取400个样本,其平均行驶里程为20000公里,标准差为6000公里。试在95%的置信度下,对小汽车轮胎的平均寿命做一个区间估计。(6分)3、某公司人力资源管理部门制订一项员工培训计划。负责培训的主管人员估计有一半的员工,会在这项培训计划完成后的考试中,获得优秀。现从参加培训的\n员工中随机抽取200人,结果有109人为优秀。问:若以0.05为显著水平做个检验,能否认为员工成绩的优秀率,显著的高于主管人员事先估计的结果?培训计划收到了良好的效果。4一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,要求抗热的平均温度不低于1250°C,在过去,供货商提供的产品都符合要求,并从大量的数据获知零件抗热的标准差为W0°C,在最近的一批进货中随机测试了100个零件,其平均的抗热为1200°C能否接受这批产品?工厂希望对实际产品符合要求而错误地加以拒绝的风险为0.05o5某种导线要求其平均拉力强度为1200公斤,一批产品在出厂时抽取了100个作样本,测试结果平均拉力强度为1150公斤,标准差为230公斤,若a=0.05能否认为这批产品的平均拉力强度低于1200公斤?6假定有10家靠近某大学校园的商店作为一个样本。兀表示学生总数的数量(单位:千人)必表示季度营业额(单位:千元)。其中:工兀=140,工y=1300,工厂=21040,工J=252&工尸=184730\n分别计算:(1)相关系数;(2)拟合回归方程,解释回归系数的实际意义;可决系数及其意义。7、已知某种商品需求量Y和价格X的有关数据,》X=94,工Y=604,》XY二5564,SX2=920,SY2=36968,样本个数为10。分别计算:(1)相关系数;(2)拟合回归方程,解释回归系数的实际意义;