《应用统计学教学资料》应用统计学专科评分标准a卷
上海建桥学院2015-2016学年第一学期期终考试(2016.01)《应用统计学》试卷A卷(本卷考试时间:120分钟)专科14级国际商务专业_L班学号姓名题号—•二三四五六总分得分请考生在拿到试卷后检查试卷页数是否止确,如有卬刷问题及吋少监考教师沟通。一、单选题(每小题1分,共20分)12345678910CABBBACBCB11121314151617181920BBABDBBCAA1、在不同时间点上搜集的数据称为(C)A.观察数拯B.实验数据C.时间序列数据D.截面数据2、从含有N个元素的总体中,抽取n个元素作为样木,使得总体中的每一个元素都有相同的机会3、大样本的样本比例的抽样分布服从(A)A.正态分布B.t分布C.F分彳|jD.x?分布3、组中值是(B)A.一个组的上限与下限之差B.一个组的上限与下线Z间的屮点值C.一个组的最小值D.一个组的最大值4、指出下面的变量哪一个属于分类变量(B)A.年龄B.购买商品时的支付方式(现金、信用卡和支票)C.汽车产量D.工资\n5、某人学科研人员希望估计该人学牛平均每月的交通费支出惜况,为此,调查了500个学生,发现他们的每刀交通费支出是100元。该研究人员感兴趣的参数是(B)A.该大学的所有学生人数B.该大学所有本科生的月平均交通费支出C.该大学所有本科生的刀交通费支出D.所调查的500名学生的刀平均交通费支出6、二手数据的特点是(A)A.采集数据的成木低,搜集比较容易B.采集数据的成木低,但搜集比较困难C•数据缺乏可靠性D.不适合自己研究的需要7、为了估计某城市愿意乘坐公交车上下班的人数的比例,在搜集数据时,蜃有可能采用的搜集数据方法是(C)A.普查B.公开发表的资料C.随机抽样D.实验8、将比例乘以100得到的数值称为(B)A.频率B.TT分数C.比例D.比率9、一组数据的最大值与最小值之差(C)A.平均值B.标准差C.极差D.标准差10、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围Z内有(B)A.68%的数据B.95%的数据C.99%的数据D.100%的数据11、若某一事件的概率的取值为1,则这一事件被称为(B)A.随机事件B.必然事件C.不可能事件D.基本事件12、在止态总体的方差未知的情况时,在小样本条件下,估计总体均值使用的分布是(B)A.止态分布B.t分布C.X?分布D.F分布\n13、某一班级的考试合格率为90%,但是有人认为实际的比例可能更高,要检验该说法是否证券,则假设式有(A)C.HO:JIW0.9,Hl:"W0.9D.HO:门〉0.9,Hl:">0.914.对于给定的显著性水平a,根据P值拒绝原假设的准则是(B)A.P二aB.P
aI).P二ci二015•如果某月份的商品销售额为84万元,该月的季节指数等T0.7,在消除季节因素后该月的销售额为(D)A.60万元B.70万元C.90.8万元D.120万元16.根据方程Y=2-3X,可以判断两个变量之间存在(B)A.正线性相关关系B.负线性相关关系C.非线性关系D.函数关系17•如果相关系数「0,则表明两个变量之间(B)A.相关程度很低B.不存在任何关系C.不存在线性相关关系D.存在非线性相关关系18.在用止态分布进行置信区间估计时,临界值1.96所对应的置信水平是(C)A.85%B.90%C.95%D.99%19.在多元线性回归模型中,若自变量Xi对因变量y的影响不显苦,那么它的冋归系数Bi的取值为(A)A.可能为0B.可能为1C.可能小于0D.可能大于120.在假设检验中,笫一类错误是指(A)A.当原假设止确时拒绝原假设B.当原假设错误时未拒绝原假设C.当备择假设止确时未拒绝备择假设D.当备择假设不正确时未拒绝备择假设二、多选题(每小题2分,共10分,漏选、少选不给分)12345\nABCABABABCDAB1.评价估计量的标准是(ABC)A.无偏性B.有效性C.一致性D.充分性\n1.两类错误是指(CD)A.e错误B.JI错误C.a裙误D.P错误2.总误差由以下组成(AB)A.组内谋差B.组间谋差C.分组误差D.总体误差3.以下是时间序列数据的步骤(ABCD)A.确定时间序列所包含的成分,也就是确定时间序列的类型B.找出适合此类时间序列的预测方法C.对可能的预测方法进行评估,以确定最佳预测方案D.利用最佳预测方法进行预测4.以下属于总指数的编撰方法是(CD)A.复杂指数B.复权指数C.简单指数D.加权指数三、判断题(每小题1分,共10分)12345XXXXV678910VXXV1.如果自变量Xi有多个,要引入一元线性回归模型。(X)2.参数佔计的有效性是指佔计量抽样分布的数学期望等丁•被佔计的总体参数。(X)3.单侧检验的原假设可以是Ho:P=0o(X)4.x2检验是对分类数据的频数进行分析的统计方法。(X)5.在单因素方差分析中,原假设Ho:口]二口2。(V)6.在多元线性回归模型屮,原假设为:Ho:u=0o(V)7.使用EXCEL中的CORREL函数,可以计算多组数据间的相关系数。(V)8.在小样木数据的悄况下,对于均值之差的检验都可以使用Z检验。(X)9.在证券组合投资中,绝对冋报越高越好,不用考虑该证券组合的波动性。(X)10.在多元线性回归模型中,假设将一个人的身高作为因变量,父亲、爷爷、母亲、奶奶的身高作为自变量,\n则是否可能出现多巫线性。(")四、计算题(每小题5分,总分为20分)1、某地方税务局为了了解该地方民营企业的销售收入增长率,随机抽取64家名营企业,算出X的值为8%,总体方差o彳为8%,总体均值的95%的置信区间为:答:u=X±Za/2。S/n=8%±1.96*8%/8,因此在95%的置信区间下,该地区民营企业R0E在6.04%-9.96%之间。2、1、某厂商产占占的合格占占为60%,合格品中的一级产占占率为40%,从产占占中任取意见为一级甜的概率是多少?答:P二0.6*0.4=0.24,因此有24%的可能抽到一级品。3、己知应用统计学的平均成绩为80分,标准差为5分。请粗略估计一卜•,问多少人的分数在75〜85分Z间?多少人的成绩在70分〜90分之间?答:按照正态分布显示,应有68%的人在75分〜85分之间,95%的人在70分〜90分之间。4、如果股票A的预期回报率为10%,标准差为5%;而股票B的预期回报率为16%,标准差为9%,试问哪个项目的投资回报风险较大?为什么?答:股票A的离差系数=5%/10%=0.5,股票B的离差系数=9%/16%=0.5625;股票A的离差系数小丁•股票B,因此回报风险较小。五、简答题(每小题5分,总分为20分)1、鉴别图表优劣的准则有哪些?一张好的图表应当:1)显示数据;2)让读者把注意力集中在图表的内容上,而不是制作图表的程序上;3)避免歪曲;4)强调数据之间的比较;5)服务于一个明确的H的;6)有对图表的统计描述和文字说明;2、为什么耍计算离散系数?离散系数是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,其作用主要是用于比较不同组别数据的离散程度。3、为检验地域和企业性质对于企业ROE的影响,某咨询公司进行了考察,得出分析结果如下:\n上海广东民营企业8129111013911国营企业56475869方差分析差异源SSdfMSFP-valueFcrit样本68.062516&062569.510642.46E-064.747225列27.5625127.562528.148940.0001874.747225交"0.062510.06250.063830.8048184.747225内部11.75120.979167总计107.437515请问这是什么模型?请根据该模型结果分析结果(95%的置信区间)。答:该模型是双因素可垂复方差模型。(2分)样木(行数据)P值小于0.05,故拒绝原检验H0,样本(行数据)表明民营或国有的企业性质対于一个企业ROE均值有显著影响(1分);列(列数据)P值小于0.05,故拒绝原检验H0,表明地域对于一个企业ROE均值有显著影响(1分);交互的P值大于0.05,故不能拒绝原检验H0,表明地域与金业性质对一个企业ROE有显著影响(1分)。4、简述统计工作(活动)有哪些过程。答:(1)统计设计过程:根据统计对象、性质、研究的目的,对整个丁作的各个环节所作的通盘考虑和安排。(2)统计调杳过程:就是根据调查方案的要求,采用科学的调杳方法,有计划、有组织地向被调查单位收集可靠、准确的材料的工作过程。(3)统计整理过程:对收集来的大量零星分散的原始资料或次级资料进行审核、分组、汇总、制表等的工作过程,起到了承前启后的作用。(4)统计分析过程:对统计工作所取得的资料进行整理、综合分析,得出必然结论。\n六、案例分析题(每小题10分,总分为20分)1、以下是中国统计局公布的一些经济数据情况:图一:屮国工业增加值增长(%)>中国工业増加值増长S同比増长(%)■累计増长(%)图二:屮国采购经理人指数(PMI)>中国采购经理人指数PFS制苣业■非制査业图三:中国工业品出厂价格指数(PPI)>中国工业品出厂价格指数(PPI)\n(1)请问各数据之间是否存在相关性?(4分)(2)结合屮国口前的经济形式,根据图表内容,写一篇300字的论文。(6分)答:(1)中国工业增长值、釆购经理人指数和中国工业品出厂价格指数(PPI)存在相关性。(2分);为了验证是否有相关性,必须通过相关关系检验等进行验证。(2)字数要求在300字以上。如谈及:因为工业增长放缓,采购经理人指数必然下滑,FL会拖累PPI(工业生产品岀厂价格指数)的下行(2分);制造业的采购经理人指数目前为50,接近萎缩,未來下行可能性较高(2分);PPI的下滑进一步蚕食工业增长空间。(2分)。其他论据只要合理,可酌情给分。2、市于战争,德国有一个时期物资特别紧缺,对面包实行配给制:政府把面粉发给指定的面包房,面包师傅烤好了面包再发给居民(假设每天1个计算)。有一个统计学家,怀疑他所在区域的面包师傅私扣面粉,于是就天天称口己的面包。100天以后,他去找面包师傅,说:“政府规定配给的面包是400克,因为模具和其他因素,你做的面包可能是398、399克,也可能是401、402克,但是按照统计学的正态分布原理,这么多天的面包重量平均应该等于400克,可是你给我的血包平均重量是398克(标准差为lg)o我有理由怀疑是你使用较小的模具,私吞了浙粉。”而包师傅承认确实私吞了浙粉,并再三道歉保证马上更换正常的模具。乂一个100天,统计学家乂去找这个面包师傅,说:“虽然这儿个月你给我的面包都在400克以上,但绘这可能是因为你没有私吞面粉,也可能是因为你从血包里特意挑人的给我。同样根据止态分布原理,这么多天不可能没有低于400克的面包,所以我认为你只是特意给了我比较大的浙包,而不是更换了正常的模具。我会立刻要求政府检查你的模具。”面包师傅只好当众认错道歉,接受处罚。请通过以上文章写-•篇300字以上的心得体会。答:(1)面包的重量应当满足N〜(400,o2)的正态分布;(2分)(2)由于统计学家对于自己的面包承重属于抽样分布,总体是全城的而包,样本是自己的100个而包(每天1个,共100天)。第一次面包称量的时候,应提出假设检验:HO:U^400g,Hl:u<400go第一个100天的面包平均重量为398g,100X共有100个面包,标准差是5g。在95%的置信区间下,根据Z检验,\nZ=-2/0.1=-20,其绝对值大于Za的1.96,故拒绝原假设,认为面包重量显著小于400克。(4分)(3)按照正态分布原理,第二次面包肯定会有小于400g的现象,因此统计学家是对的。(2分)(4)耍引中出口己对丁•统计学的理解。统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测対象未來的一门综合性科学。因此,通过対样木数据的搜集与分析,能够达到推测整体的作用,从而为自己的判断和决策提供依据等。但是统计学也有自身的缺陷,如置信区间越高,则总体均值的范围也就越人,这样可能会造成统计结果不可信。(2分)