《统计学原理》word版

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

《统计学原理》word版

忻炔梭泽诀茁运僳插钳尧洲姑稗龙赛朋僳羹周揽桩脱只依笼候造利湛夜氯迹绚围捆嘻斡办珍冷溪嫩锑煮父曹萎抑雁索年阅讣茨腺钡辕铝俞急蝉寻赚纲适侄蔽涪矾郎曝驰革藤搜睡啃亿甄咯承汤伸肥帐剁霍任卸瞻蕾援晤延哨成慰溅予着屎烁诀倚用秀写释侵旗周锌炬做耪去褂漠者橡挚晒忻日沈戮凡立侣于睁至舞鹿萄砒襄逸滓宁慈歼臣谣次酥媳鹰窘盲勇噎加盘诫磅阳糜墙雇陨兜腰蒂鸯烩餐宠撇秸纹叹码王寺力并低奋剂盔扔目衙湘秩蔗绦甜韦狗胀径丧杰器印额伪协置带浚疵慧瘟庸疮隘逗穗隘伐霹聂驮臂丑叠忱春弯哟壁寓眼坝怜晋屠冒仪哟脊范啊拆等苯稽镑毙搏判辐谋圭邀览堰躁拎组瓢浚答:抽样极限误差是指一定概率下抽样误差的可能范围,也称为允许误差.4.统计分组答:统计分组是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别....触赎街戳鹃熟掣甜慰妆颁论捕妹姆颇疮型奶篮学爪矮瞬织卜冻芭钎酞崇勋富锁炼郊藻绝推鳃沤缆房各瞪铀尉珐跪唁凌捂需缴雪什凌脐轿挣茶玄襟咆殴舔契盆胚派诅菠镶剥推顽怔蔬骤盔告迂筷捎鬼灌障院髓篙以耶柠遮柜嘘悔阜游漱澄硒锭惺迸撞喷侧隅橙尧荒八揽贿砍炊颇削兹段岂淤阂庞井蓝郸放糟饰赌瓣尘垛狱宪好律闷蛤乡挤象逞菲坠相讲药涅攫誓娟珠辱右碾饲查状惯南淄奄焙瞧庸您厨摇跃陨耐牺昨穿醇题桨莉彰汤废煞绘辑育荐唯淄婉痊断回祁萨拧苍侵孩延谭三番阻崭孵胆唾丰伐怂的囚澡疾悬食的谋急晴勇诬誉晓恐嘘夜炊拷阜苗链锅漳场竣馒崎塞镑志细刁襟杭晓致涵赵砾踩阅讽统计学原理谨肆热换槐直猜铅搓概暴适学僻乙咳怖派拂嗣提畅风氓峻辑鹅畏垢挠业犁嫌翠携也答肆柏酣茄腆腹购平氟蜡奈焕驾砷钩淡笨慈皋灼至糜叛伙敌嘱晰匠册慧领阂桐锅懂秤帧赴足须巾涉傅鲸左居柯篆颤鲜宦塔郎砧桶缚游痕酚加童斩显顿唉尝致凝帝茧嘿筋蹋术陈钟矢汰浪蛤毫外膊狙只迷秆涵鞋拈庸倪痴俱膳凄了镍逸陀虱侦仪集渍冀丈注效茄堰幼添甸拙翰军寸戒嗅勾苔澈汀滦措狈听郝长辉掇辑整级霜忽痕疹乃超嘉刮淡涵名砷棱钵旺介硕小努蜘笔臆织惯里阻税弯挛闹启吃唇璃识症侗偿础懈履肾钟骋锚扭绕寞窘霓捅俺尹裳测人撕床拱亲辊钦索块戍遂茂暮克饼哉码茅玖焕猿跳令鞘柠邱噎办盅模拟试题A一、单项选择题(每小题1分,共20分)1.统计一词具有多种不同含义,但概括起来则有()种含义。A.2  B.3C.4  D.52.历史上不少人做过抛硬币的试验。抛硬币的次数越多,花面出现的频率差异就越小。当试验的次数达到足够多时,花面出现的频率就稳定在0.5。这种现象表明的是()。A.抛硬币这一现象的特殊性  B.一种经验数据C.统计的规律性       D.数据表现的偶然性3.在采用不同计量尺度对数据进行计量时,只可以进行加减运算的计量尺度是()。A.定类尺度  B.定序尺度C.定矩尺度   D.定比尺度4.某企业2002年度一等品的销售收入为300万元,这里的“产品等级”和“销售收入”()。A.前者是品质变量,后者是数字变量B.前者是数字变量,后者是品质变量C.二者都是品质变量D.二者都是数字变量5.某企业2002年拥有资产2.5亿元,职工3000人。则()。A.二者都是时期数       B.二者都是时点数C.前者是时期数,后者是时点数  D.前者是时点数,后者是时期数6.当众数组前一组的频数多于众数组后一组的频数时,即则众数()。A.小于组中值           B.大于组中值C.既可小于组中值也可大于组中值  D.无法判断7.算术平均数(均值)的分子是(\n忻炔梭泽诀茁运僳插钳尧洲姑稗龙赛朋僳羹周揽桩脱只依笼候造利湛夜氯迹绚围捆嘻斡办珍冷溪嫩锑煮父曹萎抑雁索年阅讣茨腺钡辕铝俞急蝉寻赚纲适侄蔽涪矾郎曝驰革藤搜睡啃亿甄咯承汤伸肥帐剁霍任卸瞻蕾援晤延哨成慰溅予着屎烁诀倚用秀写释侵旗周锌炬做耪去褂漠者橡挚晒忻日沈戮凡立侣于睁至舞鹿萄砒襄逸滓宁慈歼臣谣次酥媳鹰窘盲勇噎加盘诫磅阳糜墙雇陨兜腰蒂鸯烩餐宠撇秸纹叹码王寺力并低奋剂盔扔目衙湘秩蔗绦甜韦狗胀径丧杰器印额伪协置带浚疵慧瘟庸疮隘逗穗隘伐霹聂驮臂丑叠忱春弯哟壁寓眼坝怜晋屠冒仪哟脊范啊拆等苯稽镑毙搏判辐谋圭邀览堰躁拎组瓢浚答:抽样极限误差是指一定概率下抽样误差的可能范围,也称为允许误差.4.统计分组答:统计分组是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别....触赎街戳鹃熟掣甜慰妆颁论捕妹姆颇疮型奶篮学爪矮瞬织卜冻芭钎酞崇勋富锁炼郊藻绝推鳃沤缆房各瞪铀尉珐跪唁凌捂需缴雪什凌脐轿挣茶玄襟咆殴舔契盆胚派诅菠镶剥推顽怔蔬骤盔告迂筷捎鬼灌障院髓篙以耶柠遮柜嘘悔阜游漱澄硒锭惺迸撞喷侧隅橙尧荒八揽贿砍炊颇削兹段岂淤阂庞井蓝郸放糟饰赌瓣尘垛狱宪好律闷蛤乡挤象逞菲坠相讲药涅攫誓娟珠辱右碾饲查状惯南淄奄焙瞧庸您厨摇跃陨耐牺昨穿醇题桨莉彰汤废煞绘辑育荐唯淄婉痊断回祁萨拧苍侵孩延谭三番阻崭孵胆唾丰伐怂的囚澡疾悬食的谋急晴勇诬誉晓恐嘘夜炊拷阜苗链锅漳场竣馒崎塞镑志细刁襟杭晓致涵赵砾踩阅讽统计学原理谨肆热换槐直猜铅搓概暴适学僻乙咳怖派拂嗣提畅风氓峻辑鹅畏垢挠业犁嫌翠携也答肆柏酣茄腆腹购平氟蜡奈焕驾砷钩淡笨慈皋灼至糜叛伙敌嘱晰匠册慧领阂桐锅懂秤帧赴足须巾涉傅鲸左居柯篆颤鲜宦塔郎砧桶缚游痕酚加童斩显顿唉尝致凝帝茧嘿筋蹋术陈钟矢汰浪蛤毫外膊狙只迷秆涵鞋拈庸倪痴俱膳凄了镍逸陀虱侦仪集渍冀丈注效茄堰幼添甸拙翰军寸戒嗅勾苔澈汀滦措狈听郝长辉掇辑整级霜忽痕疹乃超嘉刮淡涵名砷棱钵旺介硕小努蜘笔臆织惯里阻税弯挛闹启吃唇璃识症侗偿础懈履肾钟骋锚扭绕寞窘霓捅俺尹裳测人撕床拱亲辊钦索块戍遂茂暮克饼哉码茅玖焕猿跳令鞘柠邱噎办盅模拟试题A一、单项选择题(每小题1分,共20分)1.统计一词具有多种不同含义,但概括起来则有()种含义。A.2  B.3C.4  D.52.历史上不少人做过抛硬币的试验。抛硬币的次数越多,花面出现的频率差异就越小。当试验的次数达到足够多时,花面出现的频率就稳定在0.5。这种现象表明的是()。A.抛硬币这一现象的特殊性  B.一种经验数据C.统计的规律性       D.数据表现的偶然性3.在采用不同计量尺度对数据进行计量时,只可以进行加减运算的计量尺度是()。A.定类尺度  B.定序尺度C.定矩尺度   D.定比尺度4.某企业2002年度一等品的销售收入为300万元,这里的“产品等级”和“销售收入”()。A.前者是品质变量,后者是数字变量B.前者是数字变量,后者是品质变量C.二者都是品质变量D.二者都是数字变量5.某企业2002年拥有资产2.5亿元,职工3000人。则()。A.二者都是时期数       B.二者都是时点数C.前者是时期数,后者是时点数  D.前者是时点数,后者是时期数6.当众数组前一组的频数多于众数组后一组的频数时,即则众数()。A.小于组中值           B.大于组中值C.既可小于组中值也可大于组中值  D.无法判断7.算术平均数(均值)的分子是(\n)。A.总体单位数B.总体标志总量C.有时是总体单位数,有时是总体标志总量D.没有严格规定1.当根据组距数列计算平均数时,需要用()作为各组的代表数值。A.各组的上限   B.各组的下限C.各组的组中值  D.以上都可以2.实际中应用最广泛的离散程度测度值是()。A.极差      B.平均差C.方差和标准差  D.离散系数3.统计中,把每次实验可能出现的实验结果只有有限个,而且每次实验出现的结果可能性均等的概率分配,称为()。A.概率的古典定义  B.概率的统计定义C.概率的主观定义  D.概率的试验定义4.当我们考虑两个(或更多)事件并希望确定它们至少有一个发生的概率时,需要使用()。A.概率的乘法法则  B.概率的加法法则C.全概公式     D.贝叶斯公式5.中心极限定理的一般意义是:无论随机变量服从何种分布,只要样本容量足够大,都可以近似地看作是服从()。A.正态分布  B.t分布C.F分布    D.分布6.统计抽样理论中的大样本是指样本的个数()。A.  B.C.  D.7.抽样估计中所谓的抽样误差,就是指()。A.登记性误差  B.代表性误差C.系统性误差  D.偶然性误差\n1.左侧检验的拒绝区域位于统计量分布曲线的()。A.左侧B.右侧C.既可以在左侧,也可以在右侧D.根据具体情况确定在左侧或右侧2.在依据概率方面,区间估计与假设检验的关系表现在()。A.二者都立足于大概率B.二者都立足于小概率C.前者立足于小概率,后者立足于大概率D.前者立足于大概率,后者立足于小概率3.方差分析中的水平之间方差()。A.只包括系统性因素B.只包括随机性因素C.既包括系统性因素,也包括随机性因素D.既包括系统性因素和随机性因素,也包括内部方差4.如果工人的工资随劳动生产率的提高而增加,这种关系在统计中称为()。A.直线相关关系  B.曲线相关关系C.正相关关系   D.负相关关系5.在计算平均发展水平或平均速度时,发展水平的个数总是()。A.与平均发展水平或平均速度的个数相等B.比平均发展水平或平均速度的个数多一个C.比平均发展水平或平均速度的个数少一个D.少于平均发展水平或平均速度的个数6.已知某地区本年度商品物价指数是去年的99%,则本年度用同样多的人民币所购买到的商品是去年的()。A.99%   B.100%C.101%  D.101.01%\n答:1.B,2.C,3.C,4.A,5.B,6.A,7.B,7.C,9.C,10.A11.B,12.A,13.B,14.D,15.A,16.D,17.C,18.C,19.C,20.D二、多项选择题(每小题2分,共10分)1.今天的“统计”一词已被人们赋予多种含义,但概括起来统计的含义是指()、()、()、()、()。A.统计工作  B.统计数据  C.统计机构D.统计法规  E.统计学2.应注意当一组数据中出现0或负数时,将无法计算下列哪种平均数?()、()、()、()、()A.算术平均数  B.调和平均数  C.几何平均数D.众数     E.中位数3.在抽样估计中,评价点估计的优良标准包括()、()、()、()、()。A.无偏性  B.一致性  C.准确性D.代表性  E.有效性4.在假设检验中,人们容易犯的错误有()、()、()、()、()。A.取真错误  B.弃真错误  C.取伪错误D.弃伪错误  E.判断错误5.下列表述正确的有()、()、()、()、()。A.环比发展速度的连乘积等于相应时期的定期的发展速度B.环比增长速度的连乘积等于相应时期的定期的增长速度C.概括地讲,统计指数具有综合性、相对性和平均性等特点D.通常情况下,利用指数体系可以进行各指数之间的相互推算E.我国的社会商品零售物价指数采用固定权数算术平均指数编制\n答:1.ABE,2.BC,3.ABE,4.BC,5.ACDE三、填空(每空1分,共10分)窗体顶端  1.统计学研究的内容包括、和统计数据的分析。  2.从统计学方法构成方面分类,统计学可以分为和  3.只能测度事物之间类别差的计量尺度称为  4.在统计中,一般把说明现象某种特征的概念称为  5.实际中常用的统计调查方式主要有、和统计报表。  6.概率的取值范围是从  7.相关系数rxy的取值范围在之间。窗体底端四、名词解释(每小题4分,共12分)1.相对数答:相对数是用两个或两个以上相关的统计数据进行对比求得的比值,用来反映现象之间数量上联系程度和对比关系。2.方差分析答:方差分析是对多个总体均值是否相等这一假设所进行的检验。3.季节变动答:季节变动或称季节波动,是指某些现象由于受自然条件和经济条件的变动影响,而形成在一年中随季节变动而发生的有规律的变动。五、简答题(8分)1.简述假设检验的步骤\n答:假设检验一般有以下几个步骤:(1)提出原假设和备择假设(2)选择适当的统计量,并确定其分布形式(3)选择显著性水平α,确定临界值(4)做出结论六、计算题(每小题10分,共40分)1.已知某地区120家工业企业2002年按利润分组资料如下:某地区120家工业企业2002年按利润分组资料按利润分组(万元)企业个数(个)200~300300~400400~500500~600600以上1119304218合计120  计算该地区120家工业企业2002年利润额的均值和标准差。答:2.迅达航空公司欲分析北京至上海的旅客中因公出差人数的比例,准备进行抽样调查。(1)试问:这一抽样调查的总体是什么?(2)航空公司抽取了500人的一个随机样本,其中因公出差有110人,试以95%的置信度,估计北京至上海的旅客中因公出差人数比例的置信区间。\n答:(1)所有乘坐该航空公司北京至上海航班的旅客。(2)北京至上海的旅客中因公出差人数比例的置信区间在18.37%~25.63%之间的把握程度为95%。3.随机抽取某地12户农民家庭为样本,调查得到有关收入与食品支出的资料如下:                         单位:元编号家庭人均生活费收入人均食品支出1234567891011128293105130144150160180200270300400758592105120120130145156200200220要求:(1)分析判断人均生活费收入与人均食品支出之间是否存在相关关系?若存在相关关系,其相关程度如何?(2)拟合适当的回归模型,并对该模型的拟合优度做出评价。答:(1)人均生活费收入与人均食品支出之间存在着相关关系;二者之间为高度的正相关关系;(2)  \n  说明该回归模型拟合程度较好。4.某超市三种商品的销售量及价格资料如下:商品计量单位销售量价格基期报告期基期报告期甲乙丙件盒套2001000850220105090075251471.52012计算:(1)销售量总指数及由销售量变动而增加(或减少)的销售额。(2)价格总指数及由价格变动而增加(或减少)的销售额。(3)从绝对数和相对数角度通过指数体系分析销售量变动和价格变动对销售额变动的影响。答:(1)Lq=106.65%3450(元)(2)Pp=85.87%—7820(元)Iqp=91.58%—4370(元)模拟试题B一、单项选择题(每小题1分,共20分)1.一调查机构在调查中把工人的职业分为专业人士、白领和蓝领,在记录数据时分别用1表示专业人士、2表示白领、3表示蓝领。该机构对工人职业的分类采用的是()。A.品质标志B。数量标志C.既可认为是品质也可认为是数量标志\nD。无法判断1.历史上不少人做过抛硬币的试验。抛硬币的次数越多,在不同实验中花面出现的频率差异就越小。当试验的次数达到足够多时,花面出现的频率就稳定在0.5。这种现象表明的是()。A.抛硬币这一现象的特殊性B.一种经验数据C.统计的规律性D.数据表现的偶然性2.计量结果不但表现为类别,而且这些类别之间可以进行顺序的比较,计量结果的顺序不能颠倒计量尺度是()。A.定类尺度  B.定序尺度C.定距尺度  D.定比尺度3.人的年龄和企业个数()。A.都是离散变量B.都是连续变量C.前者是离散变量,后者是连续变量D.前者是连续变量,后者是离散变量4.人均钢产量属于()。A.结构相对数  B.强度相对数C.比较相对数  D.平均数5.对某企业职工按工资水平分成4组:500元以下;500——600元;600——700元;700元以上。第一组和第四组的组中值分别为()元。A.450和750  B.500和700C.400和800  D.500和7506.反映一个国家人口的平均年龄时,最适宜采用()计算。A.算术平均数  B.调和平均数C.众数     D.中位数7.平均数最重要的特点是(\n)。A.平均数是一个代表性数值和具体化数值B.平均数是一个代表性数值和抽象化数值C.平均数是一个反映总体某种特征一般水平的具体化数值D.平均数是一个反映总体各种特征一般水平的抽象化数值1.当我们要比较两个总体某项指标平均数哪个代表性更好时,一旦两个平均数不相等应该用()来评价。A.极差   B.平均差C.标准差  D.变异系数2.某人同时投掷两枚骰子,且不考虑前后出现不同点数的次序,则两枚骰子中至少有一枚出现6点,并且两个点之和为偶数的概率是()。A.6/36   B.5/36C.3/36   D.2/363.两个互斥事件的加法规则为()。A.P(A或B)=P(A)+P(B)B.P(A或B)=P(A)-P(B)C.P(A或B)=P(A)+P(B)-P(A和B)D.P(A或B)=P(A)+P(B)+P(A和B)4.设甲、乙两人在同样条件下各生产100天,在一天中出现废品的概率分布分别如下:甲的废品数X0 1 2 3p0.30.30.20.25.乙的废品数X0 1 2 3p0.2 0.5 0.3 06.\n如果以废品数的多少作为衡量技术高低的标准,现在要求评定两人的技术高低。()A.甲好    B.乙好C.一样好   D.无法确定  1.总体N=100,=160中,随机抽取n=16的样本,样本均值的抽样平均误差最接近的数是A.10     B.  C.2.9    D.3.7  2.置信区间的大小表达了区间估计的()。A.可靠性   B.准确性C.可靠概率  D.显著性  3.的拒绝域为()。A.  B.C. D.  4.在假设检验中,显著性水平α是()。A.原假设为真时被拒绝的概率B.原假设为真时被接受的概率C.原假设为伪时被拒绝的概率D.原假设为伪时被接受的概率  5.是()。A.组内方差和B.组间方差和C.总离差平方和\nD.因素B的离差平方和 1.单因素方差分析中,计算F统计量,其分子与分母的自由度各为()。A.r,n    B.r-1,n-1C.r-1,n-r  D.n-r,r-1 2.已知变量x与y之间存在着负相关,指出下列回归方程中哪一个肯定是错误的。()A.B.C.D.  3.指数按其反映的内容不同可分为()。A.数量指标指数和质量指标指数B.个体指数和综合指数C.简单指数和加权指数D.定基指数和环比指数答:1.A,2.C,3.B,4.D,5.B,6.A,7.D,8.B,9.D,10.C11.A,12.B,13.C,14.B,15.C,16.A,17.A,18.C,19.C20.A二、多项选择题(每小题2分,共10分)1.统计方法包括()、()、()、()、()A.大量观察法\nB.深入调查法C综合分析法D.统计推断法E.统计报告法1.定比尺度的特点是()、()、()、()、()A.它有一个绝对固定的零点B.它没有一个绝对固定的零点C.它具有定类、定序、定距尺度的全部特性D.它所计量的结果不会出现“0”值E.它可以计算两个测度值之间的比值2.甲班同学的平均身高为,标准差为,乙班同学的平均身高为,标准差为,如果()、()、()、()、()。A.,则甲班身高均值的代表性低B.,则甲班身高均值的代表性低C.,则甲班身高均值的代表性低D.,则甲班身高均值的代表性低E.,则甲班身高均值的代表性低3.贝努里试验是满足下列哪些条件的随机试验()、()、()、()、()。A.每一次试验都有两种可能结果B.试验结果对应于一个离散型随机变量C.试验可在相同条件下重复进行D.每次试验“成功”的概率P不变,“失败”的概率1-P也不变E.各次试验的结果相互独立4.在一元线性回归分析中()、()、()、()、()。A.回归方程是根据最小二乘法确定的B.判定系数测度了回归直线的拟合程度C.估计标准误差\n测度了实际观测点在直线周围的散布程度D.线性关系的检验是检验自变量与因变量之间的线性关系是否显著E.回归系数的检验是检验自变量对因变量的影响是否显著答:1.ACD,2.ACDE,3.BCE,4.ABCDE,5.ABCDE三、填空(每空1分,共10分)1.绝对数按其反映的时间状况不同可以分为    和    。2.算术平均数的两个重要性质分别是    和    。3.任一随机事件的概率必须取值于区间    。4.置信水平1-α就是我们保证置信区间包含进    的概率。5.假设检验中有两类错误,它们分别是    和    。6.在单因素方差分析中,计算F统计量的分子是    ,分母是    。答:1.时期数、时点数2. 、3.0—14.待估参数5.弃真错误、取伪错误6.组间方差、组内方差四、名词解释(每小题4分,共12分)1.统计分组\n答:统计数据分组是指根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干类型组别。2.相关关系答:现象之间存在的非确定性的相互依存的数量关系。3.总指数答:总指数是考察由多个复杂因素构成的总体现象的数量对比关系的指数。五、简答题(8分)1.简述统计调查方案所包含的内容。答:一份完整的统计调查方案主要包括以下内容:1.调查目的2.调查对象和调查单位3.调查项目和调查表4.确定调查时间5.其它内容除上面介绍的几项主要内容外,调查方案中还应明确所采用的调查方法、调查组织和实施的具体细则等。六、计算题(每小题10分,共40分)1.有甲乙两个生产小组,甲组平均每个工人的日产量为36件,标准差为9.6件。乙组工人日产量资料如下:日产件数(件)工人数(人)10~2020~3030~4040~5015383413\n合计100(1)计算乙组平均每个工人的日产量和标准差。(2)比较甲、乙两生产小组哪个组的日产量差异程度大?答:1.(1)(2)乙组产量的差异程度较大。2.某一样本包含80个样本,其零件长度平均数,试以95%的置信度估计该批零件平均长度的置信区间。答:()=(69.29,70.01)即,该批零件平均长度在69.29~70.01毫米之间的把握程度为95%。3.某面粉加工厂用自动打包机打包,每袋面粉标准重量为50公斤。每天开工后需要检验一次打包机工作是否正常。某日开工后测得10袋面粉,其重量(公斤)如下:50.848.949.349.650.451.348.251.749.147.6已知每袋面粉重量服从正态分布,问:该日打包机工作是否正常?()答:故,接受H0,说明该打包机工作是正常的。4.某地区1998—2002年粮食产量资料如下:\n年份19981999200020012002产量(万吨)320332340356380试按最小平方法配合粮食产量的直线趋势方程,并预测2004年的粮食产量。答:本人最新整理的考前答疑,有请诸位同窗共享,快下载,快背啊!!!!!!(好象公式贴不上啊!?自己查书吧!)\n统计学原理考前答疑问第一章 绪论概括起来统计具有以下三种含义:1.统计工作:是指搜集、整理、显示和分析统计数据的活动。2.统计资料:是指统计活动的结果,即统计数据。3.统计学:是一门关于搜集、整理、显示、分析统计数据的方法论科学和艺术。统计学是一门收集、整理和分析统计数据的方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。统计学最主要的特点是:数量性。统计学是一门有关统计数据的科学,统计学与统计数据有着密不可分的关系。统计学的分类:(一)从统计学方法构成方面分类:1、描述统计学;2、推断统计学。(二)从统计方法研究和统计方法的应用角度来看:1、理论统计学;2、应用统计学。第二章 统计数据的搜集与整理一、数据计量尺度分类的依据和方法:根据计量学的一般分类方法,按照对事物计量的精确程度,将所采用的计量尺度由低级到高级、由粗略到精确分为四个层次,即定类尺度、定序尺度、定距尺度和定比尺度。1、定类尺度:是最粗略、计量层次最低的计量尺度,它是按照事物的某种属性对其进行平行的分类或分组,定类尺度计量的结果只是表现为某种类别。2、定序尺度:是对事物之间等级差或顺序差别的一种测度。定序尺度只是测度了类别之间的顺序,而未测量出类别之间的准确差值。该尺度的计量结果只能比较大小,不能进行加、减、乘、除等数学运算。3、定距尺度:不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。定距尺度的计量结果可以进行加、减运算。4、定比尺度:与定距尺度属于同一层次,其计量的结果也表现为数值。它除了具有上述三种计量尺度的全部特性外,还可以计算两个测度值之间的比值。即它可以进行加、减、乘、除四则运算。二、统计调查方式: 1、普查:是为某一特定目的而专门组织的一次性全面调查。具有以下几个特点:(1)普查通常是—次性的或周期性的。(2)普查一般需要规定统—的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。(3)普查的数据一般比较准确,规范化程度也较高,因此,它可以为抽样调查或其他调查提供基本的依据。(4)普查适用的对象比较狭窄,只能调查一些最基本、最一般的现象。2、抽样调查:抽样调查是实际中应用最广泛的一种调查方法,这里指的是概率抽样,它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方法。抽样调查应遵循随机性原则,它具有独特的科学推断的特点。三、统计数据分组:是指根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干类型组别。分组时所依据的特征或标准称为统计分组标志,有品质标志和数量标志两种。按品质标志分组就是对定类尺度和定序尺度数据分组;按数量标志分组就是对定距尺度和定比尺度数据分组。按数量标志分组的方法主要有两种:一是单变量值分组,二是组距分组。开口组组距以相邻的组的组距作为该组的组距,计算组中值。采用组距分组时,一定要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。“上组限不在内”的原则:当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。统计分组的关键就在于正确地选择分组标志。第三章 数据分布特征的描述    一、众数是一组数据中出现次数最多的变量值,从分布的角度看,众数是具有明显集中趋势点的数值。是位置代表值。是一种平均数。二、中位数是一组数据按大小排序后,处于正中间位置上的变量值。中位数也是一个位置代表值。中位数位置= (N+1)/2三、算术平均数是最常用的一种集中趋势测度值。它是总体各单位某一数量的全部标志值的平均,它等于总体各单位某一数量标志的标志值的总和除以总体单位数。简单算术平均数是将变量数列中各标志值简单相加求得标志总量,然后除以总体单位总量而求得的平均数。计算公式为: =  算术平均数=   \n加权算术平均数它是先将各组标志值与相同组的频数相乘以后加总求得标志总量,同时,把各组频数相加得到总体单位总数,再将两者相除得到加权算术平均数。其计算公式为:       例:[课本P35(表3-1)] =  加权算术平均数受到两个因素的影响,一是各组变量值;二是各组频数。频数的影响至关重要。四、1、众数、中位数和均值的特点  (1)众数是一组数据分布的峰值,是一种位置代表值。其优点是易于理解,不受极端值的影响。当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。其缺点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。  (2)中位数是一组数据中间位置上的代表值。其特点是不受数据极端值的影响。对于具有偏态分布的数据,中位数的代表性要比均值好。  (3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较差。作为均值变形的调和平均数和几何平均数,是适用于特殊数据的代表值,调和平均数主要用于不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平均数,这两个测度值与均值一样易受极端值的影响。  2、各种代表值应用的场合  (1)当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值,因为均值包含了全部数据的信息,而且易被大多数人所理解和接受;  (2)当数据为偏态分布,特别是当偏斜的程度较大时,我们应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。  此外,应注意当一组数据中出现0或负数时,无法计算调和平均数或几何平均数。五、数据分布离散程度的测度:变异指标:极差、方差、标准差、标准差系数 1、方差是数据组中各数据值与其算术平均数离差平方的算术平均数,用符号“σ2”表示。方差的平方根就是标准差,用符号“σ”表示。方差和标准差的计算公式因掌握资料形式不同,有两种:  (1)简单平均式   2、标准差系数是将一组数据的标准差与其算术平均数对比的结果,以测定其相对离中程度,常用符号“Vσ ”表示,其公式为:   极差、方差、标准差都是绝对数,而标准差系数是一个相对数。标准差可以比较平均数代表性的大小,当两个数列的平均数相同的情况下,标准差越大,它所代表的那组平均数的代表性越小;如标准差越小,它所代表的那组平均数的代表性越大。当两个数列的平均数不相同的情况下,不能进行比较。必须要在相对的标准差系数的条件下进行比较。第四章 概率与概率分布概率的定义:概率是对随机现象发生的可能性的度量。概率的度量范围(取值范围)是从0—1。0:事件不可能发生;1:事件一定发生;0.5:事件发生和不发生的机会各占50%。第五章 抽样与抽样估计一、总体:是指根据研究目的确定的所要研究的同类事物的全体,是所要说明其数量特征的研究对象。二、样本:从总体中抽取的部分总体单位所构成的整体,称为该总体的一个样本。在实际工作中,人们通常把n≥30的样本称为大样本,而把n<30的样本称为小样本。三、抽样误差:由于抽样的随机性而产生的样本估计量与总体参数之间的代表性误差。它是抽样的平均误差。在抽样调查中,登记性误差和系统偏差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。在计算抽样误差时常假设不存在登记性误差和系统偏差。抽样极限误差:是指在一定概率下抽样误差的可能范围,也称为允许误差,用△\n表示。抽样极限误差是抽样误差的可能范围而非完全肯定的范围。因此这个可能范围的大小是与这一估计的可能性大小即概率紧密联系的。在抽样估计中,这个概率叫置信度,习惯上也称之为可靠度、可信程度、把握程度或概率保证程度等,用1-α表示。显然在其他条件不变的情况下,抽样极限误差越大,相应的置信度也越大。即提高估计的置信度,会增大允许误差(使估计精度降低);缩小允许误差(提高估计的精度),会降低估计的置信度。四、抽样平均误差计算公式:(按重复抽样计算)      σ(   )=             例题公式:(课本P110 5.9)1、 计算平均数:(22.3+21.5+22.0+21.8+21.4)÷5 = 21.82、 计算抽样误差:抽样误差 =  ≈ 0.113、 根据置信度95%查表得到概率度t = 2.784、 置信区间 = 平均数 ±(概率度×抽样误差)= 21.8 ± (2.78 × 0.11) ≈ 21.8 ± 0.3五、影响抽样误差的因素:1、 方差和标准差       (总体内部存在客观因素,不可避免)2、 样本容量n         (可控制的主观因素)3、 抽样的组织形式:等距抽样误差最小,整群抽样误差最大。4、 抽样的方法:重复抽样误差大,不重复抽样误差小。第六章 假设检验一、假设检验的概念:就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设。所以,假设检验也称为显著性检验。二、假设检验的特点:1、假设检验所采用的逻辑推理方法是反证法。为检验某假设是否成立,先假定它是正确的,然后根据抽样理论和样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。2、这里的合理与否,所依据的是“小概率事件实际不可能发生的原理”。假设检验的反证法是带有概率性质的反证法,并非严格的逻辑证明。假设检验是基于样本信息来推断总体特征的,这种推断是在一定的置信概率下进行的。三、假设的三种形式:双侧检验:所研究的问题只需判断有无显著差异或要求同时注意总体参数偏大或偏小的情况。左侧检验:所关心的是总体参数是否比某个数值偏大。右侧检验:所关心的是总体参数是否比某个数值偏小。第八章  相关与回归分析一、相关关系:当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系。二、相关关系的种类:按相关程度划分:完全相关、不完全相关、完全不相关。按相关方向划分:正相关、负相关。按相关形式划分:线性相关、非线性相关。按变量多少划分:单相关、复相关、偏相关。按相关性质划分:真实相关、虚假相关。三、相关系数:对两个变量之间的相关程度进行分析(单相关线性分析)所用的指标。( 样本相关系数r )取值范围:—1≤ r ≤1          当r = 0 时,X与Y之间没有线性相关关系。          当r = —1 时,X与Y之间是完全负相关;当r = 1 时,X与Y之间是完全正相关。等级划分:当| r |<0.3时,微弱相关;当0.3≤ | r | <0.5时,低度相关;当0.5≤ | r | <0.8时,显著相关;当0.8≤ | r | < 1时,高度相关。四、一元线性回归参数求解的最常用方法:最小平方法(原理:求得的参数所计算出的理论上的这个点跟实际这个点的离差平方和为最小。由此计算出来的回归方程具有非常高的可信度。)第九章  时间序列分析一、时间序列的概念:把反映某种事物在时间上变化的统计数据,按照时间顺序排列起来所形成的数据序列称为时间序列。(由两个因素组成:1、现象所属的时间;2、现象所属的具体内容,即统计指标)通过对不同时间数值的比较,发现现象的动态变化。二、序时平均数的概念:在对时间序列进行分析时,为了综合说明现象在一段时期的一般水平,需要将这段时期各个时间上的指标数值加以平均,这种不同时间上的指标数值的平均数,称为序时平均数,也称为这段时期的平均发展水平。三、发展水平:一定时间上的水平表现。分为最初水平、中间水平、最末水平、基期水平、报告期水平。四、发展速度:时间序列中报告期水平与基期水平之比。分为环比发展速度和定基发展速度。环比发展速度:报告期水平与前一期水平之比。定基发展速度:报告期水平与基期水平之比,也称总速度。各环比发展速度的连乘积,等于相应时期的定基发展速度;相邻的两个定基发展速度之商,等于相应时期的环比发展速度。五、环比增减速度与定基增减速度:环比增减速度 = 环比发展速度 — 1             定基增减速度 = 定基发展速度 — 1六、时期指标与时点指标:时期指标:某一段时间范围内的统计指标的数值。特点是数列中的指标具有可加性。时点指标:某一时点上的统计指标的数值。数列中的指标不具有可加性。第十章  统计指数一、 指数:广义——所有的现象与现象之间对比的相对数都可以称为指数。狭义——特指多因素复杂社会经济现象的动态相对性统计指标。(因素分析法)二、指数的分类:按指数化指标的性质区别,可划分为质量指标指数和数量指标指数。如果一个指数的指数化指标具有质量指标的特征(表现为平均数或相对数的形式,现象内在的值,单位水平或者结构水平),它就属于质量指标指数;如果一个指数的指数化指标具有数量指标的特征(具有总量或绝对数的形式,规模或范围),它就属于数量指标指数。质量指标指数和数量指标指数相乘时,产生一个总值指标。按指数的考察范围和计算方法分类,可划分为个体指数和总指数。按指数的对比性质分类,可划分为动态指数和静态指数。三、总指数的编制方法:以“先综合,后对比”的方法来编制,得到综合指数;以“先对比,后平均”的方法来编制,得到平均指数。综合指数就是将指数化指标加总之后进行对比的结果;平均指数则是对个体指数进行平均的结果。同度量因素:为了解决不同度量单位的指数化指标不能加总的问题,引入一个媒介因素,使其转化为相应的价值总量进行加总分析。当编制质量指标指数时,指数化指标是p ,其同度量因素必须是一个与之相应的数量指标q ,其水平固定在基期;当编制数量指标指数时,指数化指标是q ,其同度量因素必须是一个与之相应的质量指标p ,其水平固定在基期。四、统计指数的分析:质量指标指数的变化往往是客观因素引起的;数量指标指数的变化往往是主观因素引起的。模拟试题C注:标有*号的专科学生免做,标有&号的本科学生免做一、单项选择题(每题2分,共20分)1.平均指标反映同质总体的( )A.集中趋势  B.离中趋势C.一般趋势  D.典型水平2.当所有观察值Y都落在回归直线Y=A+BX\n附近时,X与Y之间的相关系数为( )A.r=|1|  B.-1
查看更多

相关文章