统计学简答重点分析

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学简答重点分析

1、试描述均值、中位数、众数的特点及应用场合。 答:均值的计算是建立在每个观测值之上的,因此均值受极端值的影响很大。在这种时候,均值歪曲了数据实际传递的信息,因此,当数据集有极端值时,均值并不是集中趋势的最好的描述。众数、中位数和均值各自具有不同的特点,在实际应用中,应选择合理的测度值来描述数据的集中趋势。 当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,选择用均值比较好,因为均值包含了全部数据的信息,易被大多数人所理解和接受;当数据为偏态分布是,特别是当偏斜的程度较大时,应选择众数或中位数;当数据为定类尺度时,如商品(服装、鞋类)等的规格,用众数是较好的选择。2、为什么要计算离散系数?答:离散系数是用来对两组数据的差异程度进行相对比较的。因为在比较相关的两组数据的差异程度时,方差和标准差是以均值为中心计算出来的,因而有时直接比较方差是不准确的,需要提出均值大小不等的影响,计算并比较离散系数。离散系数是从相对的角度观察差异和离散程度的,在比较相关事物的差异程度时,较之直接比较标准差要好些3、方差分析的基本原理是什么?答:方差分析的主要思想是将影响指标值的一个或几个因素取不同的水平,然后建立相应的方差分析模型,由此给出检验因素的不同水平对指标值是否有显著影响的统计分析过程。4、简述回归方程的显著性检验与回归系数的显著性检验的区别和联系答:回归系数的显著性检验是对回归系数进行是否等于0或等于某个常数的假设检验;而回归方程的显著性检验是指方程是否显著存在假设检验;在一元线性回归中,回归系数的显著性检验和回归方程的显著性检验是等价的,而在多元线性回归中两者不同。5、误差主要包括哪两类?引起误差的原因分别是什么? 答:主要包括抽样误差和非抽样误差 抽样误差:是指由样本数据对总体特征进行估计时所引起的代表性误差,原因是由于每次抽取一个样本,而样本中包含的哪些单元是随机的,不同的样本由于包含的单元不同,得到的估计值自然不同,各个估计值与总体特征之间不可避免的出现差距,由此产生了抽样误差。 非抽样误差:其来源比较复杂,主要有抽样框未能不重不漏包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,还有无回答误差和粗大误差。 6、什么是抽样平均误差?抽样平均误差、方差和偏差的关系怎样?答:抽样平均误差是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。即它反映了抽样指标与总体指标的平均离差程度。关系:抽样平均误差的平方等于标准差平方和偏差平方之和7、影响样本容量的因素主要包括: 答:(1)总体各单位标志变异程度;  (2)允许误差的大小; (3)概率度的大小;(4)抽样方法不同;(5)抽样方式不同。 8、什么是方差分析,它所研究的是什么?答:方差分析是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。表面上看,方差分析是检验多个总体均值是否相同,但本质上它所研究的是分类型自变量对数值型自变量的影响,例如,它们之间有没有关系,关系密切程度如何,等等。9、方差分析中有哪些基本假设?答:方差分析中有三个基本假设:1、每个总体都服从正态分布,也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简答随机样本;各个总体的方差必须相同,也就是说,对于各组观测值,是从具有相同方差的正态总体中抽取的;观测值是独立的10、一组数据的分布特征可以从哪几个方面进行测度?答:一组数据的分布特征可以从三个方面进行:集中趋势,离散程度,偏态与峰度。数据的集中趋势是指一种数据项某一中心靠拢的倾向,它反映了一组数据中心点的位置所在;数据的离散程度反映的是各变量值远离其中心的程度;数据的偏态和峰态是测度数据分布形状的两个重要指标11、如何理解置信区间的置信水平1-α?答:置信水平是置信区间可靠程度的度量。置信水平为1-α的含义是:对某个参数φ去m个容量为n的样本,用同样方法可以获得m个置信区间,这些置信区间中至少有m(1-a)个包含了参数φ\n11、对于比率数据的平均,为什么采取几何平均?答:由于现象发展的总比率并不等于各期比率之和,而等于各期比率的连乘机,所以各期比率平均数,不能讲比率代数和后按算术平均法计算,而只能在比率连乘机基础上按几何平均法计算。12、数据的计量尺度有哪些?答:数据的计量尺度有四种:1、定类尺度:也称类别尺度或列名尺度,它是把事物按照属性或类别分组。2、定序尺度:也叫顺序尺度,它是对事物之间等级差别或顺序差别的测度,具有定类尺度的所有性能。3、定距尺度:也叫间隔尺度,是对事物间的类别或次序间的间隔的测度,其计量结果变现为数值。4、定比尺度:也叫比率尺度,它与定距尺度属于同一层次,其计量结果也表现为数值。13、简述方差分析的基本步骤答:求平方和;计算自由度;计算均方;计算F值;查F值表进行F检验并作出判断;陈列方差分析表14、简述方差分析和回归分析的异同答:从资料类型来看,方差分析的因变量是连续型资料,自变量是分类变量,一般都以组别的形式出现。回归分析的因变量是连续型资料,自变量既可以是分类资料,也可以是连续型资料,也可以两种资料都有。从目的来看,大多数方差分析的目的都是比较组间差异,比如3组人群的身高是都有差异等。而回归分析主要是看自变量对因变量的影响,或因变量是否随着自变量的变化而变化,如血压是否随年龄而变化等。15、多元回归中为什么对可决系数进行修正?如果在模型中增加一个解释变量,可决系数往往增大,这是因为残差平方和往往随着解释变量个数的增加而减少,至少不会增加,但是由增加解释变量个数引起的可决系数的增大与拟合好坏无关,因此在多元回归模型之间比较拟合优度,可决系数就不是一个合适的指标,必须加以调整17、 非概率抽样的主要形式有哪些?非概率抽样的缺点是什么?  答:主要有判断抽样,便利抽样,自愿抽样,滚雪球抽样,配额抽样  缺点:难以评价样本的代表性; 无法估计抽样误差; 偏倚往往较大18、简述全面调查、非全面调查、概率抽样、非概率抽样四者之间的关系答: 根据调查是否针对总体的所有单元进行,调查有全面调查和非全面调查之分 全面调查:针对总体中的每一个单元都进行信息搜集的调查,又称为普查。 非全面调查:仅仅针对总体中一部分单元进行信息搜集的调查。  狭义的抽样调查是非全面调查中最常用、最重要的一类。而狭义的抽样一般仅指概率抽样调查,广义的抽样调查指的即是非全面调查,分为概率抽样调查和非概率抽样调查 概率抽样:按照一定概率从总体的所有单元中随机选择一部分单元进入样本的抽样方法 非概率抽样:样本不是按照一定概率抽出,而是由抽样者主观抽出或者是任由受访者自愿进入样本的抽样方法。 19、常用的统计调查方式主要有哪些? ⑴统计报表。是按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式。 ⑵普查。是为特定目的而专门组织的一次性全面调查。 ⑶抽样调查。是从研究对象的总体中随机抽取一部分个体作为样本进行调查,并根据调查结果来推断总体数量特征的一种非全面调查方法20、 分类数据、顺序数据的整理及图示方法各有哪些? ⑴用频数分布表展示分类数据和顺序数据 ⑵用图形展示分类数据和顺序数据 ① 条形图 ② 饼图 21、数值型数据的整理及图示方法有哪些?试述组距分组的步骤。 ⑴用频数分布表(变量数列)展示数值型数据 ①单变量值分组  ②组距分组 ⑵用图示展示数值型数据 ①直方图   ②箱线图   ③线图   ④茎叶图 组距分组的步骤: ① 确定组数 ② 确定各组的组距 ③ 整理成频数分布表 
查看更多

相关文章

您可能关注的文档