- 2022-08-29 发布 |
- 37.5 KB |
- 8页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
教育统计学总复习
h教育统计学总复习一、问答题1什么是描述统计和推断统计?描述统计:用来描述或概括获得数据的基本情况,显示其基本特征。推断统计:根据样本数据提供的信息,运用概率理论进行分析论证,在一定可靠程度上推断总体的有关特征。2为什么要使用抽样推断,而不用全体研究原因:3样本容量的大小对统计研究有何影响?影响:4变量有哪些种类,各有什么特点,能否相互转换?5数值变量就是连续变量吗?为什么6频数分布的作用是什么7什么是集中量数,哪些属于集中量数?集中量数是代表一组数据的典型水平或集中趋势的量;常用的集中量数有平均数、中位数和众数8什么是差异量数,哪些属于差异量数?差异量数是指表示一组数据彼此间的变异程度或离散程度的统计量,又称为离中趋势。9平均数和标准差有哪些特点平均数使用广泛,简单易懂,能反映一组数据资料的集中趋势,包括算数平均数、加权平均数、几何平均数和调和平均数;标准差是方差的平方根,标准差的单位和原始数据的单位一致,且对极值得敏感程度较低,标准差的值越小,说明数据离散程度越小,数据月整齐和集中,反之就情况相反。10差异系数的概念与应用差异系数(coefficientofvariation),也称变差系数、离散系数、变异系数,用CV表示。它是一组数据的标准差与其算数平均均数的百分比,是测算数据离散程度的相对指标。计算公式为:CV=标准差÷算术平均数·100%11什么是百分等级,有哪些应用一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。因此,85的百分等级表示在常模样本中有85%的人比这个分数要低。换句话说,百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置越低。运算公式为:PR=100-{(100R-50)/N|},其中R是原始分数排列顺序数,N是指总人数(样本的总人数)。例如小东在30名同学中语文成绩是80分,排列第5名,则其百分等级为:PR=100-{(100*5-50)/30}=85,百分等级为85即指,在100名被试中,语文成绩低于小东的80分的有85人12什么是标准分数,有哪些应用对于来自不同均值的和标准差的总体的个体数据,往往不能直接对比,需要将其化为统一规格、尺度的数据后再比较。即标准分数。标准分数=(X-均值)|标准差。运用:a8\n用于比较不同对象相同科目成绩在整体中所处的位置,b用于比较不同对象几个科目的综合成绩在整体中的位置13如何理解两个变量的相关关系,相关关系是与函数关系吗?两个变量的相关关系是指两个变量之间的不精确、不稳定的变化关系;函数关系刻画了事物之间的严格的依存关系,当自变量发生变化时,因变量也是随之发生确定性的、可在数量上准确预测的变化,即是一种一一对应的关系。14什么是正相关与负相关正相关:两个变量之间的得变化方向一致,一个变量变大,另一个变量也随之变大,一个变量变小,另一个变量也随之变小。负相关:两个变量的变化方向相反,一个变量变大,另一个变量随之变小,一个变量变小,另一个变量随之变大。15相关分析的方法有哪些方法有:积差相关系数、等级相关系数、质量相关系数、四分相关系数。16积差相关的条件是什么条件是:1两列数据都是等距连续变量的观察数据或是等比的测量数据;2都来自于正态分布的数据整体;3两列数据必须具备一一对应的关系。17等级相关的条件是什么条件是:两列具有等级顺序的测量数据,或总体为非正态分布的等距、等比数据。18·什么是二列相关和点二列相关 两个变量都是来自于正态总体的等距或等比变量,而且其中一个被认为的划分为两个类别,成为二分变量。 当两变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关;点二列相关是指两个变量中的一个是来自正态总体的等距或等比数据,另一个是二分称名变量,即按事物的某一性质只能分为相互独立的两类变量,譬如男与女,生与死等等。19解释相关系数时要注意什么1、相关系数常以小数表示。2、正值表示正相关,负值表示负相关。3、注意:完全正相关,完全负相关,零相关。4、判定相关是否密切时,考虑计算相关系数时样本量的大小]①相关系数表明两个变量之间的关系密切程度,比较相关系数时,不能用倍数关系说明。②相关系数的大小表明了两列测量数据相互间的相关程度;绝对值相同的正负相关系数值表示的相关关系程度一样,方向不同。③当两个变量间的关系受其他变量影响时,两者之间可出现伪相关,这时两列变量之间的相关系数没有任何实际意义。④相关关系不是因果关系,相关值较大的两类事物之间,不一定存在因果关系。20·什么是回归分析,回归方程有什么意义回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法;回归方程的意义:x和y之间本来没有严格的关系,也不是对群体中任一个体都适用,而是用一个简练的形式总括了x,y之间的复杂关系的大趋势,使我们能从量的角度认识两个变量之间的依存关系。21·简述相关分析和回归分析的区别和联系1、在回归分析中,y被称为因变量,处在被解释的特殊地位,而在相关分析中,x与y处于平等的地位,即研究x与y的密切程度和研究y与x的密切程度是一致的;2、相关分析中,x与y都是随机变量,而在回归分析中,y是随机变量,x可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定x是非随机的;8\n3、相关分析的研究主要是两个变量之间的密切程度,而回归分析不仅可以揭示x对y的影响大小,还可以由回归方程进行数量上的预测和控制。22·统计推断的基本问题是什么统计推断:通过选取适当的样本作为总体的代表,去推断总体的统计特征;样本要对总体有良好的代表性,关键是找到样本和总体的特定关系,并用数学语言表达出来,也就是建立数学模型。23·什么是随机事件与概率随机试验的每一种结果或随机现象的每一种表现称为随机事件;随机事件发生可能性的大小称为概率。24·概率分布有什么意义25·什么是正态分布,正态分布曲线有什么特点正态分布(Normaldistribution)是一种概率分布。正态分布是具有两个参数μx和σ^2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ^2)。遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。特点:μx—均值,σx—标准差。正态分布概率密度曲线f(x)特点:1,以μx为对称,曲线与X轴间的面积在μx两边各为0.5,2,曲线在μx±σx处有拐点,3,在μx±σx区间的面积为68.26%,在μx±2σx区间的面积为95.44%,在μx±3σx区间的面积为99.73%。26`什么是点估计和区间估计点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。(2)区间估计也是参数估计的一种形式。通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。前者得出的是一个具体的值,后者是一个区间。联系:都是统计学中常用的参数估计方法。27`简述什么是抽样分布抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。(如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。)28·中心极限定理的主要内容是什么?设从均值为μ、方差为σ^2;(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n的正态分布。设随机变量序列X1,X2,、、、Xn,、、、相互独立,均具有相同的数学期望与方差,且E(Xi)=Ui,D(Xi)=Ri^2>0,i=1,2,、、、,令:Yn=X1+X2+、、、+Xn8\nZn=〔Yn-E(Yn)〕/√D(Yn)=∑(Xi-Ui)/√∑Ri^2(i=1,2、、、、n)则称随机变量Zn为随机变量序列X1,X2,、、、,Xn的规范和。29·标准误及其意义标准误(英文:StandardError)衡量对应样本统计量抽样误差大小的尺度。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。此外,还需要特别指出的是,标准误还可以指样本标准差、方差等统计量的标准差,不仅仅只是样本均数的标准差。30·假设检验的思想与步骤假设检验的基本思想是小概率反证法思想。基本依据是“小概率原理”.所谓小概率原理就是:概率很小的随机事件在一次试验中一般不会发生.根据这一原理,我们从H0出发,在一定的显著性水平α下,从总体中抽取一个子样进行检验,在H0成立的条件下,若发现“相应统计量(即随机变量)取到此子样代入统计量后的值”是一个小概率事件,亦即小概率事件在一次试验中发生了,这与“小概率原理”矛盾,所以,此时就拒绝H0并接受H1;反之,就只有被迫接受H0.假设检验的一般步骤1)根据实际问题提出原假设H0与备选假设H1,即说明需要检验的假设的具体内容;2)选择适当的检验统计量,并在原假设H0成立的条件下确定该统计量的分布及原H0的拒绝域的形式;3)按问题的具体要求,选取适当的显著性水平α,并根据统计量的分布查表,确定对应于α的临界值,求出H0的拒绝域;31·什么是原假设和备择假设原假设就是关于样本所代表的总体参数(如平均数、方差、相关系数等)与假设总体参数(如平均数、方差、相关系数等)之间无差异的假设,或者两个以及多个样本所代表的总体参数之间的无差异假设。备择假设是关于样本所代表的总体参数与假设总体参数之间存在差异的假设,或者两个以及多个样本所代表的总体参数之间存在差异假设。32·简述假设检验中零假设和研究假设的作用研究者可以根据数据分析、经验判断或经过周密思考后确定零假设,研究者依据样本信息的计算直接证明零假设是否正确;如果研究者拒绝了零假设,那么就必须用研究假设,并推定研究假设的真实性,然后做出拒绝零假设接受研究假设的统计决策。什么是小概率原理与显著性水平小概率事件:概率很小的事件在一次试验中几乎不可能发生 显著性水平:假设检验运用了小概率原理,事先确定的作为判断的界限,即允许的小概率的标准,称为显著性水平。如果根据命题的原假设所计算出来的概率小于这个标准,就拒绝原假设;大于这个标准则接受原假设。这样显著性水平把概率分布分为两个区间:拒绝区间,接受区间。(通常假设检验时只考虑到了第一类错误,而忽视掉了第二类错误,所以将此时的假设检验称为显著性检验)33.单侧检验和双侧检验有什么不同根据是否强调检验的方向性,将检验分为单侧检验和双侧检验。双侧检验只关心两个总体参数之间是否有差异,而不关心谁大谁小;单侧检验则强调差异的方向性,即关心研究对象是高于还是低于某一总体水平。在实际操作中要根据研究的目的和假设来选择单侧检验还是双侧检验,如果假设中有一参数和另一参数方向性的比较,比如"大于"、"好于"、"差于"等,一般选择单侧检验。如果只是检验两参数之间是否有差异,就选择双侧检验。8\n双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验,一是配对样本t检验。34.统计假设检验的判断法则是什么35.单总体、双总体平均数检验的假设是什么单总体检验:检验一个样本平均数与它的总体平均数之间差异的显著性程度双总体检验:根据两个平均数之差检验与之对应的两个总体平均数之间差异的显著性程度。假设是:两个样本对应的总体平均数之间没有差异的虚无假设36.方差齐性检验的作用是什么方差齐性检验是对控制变量不同水平下各观测变量总体方差是否相等进行检验,是方差分析的重要前提,是方差可加性原则应用的一个条件。方差齐性检验是对两样本方差是否相同进行的检验。方差齐性检验和两样本平均数的差异性检验在假设检验的基本思想上是没有什么差异性的。只是所选择的抽样分布不一样。方差齐性检验所选择的抽样分布为F分布38.对平均数进行差异显著性检验时,需要考虑的因素有哪些?在考虑总体分布和总体方差的基础上,还要分析两个总体方差是否已一致,、两个样本是否相关以及两个样本容量是否相同等一系列条件。39.简单叙述T检验的条件。t检验的适用条件(1)已知一个总体均数;(2)可得到一个样本均数及该样本标准差;(3)样本来自正态或近似正态总体。40.统计假设检验中的两类错误是什么?在进行假设检验时提出原假设和备择假设,原假设实际上是正确的,但我们做出的决定是拒绝原假设,此类错误称为第一类错误。原假设实际上是不正确的,但是我们却做出了接受原假设的决定,此类错误称为第二类错误。第一类错误(Ⅰ类错误)也称为α错误,是指当虚无假设(H0)正确时,而拒绝H0所犯的错误。这意味着研究者的结论并不正确,即观察到了实际上并不存在的处理效应。可能产生原因:1、样本中极端数值。2、采用决策标准较宽松。第二类错误(Ⅱ类错误)也称为β错误,是指虚无假设错误时,反而接受虚无假设的情况,即没有观察到存在的处理效应。可能产生的原因:1、实验设计不灵敏。2、样本数据变异性过大。3、处理效应本身比较小。41.方差分析的基本思想和作用是什么方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。经过方差分析若拒绝了检验假设,只能说明多个样本总体均值不相等或不全相等。若要得到各组均值间更详细的信息,应在方差分析的基础上进行多个样本均值的两两比较。多个样本均值间两两比较:多个样本均值间两两比较常用q检验的方法,即Newman-kueuls法,其基本步骤为:建立检验假设-->样本均值排序-->计算q值-->查q界值表判断结果。8\n多个实验组与一个对照组均值间两两比较:多个实验组与一个对照组均值间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q'界值表。42.简述方差分析的过程(1)提出假设(2)计算平方和(3)计算自由度(4)计算均方(5)计算F值并作统计决断(6)列出方差分析表43.试比较方差分析与回归分析的异同方差分析和回归分析总体上都属于一个类别,一般线性模型(generallinearmodel,GLM)。从资料类型来看,方差分析的因变量是连续型资料,自变量是分类变量,一般都以组别的形式出现。回归分析的因变量是连续型资料,自变量既可以是分类资料,也可以是连续型资料,也可以两种资料都有。从目的来看,大多数方差分析的目的都是比较组间差异,比如3组人群的身高是都有差异等。而回归分析主要是看自变量对因变量的影响,或因变量是否随着自变量的变化而变化,如血压是否随年龄而变化等。44.χ²检验的概念和思想是什么卡方检验的统计量是卡方值。卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题 卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。 该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别45.什么是适合性检验,其原假设是什么适合性检验:就是检验某个类别变量的实际数据分布是否与某种理论分布相吻合。原假设:Ho:Fo=Fe或者“该类别变量的数据分布与理论假设相同”46.什么是独立性检验,其原假设是什么独立性检验:统计学的一种检验方式。与适合性检验同属于X2检验,它是根据次数资料判断两类因子彼此相关或相互独立的假设检验原假设:两个变量之间彼此独立而互不相关联47.各种假设检验情况下拒绝原假设的依据是什么?(统计量落入的区间是什么?如双总体Z检验时,拒绝H0的条件是:|Z|>Zα=1.96)某同学语文考了90分,数学考了80分,他的语文比数学考得好一些,这句话对吗?如果已知两考生的各科高考成绩,要客观判断两名考生的高考成绩哪一个更好,可以采用什么方法?某研究者欲研究学习动机和学习成绩之间的关系,用动机量表测得学生的学习动机,再用标准化考试测得学业成绩,两组数据均可视为连续变量的数据,问应当用什么方法?8\n为研究职业类型(工人、农民、教师、公务员、商人)对生活满意度(满意、不满意)是否有影响,应选用什么样的统计方法?某校长根据自己的经验预测今年高考全区的平均分为530分,全区随机抽取100名毕业生高考平均成绩为520分,标准差42。问该校长的预测是否准确?某研究者想考查教师教学效能感和教师教学效果之间的数量关系,分别用量表测得两组数据均可视为连续正态数据。从某地区的六岁儿童中随机抽取男童30人,测量身高,平均数为114cm,标准差为5cm,抽取女童27人,平均身高为112.5cm,标准差为6.5cm,问该地区六岁男女儿童身高是否有显著差异?16名小学生随机分成4组,每组被试分别解决加、减、乘、除,各10道算术问题,记录下平均解题时间,问应当用什么方法分析小学生解决这四类算术问题的解题时间有否显著差异。要研究高校教师的职称是否影响学生评教的分数,可能用到什么统计方法,说明理由。二、计算题1.某校规定教师的教学效果评定由三方面的成绩组成,学生评分占0.3,同行评分占0.4,领导及专家评分占0.3。某位老师的三种分数分别为94分,72分和79分,求该教师的总平均分数。2.有100名学生是从全地区中随机抽选出来的,他们在一次英语水平测试中平均得分73分,标准差8分,求全区平均分数99%的置信区间。3.下表是甲、乙两个学生三门学科的成绩及该班的平均成绩和标准差。问甲、乙两生谁考得更好? 考试科目甲乙班平均成绩班标准差物理5373654化学7870746数学82707112总和2132134.某中学二年级学生中随机抽取15人,学期初与学期末测试他们的某项能力,取得的成绩见下表。试用等级相关法计算两次测验的相关系数。 期初成绩 7185657679786874689078 67647280期末成绩75836678847269776792846865728258\n.一项研究考察长跑运动员肺活量的增加如何依赖于每月锻炼时数,测得7名运动员的数据如表所示,试求肺活量与锻炼时数之间的数量关系,并进行显著性检验。每月锻炼时数405060708090100肺活量增量5006006008007507509006.某年级语文平均成绩为75分,标准差为7分。现从中随机抽取40人进行新教法实验,实验结束后其测验的平均成绩为82分,标准差为6.5分。是否新教法比原来的教法好?7.从某地区10岁儿童中随机抽取男生30人,测得其平均体重为29kg;抽取女生36人,测得其平均体重为27kg。根据已有资料,该地区10岁男孩的体重标准差为3.7kg,女孩的体重标准差为4.1kg。问能否根据这次抽查结果断定该地区男女学生的体重有显著差异?8.某教师为考察复习方法对学生记忆单词效果的影响,将20名学生随机分成4组,每组5人采用一种复习方法,学生学完一定数量单词之后,在规定时间内进行复习,然后进行测试。结果见表。问各种方法的效果是否有差异?并将各种复习方法按效果好坏排序。集中循环复习820121410分段循环复习3926314540逐个击破式复习1721201720梯度复习32232825299.某校领导从该校中随机抽取84名教职工,进行关于实施新的整体改革方案的民意测验。结果赞成方案者38人,反对者21人,不表态者25人。问持各种不同态度的人数是否有显著差异?10.某县教育主管部门为了检验甲、乙两校初中二年级学生的数学水平,从甲、乙两校的初二学生中,分别随机抽取55和45人,进行统一试题的数学测验。测验结果为:甲校有35人及格,20人不及格;乙校有30人及格,15人不及格。试检验甲、乙两校初二学生的数学成绩的差异是否显著。8查看更多