统计学基础复习提纲

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学基础复习提纲

1.学位考试一、心理统计学的应用2010年考试(单项选样题)11•测得某大学牛组和专业篮球运动员组被试的体重和身高,已知体重与身高存在高相关,若要比较两组被试体重的差异,最合适的统计方法是。A.t检验B.Z检验C.方差分析D.协方差分析12.将一组数据按数值大小排序,位于序列中间的是。A.众数B.中数C.算术平均数D.儿何平均数15.以摄氏温度计测得的温度属于。A.等比数据B.等级数据C.分类数据D.等距数据16.若已建立了用某种能力测验分数(X)预测学牛数学成绩(Y)的直线冋归方程,月•已知两者的积差相关系数为0.80,则该回归方程的测定系数应为。A.0.80B.0.64C.0.40D.0.3217.由5名教师对某班级30名学生的行为表现做等级评定,若要考杏这5名教师评定结果的一致性,应计算。A.积差相关系数B.多系列相关系数C.肯徳尔和谐系数D.斯皮尔曼等级相关系数18.标准正态分布的平均数与标准差分别为:A.1和0B・1和1C.0和0D.0和1•、心理统计学的应用描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法。冃的是将大量零散的、杂乱无序的数字资料进行整理、归纳、简缩、概括,使事物的全貌及其分布特征清晰、明确地显现出來。实践应用制统计表、统计图、描述数量关系。推断统计:根据样木所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测的统计方法。目的根据已知的情况,在一定概率的意义上估计、推测未知的情况。实践应用通过样本的信息对总体的情况做推断。\n内容包括总体参数估计和假设检验。(实验者为了揭示实验屮自变量与因变量之间的关系,)在实验之前所制订的实验I」的为了揭示实验中白变最与因变最之间的关系。实践应用用统计学的原理和方法來设计实验。心理统计的基本概念总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体。个体(case):指总体中进行统计观测的每一个对彖,是统计的基本单位。样本(sample):按统计的原则和方法从总体屮随机抽取一部分个体作为代表来进行肓接的观察,这些若干个体的研究对象叫样木。样本含量(samplesize):样木所含的个体数。变量nJ以测虽的任何特征或属性Anycharacteristicorattributethatcanbemeasured。(不同个体结果町能不同)统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。随机变量在概率论中称变量为随机变量。即川來表示随机现彖的变量,一般用大写的X或Y表示随机变量。随机变虽所取得的值,称为观测值。一个随机变屋可以冇许多个观测值。心理统计的数据类型第一种分类:根据数据反映的测量水平(美国心理学家Stevens)1.称名数据(NominalData),指说明某一事物与其他事物在属性上的不同或类别上的差异,具有独立的分类单位,一般取整数形式。比如性别、颜色类别、人口数等。2.顺序数据(OrdinalData),既无相等单位也无绝对零点的数据。如等级评定、喜爱程度、能力等级等。不能进行加减乘除计算。3.等距数据(Intei-valData),有相等单位,但无绝对零点的数据。如温度、智商等。可加减,不能乘除。4.比率数据(RatioData),既冇相等单位又冇绝对零点。比如身高、体重、反应时间等。可加减乘除计算。第二种分类:根据数据是否有连续性:离散数据(DiscreteData),指乂称为不连续数据(ContinuousData),这类数据在任何两个数据点Z间所取的个数是有限的。比如球赛比分、班级人数等。连续数据(ContinuousData),无指任意两点数据Z间都可以细分出无限多个大小不同的数值。比如年龄、长度、重量等。\n第三种分类:根据数据Z间有无缝隙(gap):离散型变量(discrete)(有•缝隙)连续型变量(continuous)(无缝隙)参数统计虽(parameterandstatistic)总体如总体均数、标准差用希腊字母分别记为卩、m固定的常数J抽取部分观察单位样本统计量如样本均数、标准差采用拉丁字母分别记为X、SJ推断参数参数附近波动的随机变屋-频率与概率frequencyandprobability频率:样木的实际发生率。设在相同条件下,独立垂复进行n次试验,事件A出现f次,则事件A出现的频率为佈。概率:随机事件发生的可能性人小,用人写的P表示;取值[0,l]o频率与概率间的关系:1.样本频率总是围绕概率上下波动2.样本含量n越大,波动幅度越小,频率越接近概率。必然事件:P=1不可能事件:P=0随机事件:00),均值在中位数右侧,冇较长的右尾。二^偏态系数为正.(a)负偏态偏态系数为负偏态系数为负(负偏态gl<0),均值在中位数左侧,分布有较长的左尾。正态分布偏态系数为零,均值与中位数重合。上二偏态系数为零.如果偏态系数的绝对值大丁表明该变量的分布与疋态分布有显著不同。峰度衡量实数随机变量概率分布的峰态。\n止态分布的峰态系数为零。2)平峰峰态系数为负如果峰态系数为负,表示观测值比正态分布较少地聚集在均值附近。如果峰态系数为正,表示观测值比正态分布的较多地聚集在均值附近。(C)尖峰峰态系数为正7相对地位量数(m峰态系数跟z分数的四次方的均值密切相关(公式略)casurcofrelativeposition)某一样品在样本中所占的地位或位置O百分等级标准分数7.1百分等级和百分位数如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。中位数四分位数7.2标准分数以标准差为单位表示一个原始分数在团体中所处的相对位置,即原始分数在均值以以下几个标准差的位置。、描述统计数字图形&表格\n1统计图1.1常用统计图条形图(barchart)线形图(linechart)时序图(sequencechart)饼图(picchart)散点图(scatterplot)盒须图(box-and-whiskerplot)茎叶图(stem-and-leafplot)直方图(histogram)多边形图(polygon)a条形图:主要用于定性数据足任®(瑪旳多少取恂収比例b直方图与多边图:主要用于定量数据C线形图D时序图:反应事物变化趋势f散点图:两个变量的变化关系和变化方向g盒须图(箱型图):五数综合O茎叶图1.2“欺骗眼睛”的统计图数据不会说谎,但是数据的呈现方式却会诱导人们做出不同的判断或结论。集中量用来表现数据资料的典型水平或集中趋势。常用的集屮量包括算术平均数、加权平均数、屮位数和众数等等。一、算术平均数算术平均数一般简称为平均数、均数、均值—•般用M,或者用X表示。算术平均数是最常用的集中量。算术平均数的计算公式略\n2、算术平均数的意义算术平均数是应用最普遍的一种集中量。它是“真值”(truescore)的最佳估计值。真值是反映某种现象的真实水平的分数。由于测量过程小的各种偶然因索的影响,真值往往很难得到。在实际测量屮,往往采用“多次测最,取平均数”的方法,用平均数去估计真值。3、算术平均数的优缺点算术平均数具备一个良好的集中量所应具备的一些特点:反应灵敏、有公式严密确定、简明易懂、适合代数运算等等,因此是一个最帘用的集屮量。主要不足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。4、计算和应用算术平均数的原贝同质性原则:算术平均数只能用于表示同类数据的集屮趋势。平均数为个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个休的数据。平均数厂标准差、方差和结合原则:描述一组数据吋既要分析其集中趋势,也要分析离散程度。二、中位数中位数(median)乂称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。T•般用Md或Mdn表示。百分位数是位于依一淀顺序排列的一组数据屮某一百分位置的数值,一般用Pp表/JiO3.中位数的特点及应用中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:一纽数据中冇极端数据时;-组数据中冇个别数据不确切、不清楚时;资料属于等级性质时。三.众数众数用Mo表示,冇两种定义:理论众数是指与频数分布Illi线最高点相对应的横坐标上的一点;\n粗略众数是一组数据中出现次数最多的那个数。众数也是一种集中量,也可用来表示一组数据的集中趋势。1.众数的计算方法观察法寻找粗略众数未分纟R数据中出现次数最多的数即为众数。次数分布表中,频数最多那一组数据的纟fl屮值,即为众数。公式法计算理论众数的近似值用公式计算的众数称为理论众数。一般在心理与教冇统计中常用的公式有皮尔逊的经验公式和金氏插补法公式。2.众数的优缺点众数的概念简单易懂,但比较粗略,不能灵敏地反映一组数据的变化,而且不适合进一步代数运算。一燉用于类别变量或等级变量的资料。4.算术平均数、屮位数、众数三者的关系在正态分布中:X=Md=Mo在正偏态分布中:X>Md>Mo在负偏态分布中:X
查看更多

相关文章