《教育统计学》ppt课件

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

《教育统计学》ppt课件

教育测量与评价2011.02-11.06教材:华东师范大学 王孝玲编著课时数:64-72课时,3-4学分。章节数:共十五章,三大部分描述统计,推断统计,抽样设计教育统计学huangrongliang@nbu.edu.cn695013\n两个理论基础“凡物的存在必有其数量”--(美国心理学家桑代克1875-1949)“凡有数量的东西都可以测量”--(美国测量学者麦柯尔)\n复杂的因果关系:随机现象在因果关系复杂的条件下无法根据已知的有限原因精确地预测结果因为即使在已知条件相同的情况下,每一次预测也都是有偏差的随机现象\n学生成绩心理测验得分候车人数作物产量产品质量收入支出等等\n随机现象在一定的条件下,可能出现也可能不出现,可能这样出现,也可能那样出现的一类现象。特征:条件不能完全决定结果。研究内容:出现的可能性有多大,不出现的可能性有多大,或者这样出现的可能性有多大,那样出现的可能性有多大。\n数量差异性与数量规律性数量差异性:一定条件下,出现可能不一样;数量规律性:通过大量试验和观察,总结出随机现象的规律。数量规律性:平均数;方差、标准差;比率、百分比;相关系数等。非数量规律性:数量分布\n二、统计学和教育统计学统计学就是研究随机现象的数量规律性的一门数学分支。1、统计学含义:Statistics原意是国力、国势定义1:统计学是研究统计原理和方法的科学。P1定义2:统计学是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。研究什么(对象)、怎么做?干什么(目的)“研究搜集、整理、分析数字资料推断“总体特征”原理和方法部分推断全体\n2、教育统计学的含义:教育统计学是运用数理统计的原理和方式研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。(教育与心理统计学)\n三、统计学与教育统计学的内容数理统计学1.统计学        教育统计学应用统计学 农业统计学人口统计学2.统计学或教育统计学具体内容:\n三、统计学与教育统计学的内容统教计育学统或计学描述统计推断统计实验设计统计图表集中量数差异量数相关分析统计估计假设检验参数估计非参数估计点估计区间估计参数检验非参数检验样本选择与分配实验误差分析因子分析……方差分析回归分析抽样设计\n三、统计学与教育统计学的内容1、描述统计(descriptivestatistics):对已获得的数据进行整理、概括,显现其分布特征的统计方法。P2(主要是对样本数据的处理)2、推断统计(inferentialstatistics):根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测的统计方法。(在一定风险下,部分推断全体)3、实验设计(experimentalstatistics):为提示实验中自变量与因变量的关系,在实验之前所制订的实验计划。\n1.确定现象2.随机现象,随机事件,随机变量。*统计处理的变量都是随机变量。五、统计学中几个基本概念3.个体(Case)、总体(Population)与样本(Sample)总体--无限总体与有限总体;N表示数目样本--大样本(n>30)与小样本(n≤30)总体与样本是相对的4.统计量(Statistic)与参数(Parameter)统计量:样本上的数字特征;参数:总体上的各种数字特征。\n总体样本统计量描述统计作出推断随机抽样描述\n总体Population.样本Sample个体Case变量Vari.XNxnxi容量SizeNni结果Value参数Parameter统计量Statistic数据Data统计方法Stat.推断统计Inf.Stat.描述统计Des.Stat.计数Count总体、样本与个体\n一、统计数据来源数据种类特性:统计分类经常性资料专题性资料:报表教育调查教育实验:二分法和四分法变异性、规律性\n1、按数据观测方法和来源:数据种类(数据的水平)二分法点计数据(计数数据)度量数据(测量数据)2、按数学属性:间断数据(离散、不连续)连续数据(连续型随机变量)▲(百分制的分数理论上讲是间断的,但由于数据密度大较多,实际处理时归入连续型数据处理,连续型数据处理较方便,类似以后也有,总体比率用正态分布处理。)\n间断型随机变量取值个数有限的数据人数个数名次五分制得分……\n连续型随机变量取值个数无限的数据身高体重智商时间长短百分制得分……问题:为什么要进行数据分类?数据有不同属性(可分);不同类型数据用不同统计方法处理。\n1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)。2、按数学属性:间断(离散)数据与连续数据。数据种类(数据的水平)四分法3、按数据测量水平称名数据等级(顺序)数据等距数据等比数据(比率数据)\n(标题、表号、标目、线条、数字、表注)六部分;(标题、图号、标目、图形、图注)五个方面。简单表、分组表(1个标志)、复合表(2个及以上标志 直条图(条形图)、圆形图、线形图、频数分布图多变量图:散点图、雷达图、脸谱图等二、统计表、统计图\n例1.小教本011(30名)教育统计学单元考试成绩58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。频数分布表制作步骤\n58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。一般不少于5组,也不要超过15组。组距指的是每一个组内包含的距离(用i表示)斯特奇斯(H.A.Sturges)根据经验公式:本例为i=7.11,将组距调节为10,即每10分为一个组。组数:42/10=4.2,应该分5组。1)求全距R:全距指的是全部观察值中最大值与最小值之差。R=xmax-xmin=100-58=42。2)决定组数k和组距i。K=R/i\n频数分布表制作步骤3)决定组限组限就是每一组的起点值和终点值。4)登记频数小教本011教育统计学单元考试学生成绩频数、累积频数分布表分数50-60-70-80-90-合计组中值5565758595频数14551530累积频数15101530\n小教本011教育统计学单元考试学生成绩频数分布直方图\n第三章 常用的特征量1.集中量:平均数、中位数、众数;百分位数2.差异量:全距、四分位距、平均差、方差      和标准差、差异系数;百分位距。3.地位量:4.相关量:5.分布形态量:偏态量、峰态量。\n集中量集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。集中量包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。\n算术平均数算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。样本平均数总体平均数\n算术平均数的优点反应灵敏;严密确定,简明易懂,计算方便;适合代数运算;受抽样变动的影响较小;样本算术平均数是总体平均数的最好估计值\n算术平均数的缺点易受两极端数值(极大或极小)的影响;一组数据中某个数值的大小不够确切时就无法计算其算术平均数。这种“两极端数值”存在的问题,可用什么办法解决?\n中位数(Md)中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。中位数的原始数值计算方法:单数:121415151718202324:17双数:12141515171820232425:17.5\n中位数的应用及其优缺点中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况:(1)一组数据中有特大或特小两极端数值时;(2)一组数据中有个别数据不确切时;(3)资料属于等级性质时。\n众数(Mo)众数是集中量的一种指标。对众数有理论众数及粗略众数两种定义方法理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。\n众数的优缺点众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用:当需要快速而粗略地找出一组数据的代表值时;当需要利用算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。\n正态正偏态负偏态P34\n加权平均数加权平均数是不同比重数据(或平均数)的平均数。计算公式为:\n二、差异量1.差异量:表示一组数据变异程度或离散程度的量。2.类型:全距、四分位距、平均差、方差和标准差、    差异系数;百分位距。注:差异量越大表明数据越参差不齐,分布范围越广。\n二、差异量1、全距(Range):R=xmax-xmin例110、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。(16)3、百分位距PD:P93-P7P90-P104、平均差:5、方差和标准差:2、四分位距QD=(Q3-Q1)/2=99-10=89\n二、差异量例110、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。5、方差和标准差:●计算方法:1)原始数据法;2)计算工具法;3)其他1)原始数据法:3)计算工具法:4)数学软件:spss等2)频数分布表计算法:●问题讨论:一组数据的标准差,大好呢?还是小好?\n二、差异量6、相对差异量:差异系数用途:1)比较不同单位资料的差异程度(单位不同)2)比较单位相同而平均数相差较大(对象不同)3)判断特殊差异情况正常范围:5%≤CV≤35%不正常:CV>35%平均数无意义CV<5%数值计算正确性应用1)非零点;条件:2)等比量表。\n三、分布形态量偏态量与峰态量1、偏态量SK=0:分布对称SK≠0:偏  态SK>0:正偏SK<0:负偏2、峰态量Ku=0.263:正态峰Ku≠0.263:非正态Ku>0.263:低阔峰Ku<0.263:高狭峰\n偏态量负偏正偏\n第五章 概率及概率分布概率的一般概念概率分布:离散分布与连续分布        二项分布与正态分布正态曲线的面积与纵线正态分布在测量上的应用\n5.1概率(probability)的一般概念一、概率的定义 二、概率的性质●0≤P(A)≤1●P(A)=0:不可能事件●P(A)=1:必然事件三、概率的加法和乘法▲小概率事件A:p(A)≤0.05▲小概率原理:小概率事件在一次试验中,几乎不可能发生。\n5.2二项分布(bionimaldistribution)二、二项分布函数2.二项分布函数在n次试验中成功事件P恰好出现x次的概率例 在男生占2/5的学校中随机抽取10个学生,问正好抽到4个男生的概率是多少?至多抽到2个男生的概率是多少?1)是否是二项试验?2)共试验次数?3)所求随机事件出现次数?\n例 在男生占2/5的学校中随机抽取10个学生,问正好抽到4个男生的概率是多少?至多抽到2个男生的概率是多少?解:随机抽取一个学生即随机试验一次,因为试验结果只有两个:“男生”与“女生”,而且抽到男生与抽到女生是没有关系的,故此试验是贝努利试验。正好抽到4个男生的概率:至多抽到2个男生的概率是:二项分布(bionimaldistribution)\n5.2二项分布(bionimaldistribution)三、二项分布图二项分布的形态:P=q:对称p≠q:偏态1)当n→∞时,二项分布→正态分布;2)当np≥5且nq≥5时,二项分布开始接近正态分布。\n5.2二项分布(bionimaldistribution)四、二项分布的平均数和标准差当二项分布开始接近正态分布时,在n次二项试验中成功事件出现的平均数和标准差是:例 从我们班中随机抽取10名同学,从理论上讲,平均应抽到男生多少个?标准差是多少?五、二项分布的应用1.求n次二项试验中成功事件出现的概率;2.判断试验结果的机遇性与真实性的界限(1的反向)。\n正态分布的图形特点正态分布的密度曲线是一条关于对称的钟形曲线.特点是“两头小,中间大,左右对称”.即,取x=μ附近值的可能性大,取偏离x=μ越远的值的可能性越小。\n5.3正态分布(normaldistribution)二、正态曲线的面积与纵线2.标准正态曲线下的面积及Z值计算:2)查表法A、已知Z值求面积P:a)求P(0z1)或P(z<-z1):c)求P(z11)、P(z<-1.96)、P(z<1.96)例3,P(130:B.小样本n≤30:例.从某小学三年级随机抽取17名学生,其阅读能力的平均得分为29.92,标准差为4.1。试估计该校三年级阅读能力总体平均数95%和99%置信区间。问题:在1908年t分布理论提出前,怎样解决σ未知的估计问题?\n6.2总体平均数的估计二、正态总体均值μ的区间估计一)总体标准差 已知:Z估计二)总体标准差 未知:t估计\n总体平均数区间估计一、正态总体标准差 已知:Z估计三、正态总体标准差 未知:t估计1.小样本2.大样本t估计或近似Z估计\n6.3假设检验(本章节内容)假设检验的有关概念假设检验基本思路假设检验基本步骤及二类错误总体平均数假设检验(某总体平均水平有无显著变化?)\n6.3假设检验一、假设检验有关概念1.假设与假设检验2.小概率事件及小概率原理3.假设检验基本思路4.假设检验的一般步骤:1)提出假设:2)选择检验统计量并计算其值:Z检验或t检验3)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断:拒绝区域接受区域\n6.3假设检验例1某班进行比奈智力测验,结果   ,已知比奈测验的常模,问该班智力水平(不是这一次的测验结果)是否确实与常模水平有差异?n=1001)提出假设:2)选择检验统计量并计算其值:因为总体标准差σ已知,故采用Z检验。所以,3)选择检验的形式:因为没有资料表明,该班智力水平是否高于或低于常模水平,所以采用双侧检验。\n4)统计决断:因为Z=2即该班智力水平与常模水平,有显著性差异。所以0.01≤p<0.05,<2.58=Z0.01/2,Z0.05/2=1.960.05,所以接受H0,而拒绝H1。即该校初三英语平均成绩与全区水平没有显著差异。1-0.05t=1.47\n6.3假设检验一、假设检验有关概念1.假设与假设检验2.小概率事件及小概率原理3.假设检验基本思路4.假设检验的一般步骤:5.假设检验的二类错误:1)第一类错误:    “以真为假” 弃真错误2)第二类错误:    “以假为真” 取伪错误假设检验是概率条件下的反证法在假设检验中,一般都首先控制第一类错误。\n6.3假设检验二、平均数的显著性检验小结1)提出假设:2)选择检验统计量并计算其值:Z检验或t检验3)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断:正态总体\n第七章平均数差异的显著性检验1.需要考虑的问题?2.需要知道什么?3.共同点:显著性差异检验4.不同点:两个样本\n需考虑的问题:两总体是否正态分布;两样本是否相关两总体方差σ12和σ22是否已知;如果未知,则是否σ12=σ22;两样本为大样本还是小样本。\n平均数差异的抽样分布一、正态总体 相关样本r已知\n平均数差异的抽样分布一、正态总体 相关样本r已知\n1)提出假设:2)选择检验统计量并计算其值:Z检验或t检验或3)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断:平均数差异显著性检验步骤差异显著性检验的主要过程:1、确定两总体(样本)是否相关;2、根据问题要求,确定检验形式(双侧或单侧);3、看总体标准差是否已知;(已知Z检验)4、独立且σ未知,方差是否齐性;(齐性t、不齐性t’)5、看是大样本还是小样本;6、判断样本Z、t或t’值是否落入小概率区域;7、若落入小概率区域,还需确定差异的显著性级别。\n7.2相关样本平均数差异的显著性检验一、配对组的情况(等组实验)例1:为了揭示小学二年级的两种识字教学法是否有显著性差异,根据学生的智力水平、努力程度、识字量多少、家庭辅导力量等条件基本相同的原则,将学生配成10对,然后把每对学生随机地分入实验组和对照组。实验组施以分散识字法,而对照组施以集中识字法,后期统一测验如下表。(79.5\71)(3.459)\n1)提出假设:2)选择检验统计量并计算其值:因为相关样本且总体标准差未知,故采用t检验。所以,3)选择检验的形式:因为没有资料可以说明,两种教学方法哪一种效果好,所以采用双侧检验。79.5、71和9.12、9.94r=0.704样本均值和标准差:=3.46\n4)统计决断:因为n=10,所以df=n-1=9,查t表得因为t=3.46>3.25=t(9)0.01/2,所以p<0.01,所以在0.01显著性水平上接受H1,而拒绝H0。即这两种教学方法有极其显著性的差异。因为t=3.46>2.262=t(9)0.05/2,需进一步查t(9)0.01/2,**\n平均数差异的抽样分布二、正态总体 独立样本r=0\n贝赫兰斯-费舍(Fisher)问题,直至1957年柯克兰与柯克斯解决方案最佳。\n7.4方差齐性检验一、F分布由例1、2可知,独立样本,总体标准差未知条件下,进行差异显著性检验,首先首先要进行总体方差齐性检验。用总体标准差估计值S总体标准差σ未知下,怎样判断?即只要检验无显著性差异即可F检验,英国统计学家费舍R.A.Fisher首创\n第十章χ2检验\n10.1χ2分布及χ2检验一、χ2检验的特点●χ2检验是根据样本频数分布,对总体分布进行推断的假设检验。●χ2检验与测量数据假设检验的区别:测量数据假设检验数据属性总体分布检验对象χ2检验连续型间断型正态分布未知总体参数非总体参数\n10.1χ2分布及χ2检验一、χ2检验的特点二、χ2检验的统计量三、χ2的抽样分布四、χ2检验应用例1从某大学随机抽取54位老年教师,其中健康状况属于好的有15人,中等的有23人,差的有16人,问该校老年教师健康状况好、中、差的人数比率是否是1:2:1?解:1、提出假设H0:健康状况好、中、差的人数比率是1:2:1H1:健康状况好、中、差的人数比率不是1:2:1\n2、选择统计量并计算∵实际频数:∴理论频数:ft1=54×1/4=13.5,ft2=54×2/4=27,ft3=54×1/4=13.5。根据零假设,=1.223、统计决断∵df=k-1=2,查χ2值表,∴∵χ2=1.22<,∴P>0.05,根据χ2检验统计决断规则,所以在0.05显著水平上保留零假设,拒绝备择假设。即该校老年教师的健康状况,好、中、差人数的比率是1:2:1。\nχ2检验能解决的问题调查人们对于某社会现象的看法,结果如下。问三种态度人数有无显著差异?同质性检验赞成不置可否反对11009011022005050310009001100\nχ2检验能解决的问题表中314名学生的考试成绩是否服从正态分布?数据正态性的检验组别45-4950-5455-5960-6465-6970-7475-7980-8485-8990-9495-99次数101822404672442818124\nχ2检验能解决的问题对3627名中小学生的心理测验得到如下结果(部分),问性格类型与智力水平之间有无关联?相关性(或独立性)检验外倾中间内倾智力优秀364012智力落后469288\n第二节 单向表的χ2检验把实得的点计数据按一种分类标准编制成表就是单向表(单因素)赞成不置可否反对10090110\n二、一个自由度的χ2检验当df=1,其中只要有一个组的理论值ft<5,就要运用亚茨(Yates)连续性校正法:\n例.某区中学团员比例为0.8,现从该区某中学随机抽取20人,其中团员12人,问该校团员的比例与全区是否相同?(答案:3.83<3.84,P>0.05)ft1=20×0.8=16ft2=20×0.2=4实际频数:理论频数:<5且df=2-1=1,团员非团员\n三、次数分布正态性的χ2检验P177自由度为K-3\n第三节 双向表的χ2检验在双向表的χ2检验中,如果要判断两种分类特征,即两个因素之间是否有依从关系,这种检验称为独立性χ2检验。\n愿意不愿意未定总和nr上18271055中20192059下1871136总和nc565341150例1家庭经济情况属于上、中、下的高三毕业生,对于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表。问学生是否愿意报告师范大学与家庭经济情况是否有关系?\n解:1、提出假设H0:学生是否愿意报考师范的态度与家庭经济状况无关系H1:学生是否愿意报考师范的态度与家庭经济状况有关系例1家庭经济情况属于上、中、下的高三毕业生,对于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表。问学生是否愿意报告师范大学与家庭经济情况是否有关系?2、选择统计量并计算i=1,2,3j=1,2,3根据零假设及学生对报考师范大学的态度与家庭经济状况之间关系的双向表,可计算出相应理论频数。\n愿意不愿意未定总和nr上18(20.53)27(19.43)10(15.03)55中20(22.03)19(20.85)20(16.13)59下18(13.44)7(12.72)11(9.84)36总和nc565341150=10.48\n3、统计决断∴df=(r-1)(c-1)查χ2值表,,∴0.01
查看更多

相关文章