- 2022-09-01 发布 |
- 37.5 KB |
- 13页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
体育统计学复习资料
第一章绪论1.体育统计学的定义是一门将概率论和数理统计的理论与方法应用于体育领域,为体育实践提供解决问题的方法的工具学科。属方法论学科范畴。1.总体:根据统计研究的具体研究目的而确定的同质对象的全体。样本:根据需要与可能从总体中抽取部分研究对象所组成的子集。个体;组成总体的每个基本单位,即被研究对象的单个观测值。2.样本容量(含量):样本中所含个体的数目。记为:“n”。3.总体容量:总体中所含个体的数目。记为:“N”。4.指标:对于自然科学研究者来说,是在实验观察中用来指示(反映)研究对象中某些特征的可被研究者或仪器感知的一种现象标志。5.统计量:由样本所得,关于样本特征的统计指标。6.有效数字:通常将仅保留末一位估计数字其余数字为准确数的数字称为有效数字。统计误差:统计分析过程中产生的数据与真值之间的差距。分为两大类:测量误差和抽样误差。7.系统误差:由于实验仪器、操作人员的操作水平、以及实验环境等因素产生的误差。1.研究设计:确定研究方向―→选择课题―→作出研究设计(基本过程)调查设计(问卷调查、专家访问、文献资料等)研究设计{试验设计2.对试验设计的几点要求:1)所取的每个试验对象的测量值,不能有系统误差。2)应该选取适当的试验指标(价值)。3)所测得的数据应能找到相应的数理统计方法进行分析,使得所取数据能够满足统计分析的基本模型。3.数据的收集应注意的问题:1)保证资料的完整性、有效性和可能性。2)保证样本的代表性(遵循随机抽样原则)。附:几种常用的随机抽样方法1)单纯随机抽样法(抽签法、随机数表法)2)机械抽样3)分层抽样(类型抽样)4)整群抽样第二节资料的整理频率:(在统计学中)是指在一次试验过程中,某事件发生的次数与样本容量的比值。一、资料的审核审核数据资料的准确性和完整性。步骤如下:1.初审2.逻辑检查3.复核二、频数分布表和频数直方图的制作整理步骤如下:1.求极差2.确定组数与组距3.确定分组点及各组的上下限4.整理频数分布表5.绘制频数直方图\n第三章样本特征数第一节集中位置量数一、定义:统计学中定义为:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。二、种类:1.中位数:2.众数:3.平均数:第二节离中位置量数统计学中将离中位置量数定义为:描述一群性质相同的观察值的离散程度的统计指标。二、种类:极差、绝对差、平均差、方差、标准差、变异系数。1.极差:2.绝对差:指所有样本观测值与平均数之差的绝对值的和。3.平均差:指所有样本观测值与平均数之差的绝对值的和的平均数。4.标准差:方差的正平方根。开平方根的笔算方法(拓宽内容):1)以小数点为基点,将数据每两位向两边分段。如:12`34.56`702)然后由最高位开始估算(乘方和乘法)3)每段两位数字一起带下4)从第二位“商”的数字起,必须将以前的“商”的所有数字先乘以“20”,然后再考虑所上的“商”。依次向下……例:求=?一、变异系数1.定义:指同一样本的标准差与平均数的比值。记为“CV”.CV=2.意义:用于比较不同指标间数据的变化程度。结论:CV值大,说明数据的变化程度大;CV值小,说明数据的差异小。第四节平均数和标准差在体育实践中的应用一.可以作为选择参赛运动员的依据(和)二.变异系数在稳定性研究中的应用和大,稳定性差;和小,则稳定性高。三.“法”在原始数据逻辑审核中的应用第四章正态分布第一节概率及概率分布1.随机事件:是对于随机现象的一次观测结果。2.随机变量——随机事件的数量化。1)定义(描述性的):当用一个变量来表示随机试验的结果时,这个变量称为随机变量。\n1)频率:某事件A在n次试验中出现V次,则V/n称为事件A的频率。2)概率(描述性定义):随机事件A的频率随着试验次数的变化而变化,当时,就越来越趋近于一个常数m,则这个常数m称为随机事件A的概率。记为,即:(n→∞)1.小概率事件原则:在统计学中,一般将≤0.05的事件称为小概率事件,小概率事件在一次试验中被看作为不可能事件。2.古典概型概率的计算:1)古典概型是指能够同时满足以下两个条件的概率试验模型。①全部基本事件的个数是有限的;②每一个基本事件发生的可能性相等。1.离散型随机变量概率分布的描述变量的取值是有限的,可数的,可用“概率分布列”来描述。2.连续型随机变量概率分布的描述变量的取值是无限的,不可数的,可用“概率密度函数”来描述。(二)非标准正态分布1.标准化公式设~,则~此公式反映出新设变量与原变量之间的关系,其实是两种分布规律之间的关系。1.非标准正态分布概率的计算总结:1)已知点求面积时,关键是先将点标准化,然后查表求解;2)已知面积求解时,关键是先找出到某点之间的面积,即,然后查表求X标准化之后的标准点A,最后由标准化公式求X的值,即由得到例1.已测得某大学男生跳远成绩的平均数5.20M,标准差0.15M,原始成绩基本呈正态分布,该校男生共1500人,现要分别估计跳远成绩在5.50M以上,5.30M到5.50M,4.9M到5.30M,4.9M以下的人数。解:如图,要求出各区间的分布人数\n必须先求出各区间的概率,即为:Y“已知点,求面积”。1).先将点5.50,5.30,4.9标准化,,2).求各区间的概率:04.95.35.5X=1-0.9772=0.0228=1-0.0228-0.7486Y=0.2286==0.7486-0.0228-200.672X=0.72583).求各区间的人数:=15000.0228=34(人)=15000.2286=343(人)=15000.7258=1089(人)=15000.0228=34(人)(二)利用正态分布制定考核标准例1.测得上届学生铅球成绩~()M,现需确定本届学生铅球成绩考核标准,假定两届学生铅球成绩服从同一正态分布,规定各等级的人数比例为:优秀10﹪,良好20﹪,中等30﹪,及格32﹪,不及格8﹪,试确定各等级的成绩标准。解:如图,即已知面积,求点。1).设有,使得=0.1即=1–0.1=0.9Y查表有:=0.9\n由标准化公式X∴=7.812(M)同理得到:=7.508(M)=7.2(M)=6.736(M).(学生练习时,注意田径赛中高优指标和低优指标的区别。)2.统一变量的方法1)U分法是将原始变量转换成标准正态分布的横轴变量的一种统一单位的方法。公式为:(田赛)或(径赛)例1.某跳远样本统计量为5.65M,0.40M,若学生甲成绩为5.85M,乙为5.25M,试计算两学生的U分。解:将已知数据代入公式,得:例2.某100M成绩样本统计量,学生甲成绩,乙成绩求其U分。解:100M成绩为低优指标,将数据代入公式,得:2)Z分法(标准百分)(其中“-”用于低优指标,如径赛;“+”用于高优指标。)例1.某队运动员100M成绩~秒,其中甲成绩为\n13.3秒,乙成绩为15.1秒,问它们的标准Z分各为多少?解:100M为低优指标,故有:(分)(分)3)累进记分法前提:原始数据服从或近似服从正态分布公式:其中Y为累进分数,K为系数,D为变量,Z为常数。D是一个新变量,它与原始变量X和标准变量U的对应关系为:(“+”用于高优指标,“-”用于低优指标。)累进评分的计算步骤如下:①确定起分点和满分点的成绩与分数:起分点一般为0分,满分点一般为100或1000分。依据正态分布理论,在区间()内概率为99.74﹪,可以近似看作100﹪,此时定为起分点,0分;为满分点,100分,可以分别计算出成绩与分数。②求累进方程式:分别计算出起分点和满分点的D值(利用D值公式),然后分别代入累进分计算公式,得到方程组:解得:K=1.67Z=6.68代入公式得到累进方程式:③计算某一成绩对应的D值:④依次将各成绩的D值代入累进方程式,计算出累进分数,可以制作成评分表。例题:教材第76页;人体教材第83页,例5.21课堂练习:略。正态变量非正态变量————————百分位数法第七章假设检验\n第一节假设检验的基本知识2.假设检验的意义:在体育实践中应用广泛,如:比较成绩的优劣、训练方法的好坏等。2.相关概念:显著水平——指预先给定的用来判定是否为小概率事件标准的那个很小的数。用“a”表示,一般a=0.05、0.01、0.005、0.001等。“1-a”为置信水平,即可信度。拒接域——指根据某一分布和所给定的显著水平而得到的一个拒接接受原假设的概率区域,即小概率区。单侧检验——把拒接域放在一边的检验。分为左侧和右侧。有临界值、等。双侧检验——把拒接域放在两边的检验。有临界值、等。•如何判断采用双侧检验还是单侧检验,是左侧还是右侧?1)若只是问是否存在显著性差异,而没有问差异的倾向(即增大还是减小),可用双侧检验。2)若强调是“增”或“减”的倾向,则用单侧检验。并且依据“数据的值”的大小,是“增大”“升高”趋势用右侧检验;是“减小”“降低”趋势用左侧检验。注意:但要分清“高优指标”与“低优指标”的区别。低优指标成绩的“提高”,其实是“数据值”的“减小”,应该用左侧检验。反之则用右侧检验。第二节参数检验一.平均数的假设检验(一)关于一个正态总体均值的检验1.U—检验(以双侧为例)前提:正态总体、总体标准差()已知检验的问题:从总体中抽取一个样本,通过样本检验总体均值有无显著变化(=?)步骤:1)作统计假设:总体均值无显著变化,即=:总体均值有显著变化,即≠2)根据抽样结果,采用U—检验,计算统计量u值~(0,1)3)根据给定的显著水平a值,做双侧U—检验,查正态表,求临界值\n,使得:4)结论:若≥,则拒接,接受,即总体均值有显著变化;若<,则接受,即总体均值无显著变化。例1.由历史资料知道某地12岁男孩的身高服从~cm,今抽查100名,测得cm,若标准差无变化,该地区12岁男孩身高与以前有无显著变化(a=0.05)?解:1)作统计假设:现身高与以前无显著变化,即=:现身高与以前有显著变化,即≠2),采用U—检验,计算统计量u值:=3)根据给定的显著水平a=0.05,做双侧U—检验,查正态表,求临界值,使得:由=0.975得到:=1.964)∵=3.19>=1.96∴拒接,接受,即身高与以前有显著变化。单侧U—检验例:问与的关系A:是否小于?————左侧检验1):不小于,即≮:<2)计算值:\n3)根据显著水平a值,作左侧U—检验,查正态表,求临界值,使得4)若,则拒接若,则接受。B:是否大于?————右侧检验1):不大于,即≯:>2)计算值:3)根据显著水平a值,作右侧U—检验,查正态表,求临界值,使得4)若,则拒接若,则接受。(注:这里可以将例1中的提问改为“该地区12岁男孩身高是否增高?”则用右侧U—检验。略)2.—检验(以双侧为例)前提:正态总体、总体标准差未知检验的问题:从总体中抽取一个样本,通过样本检验总体均值有无显著变化(=?)步骤:1)作统计假设:总体均值无显著变化,即=:总体均值有显著变化,即≠2)根据抽样结果,采用—检验,计算统计量T值~3)根据给定的显著水平a值,做双侧—检验,查—分布表,求临界值\n,使得:4)结论:若≥,则拒接,接受,即总体均值有显著变化;若<,则接受,即总体均值无显著变化。设某同学的跳远成绩服从正态分布,抽查15次,成绩如下(米):4.204.224.174.264.204.264.234.194.284.384.344.324.414.234.22能否认为该同学的成绩为4.30米?解:先由样本求得米,米1)作统计假设:4.26米与4.30米无显著差异,,即可以认为该同学的成绩为4.30米。2)因总体标准差未知,采用t—检验,计算统计量T1)取显著水平,做双侧t—检验,求临界值,查t—分布表得到:2)∵<∴接受,即可以认为该同学的成绩为4.30米。单侧—检验(与单侧U—检验相似)(二)关于两个正态总体均值的检验2.U—检验对于—检验,当、均大于50时,可用U—检验代替—检验,其统计量:~(0,1)练习:从甲乙两校各抽取60名同岁男生,测得身高为=165cm,=3cm;=170cm,=3.3cm。若两校身高均服从正态分布,且,问乙校身高是否明显高于甲校(=0.05)?解:(这里可以采用—检验和U—检验两种方法)\n1)作统计假设:乙校身高不明显高于甲校,即≯:乙校身高明显高于甲校,即>2)计算统计量:若用—检验,T=8.6207若用U—检验,=8.68423)对于显著水平=0.05,作右侧—检验,查—分布表,求临界值,使得∴=1.66(利用插值公式,见教材)4)∵T=8.6207>=1.66∴拒接,接受,即乙校身高明显高于甲校。若问:甲(乙)校身高是否明显低(高)于乙(甲)校呢?则应用左(右)侧检验,请同学们练习。二.标准差的假设检验(一)关于一个总体标准差的检验—检验(以双侧为例)前提:正态总体检验的问题:从总体中抽取一个样本,根据样本结果检验总体标准差有无发生显著变化(即=)?步骤:1)作统计假设:总体标准差没有显著变化,即=:总标准差有显著变化,即≠2)根据抽样结果,采用—检验,计算统计量值~3)根据给定的显著水平a值,作双侧—检验,查—分布表,求临界值、(<),使得:(表中所给的面积为临界值右侧的面积)\n4)当<<时,接受;当≤或≥时,拒接,接受。例:施丽影教材第118页,例7.8.某学生的跳远成绩服从正态分布,且cm,任意抽查10次,结果如下(cm):578572570568572570572570596584问着10次成绩是否稳定()?解:1)做统计假设:设10次跳远成绩稳定,即=8CM(:略)2)计算统计量=3)对于显著水平a=0.05,自由度n-1=9,作双侧—检验,查—分布表,求临界值、(<),使得:得到=2.7=194)∵<K<∴接受,即认为10次跳远成绩稳定。课堂练习:某跳远运动员踏跳时脚尖距踏板前沿的距离服从正态分布,其标准差为10CM,经过一个周期训练后,测得其40次数据的标准差S=7CM,问该队员的踏板准确性有无变化(a=0.05)?解:1)做统计假设:设该队员的踏板准确性无变化,即=2)计算统计量=3)对于显著水平a=0.05,自由度n-1=39,作双侧—检验,查—分布表,求临界值、(<),使得:\n得到=23.654=58.1204)∵K=19.6<=23.654∴拒接,即该队员的踏板准确性有变化。注:—检验同样有左、右侧之分,如上题中问“踏板准确性是否提高”,即问“标准差是否减小”,应作左侧检验,请同学们练习:1)做统计假设:设该队员的踏板准确性无提高,即≮2)计算统计量=3)对于显著水平a=0.05,自由度n-1=39,作左侧—检验,查—分布表,求临界值,使得:得到4)∵K=19.6<=25.695∴拒接,即该队员的踏板准确性提高了。查看更多