计算机辅助训练程序基础上运动分析技术探索

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

计算机辅助训练程序基础上运动分析技术探索

  计算机辅助训练程序基础上运动分析技术探索----运动训练论文-->第一章绪论1.1人体运动分析的研究背景及意义随着计算机性能的提高,以及人工智能计算机视觉学科的发展,可以允许人们利用现代的先进技术来对人体运动进行“非接触式”的分析研究。人体运动分析是指对摄像设备采集到的视频序列中的人体或者是人体的感兴趣的部位进行检测,跟踪以及理解识别的过程。基于视频的人体运动分析技术是现代数字图像处理技术和生物力学相结合而发展起来的一门极具实用价值的技术。人体运动分析技术在体育运动分析,人机交互,智能监控,虚拟现实,医疗诊断等领域都有着广阔的应用前景[1][2]:(1)体育运动分析\n体育运动分析在竞技体育和技巧性体育等运动领域都起着重要的作用。基于视频的运动分析技术不仅能够做到在不对运动员产生任何干扰的情况下通过摄像装置获取运动人员准确的全面的运动数据,而且还可以分析运动员的动作,帮助教练员和运动员发现不规范的动作或者是错误动作,提高体育运动训练效率,改进运动技术,从而达到对体育运动进行辅助训练的目的。(2)智能人机交互在现实的生活中,人们除了通过语言进行交流外,还经常会通过手势以及面部表情进行交流。传统的人机交互方式通常是由鼠标和键盘来承担的,然而随着人体运动分析技术的兴起和发展,给人机交互方式带来了一场革命——智能人机交互。智能人机交互就是让人类与计算机的交流不再只是依靠鼠标键盘等这些方式,而是把计算机当成“人”,让计算机能够“看懂”或者“读懂”人类的自然的交流方式,例如人类可以使用手势、姿势等人类习惯的交流方式来与计算机进行交互,旨在尽可能的使人机交互方便快捷。要实现人机交互的智能化,这就要求计算机对外界具有感知能力,人体运动分析技术就能够让计算机拥有这项能力。(3)智能监控\n智能监控是安防领域的重要的一个组成部分。智能监控系统区别于传统的监控系统主要在于它嵌入了运动行为分析和人工智能的技术,它不仅仅是只起到代替人眼和作为事后取证的作用了,智能监控系统能够对监控画面中的状况进行分析、判断,能够做到事前预警,事中报警。智能监控主要应用在一些对安防要求比较高的场合[3][4],目前智能监控技术已经成功的应用在道路交通监控,车牌识别,人体识别中。..............................1.2国内外研究现状人类在人体运动分析技术领域的研究经历了一个漫长的过程[5],它的历史要比现代计算机视觉技术要早很多,甚至可以追溯到十五世纪。世界著名画家达芬奇在创作的时候为了能够更好地描绘出人体的某些动作,创作出栩栩如生的作品,就对人体在做这些动作的时候肢体的受力状况和肌肉组织的状态做过详细的研究。十九世纪,法国科学家玛勒发明出来了“马勒摄影枪”,这一发明使连续摄影从梦想走进现实,它能够在同一张底片上把运动物体显示出来。也是这一时期,英国的摄像师迈布里奇研制出了动物实验镜,可对运动物体实现快速的连续的投影,他们都为记录人体运动做出了很多贡献。1973年则是真正意义上的现代人体运动分析技术的开端,因为就在这一年瑞士心理学家Johasson[6]在对运动感知所做的研究工作揭开了利用图像序列研究人体运动的序幕。他在实验中,通过在人体的关节位置(例如手腕、脚踝、膝盖等等)贴上LED\n灯,然后在黑暗的环境下让人体做动作,这种情况下只有关节点是可见的,当人体运动时记录光点的位置和组合就相当于记录下了人体的运动,他的实验结果表明这些光点组合可以区分出人体运动。之后随着计算机视觉、人工智能、模式识别和图像处理等学科的发展,这些学科也加入到了对人体运动分析的研究队伍当中。国际上许多著名期刊和学术会议比如ICCV,PAMI,IJCV[7]等都将人体运动分析列为重点研究对象。在过去的几十年里,国内外的许多学者都对人体运动分析做了大量的研究工作,令人欣慰的是这些国内外学者们经过不懈的努力已经取得了相当好的研究成果。在1997年,由美国国防部高级研究计划局带头立项,美国卡内基-梅隆大学和麻省理工学院承担研究开发的视频监控项目VSAM,这一项目是可用于军事也可针对民用的智能监控系统。它可以将采集于不同位置的视频信息发送到指挥中心,通过对这些信息进行综合的分析,来实现自主独立的视频监控,当监控视频中出现异常情况时,该系统可以及时的发出报警信息,对于大范围的监控区域只需要很少的人力就能够完成监控工作,大大降低了人力的劳动成本和劳动强度[8];此外,美国的Sarnoff公司和CMU合作共同开发出了能够对视频运动目标进行实时的跟踪分类系统,此系统是基于多目视觉而搭建起来的运动分析系统,通过多台摄像机的协同作用,来实现复杂场景下的对人和车辆等运动物体的跟踪[9];2000\n年,pentland[10]总结了人体运动分析的几个有趣的主题及其应用,如身份识别,智能监控,感知用户接口等。2003年Wang和Singh[11]对运动跟踪和运动分析这两个方面做了综述工作,尤其是Wang做的更详细,包括整个人体及身体部分如脸,手,头和腿等的跟踪分析;2007年,Poppe[12]总结了现有的运动分析的研究方法,并提出了将运动分析方法分成两大类,分别是基于模型的研究方法和无模型的研究方法;当然,国内也有不少研究机构的学者取得了可喜的研究成果,其中具有代表性的就是清华大学的人体运动分析研究所就研制出了一套适合检测人体微小变动的系统,并且这套系统已经很好地应用在了射箭运动项目中来对运动员肩部和肘部的微小晃动进行检测。人体运动的研究是典型的非刚体运动研究问题,虽然目前对于刚体的运动研究已经有了一套相对完整全面的研究理论,但是对于像人体运动这种典型的非刚性结构的非刚体运动的研究还处在一个相对初级的阶段,相对于人们在刚性运动领域的研究深度而言,人们对于非刚性结构的运动分析研究技术还有很长的一段路要走。人体运动分析研究中,基于模型的人体运动分析方法需要依靠关于人体的先验知识,在使用这种方法进行研究的时候要先建立人体的2D或者3D\n模型。基于模型的人体运动分析方法的特征向量主要是从模型中获取,而建立人体模型是一个比较复杂的过程,因此在实际应用当中使用的比较少。无模型的方法不需要建立人体模型,这种方法直接从图像序列中提取特征以对人体动作进行描述,常用的特征有轮廓,面积周长比,轨迹感兴趣区域,Hu矩不变量等等,它一般是针对特定的识别行为提取相应的特征描述子,然后建立对应的特征空间来作为待识别行为在计算机中的表述。目前,无模型方法被广泛应用于人体行为识别的研究当中,国内外许多学者也一直在对如何才能方便的提取高鲁棒性的特征向量和高效的识别算法进行大量的科学研究。综上所述,本文采用基于无模型方法对运动员动作分析进行研究。.............................第二章图像预处理及人体运动目标检测技术研究\n-->人体运动目标检测是指把研究中所感兴趣的运动目标从连续的图像序列中检测出来,并将感兴趣的运动目标从背景中分割出来,以便供后续的处理来使用。人体运动目标检测是进行人体运动分析的第一步。准确的提取人体运动目标是运动分析的最基本的要求,因为后续的运动目标跟踪,特征提取和运动理解识别都是建立在准确的目标检测基础之上的,没有良好的目标检测结果后面的一切都是空谈。在实际的图像序列采集环境中往往存在各种各样的不可控制的干扰因素,比如:相机的晃动,周围光照的变化以及复杂的背景等等,这些因素都增加了运动目标检测的难度。因此,本章首先介绍图像预处理的方法,然后对常用的运动目标检测领域研究方法进行了分析,最后给出了本文所提出的运动目标检测方法。2.1中值滤波中值滤波(MedianFiltering)是抑制噪声的一种非线性平滑的方法,这种方法的突出特点是实现方便,运算简单,尤其能够对脉冲噪声进行有效的抑制,同时还能够对图像的边缘起到很好的保护效果,使边缘不被模糊[14]。中值滤波是在1971年由学者Turky首先提出的,中值滤波的做法是:以处理窗内原图像的灰度值的“中值”作为“窗口”中心处的新值。在一维情况下,若a1,a2....an为一组原始信号序列,并且假设a1,a2....an已经是从大到小的有序序列,那么这组原始信号序列的中值定义为[15]:以一维5点中值滤波为例:假设原始信号序列为“70,90,200,110,120”\n,即斜坡变化的中心处有大的孤立的噪声存在。对这类信号进行中值滤波时,做法是取5个数的中值(即第三大的值)“110”作为中值滤波后原图像“200”所在的中心位置处的新值;从上例可知,对于中值滤波而言不管孤立噪声有多大,它都可以将噪声彻底消除;再若原始信号序列为“100,100,200,200,200”,则经过中值滤波之后中心位置处仍然是“200”,不会像使用邻域平均处理后会出现边缘模糊的现象;如果考虑一种特殊的情况,就是噪声不是孤立的,而是出现连续两个相等的值,比如“100,200,200,100,100”,这种情况下利用中值滤波仍能够将噪声完全滤除,在这点上中值滤波要比邻域平均平滑的效果要好很多。............................2.2图像锐化增强图像锐化处理主要的作用就是增强图像的边缘和图像灰度跳变部分,通常所说的勾边增强方法就是对图像进行尖锐化处理。空域锐化技术的基本方法是将原始图像进行微分处理,然后将运算结果与原图像进行叠加。二阶微分一般指的是拉氏算子。拉氏算子是一个用于刻画图像变化的二阶微分算子,拉氏算子的定义为[18]:\n拉氏算子是一种线性的算子,其具有各项同性及唯一不变性,拉氏算子是对点、线、边界进行提取的算子。拉氏算子对由于扩散效应而造成的图像模糊的处理效果非常好。扩散效应是成像过程中经常会发生的一种现象,这个过程可以用下面的扩散方程加以描述[19]:上式中f(x,y,t)表示在时刻t时的图像,常数k>0。当t=0时,f(x,y,0)是没有被扩散效应模糊的图像;当t=t>0时,f(x,y,t)是受到影响而变模糊的图像。将f(x,y,t)在时刻t=t处做泰勒级数展开令t=0,并记g(x,y)f(x,y,0),f(x,y)f(x,y,t),省略掉高阶项,于是上式表明,当图像产生模糊的原因是因为光的散射而导致的时候,由已经模糊的图像减去它自己拉氏运算的倍,得到的结果就是没有模糊的图像,其中为控制锐化程度的调节因子。光散射并不是造成图像模糊的唯一因素,对于其他因素造成的图像模糊,图像与其拉氏运算结果之差也同样能加强边界的锐化程度。相应于式2-(12),数字图像的拉氏锐化表达式为\n式中D4为像素点(i,j)的四邻点,对于八邻域的情况有式中D8为像素点(i,j)的八邻点。拉氏锐化处理的更一般的表达式为............................第三章基于合成轨迹的运动识别方法研究..................................283.1基于K-L变换的人脸识别方法分析................................283.1.1K-L展开式...........................................283.1.2K-L变换识别算法................................323.2轨迹合成方法...............................................333.3本章小结.................................................38第四章基于轨迹图像特征的运动识别方法研究\n对图像序列进行轨迹合成之后,得到的就是一张静态轨迹图像,通过这种方式我们就可以将对图像序列的研究转化到对图像的研究中来,这样运动识别问题就变成了对合成后的轨迹图像的识别问题。第三章合成的轨迹图像中,白色区域是有用的信息,黑色区域中是没有携带有用信息的,而黑色区域却占据了大部分的面积,即原始图像中冗余信息较多。如果直接对轨迹图像的每一个像素点进行K-L变换,其识别效果可想而知不是最好的。因此本章中我们先对轨迹图像进行特征提取,以去除轨迹图像中包含的不必要信息,之后再利用K-L变换进行识别。图像的特征有很多种,其中有些是人视觉可以直接感受到的自然特征,如图像区域的亮度、色彩、纹理和轮廓等等,还有一些是需要通过变换或者是测量才能够得到的人为特征,如各种变换中的频谱、直方图以及各阶矩等。4.1图像的几何特征图像的几何特征尽管比较直观和简单,但其在许多图像分析问题中起着是很重要的作用[49][50]。提取图像几何特征之前,常对图像进行分割和二值化处理,即处理成只有0和1\n两种值的黑白图像。虽然二值图像只能给出物体的轮廓信息,但在图像分析、计算机视觉系统中,二值图像及其几何特征用处特别大,-->可以用来完成分类、检验、定位、轨迹跟踪等任务,下面介绍几种常用的几何特征。4.1.1位置图像中物体(图形或区域)的位置,定义为物体的面积中心。面积中心就是图形的质心O,如图4.1所示。由于二值图像质量分布是均匀的,因此质心和形心重合。若图像中的物体对应的像素位置坐标为(,)ijxy,则其质心位置坐标为:4.1.2周长区域的周长定义为区域的边界长度。区域的周长在区别具有简单或者复杂形状物体时特别有用,一个形状简单的物体用相对较短的周长来包围它所占有的面积。通常情况下,测量这个距离时包含了许多90°的转弯,从而扩大了周长的值。由于周长表示方法不同,因而计算方法也不同。周长的常用表示方法有如下几种:\n(1)当把图像中的像素看作单位面积小方块时,则图像中的区域和背景均由小方块组成。区域的周长即为区域和背景缝隙的长度之和,此时边界用隙码表示,因此这种情况下,求周长就是计算隙码的长度。(2)当把像素看作一个个点时,则周长用链码表示,求周长也就是计算链码的长度。链码是一种对边界点编码的表示方法[51][52],其特点是利用一系列具有特定长度和方向的相连的直线段来表示目标的边界。因为每个线段的长度固定而方向数目取为有限,所以只有边界的起点需用(绝对)坐标表示,其余点都可用接续方向来代表偏移量。常用的链码有4方向和8方向链码,它们的方向定义如图4.2所示。对于同一边界,如果用不同的边界点作为链码的起始点,会得到不同的链码,所以为了解决这个问题,可把链码归一化。具体做法是:给定一个从任意点开始而产生的链码,可以把它看作一个由各方向数组成的自然数。将这些方向数依照一个方向循环以使它们所构成的自然数的值最小,可将这样对应的链码起点作为这个边界的归一化链码的起点。..............................第五章总结与展望5.1总结\n运动分析技术是近年来发展起来的一个炙手可热的技术领域,它融合了计算机视觉、人工智能和模式识别等诸多相关领域的知识,它在智能监控,人机交互、虚拟现实和体育运动分析等诸多领域有着极其广泛的应用。因此,吸引了国内外的广大科研工孜孜不倦的投入到运动分析技术的研究当中。人体运动分析作为运动分析技术的一个重要分支,也越来越受到人们的追捧。对于刚体的运动分析技术目前已经取得了很大的技术突破,而且也建立了比较完备的技术理论体系;但是对于人体运动这种典型的非刚体运动的研究并不太深入,还有待于进一步的研究。本文以乒乓球运动为研究背景,主要做了一下研究工作:1、查阅大量的国内外相关文献,仔细研究了人体运动分析技术的发展历程以及国内外研究现状,同时阐述了人体运动分析技术的研究目的及意义。2、对预处理技术进行了分析研究。主要介绍了图像增强技术中图像滤波和锐化增强的常用的算法,并且对各个算法效果做了对比实验,以更直观的表达算法的性能。接着又分别从基于边缘和基于区域的角度对主流的目标分割算法进行了分析,并对各算法的实验效果做了对比分析。3、针对于K-L\n变换算法只能对静态图像进行识别,还不能够针对于图像序列进行识别的问题,本文提出了对图像序列进行轨迹合成的方法,用合成轨迹来表征运动图像序列,并对轨迹合成方法的可靠性进行了验证。4、对于特征提取及识别技术进行了重点研究,首先从几何特征和形状特征对特征提取方法进行了分析介绍,并对轨迹做了Hu矩不变量特征的提取,之后再对矩特征进行K-L变换来实现轨迹识别。.............................
查看更多

相关文章

您可能关注的文档