统计学专业毕业论文

2022-09-01 发布 |
37.5 KB |
12页

申明敬告： 本站不保证该用户上传的文档完整性，不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学专业毕业论文

湖北师范学院学士学位论文（设计）开题报告学生姓名所在院系数学与统计学院所在班级0804指导教师学生学号2008111030441专业方向统计学开题时间2012.02导师职称教授论文影响老年人服装消费因素的分析题日文献综述：[1]高惠旋：《应用多元统计分析》[M]・第一版.北京•北京大学出版社.2005年[2]王松桂，陈敏，陈立萍:《线性统计模型》[M]・第一版•北京•高等教育出版社.2009年[3]邵建利，任琳:《SAS应用统计实验》[M]•上海•上海财经大学出版社[4]王宝进：《多变量分析统计软件与数据分析》[M].北京大学出版社[5]高惠旋：《使用统计方法与SAS系统》[M]・第一版•北京•北京大学出版社2009年[6]王宁：《消费社会学一一个分析的视角》，北京科学文献出版社2011年版[7]波德里亚著，刘成富，全志刚译：《消费社会》。南京：南京大学出版社2001年版[8]文启湘：《消费经济学》，西安：西安交通大学出版社2005年版[9]房爱卿主编：《我国消费需求发展趋势与消费政策研究》，中国经济出版社2006年版[10]李子超，卢彦编著：《当代屮国价格史》，郑州：河南人民岀版社1990年[11]华梅:《中国服装史》,北京:人民美术出版社1989年版[12]安毓英：《屮国现代服装史》，北京：屮国轻工业出版社2001年版[13]宁俊，马千利：《服装消费文化理论研究》，《纺织学报》2006年第7期第117-120页[14]胡斌：《论居民衣着消费与消费结构合理化》，《消费经济》2000年第1期第27-30页[15]宋莹:《影响服装消费行为的两大因素》,《辽宁丝绸》,2002年第2期,第28-29页。[16]啊悦：《影响个人服装消费行为的诸因素》，《中国商业》，1996年第7期第22-23页。[17]刘秀墩：《衣是无言的文化-漫谈中国服装市场》中国服装2001年版。[18]赵平等：《女性服装及其类型》，北京服装学院学报1998第1期第70-77页。研究方法：调查问卷与分析方法；调查对象与资料收集调査方法：本次调查主要针对几个地区各医院、研究所、大型企业、机关、工厂、老年大学、老年活动屮心等20多个不同工种系列的老年人，年龄在60-75岁之间。采用问卷调查法。调查问卷在陕11个城市和地区，共发放600份，冋收有效问卷569份，回收有效率为94.8%o问卷涉及消费观念、生活方式、服装态度、购买服装的动机、服装的挑选\n标准、服装购买的信息来源、购买场所、购买服装的价格、年消费数量、品牌老年装知名度、影响老年装购买因素、个人基本属性（包括文化程度、月收入、职业状况等）等。本次调查，问卷设置了13个老年人挑选服装标准的问项，采用5级量表方式（完全不是、不是、一般、是、确实是）。通过频度分析，总结出影响老年人选择服装的款式凶子、实用因子、品质因子、舒适凶子、价格因子等，年龄因子，收入因子，色彩因子，文化因子。调查结束后，以有效样本结果进行分析，并运用sas及Excel软件进行整理和统计。结果分析：群体分类分析；聚类方法把调查对象分为具有不同特性的五个群法、服装态度因子分析；理论依据lx聚类分析：依据研究对象（样晶或指标）的特征，对其进行分类的方法，减少研究对象的数目。各类事物缺乏可靠的历史资料，无法确肚共有多少类别，fl的是将性质相近事物归入一类。各指标之间具有一定的相关关系。聚类分析（clusteranalysis）是一组将研究对象分为相对同质的群组（clusters）的统计分析技术。聚类分析也叫分类分析（classificationanalys⑸或数值分类（numericaltaxonomy）直接聚类法是根据距离矩阵的结构一次并类得到结果。（1）系统聚类方法的基本思想首先定义样品间的距离和类与类Z间的距离。初始将〃个样品看成〃类（每个样品包含一类）。这时类间的距离与样品间的距离是等价的，然后将距离最近的两类合并成新类。并计算新类与其他类间的距离，再按最小距离准则分类。这样每次缩小一类，直到所有的样品都并成一类为止。这个并类过程可以用谱系聚类图形彖的表达出来。系统聚类的基本步骤：⑴数据变换：便于比较和计算；⑵计算〃个样品两两间的距离，得样品间的距离矩阵/T。⑶初始"样品自成一类，类的个数“〃，第『类G（厂％｝（心1,2,…加，此时类间的距离就是样品间的距离，即刃，然后对步骤22,执行并类过程的步骤⑷、⑸。⑷对步骤‘得到的距离矩阵合并类间最短距离的两类为一新类，此时累的总个数减少1类，即+\n⑸计算新类与其他类间的距离，得心的距离矩阵若合并后的类个数R仍大于1,重复步骤⑷、⑸，直到类的个数为1是转到⑹。⑹画谱系聚类图。⑺决定分类的个数及各类的成员。(2)聚类分析基本步骤：(1)把各个分类对象单独视为一类；(2)根据距离最小的原则，依次选出一对分类对象，并成新类；(3)如果其中一个分类对象已归于一类，则把另一个也归入该类；如果一对分类对象正好属于已归的两类，则把这两类并为一类；每一次归并，都划去该对象所在的列与列序相同的行；(4)那么，经过旷1次就可以把全部分类对象归为一类，这样就可以根据归并的先后顺序做出聚类谱系图；(5)输出结果；(6)进行结果分析和解释。2、因子分析：因子分析是通过研究众多变量Z间的依赖关系，探究观测数据中的基本结构，利用少数几个因子来表示基本结构。这些因子能反映原來众多的观测变量所代表的主要信息，并解释这些观测变量之间的相互依存关系。在因子载荷炬阵屮，各行元索的平方和即共同度，表示每个指标数各个因索所解释的变异数的总和。而各列元素的平方和则表示每个因子对方丼的解释能力，即方差贡献率。方差贡献率大，则表示因子所含的信息多。因子分析的基本概念：1.一种简化数据的技术。2.探索性因了分析和证实性因了分析3.因子分析就是要找到具有本质意义的少量因子。4.用一定的结构/模型，去表达或解释大量可观测的变量。5.用相对少量的儿个因子解释原来许多相互关联的变量Z间的关系。6.描述的变虽是可观测的——显在变量。7.相关性较高，联系比较紧密的变量放在一类。8.每一类变量隐含一个因了潜在变量。9.不同类的变量之间相关性较弱。io•各个因子Z间不相关。\n3＞回归分析：(1)逐步回归分析的基本思想将变量一个一个的引入，引入变量的条件是偏凹归平方和经检验是显著的。同时，每一引入一个新变量，对已入选方程的老变量逐个进行检验，将经检验认为不显著的变量剔除，以保证所得口变量口己中的每个变量都是显著的，此过程仅经若干步直到不能再引入新变量为止。这时，回归方程中所有自变量对因变量)"都是显著的，而不在回归方程的变量对y都是经验不显著的，由此可见，逐步回归法选择变量的过程包含两个基本步骤，一是从冋归方程中剔除经检验不显著的变量，二是引入新变量到冋归方程中。(2)REG过程的功能设考察的指标(或称因变量，响应变星)为影响这些指标的因素(或称自变量,冋归变量)为X|,…,X”,。已知这些变量的〃次观测数据组成的一个SAS数据集。REG过程可以完成以下几方面的计算：(1)利用具有多项选择的MODEL语句来建立用户需要的线性回归模型；(2)提供九种选择“最佳”回归模型的方法；(3)允许采用交互方式修改模型及用于拟合这个模型的数据；(4)可建立线性约束回归模型；(5)检验线性假设和多变量假设；(6)生成原始数据和一些统计量的散点图；对散点图还有“着色”，加亮功能；(7)产生偏回归杠杆图，并进行共线性诊断，影响诊断；(8)可以输岀预测值、残差、标准残差、置信区间的上下限和影响统计量等；并把它们存储到一个SAS数据集里；(9)可以使用冷…，乙和X],…,X”,的相关阵和离差阵作为输入数据；(10)可以把离差阵(叉积阵)存贮到一个输illSAS数据集里，以便将来使用；(11)在6・11版木，REG过程完成岭回归和不完全的主成分分析(IPC)；(12)在6.11版本，PROCREG语句可使用选项GRAPHICS,它使得你能够要求PLOT语句用高分辩率图形设备绘图。(3)选择最优回归模型方法设丫和X"…,X,”的〃次观测数据为(柿•…％」)(心1,2,・・・,/7)满足线性回归模型:X=0o+01兀1+…+0后“+J\n利用矩阵符号可简记为Y=Xp+s■因考察的加个自变量对丫的作用有大有小，且自变量之间一般存在和关性。为了从Y与纸，…,X,”的所有可能凹归模型屮选出拟合这组观测数据的最优凹归子集，REG过程提供了九种选择回归模型的方法，它们通过MODEL语句屮的选项selection=来规定。下面介绍这些方法及其在选项SELECTION=中用于识别这些方法的关键词。1.全回归模型(NONE)没有对回归变量进行筛选，建立Y与全部自变量的回归模型。这是很多回归分析使用的方法。当省略选项SELECTION二时，表示建立全冋归模型。2.向前法或逐步引入法(FORWARD)向前选择法的初始模型屮没有变量。对每个自变量，向前法计算如果这个自变量包含在模型中它对模型贡献大小的F统计量，并将这些F统计量相应的"值与SLENTRY=的值(用户在MODEL语句中规定的引入时的显著水平。如果没有规定，即缺省时，则用0.50比较.如果所有自变量对应的F统计量的显著概率(卩值)都大于这个值(表示所有自变量对因变量的贡献都不显著)，向前选择过程结束。否则，就把具有最人F值的口变量引人模型。然后对未引入模型的自变量再计算它们的的F统计量，重复上述计算步骤，变量逐个被加到模型中，直到没有变量其F值相应的p值大于SLENTRY二的值。使用向前选择法,变量一旦选人模型，就不会被剔除。3.向后法或逐步剔除法(BACKWARD)向后删除法开始对包含所有自变量的模型计算F统计量，然后从这个模型中逐个删除变量，直到在模型屮的所有变量产生的F统计量在这个MODEL语句里规定的选项SLSTAY=的值(如果缺省，则用0.10)水平上是显著的。在每一步，删除对模型贡献最小的变量。4.逐步筛选法(STEPWISE)逐步法是向前选择法的修止，和向前选择法的区别在于引入模型中的变量有可能被删除。像向前选择法一样，变量被逐个引入到模型屮，而但对引入的变量其F统计量在SLENTRY二的水平上必须是显著的。引入一个变量Z后，逐步法还要检验所有已经包含在模型中的变量，并删除在SLSTAY=的水平上不显著的一切变量。仅当经过检验并把所有不显著的变量删除后，才考虑是否再引入新变量。当在模型外的所有变量在SLENTRY二的水平上都不显著，而在模型内的任一个变量的F统计量在SLSTAY=的水平上都是显著时，逐步筛选过程停止。另外，若刚被删除的变量又被引人模型时，逐步筛选过程也停止。\n1.最大增量法(MAXR)\n最大增量法不是确定唯一的一个模型。而是寻找“最优”一个变量模型，“最优”两个变量模型等等，但它对每种变量个数，并不能保证找到具有最大F的模型。MAXR方法首先寻找具有最大F的单变量模型，然后引入产生最人F增量的另一变量，得到两个变量的模型后，把模型里的这些变量与不在模型里的每个变量进行比较。每次比较，MAXR方法决定是否删除一个变量并用其它变量替换来增加A?。在比较所有可能替换之后，MAXR进行替换使得疋增加最大。然后再进行比较，这个过程一直继续直到MAXR不能找到替换使卩増加。于是得到的两个变量模型就认为是用这个方法能够找到的“最优”两个变量模型。然后乂引入变量到这模型屮，重复比较和替换过程来寻找“最优”三个变量模型等等。STEPWISE方法和MAXR法的区别是MAXR法在进行替换Z前计算了所有替换的情况。而STEPWISE法在剔除了“最坏”的变量后，有可能还没有顾上考虑如何引入“最好”的变量筛选过程就完成了。一般MARX法需要比STEPWISE法更多的计算时间。M1NR法类似于MAXR法，但替换是选择产生最小F增量的那一个变量。对给定变量个数的模型，MAXR和MINR法一般都得到相同的“最优”模型，但MINR法对每种变量个数考虑更多的模型。7.疋选择法(RSQUARE)RSQUARE法用于寻找某些口变量的子集，这些子集在给定的样本中用线性回归可以最佳地预测因变量。用户可以规定出现在子集屮门变量的最大和最小个数及被选择的每种大小子集的个数。RSQUARE法可以有效地计算所有可能回归子集并在每种子集大小里按F递减的次序输出这些模型。为了比较不同变量个数的子集，该方法还提供一些有用的统计量，这些统计量以及回归系数的估计可以直接打印或输出到一个SAS数据集里。用RSQUARE方法选择的回归子集模型对于给定的样本按炉准则是最优的，但他们对于这个样本所抽取的总体或考你想要做预测的其它样本而言未必是最优的。如果一个子集模型是根据最大F值或者用模型选择的其它一般准则建立的，在模型事先给定的假设下对那个模型计算的所有回归统计量，包括用REG计算的所有统计量都是有偏的。RSQUARE法对于研究模型的建立是一•个有效的工具，但没有统计方法能够用来建立“真的”模型。实际模型的建立要求提供大量关于预测理论及关于这些模型的函数形式。RSQUARE法和其它模型选择方法的区别在于，它总能够对所考虑变量的每种变量个\n数找到具有最大F的模型，而其它选择方法不能保证这一点。RSQUARE法比其它选择方法需要更多的计算时间，因此在考虑很多自变量的情况下，最好使用如STEPWISE等具它选择方法。7.修正疋选择法（ADJRSQ）该方法类似于RSQUARE法，只是对于选择模型使用的准则为修止R1统计量。修止R2统计量定义为■ADJRSQ=1—n_p'7其屮〃是用来拟合模型的观测个数，P是模型中参数的个数（包括截距项），而心1（当模型包含截距00（常数项）时），否则为0。8.Mallows的C”选择法（CP）这个方法类似于ADJRSQ,只是模型选择的准则使用Mallow提出的C；统计量。C；统计量定义为Cp=SSEf>/s2-（N-2p）其屮/是全回归模型的ms玖均方误差），SSE“是包含常数项（如果存在）有p个参数的模型的误差平方和。如果画-对p的图形，Mallows建议选择C；最接近p的那个模型。（4）回归分析的步骤（1）根据预测目标，确定口变量和因变量。明确预测的具体冃标，也就确眾了因变量。如预测具体目标是卜•一年度的GDP,那么GDP为Y就是因变量。通过市场调查和查阅资料，寻找与预测冃标的相关影响因素，即自变量，并从中选出主要的影响因素。（2）建立冋归预测模型。依据自变量和因变星的历史统计资料进行计算，在此基础上建立冋归分析方程，即冋归分析预测模型。（3）进行相关分析。冋归分析是对具有因杲关系的影响因素（口变量）和预测对彖（因变量）所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时，建立的回归方程才有意义。因此，作为自变量的因索与作为因变量的预测对象是否有关，相关程度如何，以及判断这种相关程度的把握性多大，就成为进行冋归分析必须要解决的问题。进行相关分析，一般要求出相关关系，以相关系数的大小來判断口变量和因变量的相关的程度。（4）检验回归预测模型，计算预测误差。回归预测模型是否可用于实际预测，取决于对回归预测模型的检验和对预测误差的计算。凹归方程只有通过各种检验，且预测误差较小,才能将冋归方程作为预测模型进行预测。（5）计算并确定预测值。利用回归预测模型计算预测值，并对预测值进行综合分析，确定最后的预测值。\n开题报告（正文）:1.背景：我国老年市场潜力巨大，根据我国国家统计局第六次人口普查结果显示：全国总人口为1339724852人，60岁及以上人口占13.26%,比2000年人口普查上升2.93个百预测分点，其屮65岁及以上人口占8.87%,比2000年人口普查上升1.91个百分点。据，2030年我国60岁以上老年人将达到3.1亿，占全国总人口比例的20.42%。到2050年，60岁以上老年人数量将达到4.68亿（其屮80岁以上人口数达1亿左右），占人口总数的27.71%o早在1999年，我国就已步入老龄化社会，当时企业界和理论界均认为我国的老年市场亟待开发、老年产业潜力巨大，但大部分企业却不敢轻易涉足老年产业。到市场上逛逛服装商店，人们就会发现这样一种现象：俊男俏女的服装，花红蓝绿的儿童服装比比皆是，而想买件老年人服装却是十分困难的事。寻找专卖老年人服装的商店更是困难。从市场经营的规律来讲，凡是市场上短缺东西，就是一个财富信号，就是一个潜力，就是一次机遇。所以，这种现状应当引起I筍家的重视。但是商家如何将老年人服装市场的潜力挖掘出来，这就需要好好的对老年人对服装许许多多方面做出思考。本文就将问卷调查对象分为5个群类法，根据频度从影响老年人选择服装的款式因子、实用因子、品质因子、舒适因子、价格因子、年龄因子、收入因子、色彩因子、文化因子9个因子入手进行统计分析。通过对这些因子的分析找出老年人服装受影响的主要因子，最终使得商家能设计出更有利于市场的老年服饰。2•研究的目标与任务：随着市场经济的不断发展，利用数学知识解决实际问题变得越来越重要。对于统计专业的我们，运用所学的统计软件对具体的数据实现综合分析及提出建议是我们学以致用的重要表现。而且统计学专业的理论知识都是在实际问题中提出的。我们在解决实际问题有助于发现我们自身的不足，从而促使我们去掌握更专业的知识。SAS是一个专业的数据分析软件，在实际数据分析的过程中起到了重要的作用。3.分析或调研报告：本文着重讨论了SAS在具体数据分析屮的实际操作及解决问题的强大优势。首先查阅和准备SAS在社会统计具体事例屮应用的相关数据和资料，初步拟定了SAS在影响老年人服装消费的相关因了中的分析，文章的核心是利用因了分析、逐步冋归、聚类思想解决影响大小定量分析的问题，重点和难点是对于SAS程序摆弄些和人量结果的有效处理及结果分析。鉴于此，拟采取如下方案。\n3.拟定方案：\n通过各种途径（如书籍，网络等）广泛收集论文的相关文献资料，好好研究精读各文献,理解文献的重耍点及闪光点，提取其精华、核心思想，自我总结SAS在数据分析屮是如何运用的。在此基础上带着问题去思考，进一步收集、研读多方面的材料,对于具体问题进行具体分析，借助于格方面的文章著作寻求问题的答案。最后就问题的答案进行探索，总结出自己分析结果。在指导老师的帮助下，纠正完成论文。1、2、3、3.写作提纲：研究背景整理的数据表3、聚类模型建立1聚类分析3、1、1系统聚类方法的基木思想3、1、2系统聚类法的种类3、3、2聚类分析SAS程序3聚类分析输出结果4、5、3、4聚类分析结论因子分析模型建立4、1因子分析4、2因子分析SAS程序4、3因子分析输击结果4、3因子分析结论逐步冋归模型建立1冋归分析1逐步回归分析的基本思想2REG过程的功能3选择最优冋归模型方法4冋归分析的步骤5、5、5、5、5、1、1、1、1、5、5、6、7、8、9、6.2逐步回归SAS程序3逐步回归输出结杲5、4逐步回归结论论文结论现实意义及改进参考文献致谢实施计划：第一阶段：第二阶段：第三阶段：调研，查找资料，阅读文献（网络、图书馆、电子阅览室、期刊阅览室）完成开题报告，做好开题准备完成初稿，并让指导教师提出指导意见第四阶段：结合指导教师意见认真修改论文，复查审核第五阶段：定稿，打印上交\n指导教师意见：签名：年月日开题指导小组意见：指导小组组长签名年月日说明1.学生应在开题报告前，通过调研和资料搜集，主动与指导教师讨论，在指导教师的指导下，完成开题报告。2・开题报告分两部分，文献综述和开题报告正文。文献综述要有6篇以上相关文章阅读量，开题报告正文（25（X）-3000字）包括，选题背景和意义、研究忖标与任务、分析或调研报告、拟定的方案或路线、撰写提纲及实施计划等。3.开题报告一式三份，一份交院系装入毕业设计（论文）档案袋，一份交指导教师，一份学生自存。4.开题报告需经各系或论文指导小组讨论.院系教学指导委员会审查合格后，方可正式进入下-阶段。

统计学专业毕业论文

文档介绍

相关文章

您可能关注的文档