试议统计学论文

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

试议统计学论文

  试议统计学论文试议统计学论文导读:河北建筑工程学院经济管理学院统计学原理课程设计题目:河北省各地级市经济发展研究专业班级:财管111学生韩倩倩学号:2011324107指导教师:高红2014年1月5日河北省各地级市经济发展研究韩倩倩(河北建筑工程学院管理系,河北张家口075000)\n摘要:文章以河北省11个地级市2012年的相关经济指标为研究对象,基于各市《国民经济和社会发展统计公报》的统计数据,采用因子分析与聚类分析相结合的方法对河北省区域经济的发展现状进行了实证分析与综合评估。并对教育支出与区域经济增长的关系进行了回归分析,为解决如何妥善处理教育支出与区域经济增长关系;如何促进地区经济发展及平衡地区差异的问题提供建议。Abstract:In11citiesinhebeiprovincerelatedeconomicindicatorsin2012astheresearchobject,basedonthevariouscitiesofthestatisticsbulletinofthenationaleconomyandsocialdevelopmentofstatisticaldata,usingfactoranalysisandclusteranalysismethodofbiningthecurrentsituationofthedevelopmentofregionaleconomyinhebeiprovincehascarriedontheempiricalanalysisandprehensiveevaluation.Relationsicgrohoicgrooteregionaleconomicdevelopmentandbalanceofregionaldifferencestoprovideadvice.关键词:因子分析,聚类分析,回归分析,河北省地级市,经济发展Keyentoftheeconomic1、引言\n河北省作为中国经济欠发达地区之一,近年来虽然其社会经济发展取得了一部分成绩,但与全国相比,仍存在较大差距,且有拉大的趋势,同时其内部各市之间经济发展也很不平衡,要客观评价各地级市经济发展状况及存在的差异,找出各地级市经济发展中的弱点和潜在优势,促进各地区经济快速发展,努力向先进经济发展水平靠拢,这既是河北省缩小与发达省份经济差距的迫切需要,也是协调河北省内各地级市经济发展的关键。以下研究运用统计学中因子分析、聚类分析、回归分析的方法对省内各地区经济发展不平衡状况进行分析并提出解决方案。2、方法原理因子分析是通过变量之间关系的研究,找出能综合原始变量的少数几个因子代表多个原始变量的一种多元统计方法。它的基本目的是用较少的综合指标分别综合存在于各变量中的各类信息,代表各类信息的综合指标就称为因子或主成分。聚类分析是按照相似性把对象进行分类的一种多元统计方法。其基本思想是先把每一个对象作为一类,然后一层一层进行聚类。然后,按照某种方法度量样本间的距离,并将距离最近的两个样本合并为一个类,在计算新的类别与其他各类别间的距离,并将距离最近的两个类别合为一类,直至所有类别都合并为一类为止。\n回归分析是重点考察一个特定的变量(因变量),而把其他变量(自变量)看做影响这一变量的因素,并通过适当的数学模型将变量间的关系表达出来,进而通过一个或几个自变量的取值来预测因变量的取值。3、实证分析3.1因子分析因子分析是用少数因子来反映原始变量的方法,大体需要经过数据检验、因子提取、因子命名和解释、计算因子得分并综合评价等几个步骤。3.1.1指标和数据的选取评定一个地区经济发展状况,必须选定合适的指标体系。本文选定以下指标,生产总值(X1),乡村消费品零售额(X2),受教育人数(X3),第二产业产值占生产总值比重(X4)第三产业产值占生产总值比重(X5),储蓄存款余额(X6)。由于原始数据指标单位不同,所以需要对所选指标数据进行标准化处理以消除由观测量纲的差异所造成的影响,标准化后的指标分别记为Z1,Z2?Z6。以上指标的原始数据如下:地区石家庄承德\n张家口唐山廊坊保定衡水邢台邯郸秦皇岛沧州第二产业占生第三产业占生生产总值乡村消费品零售额受教育人数产总值的比重产总值的比重储蓄存款总额4500412.9234.20.4980.4023735.51180.996.179.840.5290.3141359.11233.6796.95141.50.4290.404119.745861.63289.65205.210.5920.31732661793.826090.20.540.352712.42720.9259.2201.650.550.313774.91011.5124.966.80.5170.2961571.11532148.8123.160.660.2782053.83023.7223.9220.990.5360.3372924.51139.1774.1263.180.3930.4771926.52811.9220.135.260.5260.3612689.93.1.2数据检验\n因子分析的前提是原有变量之间具有较强的相关关系,如果原始变量都是独立的,则无法降维,也就无法使用因子分析法。因此在求解公因子之前,需要先检验数据。以下是采用KMO和Bartlett球度检验检验法来验证所取数据是否适合做因子分析的结果。(表1)根据以上结果可知,KMO检验结果为0.707>0.5,且在0.7左右,而Bartlett球度检验检验统计量为34.656,检验的P值接近于0,表明6个变量之间有较强的相关关系,可知原有变量适合做因子分析。3.1.3因子提取运用SPSS对选取的6项指标作因子分析,通过主成分分析得到初始解。采用方差极大法提取因子个数,据此得到的特征根和方差贡献率的结果见下表(表2):根据以上得出的特征根和累计方差贡献率,以及特征根小于1不做主成分分析,累计方差贡献率达到80%以上可选作最后的主成分原则,提取了两个公共因子,其累计方差贡献率已达83.987%,这两个主成分已经代表了原始变量的大部分信息,因此上述6个指标可综合为2个主因子F1,F2。3.1.4因子的命名和解释\n表3由旋转后的因子荷载矩阵可看出第一个因子F1与生产总值(X1),乡村消费品零售额(X2),受教育人数(X3),储蓄存款余额(X6)这几个变量的载荷系数较大,主要解释了这几个变量。从实际意义来看,这几个变量主要反映了地区发展的经济水平,因此可以把因子F1姑且命名为“经济因子”,而第二个因子与第二产业占总产值的比重(X4),第试议统计学论文(2)导读:三产业占总值的比重(X5)这两个变量的载荷系数较大,主要解释了这几个变量,从实际意义来看,这两个变量主要与生产与关,因此可以把因子F2姑且命名为“生产因子”。3.1.5计算因子得分用SPSS回归法计算出各公因子得分的系数如下表:4)根据表中因子得分系数矩阵及公式,可以将公因子表示为各变量的线性组合。得到的因子得分函数为:F1=0.298X1+0.307X2+0.262X3-0.015X4+0.104X5+0.272X6F2=-0.049X1-0.050X2-0.049X3+0.504X4-0.548X5+0.013X6\n根据表2中各公因子旋转后的方差贡献率,计算其综合因子得分为:F=0.670768F1+0.329232F2(表5)综合评价得分越高,表明城市的经济发展状况越好,综合经济实力越强,从表5中可以看出唐山和石家庄的经济因子F1和综合得分都较强,远远高于其他城市,说明唐山和石家庄的经济发展综合实力特别强,而且第一因子里主要包括生产总值,乡村消费品零售额,受教育人数,储蓄存款余额因子,这些都跟一个地区的发展有着密切的联系,因此可看出唐山石家庄的经济发展状况很好,而张家口和秦皇岛经济因子和生产因子都是负的,严重影响其综合得分,使其排名靠后,说明其生产和经济发展方面需要注意。3.2聚类分析把处理原始数据得出的两个公因子得分看成是反映各城市经济实力的两个指标,通过系统聚类中的离差平方和法,对河北省11个地级市进行合理的区域划分,划分结果如下:\n可以看出区域划分与各市的综合得分情况不完全相同,石家庄虽然综合得分排名第二,但却被分在了第二类,这是由于石家庄受教育人数的比重占生产总值的比例比较低且其第二产业所占比重与邢台,沧州,衡水等相差不多都在50%左右,且这些城市中农村消费品零售额占生产总值比重都在10%左右浮动,而唐山,邯郸,廊坊,承德等第一类城市中农村消费品零售额所占比重大概都在10%以下说明这些地区城市消费品零售额所占比重较大,城市化率较高,而且他们的第二产业所占比重都在55%左右,说明这些城市工业化率较高,张家口的经济因子和生产因子都是负数因此被分在了第三类。可见聚类分析与因子分析还是有很大差距的。3.3回归分析首先假设教育与经济是线性关系(这点可通过受教育人数与生产总值的散点图观察出来为简化此处散点图略去)利用回归分析中的线性关系检验将受教育人数作为自变量生产总值作为因变量,检验教育与经济之间线性关系是否显著。3.3.1提出假设\nH0:β0=0(两个变量之间的线性关系不显著)H1:β0≠0(两个变量之间的线性关系显著)2.3.2计算检验统计量3.3.3做出决策由图知F=7.891Q且检验统计量P接近于0,因此拒绝原假设即两个变量之间线性关系显著。由图也可得出估计的回归方程,Y=455.739+14.908X由此可看出教育与经济发展有一定的联系,因此在发展经济的同时一定要重视教育的发展。4、建议河北省作为一个中华民族的发源地之,而目前经济发展处于弱势,而区域经济发展是影响国民经济发展的重要因素,因此,构建合理和科学的区域经济综合评价指标体系,对于河北省整体经济的长期持续发展和减小地域之间生活水平的差距有着重大的意义。由以上研究得出以下建议:\n(1)合理调整河北第二产业的发展。河北省经济发展中唐山、邯郸、廊坊、承德第二产业都在生产总值中占较大比重,在发展中难免会出现一些问题,如:唐山经济因子和生产因子得分都很高,作为第二产业发展中的“龙头”其自身产业主要集中在钢铁、煤炭、重型机械等重污染、高能耗的方面,这样在发展经济时难免带来环境污染。因此在以后经济发展中这些以第二产业带动经济发展的区域要注意自身面临的问题,可以在以后发展过程中慢慢向第三产业带动经济的方向发展,缓解经济压力,保持经济持续发展。(2)加速省内各区域城市化进程,但要注意协调物质城市化与精神城市化的统一。城镇经济在国民经济发展中占主导地位,城市化程度也成为国民经济发达程度的标志。如:石家庄虽然综合得分排名第二,但却在区域划分中处于第二类,究其原因在于它的城市化水平比较低。因此区域发展要注重城市化,在城市化进程中要注意不能盲目求快,政府需要规划、指导,但要顺应市场的趋势,让市场机制成为城市化化的主要动力。\n(3)加大教育投入力度,由教育与生产总值的回归分析中线性关系检验可得教育与经济发展起到促进作用,深化教育体制改革的措施势在必行。区域经济发展需要大量的技术与智力的支撑,即加大对教育事业的投入力度,加强区域教育基础设施建设,增强对区域人才的培养。对该地的巨大促进作用,政府部门加大教育投资是,可以适当地引领企业的加入,在一些不发达的区域更应该加大教育支出投资力度,如张家口地区就应该更加重视教育问题,政府部门应采取引进和培养人才,改善其工作环境,加强区域教育基础设施建设等措施,以推进其及经济发展。5、结术语运用因子分析聚类分析以及回归分析对河北省各地级市的经济发展情况进行分析,从分析结果可看出,各种分析方法得出的结论大致上是比较符合实际情况的,但由于选取的指标不够完善,可能导致结论与实际有些偏差,只能大致得如下结论:河北省内各地区经济发展呈现多层次与不平衡性,工业化水平低、城市化水平与工业化不同步、教育水平低、区域差距过大,这些都将会影响经济整体协调发展。各地区在使得整个经济朝着缩小各地区经济差异、加快经济发展速度方向发展的同时因地制宜,根据自己的地方特色制定不同方案。
查看更多

相关文章

您可能关注的文档