- 2022-09-01 发布 |
- 37.5 KB |
- 7页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学聚类分析论文1
200902034035金融一班刘志伟用聚类分析研究河南省各市三次产业就业人员差异化【摘要】随着市场经济的多元化发展,三次产业的人员分布情况发生着很人的变化,本文利用聚类分析方法,运用全国各地三次产业人员就业情况数据,分析了各地三次产业的就业情况和人员分布情况。【关键词】聚类分析;三次产业就业人员;分布情况1.引言第一、第二、第三次产业,是根据社会生产活动历史发展的顺序对产业结构的划分。它大体反映了人类生活需耍、社会分工和经济活动发展的不同阶段,基木反映了有史以來人类生产活动的历史顺序,以及社会生产结构与需求结构之间和互关系,是研究国民经济的一种重要方法。产品直接取口口然界的部门称为第一产业,即农业,包括种植业、林业、牧业和渔业;对初级产品进行再加T:的部门称为第二产业,即工业(包括采掘工业、制造业、自来水、电力、蒸气、热水、煤气)和建筑业;为生产和消费提供齐种服务的部门称为第三产业,即除第一、第二产业以外的其他各业。根据我国的实际情况,第三产业可以分为两大部门:一是流通部门,二是服务部门。具体又可分为四个层次。第一层次:流通部门,包括交通运输业、邮电通讯业、商业饮食业、物资供销和仓储业;第二层次:为生产和生活服务的部门,包括金融、保险业,地质普查业,房地产、公用事业,居民服务业,咨询服务业和综合技术服务业,农林牧渔、水利服务业和水利,公路、内河(湖)航道养护业等;第三层次:为提高科学文化水平和居民索质服务的部门,包括教育、文化、广播电视,科学研究、卫生、体育和社会福利事业等;第四层次:为社会公共需更服务的部门,包拾国家机关、政党机关、社会团体,以及军队和警察等。2.聚类分析方法聚类分析关注于根据一些不同种类的度量构造一些相似的对象组成的群体。关键的思想去确定对分析目标有利的对象分类方法。这个思想已经用于许多领域,包括天文学、考古学、医药、化学、教育、心理学、语言学和社会学。在聚类分析前,首先把数据标准化为Z-分数,采用系统聚类(HierachicalCluster)\n方法,用咅差平方和法(Ward法)计算欧几里得(Eudlidean)距离。聚类分析依据的基木原则是:直接比较样木中各事物Z间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差界小,类与类Z间的事物性质相差较大。其中欧式距离在聚类分析屮用得最广,它的表达式如下:|m2d.=Mxlk-X^YE其中Xik表示第i个样品的笫k个指标的观测值,Xjk表示笫j个样品的第k个指标的观测值,dij为第i个样品与第j个样品Z间的欧氏距离。若dij越小,那么第i与j两个样品Z间的性质就越接近。性质接近的样品就可以划为一类。当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,本节只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。首先将n个样品每个自成一类,然后每次将具有最小距离的两类合并成一类,合并后重新计算类与类Z间的距离,这个过程一直持续到所有样品归为一类为止。分类结果可以画成一张直观的聚类谱系图。应用系统聚类法进行聚类分析的步骤如下:①确定待分类的样品的指标;②收集数据;③对数据进行变换处理(如标准化或规格化);④使各个样品自成一类,即n个样品一共有n类;⑤计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成一类;⑥并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止;⑦最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。2.实例分析本文以河南省各地区三次产业就业人员数(2006年)为研究对彖,运用聚类分\n析方法对产业分布情况进行评价。各市区按三次产业分就业人员数(2006年底)市区第一产业第二产业第二产业构成(合计=100)第一产业第二产业第三产业全省3050.031350.571318.1253.323.623.0郑州市120.48127.85158.0629.631.538.9开封市17&2852.0753.4862.818.31&8洛阳市17&40106.1095.2047.027.925.1平顶山市162.1470.0874.5452.922.824.3安阳市162.5899.9067.0049.330.320.3鹤壁市35.4224.7721.4543.430.326.3新乡市149.7984.4755.4251.729.219.1焦作市85.8560.6749.5743.830.925.3濮阳市114.8566.1853.3449.028.222.8许昌市133.5677.0963.124&828.223.1潔河市77.8643.3630.7351.228.520.2三门峡市66.2326.8930.9353.421.724.9南阳市353.86137.50147.4455.421.523.1商丘市291.9189.12100.2760.618.520.8信阳市237.1579.88134.4352.517.729.8周口市357.82146.68156.4454.122.223.7驻马店市308.2099.07129.7957.41&424.2济源市14.3711.5913.5736.429.334.3聚类案例处理汇总"案例\n有效缺失总计N百分比N百分比N百分比18100.00.018100.0平均联结(组之间)聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集211316180.95400142710377.16700531112406.55800104618678.9090013547860.771027689885.573001()745953.185509814171235.79700129242082.3460711108112350.486631311232896.52090】51214154844.415801413686121.4984101614131410857.76111217151212621.79801116161616465.497151317\n1711354117.35016140\n树状图CASE0510152025Labe1Num++-+….+----+….+南阳市13-++周口市16・++-+•商丘市14■-1F11驻马店市17■-卜4卜1信阳市15+1鹤壁市6•+・・・+1济源市18・+++1潔河市11・+・+111三门峡市12-++・+11焦作市8・+・+11濮阳市9・+11新乡市7•+++许昌市10■+1平顶山市4-+1安阳市5++1开封市2-++•+1洛阳市3・—卜++郑州市1・+4、结论:由以上分析得知,三次产业人员就业情况河南省来说分两部分,第一部分包括13个城市,第二部分包括5个城市。第一部分的城市为郑州市,洛阳市,开封市,安阳市,平顶山市,许昌市,新乡市,濮阳市,焦作市,三门峡市,潔河市,济源市,鹤壁市。这13个城市都是我省主要的工业城市,人员就业主耍集中在第一和第二产业,这是由城市的定位决定的。而其他的5个城市,南阳市,周口市,商丘市,驻马店市,信阳市,这儿个城市是农业为主的城市,人口众多,人部分从事农业生产和外出务工,因此在这些城市里面,第一产业和第三产业的从业人数较多。而第二产业从业人员较少。\n用聚类分析研究河南省各市三次产业就业人员差异化专业班级:统计062班姓名:杨忠宏学号:06110040227查看更多