- 2022-08-24 发布 |
- 37.5 KB |
- 8页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
多元统计学分析报告
多元统计学作业——分析报告姓名:代晓双学号:班级:统计09-2班我国16个地区农民在1982年支出情况的抽样调查数据的汇总资料,每个地区都调查了反应每人平均消费生活消费支出情况的六大指标。对16个地区进行分析。一:数据来源《应用多元统计分析》教材343页例6.4.1二.对于生活消费水平因素的假设:1、食品消费占所有影响变量的主体2、各消费因素之间相互联系3、生活用品及其他与各变量相关4、各消费因素与地区发达程度有关三、操作步骤:报告应用到软件中的因子分析、描述统计分析、单因子检验等检验分析、方差均值分析等。分析描述统计描述现在所需项目输出“描述统计量”及图形分析(如表1等)分析降维因子分析输出“解释的总方差”(如表2)因子分析抽取(固定因子数为3)分析降维因子分析旋转输出“解释的总方差”(如表3组)标准化后得分聚类分析:分析——分类——系统聚类(如表4组)T检验:分析——比较均值——配对检验(如表5)分组:数据——分析——描述(如表6)其他:excle表格制作表(如表7组)相关分析(如表8)四、操作结果分析表1等分析结果如下:分析——描述统计——描述——现在所需项目输出“描述统计量”描述统计量N和百分比均值标准差方差偏度峰度统计量统计量统计量统计量统计量统计量统计量标准误统计量标准误文化生活服务支出X61679.871.99%4.99191.630772.659.864.564.9861.091燃料X316201.7711.47%12.61063.7019813.705.182.564-1.0591.091生活用品及其他X516459.2413.13%28.702510.78878116.398.918.564-.1181.091衣着X216471.405.04%29.46256.5897643.425.595.564-.2331.091住房X416523.9011.77%32.743826.51414703.0002.255.5646.1251.091食品X1162266.8056.60%141.675033.317701110.069.809.564.8411.091有效的N(列表状态)16由上表分析如下4点:1、由和可以知道食品消费的数量是最大的,为2266.80,起主体作用,文化生活服务支出相对数量较小,为79.87。且由百分比可以知道食品占多部分高达56.60%,生活用品及其他占13.13%,住房占11.77%,燃料占11.47%,衣着占5.04%,文化生活服务支出占1.99%。\n2、由方差可以知道食品的方差最大是1110.069文化生活服务支出方差最小是2.659,从而可以知道食品消费的落差大,不稳定。而文化生活服务支出落差较小,相对较稳定。3、由偏度值>0表示为右偏,偏度值<0表示为左偏,由以上可以知道,平均消费生活消费支出情况的六大指标均为右偏。4、由峰度值>0表示为在均值以上,偏度值<0表示为在均值以下,由以上可以知道,燃料、生活用品和衣着都是在均值以下、食品和文化生活服务支出都是在均值以上。由上图说明:在任何地区食品所占比例都是比较大的,文化生活服务支出各地区差距不大,综合来看,上海、北京、江苏各指标相对较高,说明这些地区相对较发达。上海的住房十分宽松。表2分析结果如下:分析——降维——因子分析——输出“解释的总方差”解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%13.55959.31559.3153.55959.31559.31521.31121.84681.1601.31121.84681.1603.61310.21991.3794.3746.23097.6095.1061.77599.3836.037.617100.000提取方法:主成份分析。由上表说明只有选择三个因子才可以保留91.379%>85%,因此固定因字数为3。\n抽取(固定因子数为3)表3组分析结果如下:分析——降维——因子分析旋转——输出“解释的总方差”标准化后得分(1)由抽取(固定因子数为3)得下表:解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差%累积%合计方差%累积%合计方差%累积%13.55959.31559.3153.55959.31559.3153.10951.81651.81621.31121.84681.1601.31121.84681.1601.25520.90872.7253.61310.21991.379.61310.21991.3791.11918.65491.3794.3746.23097.6095.1061.77599.3836.037.617100.000提取方法:主成份分析。由以上两表进行对比,说明选择3个固定因子后使得数据的贡献率达91.379%,有碎石图可以看出其数据变化集中情况。旋转成份矩阵a成份123食品X1.744.483.354衣着X2.890.170-.069燃料X3-.057.130.985住房X4.879.215-.051生活用品及其他X5.970.086-.029文化生活服务支出X6.216.960.128提取方法:主成分分析法。旋转法:具有Kaiser标准化的正交旋转法。a.旋转在4次迭代后收敛。(2)由旋转操作得下表:成份矩阵a成份123食品X1.908.294.032衣着X2.870-.248.083燃料X3.102.891.429住房X4.880-.209.055生活用品及其他X5.913-.280.193文化生活服务支出X6.599.496-.617提取方法:主成分分析法。a.已提取了3个成份。①由旋转矩阵的分析给3个因子进行命名:由因子1的数据发现食品、衣着、住房占比例相当大,命名为“生活消费”;由因子2的数据发现燃料、文化生活服务支出占比例相当大,命名为“享受消费”;由因子3的数据发现生活用品占比例相当大,命名为“发展消费”;②由成分矩阵给出模型:X1=0.908F1+0.295F2+0.035F3;X2=0.870F1-0.205F2+0.078F3;X3=0.099F1+0.892F2+0.482F3;X4=0.811F1-0.207F2+0.057F3;X5=0.913F1-0.280F2+0.193F3;X6=0.599F1+0.500F2-0.614F3;(3)标准化后的得分分析\n因子1因子2因子3北京2.04082-0.24218-1.98694天津0.37437-1.102910.64221河北-1.08986-1.060860.31144山西-1.13556-1.32293-0.63094内蒙古-0.67586-0.896210.10462辽宁0.234980.355702.27919吉林0.072561.311100.88614黑龙江-0.420370.43586-0.83205上海2.34017-0.470430.66693江苏0.141070.00149-0.64931浙江0.60833-0.080230.34026安徽-0.317391.40097-0.74482福建-0.357191.62714-0.71155江西-0.699661.466540.40059山东-0.16058-0.642960.75418河南-0.95583-0.78009-0.82995合计2.04082-0.24218-1.98694①由此表因子1可以知道生活消费方面河北、山西、内蒙古、黑龙江、安徽、福建、江西、山东、河南的生活消费水平在平均水平之下,北京、天津、辽宁、吉林、上海、江苏、浙江相对较高。说明北京、天津、辽宁、吉林、上海、江苏、浙江这些地区消费较高。②由此表因子2可以知道享受消费方面北京、天津、河北、山西、内蒙古、上海、浙江、山东、河南的享受消费水平在平均水平之下,辽宁、吉林、黑龙江、江苏、安徽、福建、江西相对较高。说明辽宁、吉林、黑龙江、江苏、安徽、福建、江西这些地区精神世界较丰富。③由此表因子3可以知道发展消费方面北京、山西、黑龙江、江苏、安徽、福建、河南的发展消费水平在平均水平之下,天津、河北、内蒙古、辽宁、吉林、上海、浙江、江西、山东相对较高。说明天津、河北、内蒙古、辽宁、吉林、上海、浙江、江西、山东这些地区消费较高。表4组聚类分析分析——分类——系统聚类快速聚类安徽12福建13江西14黑龙江8江苏10浙江11天津2山东15辽宁6吉林7河北3河南16山西4内蒙古5北京1上海9由于分三类:由上图可以知道:1、上海为一类为发展消费2、内蒙古、山西、河南、河北、江西、福建、安徽、黑龙江、吉林、辽宁、浙江、江苏、山东、天津为一类,为生活消费3、北京为一类为享受消费\n由以上表可以将上述地区进行分类同样若分3类则1、上海为一类为发展消费2、内蒙古、山西、河南、河北、江西、福建、安徽、黑龙江、吉林、辽宁、浙江、江苏、山东、天津为一类,为生活消费3、北京为一类为享受消费表5:T检验:分析——比较均值——配对检验成对样本检验成对差分tdfSig.(双侧)差分的95%置信区间均值标准差均值的标准误下限上限对1食品X1-衣着X2112.2125029.362097.3405296.56654127.8584615.28715.000对2食品X1-燃料X3129.0643832.253378.06334111.87777146.2509816.00615.000对3食品X1-住房X4108.9312520.855125.2137897.81834120.0441620.89315.000对4食品X1-生活用品及其他X5112.9725026.815866.7039798.68334127.2616616.85215.000对5食品X1-文化生活服务支出X6136.6831332.307338.07683119.46776153.8984916.92315.000对6衣着X2-燃料X316.851877.798081.9495212.6965721.007188.64415.000对7衣着X2-住房X4-3.2812522.688185.67204-15.370938.80843-.57815.572对8衣着X2-生活用品及其他X5.760005.624451.40611-2.237063.75706.54015.597对9衣着X2-文化生活服务支出X624.470626.166741.5416921.1846027.7566515.87315.000对10燃料X3-住房X4-20.1331327.087446.77186-34.56701-5.69924-2.97315.009对11燃料X3-生活用品及其他X5-16.0918811.609732.90243-22.27826-9.90549-5.54415.000对12燃料X3-文化生活服务支出X67.618753.65243.913115.672519.564998.34415.000对13住房X4-生活用品及其他X54.0412518.544394.63610-5.8403613.92286.87215.397对14住房X4-文化生活服务支出X627.7518825.965876.4914713.9156441.588114.27515.001对15生活用品及其他X5-文化生活服务支出X623.7106310.397422.5993518.1702329.251029.12215.000\n由以上表可以知道:衣着-住房、衣着-生活用品及其他、住房-生活用品及其他的Sig.(双侧)/2>0.05,接受原假设。也就是衣着、住房、生活用品及其他是有联系的,并且联系密切。分组:表6食品消费分组:数据——分析——描述组食品消费分组地区数(个)190-11032110-13033130-15054150-17035170-1902经以上表1和表3组分析可知食品消费占比例最大,对其进行分组得到:食品消费基本集中于130-150之间,两极分布基本均匀,由直方图知道基本呈正态分布。表7组:表格制作(excle表格制作表)A=各地区占本次抽样比率(如:北京的食品消费占所抽样食品消费总和的8.40%)B=各项指标占本地区的百分比(如:北京的食品消费占北京消费的52.52%)食品衣着燃料住房生活用品文化ABABABABABAB北京8.40%52.52%9.29%12.08%4.82%2.68%11.51%16.70%10.67%13.52%2.49%11.32%天津5.96%50.70%7.72%13.65%5.19%3.93%8.40%16.56%7.95%13.68%1.48%4.93%河北4.20%54.28%4.84%13.02%4.61%5.30%4.27%12.79%4.97%13.01%1.60%3.51%山西4.62%62.52%5.33%14.98%3.17%3.82%1.88%5.90%3.96%10.84%1.94%4.07%内蒙古5.66%62.69%5.86%13.49%4.43%4.36%2.39%6.14%5.22%11.71%1.60%4.09%辽宁6.43%54.74%6.96%12.34%8.82%6.68%5.19%10.25%8.51%14.69%1.30%4.34%吉林7.03%62.88%7.08%13.17%9.10%7.25%2.25%4.66%5.51%9.98%2.06%6.54%黑龙江5.13%57.94%6.27%14.74%6.56%6.60%2.62%6.86%4.74%10.84%3.01%7.56%上海9.75%49.73%8.20%8.69%6.21%2.82%21.99%26.01%11.07%11.43%1.32%7.37%江苏6.40%55.46%6.18%11.14%5.78%4.46%8.10%16.30%5.94%10.44%2.20%7.19%浙江7.50%56.29%6.95%10.85%6.30%4.21%8.96%15.61%7.48%11.38%1.66%6.26%安徽6.75%63.81%4.90%9.62%7.74%6.51%4.48%9.81%3.96%7.58%2.66%8.00%福建6.39%62.77%4.51%9.21%8.27%7.23%3.71%8.45%4.74%9.42%2.92%8.43%江西6.20%63.95%4.56%9.78%8.74%8.03%3.65%8.73%3.48%7.27%2.25%6.19%山东5.11%50.47%6.42%13.18%6.05%5.32%6.39%14.64%7.35%14.71%1.68%4.82%河南4.46%56.87%4.93%13.07%4.19%4.76%3.84%11.35%4.46%11.52%2.42%5.38%由上表我们知道:由A知道各地区的食品消费占所抽样食品消费总和的百分比;由B知道各地区的食品消费占所在地区的消费的百分比。⑴纵观A各地区的食品消费占所抽样食品消费总和的百分比和B各地区的食品消费占所在地区的消费的百分比可以知道:在食品消费中:抽样食品消费中上海所占比例最大,高达9.75%,河北所占比例最小为4.20%。上海比例是河北的2.5倍左右,落差较大。各地区食品消费占本地区的百分比中江西所占比例最大为63.35%,上海所占比例最小占49.73%,江西比例是上海的1.5倍左右,落差较大。在衣着消费中:抽样衣着消费中北京所占比例最大,高达9.29%,福建所占比例最小为4.51%。北京比例是福建的2倍左右,落差较大。各地区衣着消费占本地区的百分比中黑龙江所占比例最大为14.74%,上海所占比例最小占8.69%,黑龙江比例是上海的1.5倍左右,落差较大。在燃料消费中:抽样燃料消费中辽宁所占比例最大,高达8.82%,山西所占比例最小为3.17%。辽宁所占比例是山西的2.5倍左右,落差较大。各地区燃料消费占本地区的百分比中江西所占比例最大为8.03%,北京所占比例最小占2.68%,江西比例是北京的3倍左右,落差较大。在住房消费中:抽样住房消费中上海所占比例最大,高达21.99%,山西所占比例最小为1.88%。上海比例是福建的10倍左右,落差巨大。各地区住房消费占本地区的百分比中上海所占比例最大为26.01%,吉林所占比例最小占4.66%,上海比例是吉林的5倍左右,落差较大。\n在生活消费中:抽样生活用品消费中上海所占比例最大,高达11.07%,江西所占比例最小为3.48%。上海比例是江西的3倍左右,落差较大。各地区生活消费占本地区的百分比中山东所占比例最大为14.71%,江西所占比例最小占7.27%,山东比例是江西的2倍左右,落差较大。在文化消费中:抽样文化消费中黑龙江所占比例最大,高达3.01%,辽宁所占比例最小为1.30%。黑龙江比例是辽宁的2.5倍左右,落差较大。各地区文化消费占本地区的百分比中北京所占比例最大为11.32%,河北所占比例最小占3.51%,北京比例是河北的3倍左右,落差较大。⑵按地区分析:发达地区(北京):抽样里面北京的衣着消费比例是最大的,说明北京人时尚的一面。食品、住房、生活、文化消费比例都相对较大的,然而燃料消费相对较小,说明北京环保不错。在北京本地区消费中食品占比例最大,燃料比例最小。可见北京是一个消费高的地区。快速发展地区(上海):抽样里面上海的食品、住房、生活消费比例是最大的,其他消费处于中等水平。说明上海住房较宽松,生活、食品消费高。发展中地区(其余):各种消费没有严重偏高或者偏低,处于比较稳定状态。表8相关分析:相关性控制变量食品X1衣着X2燃料X3住房X4文化生活服务支出X6生活用品及其他X5-无-a食品X1相关性1.000.664.338.780.635.706显著性(双侧)..005.200.000.008.002衣着X2相关性.6641.000-.075.663.375.902显著性(双侧).005..781.005.153.000燃料X3相关性.338-.0751.000-.087.250-.059显著性(双侧).200.781..749.350.829住房X4相关性.780.663-.0871.000.363.831显著性(双侧).000.005.749..166.000生活用品及其他X5相关性.706.902-.059.831.3111.000显著性(双侧).002.000.829.000.241.df14141414140文化生活服务支出X6相关性.635.375.250.3631.000.311显著性(双侧).008.153.350.166..241生活用品及其他X5食品X1相关性1.000.089.537.491.616显著性(双侧)..753.039.063.014衣着X2相关性.0891.000-.052-.359.229显著性(双侧).753..853.189.411燃料X3相关性.537-.0521.000-.068.283显著性(双侧).039.853..808.306住房X4相关性.491-.359-.0681.000.198显著性(双侧).063.189.808..479文化生活服务支出X6相关性.616.229.283.1981.000显著性(双侧).014.411.306.479.a.单元格包含零阶(Pearson)相关。由左图偏相关可以知道:在无控制变量时:食品和衣着较强相关显著;食品和燃料弱相关不显著;食品和住房较强相关显著;食品和生活用品及其他较强相关显著;食品和文化生活服务支出较强相关显著;衣着和燃料不相关不显著;衣着和较强相关显著;衣着和生活用品及其他强相关显著;衣着和文化生活服务支出弱相关不显著。燃料和住房不相关不显著;燃料和生活用品及其他不相关不显著;燃料和文化生活服务支出不相关显著;住房和生活用品及其他强相关显著;住房和文化生活服务支出弱相关不显著;生活用品及其他和文化生活服务支出弱相关不显著。有生活用品及其他为控制变量时:对食品、衣着、燃料有影响。\n五、分析结论:综上所述得如下结论:1、食品消费占所有影响变量的主体,百分比可高达56.60%2、有些消费因素之间相互联系,如:衣着、住房、生活用品及其他是有联系的,并且联系密切3、生活用品及其他与一些变量相关,如对食品、衣着、燃料有影响。由2、3知道生活用品及其他与食品、住房、燃料之间的关系紧密,都与人们的日常生活有关4、各消费因素与地区发达程度有关发达地区(北京)北京的衣着消费比例是最大的,说明北京人时尚的一面。食品、住房、生活、文化消费比例都相对较大的,然而燃料消费相对较小,说明北京环保不错。在北京本地区消费中食品占比例最大,燃料比例最小。可见北京是一个消费高的地区。快速发展地区(上海):抽样里面上海的食品、住房、生活消费比例是最大的,其他消费处于中等水平。说明上海住房较宽松,生活、食品消费高。发展中地区(其余):各种消费没有严重偏高或者偏低,处于比较稳定状态。查看更多