- 2022-08-13 发布 |
- 37.5 KB |
- 15页



申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学分析报告
关于某国东北部,西南部,西部1517居民生活状况的统计分析报告一,数据介绍:本次分析的数据为某国东北部,西南不,两部1517居民生活状况统计表,其屮包括九个变量,分别是:1.性别,为二类变量(1代表男,2代表女)2.种族,为三类变量(1代表白人,2代表黑人,3代表其他)3.地区分布,为三类变量(1东南部,2西南部,3西部)4.幸福感,为三类变量(1非常幸福,2比较幸福,34、太幸福)5.受教育程度,三类变量(1高中及以下,2大学水平,3木科以上)6.家庭健烘状况的担忧,为八类变量(1自己准备看病,2精神问题,3酗酒,4吸毒,5长辈病重,6配偶病重,7孩了病重,8孩子染毒)7.工作的担忧,为九类变量(1失业或者儿个月没找到工作,2降职或者搬去更糟糕的的地方,3被降薪或者T作时长变短,4升职压力,5和上级处理不快,6负债或者破产,7长辈被炒,X长辈减薪,9配偶失业)8.去年中最重要的问题,为七类变量(1健康,2经济,3失去基础保障,4家庭,5个人,6法律官司,7,杂项资产)9.通过运用SPSS统计软件,对变量进行频数分析,描述性分析,方差分析,相关分析,以了解三个地区上去方面的综合情况,并分析各个变量的分布特点及相互Z间的关系。二、数据分析1、频数分析。通过频数分析三个地区1517个居民生活状况的统计数据表,了解三个地区总体的性别,种族,地区分类,年龄的基木分布。统计量性别种族地区分类年龄N有效1517151715171517缺失0000均值1.581.201.8312中值2.001.002.0000众数211.00标准差.494.473.83571方差.244.224.698极小值1I1.00极大值233.00和239818192778.00对三个地区总体性别,种族,年龄分布,并对三个地区的数据人总体数据的比重进行分析,结果如下:性别\n频率百分比有效百分比累积百分比有效男63641.941.941.9女8815&I5&I100.0合计1517100.0100.0表说明,在三个地区被调查的1517个居民中,有881名女性,占58.1%,636名男性,占41.9%。三个地区总共居民的男女数量差别不大,女性比男性多16.2%.种族频率百分比有效百分比累积百分比有效白人126483.383.383.3黑人20413.413.496.8其他493.23.2100.0合计1517100.0100.0表说明,在三个地区被调查的1517个居民屮,白人明显多于黑人和其他种族,在所调杳的居民屮,白人1264名,占-总调杳人口的83.3%地区分类频率百分比有效百分比累积百分比有效东北部67944.844.844.8东南部41527.427.472.1西部42327.927.9100.0合计1517100.0100.0表说明,在调查的数据中,来自东北部的居民最多,为679名,占44.8%,来自东南和西部的居民数量差不多,分别占一比重各为27.4%和27.9%年龄频率百分比有效百分比累积百分比有效134022.422.422.4253635.335.357.7364142.342.3100.0合计1517100.0100.0表说明,在三个地区被调查的1517个居民中,30岁以下的居民为340为,占22.4%,31至45岁的为536名,占35.3%,46岁以上的为641名,占42.3%。下曲是來自东北部,东南部,西部数据占总体数据的比重的直方图。\n50-城EG类flibarftmarear缈0分穴2、描述性统计分析。通过简单的频数分析了解居民的年龄,性别,种族和三个地区在数据屮所占的比重,继续对他们的均值,标准差,偏度风度等数据,已进行把数据的集屮趋势和离散趋势。描述统计量N全距极小值极大值和均值标准差方差偏度峰度统计最统计最统计统计最统计统计最统计统计最统计最标准误统计标准误幸福感150421327061.80.617.380.155.063-.533.126受教育程度15172.001.003.002383.001.5709.66262.439.740.063-.542.126有效的N(列表状态)1504如表所示,以幸福感为例读取分析结果,在1517个人屮平均水平是1.80,比较幸福,最低不太幸福,最好是非常幸福,标准差为0.617.偏度为0.155,峰度为-0.533.可以得出结论三个地区总体的居民在不太幸福和比较幸福之间。3•探索性数据分析(1)交叉分析前血只能的到总体的分布情况,要分析变量之间的相互影响和关系,不仅要了解单个变量的数据分布情况,还要分析多个变量不同取值下的分布。现需要分析性别和受教冇穆度,工作担忧,年龄,幸福感的交叉分析。现以性别和受教育程度,工作扌H忧等级的列表分析为例,读取数据:案例处理摘要性别案例有效缺失合计N百分比N百分比N百分比\n受教育程度男636100.0%0.0%636100.0%女881100.0%0.0%881100.0%工作担忧男636100.0%0.0%636100.0%女881100.0%0.0%881100.0%描述性别统计量标准课受教育程度男均值1.6509.02755均值的95%置信区间下限1.5968上限1.70505%修整均值1.6122中值2.0000方差.483标准差.69476极小值1.00极大值3.00范围2.00四分位距1.00偏度.594.097峰度-.787」94女均值1.5131.021引均值的95%置信区间下限1.4712上限1.55495%修整均值1.4589中值1.0000方差.400标准差.63255极小值1.00极大值3.00范围2.00四分位距1.00偏度.842.082峰度・.331」65\n工作担忧男均值512.0310.813均值的95%置信区间下限490.80上限533.275%修整均值527.63中值500.00方差74360.780标准差272.692极小值1极大值742范围741四分位距242偏度-.960.097峰度・.514」94女均值544.128.712均值的95%置信区间下限527.02上限561.225%修整均值563.24中值742.00方差66870.274标准差258.593极小值I极大值742范围741四分位距242偏度-1.182.082峰度.064」651、就性别和受教冇稈度来看,在相同的受教冇程度下,男性均值是1.6509,标准差是0.69467,女性均值是1.5131,标准差是0.63255,各个受教育水平都有涉及男性受教育程度的偏度为0.594,峰度为・0。787,女性数值偏度为0.82,峰度为-0.330据此得出结论,相同的受教冇水平的男女数量差别不大,均值均在大学水平。在大多数角度来看,女性比男性的受教育程度要高。2、就性别与工作担忧来看,相同的工作担忧,男性均值为512.03,标准差为272.692,女性均值为544.12,标准差为258.593,担忧程度的范围差别不大。\n500-直方图用干sex=女:坷谊=1.51[施踊痊.=633N=881400-300-200-100-0.501.001.502.002.503.003.50受教育程度3.00--5022受•教育程度JUffl性别\n性别,受教冇程度,年龄之间的交叉关系图表:性別131313工作担忱年龄表数据表示随着受教冇程度的上升,对工作担忧的程度也随之减少。在相同的受教冇稈度性别条件下,年龄越大则对工作担忧越大。4、相关分析分析年龄,幸福感和在去年屮最重要的问题两两Z问的相关关系。描述性统计量均值标准差N年龄2.20.7801517幸福感1.80.6171504在去年屮最审:要的问题925.42479.4181517相关性年龄幸福感在去年中最重要的问题\n年龄Pearson相关性1-.030.061*显箸性(双侧).243.017平方与叉积的和921.276-21.76134646.219协方差.608-.01422.854N151715041517幸福感Pearson相关性-.0301-.090**显箸性(双侧).243.000平方与叉积的和-21.761571.359-39905.074协方差-.014.380-26.550N150415041504在去年中最重要的问题Pearson相关性.061"-.090"1显著性(双侧).017.000平方与叉积的和34646.219-39905.0743.484E8协方差22.854-26.550229841.457N151715041517*.在0.05水平(双侧)上显著相关。**.在.01水平(双侧)上显著相关。表数据显示,年龄和幸福感的皮尔逊相关性洗漱为-0.030,明显小于0.05,即没有充分理市拒绝原假设(年龄和幸福感Z间无关),所以年龄和幸福感无关。同理可得,在去年屮最重要的问题和年龄,幸福感均相关相关,偏回归分析分析在性别为分类条件的,年龄和在家庭健康担忧Z间的线性相关稈度。DescriptiveStatisticsMeanStd.DeviationN年龄2.20.7801517受教疗程度1.57.6631517性别1.58.4941517CorrelationsControlVariables年龄受教育程度性别・none」年龄Correlation1.000-.088.053Significance(2-tailed)•.001.037df015151515受教育程度Correlation-.0881.000-.103Significance(2-tailed).001■.000df151501515\n性别Correlation.053-.1031.000SigniGcance(2-tailed).037.000■df151515150性别年龄Correlation1.000-.083Significance(2-tailed)•.001df01514受教育程度Correlation-.0831.000Significance(2-tailed).001■df15140a.Cellscontainzero-order(Pearson)correlations・表数据显示,在未控制性别时,年龄和受教冇穆度的相关性为-0.088,显著系数为0.001所以得出结论为年龄和受教冇程度是显著不相关;在同一性别时,年龄和受教育程度的相关系数为-0.083,SIG为0.001,所以得出结论是同一性别,年龄和受教育程度显著无关。也可推测出,在近几年屮,教冇的普及面并没有扩大,而由前血得出三个地区总体受教育程度平均值和峰值都是略高于高屮毕业水平,说明三个总体居民大学辍学比较常见,而且较易与人接受。男女的受教育比重没有改变,说明教育的总体很稳定,基本没变动。5、线性分析通过对居民幸福感及这些居民的居住地,受教育稈度,年龄,种族,工作类别,孩了数量的数据拟合多元线性冋归模型,分析上述特征和居民幸福度的关系,以寻找可以提高居民幸福感的方法。ANOVAaModelSumofSquaresdfMeanSquareFSig.1Regression14.93262.4896.795.000bResidual509.8621392.366Total524.7951398a.DependentVariable:幸福感b.Predictors:(Constant),孩子数最,地区分类,种族,工作分类,年龄,受教育年限ANOVO表格给出了回归过稈的每一步的方羌分析结果冋归平方和和残差平方和相差很大,拟合效果理想。由SIG系数远小于0.05,说明当冋归方程包含不同白变量时,其显著性远小于概率均值,所以方羌分析行效。ANOVAabModelSumofSquaresdfMeanSquareFSig.1Regression8.80518.80523.483.000°Residual560.9081496.375\nTotal569.7121497a.DcpcndcrHVariable:幸祸感b.Selectingonlycasesforwhich年龄>=0c.Predictors:(Constant),受教育年限Coefficients"ModelUnstandardizedCoetlicientsStandardizedCoefiicientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1(Constant)2」30.07030.286.000受教育年限-.026.005・.124-4.846・0001.0001.000a.DependentVariable:幸福感b.Selectingonlycasesforwhich年龄>=0ResidualsStatistics3年龄>=0(Selected)MinimumMaximumMeanStd.DeviationNPredictedValue1.612.131.80.0771498Std.PredictedValue-2.3924.330.0001.0001498StandardErrorofPredictedValue.016.070.021.0071498AdjustedPredictedValuei.612.141.80.0771498Residual-1.1301.386.000.6121498Std.Residual-1.8452.263.0001.0001498Stud.Residual-1.8572.268.0001.0001498DeletedResidual・1」451.392.000.6131498Stud.DeletedResidual-1.8592.271.0001.0011498Mahal.Distance.00218.746.9991.6501498CookrsDistance.000.023.001.0011498CenteredLeverageValue.000.013.001.0011498a.DependentVariable:幸福感\nHistogramDependentVariable:幸福感400-Mean=-4.29E-16Std.Dev.=1.000N=1,498?uo>nba)t200--2-10123RegressionStandardizedResidualScatterplotDependentVariable:幸福感iiii-2024RegressionStandardizedPredictedValue-enp-sem(ss®」d)®pezRuwprusuoas®」6a(r以上数据表明这个以幸福感为因变量,以受教冇稈度和年龄为变量以年龄为变量的线性冋归方稈建造不成,因为标准残差不能稳定在一个准确的值。7曲线分析\n通过llll线冋归来分析去年最重要的问题Z间的关系ModelSummaryandParameterEstimatesDependentVaiiable:去年最重要的问题EquationModelSummaryParameterEstimatesRSquareFdfldf2Sig.Constantblb2b3Linear.0022.995I1512.084870.2691.198Quadratic.0032.40921511.090751.7396.641-.054Cubic.0042.08331510」011011.466・11.738.338-.003Compound.0034.993I1512.026332.9271.006Growth.0034.99311512.0265.808.006Theindependentvariableis年龄.去年最重耍的问题1200*600-400-H200-16080100o-f0OObservedLinear—Quadratic—CubicCompound--Growth40年龄每个年龄段都有去年最重要的问题,与受教育程度等无关,上述的散点图表现的有点极端,每个年龄的人不是关于健康,经济,等烦恼事有几乎没什么烦恼,要不就是会有很多烦恼。所以说,成年人或者是长大了的人感叹过去灿烂时光无忧无虑其实是只记得童年的欢乐和a由,忘了去记起童年的白己也想这样羡慕长大的人。重要的是,如何做,怎么想。\n8>独立样本T检验\n检验工作类别和性别是否具冇显著并界GroupStatistics性别NMeanSid.DeviationSid.ErrorMean工作分类男6213.351.941.078女7972.591.558.055IndependentSamplesTtstLevenersTestforEqualityofVariancest-tesllorEqualityofMeansFSig.tdfSig.(2-tailcd)MeanDiffcrcnccStd.ErrorDiffcrcncc95%ConfidenceIntervaloftheDifterenceLowerUpper工作分类Equalvariancesassumed161.363.0008.1701416.000.759.093.577.942Equalvariancesnotassumed7.9531169.230.000.759.095.572.947从表格得出,SIG的值远小于0.01,否认方弟相等的原假设,所以参考第一行的(检验结果,t值为&170大于2,相对应的双侧sig值小于0.01,即在0.01的显著性水平上,认为性别和工作分类无关。\nSPSS统计分析小学期统计分析报告班级:应用统计Q1341学号:13140142姓名:杨辰玉查看更多