统计学实验报告 东华大学 统计学大作业

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学实验报告 东华大学 统计学大作业

东华大学管理学院管理科学与工程专业2010级统计学实验报告——居民消费价格指数的统计学分析学号:100750324姓名:指导老师:周力分数34\n居民消费价格指数的统计学分析背景描述:统计学在经济管理领域有着广泛的应用,本文将应用统计学对中国1978年至2006年的居民消费者价格指数进行分析,分析的方面包括(1)历年居民消费价格指数,(2)历年城市居民消费价格指数,(3)历年农村居民消费者价格指数,(4)历年商品零售价格指数,(5)历年工业品出厂价格指数,以及(6)2006年居民消费价格分类指数,其中前五个指数均以1978或者1985年为基年,最后一个指数以2005年为基年。本文一共应用了统计描述、散点图、箱形图、回归、移动平均法、指数平滑法、假设检验、方差分析、定基指数、环比指数等方法进行统计学分析。其中对历年商品零售价格指数进行回归,以探究其回归方程,把握数据的变动规律;对历年商品零售价格指数进行移动平均预测和指数平滑预测;对城市居民消费价格指数和农村居民消费价格指数做假设检验,检验两者均值是否有显著性差异;对商品零售价格指数和工业品出厂价格指数做价格检验,检验两者均值是否有显著性差异;对居民消费价格分类指数中的各类(共有“食品”、“烟酒及用品”、“衣着”、“家庭设备用品及服务”、“医疗保健和个人用品”、“交通和通信”、“娱乐教育文化用品及服务”、“居住”八大类)进行方差分析,检验各类消费价格指数的均值是否有显著性差异,探究此案例中分类型自变量是否对数值型自变量有显著性影响;将定比指数换算环比指数,探究环比指数之下变动情况并且与定比指数的情况进行对比。数据采集方式:《中国统计年鉴(2007年版)》第309页原始数据1:各种价格定基指数年份居民消费价格指数(1978=100)城市居民消费价格指数(1978=100)农村居民消费价格指数(1985=100)商品零售价格指数(1978=100)工业品出厂价格指数(1985=100)19781001001001980109.5109.5108.11985131.1134.2100128.11001990216.4222165.1207.71591991223.8233.3168.9213.7168.91992238.1253.4176.8225.2180.41993273.1294.2201254.9223.71994339367.8248310.2267.31995396.9429.6291.4356.1307.11996429.9467.4314.4377.83161997441.9481.9322.3380.83151998438.4479319.1370.9302.11999432.2472.8314.3359.8294.82000434476.6314354.4303.12001437479.9316.5351.6299.234\n2002433.5475.1315.2347292.62003438.7479.4320.2346.7299.32004455.8495.2335.6356.4317.62005464503.1343359.3333.22006471510.6348.1362.9343.2原始数据2:居民消费价格分类指数(2006年)项目全国居民消费价格指数食品粮食大米104.3面粉99.7淀粉101.8干豆类及豆制品100.8油脂98.6肉禽及其制品97.1蛋96水产品101.2菜鲜菜108.2调味品102.3糖111.2茶及饮料茶叶101.2饮料100.9干鲜瓜果鲜果121.5糕点饼干面包101.3液体乳及乳制品100.9在外用膳食品101.6其他食品101.2烟酒及用品烟草100.2酒101.2吸烟、饮酒用品100.7衣着服装99衣着材料100.5鞋袜帽100.2衣着加工服务费101.5家庭设备用品及服务耐用消费品34\n家具100.2家庭设备101.2室内装饰品100床上用品99.6家庭日用杂品101.1家庭服务及加工维修服务费105.8医疗保健和个人用品医疗保健医疗器具及用品97.2中药材及中成药99.9西药98.4保健器具及用品100.3医疗保健服务103个人用品及服务化妆美容用品99.7清洁化妆用品99.9个人饰品110.8个人服务102.5交通和通信交通交通工具97.8车用燃料及零配件112.8车辆使用及维修费102.4市内公共交通费104.8城市间交通费105.6通信通信工具82.2通信服务100娱乐教育文化用品及服务文娱用耐用消费品及服务94.2教育教材及参考书100.3学杂托幼费100文化娱乐文化娱乐用品99.6书报杂志100.7文娱费102.6旅游103.1居住建房及装修材料103.9租房102.7自有住房103.7水电燃料105.934\n针对原始数据1的分析:预处理:所有数据来源于《中国统计年鉴(2007年版)》,确保真实、完整、有效。描述性统计:统计量ConsumerPriceIndexN有效20缺失20均值345.215均值的标准误29.0203中值431.050众数100.0a标准差129.7827方差16843.546偏度-.858偏度的标准误.512峰度-.839峰度的标准误.992全距371.0极小值100.0极大值471.0百分位数25227.37550431.05075438.625a.存在多个众数。显示最小值由SPSS19中的描述统计中的频率可以得到上表,均值为345.215,中值为431.050,标准差为129.7827,正负三个标准差的范围为-44.1331~734.5631,所有数据均在此范围内,无异常值。偏度为-0.858,为左偏,峰度为-0.839.最大值为471,最小值为100,全距为371.现在针对“居民消费者价格指数”做回归分析:SPSS输入页面如下,其中AdjustedYear为调整后的年份34\n作出散点图如下:34\n回归分析表如下:34\n曲线拟合模型描述模型名称MOD_3因变量1ConsumerPriceIndex方程1线性2对数3倒数4二次5三次6复合a7幂a8Sa9增长a10指数a11Logistica自变量调整后年份常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001a.该模型要求所有非缺失值为正数。个案处理摘要N个案总数40已排除的个案a20已预测的个案0新创建的个案0a.从分析中排除任何变量中带有缺失值的个案。34\n变量处理摘要变量因变量自变量ConsumerPriceIndex调整后年份正值数2020零的个数00负值数00缺失值数用户自定义缺失00系统缺失2020模型汇总和参数估计值因变量:ConsumerPriceIndex方程模型汇总参数估计值R方Fdf1df2Sig.常数b1b2b3线性.892148.210118.00057.18915.611对数.71645.348118.000-17.181133.117倒数.38311.190118.004387.879-368.306二次.89471.830217.00040.53918.563-.095三次.955112.643316.000132.432-23.1873.293-.073复合.898157.897118.000100.7841.063幂.82786.271118.00067.968.560S.50518.330118.0005.936-1.654增长.898157.897118.0004.613.061指数.898157.897118.000100.784.061Logistic.898157.897118.000.010.941自变量为调整后年份。34\n根据R方值可以看出三次方拟合是最好的,可以得出回归方程为此时曲线拟合图为:34\n但是由明显可以看出,预测曲线在末尾是下降趋势,而实际数据在末尾确实上升趋势。所以以1998年(AdjusterYaer=21)为临界点,1998年前后各做回归分析。首先是1918~1998年:SPSS曲线回归输出结果如下:34\n模型汇总和参数估计值因变量:consuner方程模型汇总参数估计值R方Fdf1df2Sig.常数b1b2b3线性.84248.03419.00029.31617.897对数.59813.37719.00526.225102.295倒数.3484.81019.056309.483-258.397二次.980194.32628.000123.610-12.6341.464三次.983134.54037.000102.404.763-.040.046复合.953181.81619.00080.4221.085幂.75727.99619.00074.490.493S.4848.45319.0175.688-1.306增长.953181.81619.0004.387.082指数.953181.81619.00080.422.082Logistic.953181.81619.000.012.922自变量为AdjustedYear根据R方值可以看出三次方拟合是最好的,可以得出回归方程为y=102.404+0.763x-0.04x2+0.046x334\n此时拟合曲线为:其次是1998~2006年:SPSS曲线回归输出结果如下:模型汇总和参数估计值因变量:consumer方程模型汇总参数估计值R方Fdf1df2Sig.常数b1b2b3线性.71317.39117.004331.9974.518对数.67414.50017.00794.526109.050倒数.63412.13217.010550.160-2601.821二次.95056.43926.0001042.211-52.9111.149三次.94854.63526.000805.653-24.269.000.015复合.71317.40117.004346.1081.010幂.67514.51917.007204.283.242S.63512.15417.0106.331-5.777增长.71317.40117.0045.847.010指数.71317.40117.004346.108.010Logistic.71317.40117.004.003.990自变量为AdjustedYear。34\n根据R方值可以看出二次方拟合是最好的,可以得出回归方程为y=1042.211-52.911x+1.149x2此时曲线拟合图为:34\n然后用移动平均值法对“居民消费价格指数”做预测:操作数据如下:由图可见三期移动平均预测的“标准误差”更小,预测的2007年的消费价格指数为463.6随后用指数平滑法进行预测:34\n可见用α=0.5的指数平滑产生的标准误差最小,预测2007年消费价格指数为463.014α=0.534\nα=0.4α=0.3然后针对“城市居民消费价格指数”和“农村居民消费价格指数”做假设检验:H0:μ1=μ2H1:μ1≠μ2SPSS输入如下:34\nSPSS作箱型图如下:独立样本T检验输出结果如下:34\n组统计量分组1StatisticBootstrapa偏差标准误差95%置信区间下限上限urban&rural1.0N20均值373.250.93132.006303.293435.137标准差145.7669-4.987417.4844102.6945171.3394均值的标准误32.59452.0N20均值280.250-.58716.514246.332310.801标准差75.1542-2.707312.177746.339093.0758均值的标准误16.8050a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples独立样本检验方差方程的Levene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的95%置信区间下限上限urban&rural假设方差相等14.547.0002.53638.01593.000036.671618.7622167.2378假设方差不相等2.53628.435.01793.000036.671617.9333168.0667因P值=0.000<0.05,<0.05,因此拒绝原假设,两组数据均值有显著性差异。可见我国城市居民与农村居民的消费价格指数有显著差异,城市居民消费价格指数要明显高于农村居民消费价格指数。之后对“商品零售价格指数”和“工业品出厂价格指数”做假设检验:H0:μ1=μ2H1:μ1≠μ2用SPSS绘制箱形图如下所示:34\n用SPSS做独立样本T检验输出结果如下:组统计量分组2StatisticBootstrapa偏差标准误差95%置信区间下限上限商品零售&工业品出厂1.0N20均值293.580.55020.520250.207331.421标准差95.7651-3.784714.463561.5798114.5060均值的标准误21.41372.0N18均值267.917-.71516.163233.959296.480标准差70.1435-2.484812.612539.660989.3613均值的标准误16.5330a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples34\n独立样本检验方差方程的Levene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的95%置信区间下限上限商品零售&工业品出厂假设方差相等3.256.080.93336.35725.663327.4983-30.105981.4326假设方差不相等.94934.644.34925.663327.0534-29.278280.6048因P值=0.08>0.05,所以不拒绝原假设,两组数据均值不具有显著性差异。可见商品零售价格指数和工业品出厂价格指数均值之间没有显著性差异。然后作居民消费价格分类指数的方差分析:H0:μ1=μ2=···μ8H1:μi(i=1,2,3,···,k)不全相等SPSS输入界面如下:34\n作箱形图如下所示:34\nSPSS假设检验输出结果如下:34\n描述价格指数N均值标准差标准误均值的95%置信区间极小值极大值分量间方差下限上限118102.56675.195131.2245099.9832105.150196.00117.9023100.7000.50000.2886899.4579101.9421100.20101.2034100.30001.02956.5147898.6617101.938399.00101.5046101.31672.28422.9325398.9195103.713899.60105.8059101.30003.988731.3295898.2340104.366097.20110.8067100.80009.497373.5896792.0164109.583682.20112.8077100.07142.907301.0988697.3826102.760294.20103.1084104.05001.34040.67020101.9171106.1829102.70105.90总数58101.57594.74857.62352100.3273102.824482.20117.90模型固定效应4.92579.64679100.2767102.8750随机效应.64679a100.0465a103.1053a-2.03605方差齐性检验价格指数Levene统计量df1df2显著性1.983750.076ANOVA价格指数平方和df均方F显著性组间72.114710.302.425.882组内1213.1735024.263总数1285.28657均值图:34\n因为P值=0.882>0.05,所以不拒绝原假设。即居民消费价格指数的各个分类的均值没有显著性差异,可见居民在生活的各个方面的价格指数相差不显著。因此方差分析中有较多异常值,因此本文将对异常值单独关注,并在对异常值剔除后再次进行方差分析。异常值中偏小值分别为:697.1肉禽及其制品796蛋4682.2通信工具4894.2文娱用耐用消费品及服务异常值中偏大值分别为:9108.2鲜菜11111.2糖14117.9干鲜瓜果31105.8家庭服务及加工维修服务费39110.8个人饰品由此看见,2006年时,食品方面“肉禽及其制品”、“蛋”是相对便宜的,可以选择多消费,“鲜菜”、“糖”、“干鲜瓜果”是相对贵的,可以选择少消费;“通信工具”、“文娱用耐用消费品及服务”比较便宜,“家庭服务及加工维修服务费”、“个人饰品”比较贵,可以在消费上有侧重。34\n剔除异常值后的方差分析:SPSS输出箱形图:SPSS方差分析输出:描述34\n价格指数N均值标准差标准误均值的95%置信区间极小值极大值分量间方差下限上限113101.21541.31329.36424100.4218102.009098.60104.3023100.7000.50000.2886899.4579101.9421100.20101.2034100.30001.02956.5147898.6617101.938399.00101.5045100.4200.70143.3136999.5491101.290999.60101.2058100.11251.91791.6780898.5091101.715997.20103.0066103.90005.245572.1414998.3951109.404997.80112.8076101.05001.44879.5914799.5296102.570499.60103.1084104.05001.34040.67020101.9171106.1829102.70105.90总数49101.38782.48618.35517100.6736102.101997.20112.80模型固定效应2.23911.31987100.7418102.0338随机效应.55797100.0684102.70711.35266方差齐性检验价格指数Levene统计量df1df2显著性3.687741.004ANOVA价格指数平方和df均方F显著性组间91.134713.0192.597.026组内205.559415.014总数296.6934834\n因P值=0.026<0.05,所以拒绝原假设。即居民消费价格指数的各个分类的均值有显著性差异。有箱形图和均值图可以看出第6组和第8组的均值明显较高,现在单独剔除第8组,做箱形图和方差分析,得:34\n描述价格指数N均值标准差标准误均值的95%置信区间极小值极大值分量间方差下限上限113101.21541.31329.36424100.4218102.009098.60104.3023100.7000.50000.2886899.4579101.9421100.20101.2034100.30001.02956.5147898.6617101.938399.00101.5045100.4200.70143.3136999.5491101.290999.60101.2058100.11251.91791.6780898.5091101.715997.20103.0066103.90005.245572.1414998.3951109.404997.80112.8076101.05001.44879.5914799.5296102.570499.60103.10总数45101.15112.43288.36267100.4202101.882097.20112.80模型固定效应2.29512.34214100.4585101.8437随机效应.5024399.9217102.3805.77223方差齐性检验价格指数Levene统计量df1df2显著性4.048638.003ANOVA价格指数平方和df均方F显著性组间60.264610.0441.907.105组内200.169385.268总数260.4324434\nP值=0.105>0.05,不拒绝原假设。即居民消费价格指数的各个分类的均值没有显著性差异。单独剔除第6组,做箱形图和方差分析,得:34\n描述价格指数N均值标准差标准误均值的95%置信区间极小值极大值分量间方差下限上限113101.21541.31329.36424100.4218102.009098.60104.3023100.7000.50000.2886899.4579101.9421100.20101.2034100.30001.02956.5147898.6617101.938399.00101.5045100.4200.70143.3136999.5491101.290999.60101.2058100.11251.91791.6780898.5091101.715997.20103.0076101.05001.44879.5914799.5296102.570499.60103.1084104.05001.34040.67020101.9171106.1829102.70105.90总数43101.03721.66161.25339100.5258101.548697.20105.90模型固定效应1.37415.20956100.6122101.4622随机效应.4822099.8573102.21711.0409834\nANOVA价格指数平方和df均方F显著性组间47.98267.9974.235.003组内67.979361.888总数115.96042P值=0.003<0.5,拒绝原假设。即居民消费价格指数的各个分类的均值有显著性差异。由以上方差分析可以得到结论:第8组的均值显著高于其他组,其他7组之间的均值无显著性差异。即居民在“居住”这一大类(包含“建房及装修材料”、“租房”、“自有住房”、“水电燃料”四个小类)中的居民消费价格分类指数要显著高于其他组,反映了我国住房花费高的现实状况。最后将把定基指数转化为环比指数,并观察和解释他们之间的区别。转化后数据如下:34\n左侧为定比指数,右侧为环比指数。他们的折线图如下:定比价格指数34\n环比价格指数由图可以看出,定比价格指数中,各个指数之间差异较明显,城市居民消费价格指数明显高于农村居民消费价格指数,商品零售价格指数高于工业品出厂价格指数,只是在假设检验中两者并不算是0.5显著性水平下的显著性差异。而环比价格指数中,几个指数之间几乎无差异,也就是说在每个指数自身与自身纵向比较起来,各指数变化率差异不大。34
查看更多

相关文章

您可能关注的文档