- 2022-09-01 发布 |
- 37.5 KB |
- 7页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
SPSS管理统计学作业
洪城水业2009-2013年日收盘价与大盘走势分析研究--以上证A股洪城水业(600461)为例(一)个股分析本文我们将对洪城水业2009-2013年五年每日的收盘价为样本研究对象,将大盘走势用上证综合指数来表示。剔除离群值,画出图形,并进行数据分析。本文数据来源于国泰安数据库,利用EXCEL与SPSS21.0进行分析。在我们所要分析的数据中,有时会出现个别测定值与其他数据相差甚远,这些数据被称为离群值。而离群值对统计分析会造成影响,造成参数估计的偏离,统计分布的错判,以及对统计方法的选择与结果解释都会造成一定的影响,从而得出错误的统计分析结论。常用的剔除离群值的方法有:(1)可依据常识和原理直接判断;(2)箱线图观察;(3)Z值观察。箱线图法剔除离群值相对精确,因此为提高数据的代表性我们选择此种方法去除离群值对样本的影响。如图:图1-1箱线图图1-2统计量交易日期日收盘价N有效11921192缺失00图中的点为疑似异常点,相应的序号为245、246、247、256、258、259、260、265、458、463、465、466、469、1177、1176代表异常点在各列对应的位置。将这些离群值去掉所得洪城水业历史五年从2009-2013年每日收盘价共1192个数据。图中横轴表示时间,纵轴表示日收盘价。从箱线图1-1中我们可以看出2010年日收盘价相对较高,而2011年全年股价的每日收盘价差异较大,并在这一年股价也达到了历史最高水平,相对前几年来说2012-2013股价变化平稳。\n图1-3交易日期频率百分比有效百分比累积百分比有效200924120.220.220.2201023619.819.840.0201124020.120.160.2201223719.919.980.0201323820.020.0100.0合计1192100.0100.0图1-3表示洪城水业2009-2013年日收盘价的频率分析图。图1-42009-2013年洪城水业个股收盘价描述性分析N极小值极大值均值标准差偏度峰度统计量统计量统计量统计量标准误统计量统计量标准误统计量标准误20092415.6112.079.1080.093521.45184-.271.157-.167.312201023610.5218.6414.9551.112981.73566-.575.158.554.31620112408.0919.8713.1935.236123.65803.414.157-1.637.31320122376.119.037.4653.04368.67245.385.158-.703.31520132386.269.157.6996.03709.57222.194.158-.283.314数据来源:作者手工整理根据2009-2013年洪城水业个股收盘价描述性分析图可以看到5年历史日收盘价2009年为最低值5.61,在2011年达到最大值19.87,股价波动的最大差距为14.26,反映股价5年间波动较大。2010年日收盘价均值为14.9551均高于其他年度,说明2010年洪城水业股票价格增长势头明显,可以给投资者带来更多投资回报。而2012年和2013年日收盘价的最小值分别为6.11和6.26,最大值为9.03和9.15,标准差分别为0.67245和0.57222,表明这两年股价变化平稳,相比以往年度有所下降。图1-5\n从图1-5日收盘价的直方图中可以看出2009-2013年洪城水业收盘价具有右偏趋势,不具备明显的正态分布。图1-6正态性检验交易日期Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.日收盘价2009.067241.010.973241.0002010.124236.000.938236.0002011.274240.000.801240.0002012.082237.001.967237.0002013.068238.010.989238.064a.Lilliefors显著水平修正图中显示了按时间分为的5个分组的两种检验方法的正态性检验结果,包括各分组的统计量、自由度及显著性水平,以K-S方法为例分析:2009-2013年洪城水业日收盘价其自由度sig.分别为0.01、0.000、0.000、0.001、0.010明显小于0.05,故应拒绝原假设,认为日收盘价分组中的数据不服从正态分布。图1-7M-估计器交易日期Huber的M-估计器aTukey的双权重bHampel的M-估计器cAndrews波d日收盘价20099.12009.19779.15839.2043201015.035815.092315.093215.0907201111.428910.274511.063510.273020127.39177.39547.42617.395820137.66127.65937.67287.6590a.加权常量为1.339。b.加权常量为4.685。c.加权常量为1.700、3.400和8.500d.加权常量为1.340*pi。图1-7中提供了四种估计方法,每种估计方法的加权量在表下方给出,对于有异常值或极端值的数据,M均值估计有很好的稳定性,用M估计值代替均值或中位数,结果更准确。根据样本值的权重不同,可以得到不同的估计量。从表中我们可以看到使用每一种方法的出来的估计量相差都不大,证明其稳定性较好。图1-8\n图1-9根据图1-8和图1-9从上图中可以看出,分组中的数据日收盘价与直线的重合度不是很好,故不服从标准正态分布这与前面的正态检验表中的结果一致。卡方检验分析:图1-10案例处理摘要案例有效的缺失合计N百分比N百分比N百分比交易日期*日收盘价1192100.0%00.0%1192100.0%图1-11卡方检验值df渐进Sig.(双侧)Pearson卡方3438.453a2676.000似然比3046.7362676.000有效案例中的N1192a.3350单元格(100.0%)的期望计数少于5。最小期望计数为.20。表1-11中显示行、列变量通过卡方检验给出的独立性检验结果。共使用了三种检验方法。上表各种检验方法显著水平sig.都远远小于0.05,所以有理由拒绝实验准备与评价结果是独立的假设,即认为日收盘价这个评价指标和时间是相关的。(二)大盘走势分析研究大盘走势选用上证综合指数进行统计分析,选取2009-2013年5年每日收盘指数共1211个数据,同样利用箱线图法剔除离群值,根据离群值的判别法大盘综合指数2009-2010年数据分布较为合理不存在大于1.5倍四分位数间距的数值,故无需剔除离群值。如图:图2-1\n2009-2013年上证综合指数箱线图图2-2案例处理摘要日期案例有效缺失合计N百分比N百分比N百分比收盘指数2009244100.0%00.0%244100.0%2010242100.0%00.0%242100.0%2011244100.0%00.0%244100.0%2012243100.0%00.0%243100.0%2013238100.0%00.0%238100.0%图2-3日期频率百分比有效百分比累积百分比有效200924420.120.120.1201024220.020.040.1201124420.120.160.3201224320.120.180.3201323819.719.7100.0合计1211100.0100.0\n图2-42009-2013年上证综合指数描述性分析N极小值极大值均值标准差偏度峰度统计量统计量统计量统计量标准误统计量统计量标准误统计量标准误20092441863.3673471.4422765.3973927.450758428.794542-.416.156-.975.31020102422363.9473282.1792830.9945114.904126231.853789-.029.156-1.158.31220112442166.2053057.3292666.8918414.853909232.025474-.328.156-.915.31020122431959.7672460.6932219.135498.777490136.827520.072.156-1.290.31120132481950.0132434.4772191.699307.195867111.012435-.134.158-.529.314数据来源:作者手工整理从图2-1到图2-4中可以看出上证综合指数2009年的收盘指数变动幅度较大,且达到最大值3471.442,极小值为1863.367,两者差值为1608.075,均高于其他年度,这与洪城水业2009年个股收盘价走势相吻合。2010年收盘指数均值统计量达,5年中的最大值2830.99451,反映出2010年股市走势相对较好。而2012年和2013年上证综指的收盘指数最小值分别1959.767和1950.013,最大值分别为2460.693和2434.477,均值分别为2219.13549和2191.69930,说明相比往年股市有疲软现象且这两年大盘走势相对稳定。这又和我们分析的个股走势不谋而合。图2-5正态性检验日期Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.收盘指数2009.100244.000.946244.0002010.121242.000.957242.0002011.094244.000.959244.0002012.107243.000.945243.0002013.064238.018.985238.014a.Lilliefors显著水平修正图2-5中显示了按时间分为的5个分组的两种检验方法的正态性检验结果,包括各分组的统计量、自由度及显著性水平,以K-S方法为例分析:2009-2013年上证综指其自由度sig.分别为0.000、0.000、0.000、0.000、0.018明显小于0.05,故应拒绝原假设,认为日收盘价分组中的数据不服从正态分布。图2-6\n从图2-6上证综合收盘指数的直方图中可以看出2009-2013年收盘指数具有右偏趋势,不具备明显的正态分布。图2-7图2-8根据图2-7和图2-8从上图中可以看出,分组中的数据日收盘指数与直线的重合度不是很好,故不服从标准正态分布这与前面的正态检验表中的结果一致。查看更多