- 2022-08-13 发布 |
- 37.5 KB |
- 108页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
高级统计学统计学课件
高级统计学哈尔滨工业大学管理学院葛虹\n高级统计学研究的对象多指标或多变量数据企业管理:产值、单位成本、原材料消耗、工资、劳动生产率、销售收入、利润、全要素生产率居民家庭消费:家庭收入、家庭人口、阶层、中高档消费品支出等等\n必备知识概率论与数理统计统计学——点估计——区间估计——假设检验\n研究内容简化数据结构箱式数据平面数据变换主成分分析PrincipleAnalysis因子分析FactorAnalysis\n按观测点分类或按变量分组分类比较是一切科学比较的基础和开端对观测点分类:银行发放贷款对各企业财务指标、信用状况进行分析对变量分组:股票市场是宏观经济的晴雨表经济指标与股票市场各种指标间的群组关系聚类分析判别分析ClusterAnalysisDiscriminantAnalysis\n回归分析RegressionAnalysis结构方程StructuralEquationModel变量间的依存关系+关系的强弱分析寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律:预测、控制\n内容提要回归分析1定性数据的建模2聚类分析3判别分析4主成分分析5因子分析6结构方程7\n教学内容结构回归分析OneTwoThree定性数据建模聚类分析判别分析主成分分析因子分析高级统计学结构方程\n预测回归分析定性数据建模分类聚类分析判别分析判别主成分分析因子分析结构方程关联性分析综合评价统计学方法的应用以及内容之间的逻辑关系应用范围教学内容\n参考书多元统计分析(何晓群编著)中国人民大学出版社应用统计(陆璇编著)清华大学出版社\n预备知识ONETWO随机向量及其分布随机向量的数字特征THREEFOUR随机向量的样本及其数字特征多元正态分布\n随机向量及其分布P维随机向量:联合分布函数:联合密度函数:\n随机向量的数字特征随机向量的数学期望随机向量的方差阵\n随机向量的相关系数阵\n随机向量的样本及其数字特征P维随机向量的一个容量为n的样本:的样本的样本的样本\n样本均值\n样本离差阵与样本方差阵样本离差阵样本方差阵\n样本相关系数阵与的样本相关系数\n相关系数阵计算的SPSS实现\n\n\n\n多元正态分布定义1q维标准正态分布设独立同分布于,则称随机向量服从q维正态分布,记Y~密度函数:\n定义2p维一般正态分布设,B为实数矩阵,为维实数向量,则是维正态随机向量,记为:其中为非负定阵。\n定理1若服从,则(1),(2)密度函数:定理2与分别是和的无偏估计,即\n回归分析一元回归模型的建立1回归模型的诊断以及SPSS实现2回归模型的矩阵表示3多元回归模型的建立4多元回归模型的诊断以及SPSS实现5\n为什么要建立线性模型一般函数线性化…特殊函数线性化…简单易分析…相关性=线性性…线性模型\n一元回归的SPSS实现观察散点图GraphsScatter点击1点击2\n点击1点击2点击3点击4\n点击\n\n执行回归过程AnalyzeRegressionLinear\n点击1点击2点击3点击4点击5\n点击1点击2点击3\n点击1点击5点击2点击3点击4点击6\n点击\n点击2可选点击1\n\n\n\n\n一元回归模型的建立观察由n个样本构成的散点图或计算样本相关系数,若呈现明显的相关性,建立数学模型~其中是未知参数,需要利用样本对它们进行估计.\n散点图(1)\n参数的最小二乘估计(1)模型1最小二乘解:\n矩阵偏导数与样本矩阵表达\n模型2最小二乘解:(1)为y关于x的回归方程(2)称为方程的回归系数()(3)称为残差,为残差向量(4)称为残差平方和参数的最小二乘估计(2)\n散点图(2)\n与的性质性质1~‾~~\n‾性质2~‾,且即的无偏估计是性质3与相互独立\n性质4若,则~于是的置信区间是:的样本标准差\n一元回归模型的显著性决定系数法RSquare+Adjusted-RSquare回归方程的显著性检验方差分析=F-检验\n决定系数法总平方和分解决定系数总平方和回归平方和残差平方和df=n-1df=n-2df=1\n方差分析法(回归方程的显著性检验)零假设检验统计量含义?~\n拒绝域(临界值法):→回归方程显著\nP值法:P<0.05→回归方程显著\n方差分析表(ANOVA)AnalysisofVariance\n回归系数的显著性检验(1)零假设检验统计量含义?~\n拒绝域(临界值法)→常数项显著\nP值法P<0.05→回归系数显著\n回归系数的显著性检验(2)零假设检验统计量~~\n一元回归模型的诊断前提假设等方差性独立性正态性\n误差的估计残差与残差图残差图(独立、等方差)\n残差图残差不独立异方差\n检验的正态性(Q-Q图)的分位数理论分位数样本分位数\nQ-Q图(Quantile-QuantilePlot)\n回归分析过程建模过程显著性检验过程回归诊断过程回归方程的显著性—F检验回归系数的显著性—t检验残差图Q-Q图参数估计误差估计\n多元回归模型的建立模型基本形式:~样本表达:矩阵表达:\n\n\n\n\n参数和的估计参数的最小二乘估计是参数的无偏估计是其中是残差平方和\n与的性质性质1‾性质2‾即是的无偏估计性质3与相互独立\n性质4若,则~于是的置信区间是:的第i+1个对角元\n性质5若(1)~(2)~且与相互独立(3)~\n多元回归模型显著性检验(1)决定系数法方差分析法零假设:检验统计量与其分布:~含义?\n回归系数的显著性检验(2)零假设检验统计量与其分布:~其中是的第j+1个对角元含义?\n多重共线性什么是多重共线性p个自变量在某种程度上是线性相关的多重共线性可以造成参数的估计值严重偏离实际值一个解释:~的共线性使接近奇异阵,从而使中的对角分量或的方差很大.\n随机模拟方法多重共线性对参数估计影响的例原线性模型:的观测值:正态随机数:由模型得到:回归模型:\n多重共线性的判定方法1相关系数法若自变量间的相关系数ⅼⅼ≈1,则相应的两个变量之间有较强的共线性。方法2方差膨胀系数法()若是把第j个自变量看作因变量,用其余p-1个变量作线性回归所得到的决定系数,则第j个自变量的方差膨胀系数为:\n方法3检查统计量的显著性.很大,但没有几个显著的t统计量或F统计量高度显著,而每个t统计量都不显著.方法4检查系数的标准差.如果几个系数的标准差都很高,而且从方程中去掉一个或几个变量会降低剩下几个变量系数的标准差,此时有可能存在多重共线性.\n共线性诊断的SPSS实现点击\n点击\n\n原方程:回归方程:\n克服多重共线性的统计方法逐步回归岭回归主成分回归消除多重共线性\n主成分回归第一步:寻找主成分\n第二步:如果第一和第二主成分的累积贡献率超过85%,则建立回归模型\n随机模拟例的主成分回归结果第一主成分的贡献率为0.993y关于第一主成分的回归模型为:最后的整理结果为:\n岭回归岭估计最小二乘估计\n逐步回归引进变量过程剔除变量过程按某种法则将变量逐个引进每引进一个变量后剔除不显著的选入变量\n逐步回归的SPSS实现\n\n\n\n习题一方差分析表33.2402913.740\n参数估计表constantx1x2BStd.Error11.307-6.5911.4634.719-1.486t7.719\n回答如下问题写出回归方程的表达式回归方程是显著的吗?回归系数是显著的吗?回归系数不显著的原因可能是什么?计算决定系数和调整的决定系数总体标准估计误差是多少?临界值:\n科研案例刘小玄.民营化改制对中国产业效率的效果分析——2001年全国普查工业数据分析.经济研究,2004,(8):16-26\n内容提要本项研究利用了第二次全国基本单位普查数据(2001年),在全部工业的基础上,考察了最新的民营化发展动态,考察20多年来形成的改制面和所产生的相应绩效效果。按照现行的国家规定的企业产权注册的详细分类指标,我们得以将改制企业从一般公有制或私有制中加以分离,从而能够通过相应的实证模型,来检验不同所有权因素,尤其是改制形式的不同股权类型对于产业效率的影响及程度。主要的发现如下:(1)国有企业(包括传统国有、国有独资企业)\n对于效率具有明显的负效率,私营企业、股份制企业和三资企业则都表现为积极地对于效率的正相关推动作用。其中,私营企业推动产业效率的作用最强,三资和股份合作企业其次,再次则是股份企业和集体企业。(2)对于改制企业的不同资本股份来说,个人资本普遍具有最显著的对于效率的正相关的积极效果,法人资本表现为显著性不稳定的正相关作用,集体资本表现与效率不相关的结果,而国家资本则表现出十分显著的负相关效果。(3)对于股份有限、有限责\n任和股份合作企业这三种股份企业之间差异的分析表明:股份有限公司的规模效益作用明显小于股份制企业,这是较多的国有产权的消极作用抵消了规模效益的积极作用的结果。相对于股份有限公司,股份合作或有限责任公司的劳动贡献率明显高于资本贡献率,表明这类改制企业在改制后初期主要依靠“劳动推动”或“人力资本推动”来提高企业效率。\n产业效率决定因素的估计模型销售收入固定资产净值就业人数所有权结构变量规模变量\n所有权变量的度量:不同注册类型企业的实收资本占该行业总资本的比重(国有、集体、私营、股份合作、有限公司、股份有限、港澳台合资、港澳台独资、外商合资、外商独资和其他,总共11种产权变量)规模变量的度量:一行业内大型、中型或小型企业的市场份额\n影响产业效率的国有因素因变量参数估计(T检验值)截距2.699(14.36)LK0.424(12.56)LL0.5770.566-0.5550.801(16.44)(3.21)(6.93)(-8.37)大型中型国有结论:国有企业对于效率具有明显的负效率\n影响产业效率的其他所有制因素股份公司中的不同资本所有权对于效率的作用股份公司中的国家资本所有权对于效率的作用\n读书报告(研究生网站上下载)至少两篇文献(所学专业)报告内容包括:研究的目的和意义研究内容研究方法模型、变量的选择;模型的估计结果结论参考文献(格式按研究生毕业论文要求)\n实验报告(用于上机实验)寻找与本专业研究方向有关的数据(报告中要给出数据,并说明数据的来源)通过对数据的整理建立相关模型并说明:研究的目的和意义研究内容研究方法模型、变量的选择;模型的估计结果结论参考文献(格式按研究生毕业论文要求)查看更多