统计学课程设计

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学课程设计

一、问题背景参数估计是在已知系统模型结构时,用系统的输入和输出数据计算系统模型参数的过程。18世纪末德国数学家C.F.高斯首先提出参数估计的方法,他用最小二乘法计算天体运行的轨道。20世纪60年代,随着电子计算机的普及,参数估计有了飞速的发展。参数估计有多种方法,有最小二乘法、极大似然法、极大验后法、最小风险法和极小化极大熵法等。基本介绍:参数估计(parameterestimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。标准特点:(1)无偏性(2)一致性(3)有效性(4)充分性方法:矩估计法用样本矩估计总体矩,如用样本均值估计总体均值。最小二乘法为了选出使得模型输出与系统输出yt尽可能接近的数估计值,可用模型与系统输出的误差的平方和来度量接近程度。使误差平方和最小的参数值即为所求的估计值。极大似然法选择参数θ,使已知数据Y在某种意义下最可能出现。某种意义是指似然函数P(Y│θ)最大,这里P(Y│θ)是数据Y的概率分布函数。与最小二乘法不同的是,极大似然法需要已知这个概率分布函数P(Y│θ)。在实践中这是困难的,一般可假设P(Y│θ)是正态分布函数,这时极大似然估计与最小二乘估计相同。性质:当估计值的数学期望等于参数真值时,参数估计就是无偏估计。当估计值是数据的线性函数时,参数估计就是线性估计。当估计值的均方差最小时,参数估计为一致最小均方误差估计。若线性估计又是一致最小均方误差估计,则称为最优线性无偏估计。如果无偏估计值的方差达到克拉默-尧不等式的下界,则称为有效估计值。若,则称为一致性估计值。在一定条件下,最小二乘估计是最优线性无偏估计,它的估计值是有效估计,而且是一致性估计。极大似然估计在一定条件下渐近有效,而且是一致的。点估计:点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。例如,设一批产品的废品率为θ。为估计θ,从这批产品中随机地抽出n个作检查,以X记其中的废品个数,用X/n估计θ,这就是一个点估计。构造点估计常用的方法是:①矩估计法。用样本矩估计总体矩,如用样本均值估计总体均值。②最大似然估计法。于1912年由英国统计学家R.A.费希尔提出,利用样本分布密度构造似然函数来求出参数的最大似然估计。③最小二乘法。主要用于线性统计模型中的参数估计问题。④\n贝叶斯估计法。基于贝叶斯学派(见贝叶斯统计)的观点而提出的估计法。可以用来估计未知参数的估计量很多,于是产生了怎样选择一个优良估计量的问题。首先必须对优良性定出准则,这种准则是不唯一的,可以根据实际问题和理论研究的方便进行选择。优良性准则有两大类:一类是小样本准则,即在样本大小固定时的优良性准则;另一类是大样本准则,即在样本大小趋于无穷时的优良性准则。最重要的小样本优良性准则是无偏性及与此相关的一致最小方差无偏估计,其次有容许性准则,最小化最大准则,最优同变准则等。大样本优良性准则有相合性、最优渐近正态估计和渐近有效估计等。区间估计:区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。1934年统计学家J.奈曼创立了一种严格的区间估计理论。求置信区间常用的三种方法:①利用已知的抽样分布。②利用区间估计与假设检验的联系。③利用大样本理论。方差系数:反映标志变动程度的相对指标。总体标准差系数的计算公式为Vσ=σ/x式中:Vσ为标准差系数;σ为标准差;x为平均数。当以样本标准差系数(称变异系数/离散系数)估计总体标准差系数时,VS=式中:VS为变异系数;S为样本标准差。对于不同水平的总体不宜直接用标准差指标进行对比,标准差系数能更好的反映不同水平总体的标志变动度。标准差变动系数为标志变异系数的一种。标志变异系数指用标志变异指标与其相应的平均指标对比,来反应总体各单位标志值之间离散程度的相对指标,一般用v表示。标志变异指标有全距、平均差和标准差,相对应的,便有全距系数、平均差系数和标准差系数3种。计算方法为:标志变异系数=标志变异值/相对应的平均值标准差系数是将标准差与相应的平均数对比的结果。标准差和其他变异指标一样,是反映标志变动度得绝对指标。它的大小,不仅取决于标准值的离差程度,还决定于数列平均水平的高低。因而对于具有不同水平的数列或总体,就不宜直接用标准差来比较其标志变动度的大小,而需要将标准差与其相应的平均数对比,计算标准差系数,即采用相对数才能进行比较。二、建立模型(一)数据取得:编号(mm)(kg/cm)(t/cm2)(A/B)()编号(mm)(kg/cm)(t/cm2)(A/B)()直径抗拉强度屈服点掺料检验员直径抗拉强度屈服点掺料检验员112.0128.235.20A李2612.1224.525.11A王212.0632.525.27A李2712.1338.874.23B王312.0626.555.16A李2812.1330.884.21B王412.0626.774.39B李2912.1332.964.59B王\n512.0734.434.84B李3012.2028.664.96A王612.0731.334.34B李3112.2629.314.56B王712.0735.523.99B李3212.2928.385.54A王812.0827.865.35A李3312.3128.515.12A王912.0832.264.42B李3412.4229.875.35A王1012.0832.124.48B李3512.0135.624.33B张1112.1032.324.76B李3612.0331.435.61A张1212.1128.415.27A李3712.0327.534.99A张1312.1334.684.20B李3812.0631.005.15A张1412.1327.434.64B李3912.0729.334.33B张1512.1629.965.00A李4012.0732.004.71B张1612.1630.335.26A李4112.0829.185.23A张1712.5526.954.77A李4212.1130.294.14B张1812.0126.664.88A王4312.1131.754.38B张1912.0532.554.53B王4412.1329.345.38A张2012.0732.885.46A王4512.1329.165.64A张2112.0731.333.21B王4612.1331.284.48B张2212.0729.124.60B王4712.1526.374.98A张2312.0930.335.11A王4812.2829.865.20A张2412.1126.374.42B王4912.3827.195.38A张2512.1131.894.52B王5012.4434.284.17B张①参数的区间估计如果把这批出厂钢筋的全部作为总体,根据抽样数据预测,如果对这批钢筋进行普查,这批钢筋总体的"直径"、"抗拉强度"和"屈服点"各自的平均值μ1,μ2,μ3的置信系数1-α=0.99,0.95,0.90介于哪段区间?②不同的掺料(A、B)对钢筋的"直径"大小上是否不同?在"抗拉强度"上是否不同?在"屈服点"上是否不同?(二)方法选择:本体总体方差未知,样本的容量为50>30,即为大样本,可用正态分布近似地作为t分布,因此无论方差是否可知,在实际中仅当大样本时才应用t分布。根据中心极限定理,只要抽样的样本足够大,抽样分布就会服从正态分布。因此在方差未知且为大样本下,仿照小样本下的区间估计,同样可采用标准正态分布代替t分布的总体均值µ的区间估计:采用标准正态分布替换t分布后还有另一个好处,替换后将可以利用CNFIDENCE函数来求总体均值的置信区间。\n由于A、B掺料的均值和标准差都不相同,其都具为含有量纲的值,因此会受到计量单位不同或者改变而变得缺乏可比性,而方差系数则是从相对的角度,通过比值来衡量分散程度,消除了刚性。方差系数:vc=∕(为样本的标准差,为样本的均值)(三)图表、模型建立:①参数的区间估计如果把这批出厂钢筋的全部作为总体,根据抽样数据预测,如果对这批钢筋进行普查,这批钢筋总体的"直径"、"抗拉强度"和"屈服点"各自的平均值μ1,μ2,μ3的置信系数1-α=0.99,0.95,0.90介于哪段区间?表11-α=0.99的区间估计直径抗拉强度屈服点区间上限12.17731区间上限31.36852区间上限4.区间下限12.09309区间下限29.28628区间下限4.1-α=0.95的区间估计直径抗拉强度屈服点区间上限12.16724区间上限31.1196区间上限4.区间下限12.10316区间下限29.5352区间下限4.1-α=0.90的区间估计直径抗拉强度屈服点区间上限12.16209区间上限30.99223区间上限4.区间下限12.10831区间下限29.66257区间下限4.②不同的掺料(A、B)对钢筋的"直径"大小上是否不同?在"抗拉强度"上是否不同?在"屈服点"上是否不同?表2直径分类N平均数标准差方差系数A2512.15880.0.B2512.11160.0.总5012.13520.抗拉强度A2528.86721.0.B2531.78762.0.总5030.32742.屈服点A255.21480.220570.B254.37880.0.总504.79680.三、结果分析:\n根据表一可看出随着置信系数增加范围越来越小。直径越大抗压强度越强,屈服点越大。根据表二分别得出A、B直径,抗拉强度,屈服点的平均数,标准差,方差系数。根据表中数据分析,A、B直径的平均数相别不大相差0.0472,标准差和方差系数相当大较大,A>B这说明B的离散程度相对较大。抗压强度中,B比A大1.9204,表侦查相差也很大,有0.9左右,当时方差系数相差且很小,说明这组数据中存在的量纲性,因此我们应该根据方差系数来比较两个惨料的抗压强度。A的抗压能力比B相对好一些。对于屈服点,A的屈服点大于B的屈服点0.836,标准差B比A大0.888,而方差系数相差不大,所以可知在屈服点也存在量纲,所以我们应该根据方差系数来更好的说明A比B相对好些。四、结论:这批钢筋的平均直径的99%的范围在12.09309mm到12.16724mm,95%的范围在12.10316mm到12.16724mm,90%的范围在12.10831mm到12.16209mm。平均抗压强度99%的范围在29.28628(kg/cm)到31.36852(kg/cm),95%的范围在29.5352(kg/cm)到31.1196(kg/cm),90%的范围在29.66257(kg/cm)到30.99223(kg/cm)。平均屈服点的99%范围在4.(t/cm2)到4.(t/cm2),95%范围在4.(t/cm2)到4.(t/cm2),90%范围在4.(t/cm2)到4.(t/cm2)。掺料A与掺料B对钢筋直径,抗压强度,屈服点上有所不同,但差别很小。
查看更多

相关文章

您可能关注的文档