统计学 参数 估计

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学 参数 估计

第五章参数估计第一节点估计和区间估计第二节抽样分布第三节总体参数估计第四节抽样设计1\n统计推断:利用样本统计量对总体某些性质或数量特征进行推断。两类问题:参数估计和假设检验基本特点:(1)以随机样本为基础;(2)以分布理论为依据;(3)推断的只是一种可能的结果;(4)是归纳推理和演绎推理的结合。2\n参数估计在统计方法中的地位假设检验统计方法描述统计推断统计参数估计3\n第一节点估计和区间估计本节主要内容:总体参数估计概述总体参数的点估计参数区间估计样本容量的确定4\n一、总体参数估计概述设待估计的总体参数是θ,用以估计该参数的统计量是,抽样估计的极限误差是Δ,即:5\n极限误差是根据研究对象的变异程度和分析任务的性质来确定的在一定概率下的允许误差范围。参数估计的两个要求:精度:估计误差的最大范围,通过极限误差来反映。显然,Δ越小,估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。可靠性:估计正确性的一个概率保证,通常称为估计的置信度。6\n二、总体参数的点估计点估计的含义:直接以样本统计量作为相应总体参数的估计量。7\n优良估计量标准优良估计标准:无偏性:要求样本统计量的平均数等于被估计的总体参数本身。一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。有效性:8\n总体方差的无偏估计量为样本方差点估计完全正确的概率通常为0。因此,我们更多的是考虑用样本统计量去估计总体参数的范围区间估计。9\n三、参数区间估计(一)区间估计的含义估计总体参数的区间范围,并给出区间估计成立的概率值。其中:1-α(0<α<1)称为置信度;α是区间估计的显著性水平,其取值大小由实际问题确定,经常取1%、5%和10%。10\n区间估计的基本要求1.置信度。随机区间包含的概率(即可靠程度)1-α越大越好。2.精确度。随机区间的平均长度E越短越好。11\n(二)平均数的区间估计对总体平均数或成数的区间估计时,使用下面的式子(式中Δ是极限误差)有两种模式:1、根据置信度1-α,求出极限误差Δ,并指出总体平均数的估计区间。2、给定极限误差,求置信度。12\n1正态总体——方差已知则总体均值的置信区间上、下限值为:例:某公司成批生产金属棒,其长度服从正态分布,标准准差为0.06cm,随机抽取25根进行测量,平均长度为7.48cm,试求这批金属棒平均长度μ的置信度为95%的置信区间。13\n解:因为总体服从正态分布,且方差已知,置信度1-α=0.95,α=0.05,查表所以μ的95%的置信区间下限值为:上限值为:即有95%的把握这批金属棒的平均长度在7.456~70504之间14\n2正态总体——方差未知则总体均值的置信区间上、下限值为:例:某时装专卖店想估计顾客的平均年龄,随机抽取16名顾客进行调查,得知平均年龄为32岁,标准差为8岁,假定顾客年龄近似服从正态分布,试求顾客平均年龄置信度为95%的置信区间。15\n解:因为总体近似服从正态分布,且方差未知,总体均值μ置信度95%的置信区间下限值为:上限值为:即该店顾客平均年龄的置信度95%的置信区间为(27.737,36.263)16\n3非正态总体不能假定总体服从正态分布或近似服从正态分布。根据中心极限定理,只要样本容量足够大,样本均值的抽样分布就近似服从正态分布。若方差已知,则总体均值的置信区间上、下限值为:若方差未知,用样本S代替总体方差σ17\n例:某公司负责人想估计6000包材料的平均重量。随机抽取350包组成样本,测得样本的均值和标准差分别为32公斤和7公斤。试求总体均值μ的置信度95%的置信区间。解:因为不知道总体是否服从正态分布,方差未知,且由于抽样比n/N=350/6000大于5%,校正系数不能忽略,故总体均值置信度95%的置信区间下、下限值为:18\n参数的区间估计简单随机抽样待估计参数已知条件置信区间正态总体,σ2已知正态总体,σ2未知非正态总体,n≥30有限总体,n≥30(不放回抽样)总体均值(μ)σ未知时,用Sσ未知时,用S两个正态总体已知两个正态总体未知但相等两个非正态总体,n1,n2≥30两个总体均值之差μ1-μ219\n成数的区间估计由于总体的分布是(0,1)分布,只有在大样本的情况下,才服从正态分布。总体成数可以看成是一种特殊的平均数,类似于总体平均数的区间估计,总体成数的区间估计的上下限是:注在实践中,由于总体成数常常未知,这时,抽样平均误差公式中的总体成数用样本成数代替。大样本的条件:np≥5且n(1-p)≥5,由于总体成数p通常未知,可以用样本成数来近似判断。20\n设该厂的产品质量检验标准规定,元件耐用时数达到1000小时以上为合格品。要求估计该批电子元件的合格率,置信水平95%。例:对某型号的电子元件进行耐用性能检查,抽查资料分组如下表。21\n解:22\n总体成数估计区间估计总结总体成数估计区间的上下限只考虑大样本情况(请记住大样本条件)23\n对总量指标的区间估计在对总体平均数进行区间估计的基础上,可进一步推断相应的总量指标,即用总体单位总数N分别乘以总体平均数的区间下限和区间上限,便得到相应总量(Nμ)的区间范围。24\n例:某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质率为85%,试计算当把握程度为90%时优质品率的区间范围。25\n若这批产品共有2000只,则可进一步推算出这批产品中优质品总数Np的置信区间为26\n例:某商场从一批食品(共800袋)中随机抽取40袋(假设用重复抽样),测得每袋平均重量为791.1克,标准差为17.136克,要求以95%的把握程度,估计这批食品的平均每袋重量以及这批食品总重量的区间范围。27\n三、样本容量确定什么是样本容量确定问题?当抽样平均误差保持不变时,极限误差Δ(体现估计精度)与概率度z(体现可靠性)两者同向变化。因此,抽样估计的精度与可靠性之间存在矛盾。为了调和这一矛盾的,可以适当降低抽样平均误差。而要降低,则必须增加样本容量n。样本容量n究竟取多大合适?28\n确定样本容量在设计抽样时,先确定允许的误差范围和必要的概率保证程度,然后根据历史资料或试点资料确定总体的标准差,最后来确定样本容量。29\n估计总体均值时样本容量的确定重复抽样不重复抽样估计成数时样本容量的确定重复抽样不重复抽样30\n确定样本容量应注意的问题1.计算样本容量时,一般总体的方差与成数都是未知的,可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;三是成数方差在完全缺乏资料的情况下,就用成数方差的最大值0.25代替。31\n确定样本容量应注意的问题2.如果进行一次抽样调查,同时估计总体均值与成数,用上面的公式同时计算出两个样本容量,可取一个最大的结果,同时满足两方面的需要。3.上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替。例如计算得到:n=56.03,那么,样本容量取57,而不是56。32\n例:对某批木材进行检验,根据以往经验,木材长度的标准差为0.4米,而合格率为90%。现采用重复抽样方式,要求在95.45%的概率保证程度下,木材平均长度的极限误差不超过0.08米,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少?33\n抽样估计效果的衡量抽样估计效果好坏,关键是抽样平均误差的控制。抽样平均误差小,抽样效果从整体上看就是好的;否则,抽样效果就不理想。34\n抽样平均误差受以下几方面的因素影响:一是总体的变异性,即总体的标准差大小有关二是样本容量三是抽样方法。四是抽样的组织形式抽样的组织形式有如下几种:简单随机抽样、类型抽样、等距抽样、整群抽样、阶段抽样35\n1.假定样本容量增加50%。则重复抽样平均误差:(甲)为原来的一半;(乙)为原来的81.6%。在重复抽样时,为使误差减少50%,则样本容量:(丙)应增加三倍;(丁)应增加四倍。A.甲丙B.甲丁C.乙丙D.乙丁2.抽样估计中的抽样误差()A.是不可避免的B.可以通过改进调查方法避免的C.是可以运用数学公式计算的D.误差大小是可以加以控制的E.包含了登记性误差3.抽样平均误差指标说明()A.样本平均数的代表性B.抽样指标的代表性C.估计值与实际值的平均误差D.样本指标相对于总体指标离差的平均水平E.抽样误差的大小36\n4.从一个全及总体中可以抽取一系列样本,所以()A.样本指标的数值不是唯一确定的B.样本指标是样本变量的函数C.总体指标是随机变量D.样本指标是随机变量E.样本指标数值随着样本的不同而不同5.影响抽样数目(样本容量)的因素有()A.允许误差范围B.抽样指标的大小C.抽样方D.总体标志变异程度E.概率保证程度37\n6.是非标志不存在变异时,意味着:()A.各标志值(1或0)遇到同样的成数(0.5)B.总体所有单位都只具有某属性——只运用变量值“1” C.总体所有单位都只具有某属性——只运用变量值“0” D.所计算的方差为0 E.所计算的方差为0.257.抽样推断的置信度、概率度和精确度关系表现在()A.概率度增大,估计的可靠性也增大B.概率度增大,估计的精确度下降C.概率度缩小,估计的精确度也缩小D.概率度缩小,估计的可靠性也增大E.估计的可靠性增大,估计的精确度也增大8.标准差、抽样平均误差的联系和区别?38
查看更多

相关文章

您可能关注的文档