部分:统计学基础(续)

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

部分:统计学基础(续)

(二)对总体方差的估计(一般在未知u时对总体方差进行区间估计)\n总体方差区间估计的例题例3冷拔丝的抗拉强度服从正态分布,现从一批铜丝中任取10根,测的抗拉强度数据(单位:N)如下:578、572、570、568、572、570、570、596、584、572,求的置信度为90%的置信区间.解:样本均值与方差的观测值分别为:\n(三)关于区间估计的几点说明(1)区间估计在方法上是定理1.12~1.16的应用。(2)在进行区间估计时,应针对不同的情况,采用不同的方法。例如分清分布的形式是已知或是未知;是大样本或是小样本;小样本(估计总体数学期望时)又分清是已知方差或是未知方差等。充分利用分布信息可以得到较精确的估计。(3)一般地,越大置信度越低,置信区间越长;反之,则反。\n第七节通过样本,估计总体(三)——假设检验一、假设检验的概念二、两类错误三、置信区间法和临界值法四、假设检验的应用单正态总体的假设检验五、“小概率原理”在假设检验中的应用\n一、假设检验的概念定义:称对任何一个随机变量未知分布的假设为统计假设,简称假设。一个仅涉及到随机变量分布中未知参数的假设称为参数假设。一个仅涉及到随机变量分布的形式而不涉及到未知参数的假设称为非参数假设。提出一个统计假设的关键是将一个实际的研究问题用数学语言转换为统计假设。\n例1.检验一个硬币是否均匀抛掷一个硬币100次,“正面”出现60次,问此硬币是否均匀?分析:若用X描述抛掷硬币的试验,“X=1”和“X=0”分别表示“出现正面”和“出现反面”。上述问题就是检验X是否可以被认为服从p=0.5的0-1分布。问题是分布形式已知,检验参数p=0.5的假设。记作,H0:p=0.5H1:p<>0.5\n零假设与备择假设在统计假设——H0:p=0.5H1:p<>0.5中,H0称为零假设或原假设,是我们进行统计假设检验欲确定其是否成立的假设——体现我们进行假设检验的目的。H1称为备择假设,统计假设检验是二择一的判断,当不成立时,不得不接受它。\n例2.检验1999年新生女婴体重是否等于某个既定值从2003年出生的女婴中随机地抽取20名,测得平均体重=3160克,标准差=300克,根据已有的统计资料新生女婴的体重=3140克,问现在与过去新生女婴的体重是否有变化?分析:把2003年出生的女婴视为一个总体,用X描述,问题就是判断:H0:EX=3140H1:EX<>3140因为通常可以假定经过量测得到的资料是服从正态分布的,无须检验总体的分布形式,显然这是一个关于参数的假设检验问题。\n二、两类错误(1)两类错误的概念(2)Neyman-Pearson方法(3)显著性水平\n(1)两类错误的概念由于我们作出判断的依据是一组样本,结论却是对于总体的,即由局部=>全面,由特殊=>一般,由个别=>整体,因而假设检验的结果不可能绝对正确,它有可能是错误的。而且出现错误可能性的大小,也是以统计规律(小概率原理)为依据的。所可能犯的错误有两类:第一类—弃真,原假设符合实际情况,而检验结果把它否定了。设犯这类错误的概率为,那么=p(否定H0/H0实际上为真)。为显著性水平第二类—取伪,原假设不符合实际情况,而检验结果却把它肯定下来。设犯这类错误的概率为,那么=p(接受H0/H0实际上不正确)。1-称为检验的功效。\n(2)Neyman-Pearson方法自然我们希望犯两类错误的概率都越小越好。但对一定的样本容量n,一般都不能做到犯这两类错误的概率同时都小。由于减小=>增大,或者减小=>增大,于是我们面临抉择,计量经济学中常常愿意使犯”第一类错误“的概率较小,则拒绝错了的概率就较小。而不考虑。因此,拒绝H0是坚决有力的(冒险率是确定的),而不拒绝H0则是无可奈何的(冒险率是没有确定的)。Neyman-Pearson提出了一种方法:先固定犯“第一类错误”的概率,再考虑如何减小犯“第二类错误”的概率,也称Fix,Min方法。当确定以后,让尽量的小,1-就越大,称不犯“第二类错误”的概率为“检验的功效(Poweroftest)。\n(3)显著性水平显著水平指的是犯“第一类错误”的可能性,即“冒险率”<==>冒H0是真而我们抛弃了H0所犯错误的概率<==>反之,而不接受H0,乃是因为客观事实与H0假设存在差异,且这种差异的程度已经太大了,在给定的小概率下,零假设几乎是不可能发生的,从而认为零假设H0是错的,必须抛弃它。同时,即使抛弃零假设H0,这时也只需冒的风险,<==>抛弃H0的可靠性则为1-。如果假设事关重大,譬如人命关载人的宇宙飞船升空或药品试验,则必须提高差异显著水平即减小,使我们不能轻易地拒绝H0。否则,则可以降低显著水平。\n三、假设检验:置信区间法(一)问题的提出(二)假设检验的置信区间法\n(一)问题的提出曾经提到“某甲成绩大概是80分左右”可以看成一个区间估计问题。“大概80分左右”<==>p(1<<2)=大概的准确程度<==>如:p(75<<85)=95%<==>(75,85)是某甲成绩的估计区间,某甲成绩落在此区间的概率在95%以上。类似地,对这个问题,也可举出一个假设检验的问题<==>在允许你犯5%以下的错误,即以95%的正确性来回答:“某甲的成绩是80,对吗?”<==>假设检验同样的问题又是一个假设检验的问题。\n(二)假设检验的置信区间法的定义对比区间估计和假设检验两种情况,我们发现区间估计实际上给出了一种进行假设检验的方法。比如,当涉及“某甲成绩为80分”(=5%)后,,首先对问题进行区间估计,得到成绩在75~85之间的概率为95%。若原假设H0落在(75,85)内,显然应当接受H0,否则,则拒绝H0。这种利用区间估计法来进行假设检验的方法称为区间估计法。\n(三)假设检验的检验水平=区间估计中的显著水平续以上问题继续讨论。对于给定的置信度95%,对成绩进行区间估计结果为(75,85),若原假设落入该区间,我们便接受H0,认为甲的成绩是80分。如此(接受时),我们可能犯第二类错误,即甲的成绩实际上是72,不是80,而把错误的H0接受了(取伪了)。必须指出,这里的置信度95%只保证了我们运用置信区间法进行假设检验时,在95%下,如果H0正确,我们不会拒绝它,即95%地防止了假设检验中第一类错误的发生,也就是显著水平达到了5%。由此可见,在利用置信区间法进行假设检验时,区间估计中的置信度1-中的,就是假设检验中的检验水平。\n也就是、不可能同时减小的再探在置信区间法下,随着检验水平的减小(第一类错误的概率减小),例如5%1%,区间估计的置信度就会增大(95%99%);置信度的加大,导致置信区间长度变大,比如从(75,85)(70,90);这样就加了大犯第二类错误的概率,换言之,我们不但可能把72分成绩误认为80分,还可能把70分误认为80分;所以,也就是、不可能同时减小\n通过求置信区间进行假设检验的例子例3根据长期经验和资料分析,某砖厂生产的砖的“抗断强度”服从正态分布,方差=1.21,今从该厂生产的砖中随机地抽取6块砖,测得强度如下(单位千克/cm2):检验这批砖的平均抗断强度为32.50千克/cm2是否成立(=0.05)?解:H0:=32.50H1:<>32.50首先求的置信区间:\n临界值法(显著性检验)\n检验的步骤(检验均值,已知)1、提出零假设H0:=0H1:<>0(双侧检验)2、根据抽样所得样本计算检验统计量3、确定显著水平=0.05(或0.01)和相应的临界值4、将计算的U与进行比较。如果U落在拒绝域内,则拒绝H0,否则接收H0.;5、依据统计结论,作出专业(经济学)上的解释\n采用临界值法重作例31、提出零假设H0:=32.5H1:<>32.52、根据抽样所得样本计算检验统计量3、确定显著水平=0.05和相应的临界值为1.964、将计算的U=3.05与临界值1.96进行比较5、下结论:因为U=3.05>1.96,故P<=0.05小概率事件发生,则拒绝H0。不认为抗断强度为32.5。6、依据统计结论,作出专业(经济学)上的解释\n四、假设检验的应用单正态总体的假设检验设总体~N(,2),对于其参数,2的假设检验,讨论3种情况:已知方差2,检验假设H0:=0(前面已讲)未知方差2,检验假设H0:=0未知期望,检验假设H0:2=20其中,H0中的0和20均是已知的数。\n例4未知总体方差,检验总体均值等于定值从2003年出生的新生女婴中随机抽取20个,测得其平均体重为3160克,样本标准差为300克,根据过去的资料,新生女婴平均体重等于3140克,问现在女婴体重与过去有无差别(=0.01)?\n例5未知总体数学期望,检验总体方差等于定值某铁厂的铁水含碳量在正常情况下服从正态分布,现对操作工艺进行改进,然后抽取5炉铁水测得含碳量数据如下:问是否可以认为新工艺炼出的铁水含碳量的方差为原先的0.1082(=0.05)?\n五、“小概率原理”在假设检验中的应用数理统计学中的“小概率原理”认为:概率很小的事件在一次抽样试验中几乎是不可能发生的。在假设检验中,我们就是根据这一原理来拒绝各种H0。在H0成立的条件下,统计量大于临界值为一个小概率事件,因此,在一次抽样试验中,依据小概率原理,是不会发生的。但是,既然小概率事件(“统计量>临界值”的事件)居然发生了。出错了,那么,错在那里呢?因为,在整个假设检验过程中,抽样是正确的、统计量的选择是正确的、根据显著水平确定的临界值是正确的、统计量的计算是正确的,统计量与临界值的比较也是正确的。因而,只能是提出的假设H0发生了错误,所以必须拒绝H0。\n检验“大海里丢了一棵针”?(1)提出假设:检验“大海里丢了一棵针”(2)进行抽样,并计算统计量——计算打捞起来的“针”的棵数(3)因为“大海里捞针一场空”是一小概率事件,依据小概率原理,在一次试验中几乎是不可能发生的,确定“临界值”<1(不会捞到一棵针或=0)是正常的、大概率事件。(4)、(5)计算统计量和下结论:A.捞到了一棵针,小概率事件发生了(不该发生的居然发生了,只能是H0出错),所以拒绝H0,==>认为大海里不只丢了一棵针。(针丢多了才可以捞到)B.得到了“0”棵针,大概率事件发生了(应该发生)==>接受H0,认为“大海里只丢了一棵针”。\n大海里捞针的错误之一——“弃真”1.提出假设H0:“大海里丢了一棵针”真实情况:大海里真的只丢了一棵针,2.如果假设为真,一次试验是不可能捞到一棵针的<==>小概率事件3.打捞结果及下结论:在一次试验中捞到了一棵针,小概率事件居然发生了,而不得不拒绝H0,认为大海里不只一棵针。对比真实情况,那么,此时发生了第一类错误——“弃真”\n大海里捞针的错误之一——“取伪”1.提出假设H0:“大海里丢了一棵针”。而真实情况是,大海里不是丢了一棵针,是很多很多。2.如果假设为真,一次试验是不可能捞到一棵针的<==>小概率事件。3.打捞结果及结论:在一次试验中没有捞到了一棵针,大概率事件发生了,是完全应该发生,接受H0是顺理成章之事,认为大海里只丢了一棵针。那么,对比真实情况,此时发生了第二类错误——“纳伪”(把错误的假设接纳了)。\n本章的几点注意点:(1)数理统计学研究的核心问题是如何从样本来推断总体的性质。作为观察者,我们对总体的情况往往是不了解的,我们只能对总体进行随机抽样,获得一组样本,通过对一组样本的研究,进而估计总体的各种属性。所以,对总体的研究都是基于样本的。(2)为了描述总体引入了随机变量,只有随机变量这类特殊的变量,才能用以对总体进行全面描述。(3)总体就是一个随机变量。(4)我们通常遵循统计量三个优良性来构造各种统计量,而且利用假设检验来具体的评价关于总体参数的假设是否合理。(5)区间估计和假设检验是一个问题的两个方面。
查看更多

相关文章

您可能关注的文档