统计学习题整理2013.02.23

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学习题整理2013.02.23

目录3目录前言3目录4第一章绪论5一、习题5二、习题答案8第二章统计数据的描述10一、习题10二、习题答案15第三章抽样与抽样分布19一、习题19二、习题答案22第四章参数估计23一、习题23二、习题答案28第五章假设检验31一、习题31二、习题答案36第六章方差分析与试验设计40一、习题40二、习题答案46第七章相关与回归分析51一、习题51二、习题答案58第八章时间序列66一、习题66二、习题答案73第九章统计指数83一、习题83二、习题答案90\n第一章绪论4第一章绪论一、习题(一)判断题1、标志不能用数值表示,而指标都可以用数值表示。()2、数量标志可以用数值表示,质量指标不能用数值表示。()3、统计学的研究对象是社会经济总体现象的质量方面。()4、随着统计研究任务、目的及范围的变化,总体和总体单位是可以变换的。()5、统计报表依据自下而上的行政手段保证统计报表制度的实施。()6、截面数据是在相同或近似相同的时间点上对研究对象收集到的数据。()7、时间序列数据是指对研究对象在不同时间上收集到的数据。()8、劳动生产率是数量指标。()9、运动员的年龄和体重这两个变量均为连续变量。()10、统计量是对数据进行分析、检验,用来描述样本特征的概括性数字度量。()(二)单项选择题1、统计有三种涵义,其中()是基础,是源。A、统计学B、统计资料C、统计工作D、统计方法2、一个统计总体()。A、只能有一个指标B、只能有一个标志C、可以有多个指标D、可以有多个标志3、构成统计总体的总体单位()。A、只能有一个标志B、只能有一个指标C、可以有多个指标D、可以有多个标志4、研究某市全体学生的学习情况,则总体单位是()。A、全体学生B、全体学生的学习情况C、每一个学生D、每一个学生的学习情况5、研究某市全部工业企业的产品生产情况,则统计总体是()。A、该市全部工业企业B、该市每一个工业企业C、该市工业企业的每一个产品D、该市工业企业的全部产品6、“统计”一词的三种涵义是()。A、统计调查、统计资料、统计分析B、统计工作、统计资料、统计学C、统计设计、统计调查、统计整理D、大量观察法、分组法、综合指标法7、以全国的钢铁工业企业为总体,则宝钢集团总产值是()。A、品质标志B、数量标志\n第一章绪论4C、数量指标D、质量指标8、某工人的月工资是1500元,则工资是()。A、质量指标B、数量指标C、数量标志D、变量值9、某工人的月工资是1500元,则1500元是()。A、质量指标B、数量指标C、数量标志D、变量值10、要了解某地职工情况,统计指标是()。A、该地每个职工B、该地每个职工的工资C、该地全部职工D、该地职工的工资总额11、下列变量属于连续变量的是()。A、某地学校数B、某地人口数C、学生的年龄D、工业企业数12、下列标志中不属于数量标志的是()。A、人的年龄B、学生的成绩C、人的性别D、工人的工资13、在全国人口普查中()。A、全国的人口是统计指标B、人的年龄是变量C、人口的平均寿命是数量标志D、男性是品质标志14、下列属于品质标志的是()。A、人的年龄B、学生的成绩、C、产品的价格D、民族15、数量指标是反映()。A、总体的绝对数量B、总体内部数量关系的指标C、总体单位数量指标D、总体的相对数量指标16、质量指标是说明()。A、总体内部数量关系的指标B、总体的绝对数量指标C、总体单位数的指标D、总体单位质量的指标17、其数量随总体范围的大小而增减的指标是()。A、数量指标B、质量指标C、品质指标D、相对指标18、其数量不随总体范围的大小而增减的指标是()。A、数量指标B、质量指标C、品质指标D、总量指标19、总体具有差异性的特征,差异性是指()。A、标志的具体表现不同B、指标和标志德名称不同C、总体单位之间的性质不同D、总体和总体单位的性质不同20、某企业2011年全体职工的平均年龄为30岁,这是()。A、相对指标B、品质标志\n第一章绪论4C、数量指标D、质量指标(三)简答题1、什么是统计学?2、统计研究的对象是什么?3、统计研究的特点有哪些?4、统计的作用有哪些?5、描述统计和推断统计的区别和联系是什么?\n第一章绪论6二、习题答案(一)判断题1、×;2、×;3、×;4、√;5、×;6、√;7、√;8、×;9、√;10、√(二)单项选择题1-5、CCDCD;6-10、BBCDD;11-15、CCBDA;16-20、AABCD(三)简答题1、统计是指根据研究目的及要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。从字面上直观理解,“统计”是指对大量事物进行汇总计数,因此可以简单地说统计就是总起来计量,即统而计之。例如计算全国的总人口数、国内生产总值,计算某个企业的职工人数、产品产量,甚至是计算某个家庭每月的收入和支出等等都是统计。随着社会经济的发展,“统计”的涵义也不断地拓展和延伸。从不同角度看,对“统计”一词可以有不同的理解:统计活动、统计资料和统计学。2、统计学是一门研究客观现象数量特征和规律性的方法论科学。统计学的研究对象不同于统计对象。统计学的研究对象是客观事物的数量特征和规律性,而统计对象是客观事物本身。例如人口统计的统计对象是人,人口统计学则以人口数量特征为研究对象,是探索人口数量特征和规律性的方法,包括如何收集人口原始数据、如何计算人口总规模、如何描述人口增长规律、如何分析人口与其它社会经济现象的关系等等。3、统计研究的特点可以概括为以下几点:(1)数量性“数字是统计的语言”,数量性是统计研究的基本特点。在统计研究系统,输入的是数据,即客观事物个别的或者局部的原始数据;输出的是客观事物综合的数量特征,包括数量大小和数量的规律性。统计研究系统是一个数据获取和加工处理系统。(2)总体性“统”就是总起来、综合起来。统计研究就是总的、综合的数量研究。一般理解的总体是指统计总体,是由同类个体组成的集合体,如人口总体、企业总体、商品总体等等,这时统计研究的目的不是计量个体的特征表现,而是对个体的特征表现进行统计整理和统计分析,得到总体的综合的数量特征。(3)具体性具体性即客观性。统计对象是具体的,是客观存在的事物或现象。统计数据包括原始数据和计算结果,都是客观现象在一定时间、地点、条件下的数量表现,是具体的数据。4、统计具有以下三个方面的作用:(1)\n第一章绪论6提供统计信息是统计的信息职能,是统计的首要职能。信息是有价值的数据,从收集的原始数据到经过加工整理后的中间数据到最后分析得到的综合指标分别是反映客观现象个别、部分以及全部的统计信息,是统计工作的成果。经过整理、分析得到的综合信息更有价值。(2)提供咨询服务是统计的咨询职能。统计工作的任务不仅要完成提供信息的基本任务,还要进一步利用已经掌握的各种统计信息资料,为政府、企业以及个人等提供各种咨询建议和对策方案。(3)提供监督服务是统计的监督职能。监督职能是指根据长期的大量的统计信息,按照标准监督客观现象发展变化状况,确定其是否正常,有无警情。对社会经济的一些重要方面都要进行监督。统计的三大职能是相互联系、相辅相成的。信息职能是最基本的职能,是保证咨询和监督职能有效发挥的基础,咨询和监督职能是信息职能的延伸和拓展,是统计信息开发和利用的结果。5、描述统计法和推断统计法是统计分析的两类方法。描述统计法是综合描述的方法,是通过对所收集的数据进行加工处理,计算综合性的统计指标,描述所研究现象总体数量特征和数量关系的方法。推断统计法是在对已知事物进行描述的基础上,对未知事物进行推断的方法。根据推断的内容不同可分为抽样估计法以及假设检验法等。描述统计法是推断统计法的基础。从描述方法到推断方法反映了统计学的发展,传统统计学以描述统计方法为主,现代统计学以推断统计方法为主。\n第二章统计数据的描述11第二章统计数据的描述一、习题(一)判断题1、重点调查中的重点单位是根据当前工作的重点来确定的。()2、实验法是一种特殊的观察法。()3、调查表一般由表头、表体和表外附加三部分组成。()4、统计调查按调查对象包括的范围不同可分为重点调查和非重点调查。()5、统计整理的关键在于统计分组。()6、统计数据的审核主要是审核数据的准确性、完整性和科学性。()7、对统计总体进行分组时,采用等距分组还是异距分组,取决于现象的特点和组数的多少。()8、在组距相等的条件下,频数分布和频数的密度分布是一致的。()9、加权算术平均数的大小只受各组标志值大小的影响。()10、平均数是测定总体各单位的离散程度。()(二)单项选择题1、某地区为了掌握该地区陶瓷生产的质量情况,拟对占该地区陶瓷总产量90%的6家大型陶瓷厂的生产情况进行调查,这种调查方式是()。A、普查B、典型调查C、抽样调查D、重点调查2、人口普查规定统一的标准时间是为了()。A、避免登记的重复与遗漏B、确定调查的范围C、确定调查的单位D、登记的方便3、以下哪种场合宜采用标准式访问()。A、居民入户调查B、座谈会C、当事人或知情者个别采访D、观察法4、问卷设计的主体部分是()。A、被调查基本情况B、引言和注释C、问题和答案D、结语5、统计调查的基本任务是取得原始统计资料,所谓原始统计资料是()。A、统计部门掌握的资料B、对历史统计资料进行整理后取得的资料C、统计年鉴或统计公报上发布的资料D、直接向调查单位进行登记取得的资料6、全面调查是对调查对象总体的所有个体进行调查,下述调查属于全面调查的是()。A、某地区对工业企业设备进行普查B、对某种连续生产的产品质量进行抽查\n第二章统计数据的描述11C、抽选部分地块进行农产量调查D、对全国水泥生产中的重点单位进行调查7、抽样调查与重点调查的主要区别是()。A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同8、进行统计分组的关键是()。A、划分各组组限B、正确选择分组标志C、确定各组组距D、计算各组组中值9、划分离散变量的组限时,相邻两组的组限()。A、必须是间断的B、必须是重叠的C、应当是相近的D、既可以是间断的,也可以是重叠的10、用组中值代表各组内的一般水平的假定条件是()。A、各组的频数均相等B、各组的组距均相等C、各组的变量值均相等D、各组频数在本组内呈均匀分布11、在进行组距式分组时,在全距不变的情况下,组距与组数的关系是()。A、正比例关系B、反比例关系C、乘积关系D、没有关系12、频数分布用来表明()。A、总体单位在各组的分布状况B、各组变量值的构成情况C、各组标志值的分布情况D、各组变量值的变动程度13、下列为构成频数分布表的基本要素的是()。A、各组的组别B、组限C、组中值D、组距14、下列为确定组限时常用的方法的是()。A、对离散变量采用重叠分组法B、对连续变量采用重叠分组法C、对连续变量采用不重叠分组法D、对连续变量和离散变量均采用重叠分组法15、若两组数据的标准差相等而平均数不等,则()。A、平均数小代表性大B、平均数大代表性大C、代表性也相等D、无法判断16、计算平均数的基本要求是所要计算的平均数的总体单位应是()。A、大量的B、同质的C、差异的D、少量的17、一组数据的偏态系数为-1,则表明该组数据的分布是()。A、正态分布B、平顶分布C、左偏分布D、右偏分布18、当一组数据属于右偏分布时,则()。A、众数在左边、平均数在右边B、平均数、中位数与众数是合而为一的C、众数在右边、平均数在左边D、众数的数值较大、平均数的数值较小\n第二章统计数据的描述1119、关于极差,下列说法错误的是()。A、只能说明变量值变异的范围B、不反映所有变量值差异的大小C、反映数据的分配状况D、最大的缺点是受极端值的影响20、对于众数的描述,下列说法错误的是()。A、位置平均数B、总体中出现次数最多的标志值C、不受极端值的影响D、处于变量数列中点位置的那个标志值(三)简答题1、概率抽样调查方法的优点?2、统计数据整理有哪些程序?3、统计数据的误差控制有哪个方面?4、什么是统计数据的分组整理?简述统计数据分组整理的原则。5、简述算术平均数、中位数、众数三者之间的关系?(四)计算题1、有一个班40名学生的数学考试成绩如下表2-1所示。表2-164868598836092947864738356788982845976787269637177749088877460617685848875578386学校规定:60分以下为不及格,60~70分为及格,70~80分为中,80~90分为良,90~100分为优。试把该班学生分为不及格,中,良,优四组,编制一张频数分布表。2、有27人比赛钓鱼,各自所钓鱼的数量如下表2-2所示。表2-2541454654223434446134223233试编制一张频数分布表。3、某电子公司在全国各地有40家销售分公司,这40家公司上个月的销售额如下表2-3所示(单位:万元)。表2-3402728473731373444404538463539484237334346362948333644302837\n第二章统计数据的描述1149424137374838384332根据上面的资料进行适当分组,并编制频数分布表。4、有一个班40名学生的数学成绩资料如下表2-4所示。试根据所给资料计算学生数学成绩的算术平均数、中位数和众数。表2-4成绩分组学生人数(人)60分以下260-751175-901990分以上8合计405、已知某工业企业大部分职工的月薪收入为1965元,其中月薪为1932元的职工处于全企业月薪收入中间位置,试计算全企业职员的月平均薪资。并指出该企业职员月薪收入是何种分布形式?6、某企业为了调查以件记工对劳动生产率的影响,统计了企业60名员工4、5月份的生产量。数据资料如下表2-5所示。表2-5员工日生产量(件)员工数4月份5月份400以下53400-500135500-6001812600-7001520700-800715800以上25合计6060试计算4、5月份的劳动生产率,并指出4、5月劳动生产率高低不等的原因。7、有A、B两地,A地高中毕业生平均月薪为950元,标准差为140元。B地高中毕业生月薪数据如下表2-6。用尽可能简便的方法比较甲、乙两单位工人平均工资的代表性大小。表2-6按月薪分组人数700-800100800-900200900-1000400\n第二章统计数据的描述111000-11002001100以上100合计10008、某水果的产量和播种面积资料如下表2-7,试计算其偏度和峰度。表2-7亩产量400-500500-600600-700700-800800-900900-1000合计播种面积103050604010200\n二、习题答案(一)判断题1、×;2、√;3、√;4、×;5、√;6、×;7、×;8、√;9、×;10、×(二)单项选择题1-5、DAACD;6-10、ADBDD;11-15、BAABB;16-20、BCACD(三)简答题1、(1)节省经费。由于抽样调查的单位数相对很少,所以大大减少了开支。(2)速度快。抽样调查所需搜集和处理的数据远远少于全面调查,提高了时效性。(3)较高的精确度。由于是自上而下的组织调查,组织专业队伍进行,且按照随机原则抽取样本,抽样误差可以加以控制,因而调查结果可以保证有效的可靠性。(4)灵活性。组织方便灵活,项目可多可少,调查范围可大可小。可根据需要因地制宜地、灵活地组织抽样调查。(5)适应性广。2、(1)统计资料的审核在数据进行汇总整理之前,必须对调查收集的原始数据进行审核,以确保统计工作的质量。对原始资料的审核主要包括资料的及时性、完整性和准确性审核。经审核后若发现错误,应根据不同情况及时纠正和处理。(2)进行统计分组按照整理表的要求选择最能说明现象本质特征的分组标志对原始资料进行科学的统计分组。(3)进行加工汇总,编制分配数列按统计分组的要求对统计调查单位的项目进行分组汇总,并在此基础上加以全面汇总,编制分配数列,使之能反映调查对象的全貌。(4)编制统计表和绘制统计图将汇总整理后所得的结果采用恰当的统计表格或统计图简明扼要地表达出来,以表明现象总体综合特征。(5)统计数据资料的积累、保管和公布。3、实际中控制误差的方法有:(1)正确制定调查方案,力求调查的范围明确、调查项目解释清楚、方法科学适用;(2)加强调查人员培训,提高调查技术水平;(3)做好思想教育工作,坚持实事求是,加强法律观念;(4)严格要求调查人员认真细致,多加审查及时更正;(5)完善各种计量、测量工具;(6)调查过程进行控制,对调查结果进行检验、评估,现场调查人员进行奖惩的制度。4、\n统计分组是根据统计研究的需要,按照某种标志将统计总体区分为若干性质不同而又有联系的几个部分的一种统计方法。统计分组必须遵循穷尽和互斥两条原则。穷尽原则就是总体中的每一个单位都有组可归,无一遗漏。互斥原则就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。5、算术平均数、众数和中位数之间的关系与次数分布数列有关。在次数分布完全对称时,算术平均数、众数和中位数都是同一数值。在次数分布非对称时,算术平均数、众数和中位数不再是同一数值了,而具有相对固定的关系。在尾巴拖在右边的正偏态(或右偏态)分布中,众数最小,中位数适中,算术平均数最大,在尾巴拖在左边的负偏态(或左偏态)分布中,众数最大,中位数适中,算术平均数最小。在统计实务中,可以利用算术平均数、中位数和众数的数量关系判断次数分布的特征。此外还可利用三者的关系进行相互之间估算。根据经验,在分布偏斜程度不大的情况下,不论右偏或左偏,三者存在一定的比例关系,即众数与中位数的距离约为算术平均数与中位数的距离2倍(四)计算题1、数学考试成绩的频数分布表如下表2-8所示。表2-8成绩分组学生人数比率60以下30.07560-7070.17570-80120.380-90140.3590以上40.12、比赛者所钓鱼的数量的频数分布表如下表2-9。表2-9所钓鱼的数量人数比率120.074074250.185185360.222222490.333333530.111111620.074074合计27---3、“销售额”是连续变量,应编制组距式频数分布表。具体过程如下:第一步:计算全距:第二步:按经验公式确定组数:第三步:确定组距:\n第四步:确定组限:以27为第一组的下限,其他组限利用组距依次确定。第五步:编制频数分布表。如下表2-10所示。表2-10按销售额分组公司数频率(%)27-33717.533-391537.539-45102545-51820合计401004、相关数据计算如下表2-11。表2-11成绩分组学生人数(人)组中值(分)向上累计人数向下累计人数60分以下252.524060-751167.5133875-901982.5322790以上897.5408合计40算术平均数为:(分)众数为:由表2-11可知最大频数是19,即众数组为75-90这一组,根据公式有(分)中位数为:由表2-11知,中位数的位置为40/2=20,即在75-90这一组,由公式得(分)5、月平均薪资为:(元)因为平均数小于中位数且中位数小于众数,所以该企业职工月薪资收入呈左偏分布。6、(件/人)\n(件/人)原因是五月份劳动生产率高的工人人数比重较大。说明以件记工对劳动生产率有一定影响。7、(元)(元)因AB两地高中毕业生的平均月薪资相等,且A地的标准差较大。因此B地高中毕业生的平均月薪资的代表性较大。8、相关数据计算如下表2-12。表2-12 亩产(百斤)组中值      14.51045-2.772.9-196.83531.44125.530165-1.786.7-147.39250.56336.550325-0.724.5-17.1512.00547.5604500.35.41.620.48658.5403401.367.687.88114.24469.510952.352.9121.67279.841(百斤),;偏度,峰度\n第三章抽样与抽样分布一、习题(一)判断题1、在抽样推断中,作为推断对象的单体和作为观察对象的样本都是确定的、唯一的。()2、抽样平均误差总是小于抽样极限误差。()3、样本统计量就是对样本数据特征的数量表示。()4、重复抽样属于简单随机抽样。()5、在总体分布未知的情况下,当样本的规模大于等于30的时候,就可以利用正态分布来推断总体的多种统计特征。()6、样本方差是总体方差的无偏估计值。()7、某总体服从正态分布,如果抽样的样本容量为5,样本均值的抽样分布也是正态分布。()8、正态分布、卡方分布、学生分布之间没有任何联系。()9、奈曼分配考虑到费用问题。()10、非抽样误差是由于抽样的随机性带来的。()(二)选择题1.对某地区工业企业职工状况进行了解,统计总体是()。A)该地区全部工业企业    B)每个工业企业C)该地区全部工业企业的全部职工D)每个工业企业的全部职工2.某城市进行工业企业未安装设备普查,总体单位是()。A)工业企业全部未安装设备B)每个工业企业的未安装设备C)工业企业每一台未安装设备D)每一个工业企业3.抽样调查必须遵循的原则是()。A)全面性原则B)灵活性原则C)随机性原则D)经济性原则4.抽样误差是指()。A)在调查过程中由于观察、测量等差错所引起的误差B)在调查中违反随机原则而出现的系统误差C)随机抽样而产生的代表性误差 D)人为原因所造成的误差5.连续生产的电子管厂,产品质量检验是这样安排的,在一天中,每隔一小时抽取5分钟的产品进行检验,这是()。A)简单随机抽样B)整群抽样C)等距抽样D)类型抽样6.抽样调查的主要目的是()\nA)对调查单位作深入研究B)用样本指标来推算总体指标C)计算和控制抽样误差 D)广泛运用数学方法7.当样本量足够大时,渐近于()A)非标准正态分布B)卡方分布C)标准正态分布D)分布8.若,那么服从()分布。A)正态分布B)卡方分布C)学生分布D)分布9.对某小区的户均收入进行调查,首先随机抽取一幢居民楼,然后对居民楼的所有住户进行调查,该调查方法是()。A)简单随机抽样B)整群抽样C)等距抽样D)分层抽样10.(根据上一题)假如是随机抽取小区内一定数量的住户进行调查,该调查方法是()。A)简单随机抽样B)整群抽样C)等距抽样D)分层抽样11.常用的抽样组织形式包括()。A)重复抽样B)简单随机抽样   C)不重复抽样D)等距抽样    E)类型抽样F)整群抽样12.在抽样推断中,样本单位数的多少取决于()。A)总体标准差的大小B)允许误差的大小C)抽样估计的把握程度D)总体参数的大小E)抽样方法和组织形式13.影响抽样误差的因素有()。A)是有限总体还是无限总体B)抽样的组织形式C)抽取样本的方法D)总体被研究标志的变异程度E)抽样单位数的多少14.系统抽样的优点有()A)简单易行;B)在总体分布比较均匀;C)抽样的准确性较高;D)抽样分布的标准差一般较小。15.样本均值的抽样分布的特点有()A)样本均值会随着样本容量的增大而变小;B)样本均值的误差会随着样本容量的增大而变小;C)样本均值抽样分布的标准差会随着样本容量的增大而变大;D)样本均值抽样分布的标准差会随着样本容量的增大而变小;\nE)根据样本均值的抽样分布规律,只要样本容量足够大,可以记你想那个科学准确的推断。16.决定样本量时,需要考虑的因素有()。A)调查费用;B)调查要求的精度;C)调查的目的;D)调查的技术。17.一般的概率分布之间主要有哪几种关系。()A)极限关系;B)变换关系;C)独立同分布随机变量之和的关系;D)特殊情形。18.抽样调查过程的基本程序包括()。A)总结评估;B)编制抽样框;C)设计调查表;D)试抽样调查;E)推断分析;F)数据处理.19.属于概率抽样的有()。A)简单随机抽样   B)等距抽样C)簇群抽样    D)分层抽样20.简单随机抽样通常有()两种方法。A)抽签法;B)随机数法;C)标记法;D)最优分配法。(三)简答题1.抽样调查的概念、特点及优越性。2.简述调查单位与填报单位的关系。4.什么是统计分组?有哪些分类?5.什么是统计分布?它包括哪两个基本要素?6.抽样误差的大小受哪些因素的影响?7.抽样推断有哪些基本特点?8.请列举分层抽样中样本量在各层分配的三种方法,并简述三种方法的思想。9.抽样调查中样本量的确定,主要受哪俩个因素的约束?10.概率抽样与非概率抽样的区别。\n(四)计算题1.某学校进行一次英语测验,为了解学生和考试情况,随机抽选部分学生进行调查,所得资料如下:考试成绩60以下60-7070-8080-9090-100学生人数102022408要求:(1)试以0.9545的可靠程度估计该校学生平均成绩的区间范围。(2)试以0.9545的可靠程度估计该校学生成绩在70分以上的学生所占比重的区间范围。2.从一批袋装食品中按简单随机重复抽样方式抽取50包检查,结果如下:每包重量(克)包 数90-9595-100100-105150-110233510要求:试以0.9545的概率(t=2)估计该批食品平均每包重量的区间范围。3.某厂为了解消费者对本厂新推出的化妆品的喜欢程度,随机抽取了500名消费者进行调查,结果发现喜欢该化妆品的有205人,以0.9545的概率保证程度估计消费者中喜欢这一化妆品的比率区间范围。(t=2)4.采用简单随机重复抽样的方法在20000件产品中抽取200件,其中合格品195件。要求:以0.9545的概率保证程度(t=2)对该批产品合格品量进行区间估计。5对一个电脑鼠标的生产商,声称自己所生产的鼠标的平均使用寿命是36个月,标准差是3个月。质量监察部门决定抽取60个这样的鼠标作为样本来检测这种鼠标的使用寿命。(1)试描述这60个鼠标样本的平均寿命分布;(2)假设这个生产商的话是真实的,则质量部门抽查的样本寿命均值低于或者等于34个月的概率是多少?(6.为了解2012伦敦奥运期间场馆工作人员每天的平均工作时间(单位:h),随机抽取了10名工作人员,得到的结果为7、6、8、7、6、5、7、8、7、7,试估计工作人员每天的平均工作时间,及其方差。7.从1000包某品牌奶粉中无放回随机抽取100包进行检查,其中有合格的有95包,试估计该品牌奶粉的合格率,并给出方差的估计。8.某企业有工人160人,技术人员80人,管理人员40人。欲通过分层抽样,了解过去一年平均每人的请假天数。已知抽取了16名工人,平均每人的请假天数为8天,方差为36;抽取的8名技术人员中,平均每人的请假天数为4天,方差为25;抽取的4名管理人员中,平均每人的请假天数为4天,方差为20;试估计平均每人每年请假的天数,及其方差的估计。9.在对出厂的牛奶进行三聚氰胺抽检时,某批次牛奶共有1000箱,每箱装有30包牛奶,质检部门随机抽取10箱作为样本,逐个检验,结果这10箱牛奶中不合格的牛奶包数分别为0、1、2、1、3、2、3、3、2、1包。(1)估计这批牛奶的不合格率及其方差估计;(2)如果采取随机抽样的方法抽取300包随机样本,而非簇群抽样,其他条件不变,那么这批牛奶的不合格率估计及其方差估计又是多少。与(1)中的方差估计相比怎么样。10.\n检查某书稿上的错别字,每10页抽查1页上的错别字,系统抽取20页后的错别字结果如下表:23214220120021130110试估计这本书稿平均每页的错别字数。\n二、习题答案(一)判断题1、×;2、×;3、Ö;4、Ö;5、Ö;6、×;7、Ö;8、×;9、×;10、×(二)选择题1-5、CCCBC;6-10、BCBBA;11、BDEF;12、ABCE;13、BCDE;14、AD;15、DE;16、AB;17、ABCD;18、ABCDEF;9、ABCD;10、AB(三)简答题略。(四)计算题1.(1)该校学生考试的平均成绩的区间范围为:[74.32―78.87]。(2)该校学生考试的学生成绩在70分以上的学生比重区间范围为:[60.84%-79.16%]2.该批食品平均每包重量的区间范围为:[101.88-103.72]克。3.以0.9545的概率保证程度估计消费者中喜欢这一化妆品的比率区间范围为:[36.6%-45.4%]。4.以0.9545的概率保证程度估计该批产品合格品量区间为:[19060-19940]件。5.1)平均寿命的抽样分布服从正态分布,而抽样分布的均值与总体均值相等。根据声称,则总体均值为m=35个月。抽样分布的标准差=0.2582)如果生产商是对的,则对于60个样本来说,则观察到平均寿命小于34个月的概率P(x<=34)的概率计算如下:因此,出现小于或者等于34个月的概率几乎为0,如果这次观察出现了小于或者等于34个月,则认为生产商的声称不正确。6.解:工作人员每天的平均工作时间(h);7.解:8.解:(1)\n(2)9.解:(1)因为群规模一样,所以;(2);,比(1)的方差大,说明簇群抽样的精度比简单随机抽样的高。10.解:\n第四章参数估计30第四章参数估计一、习题(一)判断题1、统计量不能含有任何总体参数。()2、参数是对总体的一种数量描述,它的值是已知的。()3、对于给定的置信度,参数的置信区间是唯一的。()4、对方差未知的正态总体进行样本容量相同的n次抽样,则这n个置信区间的宽度必然相等。()5、抽取的样本容量的多少与估计时要求的可靠程度成正比。()6、用样本各阶原点矩的函数来估计总体各阶原点矩同一函数的方法称为矩估计法。()7、在其他条件不变的情况下,增大样本容量可以缩短置信区间的长度。()8、置信区间的长度的均值表达了区间估计的可靠性。()9、一个估计量的有效性是指该估计量的方差比其他估计量小。()10、正态总体的方差未知时,估计其均值采用的是卡方检验方法。()(二)单项选择题1、0,2,2,3,3为来自均匀分布总体的样本观测值,则的矩估计值为()。A、1B、2C、3D、42、设0,1,0,1,1为来自两点分布总体的样本观测值,的矩估计值为()。A、1/5B、3/5C、2/5D、4/53、在矩估计中,估计总体的均值和总体的方差应该用()。A、样本均值样本方差B、总体均值总体方差C、样本均值总体方差D、总体均值样本方差4、9,8,7,7,6,5为来自正态分布总体的样本观测值,则总体方差的估计量为()。A、7B、5/3C、2D、105、矩估计必然是()。A、无偏估计B、总体矩的函数C、样本矩的函数D、极大似然估计6、设是正态总体的总体容量为2的样本,为未知参数,则\n第四章参数估计30的无偏估计是()。A.B.C.D.7、设某钢管直径服从正态总体,其中为未知参数,从刚生产的一大堆钢管中抽出9根,求得样本均值,样本方差,则的极大似然估计值为()。A、31.06B、8.82C、0.98D、279.548、以下关于参数估计的说法正确的是()。A、区间估计优于点估计B、样本含量越大,参数估计准确的可能性越大C、样本含量越大,参数估计越精确D、对于一个参数只能有一个估计值9、当置信水平一定时,置信区间的宽度()。A、随着样本量的增大而减小B、随着样本量的增大而增大C、与样本量的大小无关D、与样本量的平方根成正比10、在其他条件不变的情况下,总体数据的方差越大,估计是所需的样本量()。A、越小B、越大C、可能大也可能小D、不变11、设罐子里装有黑球和白球,有放回地抽取一个容量为的样本,其中个白球,则罐子里黑球数与白球数之比的最大似然估计量为()。A、B、C、D、12、正态总体方差已知时,在小样本条件下,总体均值在置信水平下的置信区间可以写为()。A.B.C.D.13、在区间估计中的正确含义是()。A.以的概率落在区间内B.落在区间以外的概率为C.不落在区间以外的概率为D.随机区间包含的概率为14、设总体,对参数或\n第四章参数估计30进行区间估计时,不能采用的样本函数有()。A.B.C.D.15、在其他条件相同的情况下,95%的置信区间比90%的置信区间()。A、要宽B、要窄C、相同D、可能宽也可能窄16、置信系数表达了置信区间的()。A、准确性B、精确性C、显著性D、可靠性17、估计量的含义是指()。A、用来估计总体参数的统计量的名称B、用来估计总体参数的统计量的具体数值C、总体参数的名称D、总体参数的具体数值18、使用统计量估计总体均值的条件是()。A、总体为正态分布B、总体为正态分布且方差已知C、总体为正态分布且方差未知D、大样本19、设为未知参数的无偏,一致估计,且存在,则是的()。A、无偏一致估计B、无偏非一致估计C、有偏一致估计D、有偏非一致估计20、无偏估计是指()。A、样本统计量的值恰好等于待估的总体参数B、所有可能样本估计值的数学期望等于待估总体参数C、样本估计值围绕待估总体参数使其误差最小D、样本量扩大到和总体单元相等时与总体参数一致(三)简答题1、在参数估计时,评价估计量好坏的标准。2、简述样本容量与置信水平,总体方差,允许误差的关系。3、什么是点估计和区间估计?4、什么是点估计的矩估计法和最大似然法?5、解释置信区间和置信水平的联系。(四)计算题1、设,求的矩估计。2、设总体的密度函数为,求的最大似然估计。\n第四章参数估计303、设为从总体中抽出的一组样本,总体均值已知,用去估计总体方差,它是否是的无偏估计,应如何修改,才能成为无偏估计。4、设是取自双参数指数分布的一个子样,,其中。试求参数和的极大似然估计和矩法估计。5、设和为参数的两个独立的无偏估计量,且假定,求常数和,使得为的无偏估计,并使方差最小。6、对方差为已知的正态总体来说,问需取容量为多大的样本,才能使总体均值的置信水平为的置信区间的长度不大于?7、设从正态总体中采用了个相互独立的观察值,算的样本均值及样本方差,求总体的均值和方差的90%的置信区间。8、二正态总体参数均未知,依次取容量为的二独立样本,测得样本均值分别为,样本方差分别为。(1)求二总体均值差的90%的置信区间。(2)求二总体方差比的90%的置信区间。(五)案例分析题1、某社会调查部门为了解某地大学生每天学习的时间,在该地区几万名学生中采用不重复的方法随机抽取了40人,得到他们每天的学习时间如下表4-1:表4-13.34.42.14.73.121.91.46.25.41.21.25.82.65.12.92.44.21.84.13.54.36.42.35.43.53.60.54.55.70.83.63.22.31.52.51.73.20.84.1试在置信区间分别为0.9,0.95下,给出该地区大学生平均学习时间的置信区间。2、某地区水资源匮乏,为了鼓励节约用水,该地某部门对本市的25\n第四章参数估计30户人家进行了调查。得到的用水量数据如下表4-2:表4-2用水量(0.1吨)户数45-55255-65565-75975-85685-953合计25求在95%的置信度下,全市家庭用户平均用水的置信区间(计算时区间以其中值代替)。\n第四章参数估计30二、习题答案(一)判断题1、√;2、×;3、×;4、×;5、√;6、√;7、√;8、×;9、√;10、×(二)单项选择题1-5、DBABC;6-10、DACAB;11-15、BCDDA;16-20、DABCB(三)简答题1、(1)无偏性(2)有效性(3)相合性2、样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。3、点估计是指用估计量的数值直接作为总体参数的估计值的方法和过程。在总体分布形式为已知,从该总体中抽取一个样本,对未知参数所作的一个数值点的估计,称为参数的点估计。点估计的方法有矩估计法,顺序统计量法,最大似然法和最小二乘法等。区间估计是在点估计的基础上,给出在一定的置信程度下确定总体参数取值区间的方法和过程。4、矩估计法是用样本各阶原点矩的函数来估计总体各阶原点矩同一函数的方法。此方法直观而又简便,但其要求总体的原点矩存在。一旦某分布的原点矩不存在,那就不能用矩法。最大似然估计法是指利用已知的总体分布的密度函数和样本信息,来估计未知的总体参数的方法。此方法充分利用了总体概率函数的表达式所提供的信息,具有很多优良的性质,是最常用的估计方法。5、置信水平讲的是落在置信区间的可能性,一个置信水平对应(即可找到)多个(无数)置信区间,一个置信区间只有一个置信水平。在进行区间估计是,关键是对一个置信水平找出最窄置信区间。(四)计算题1、,故,所以。2、设,则由,可得。\n第四章参数估计303、因所以,不是的无偏估计。但是的无偏估计。4、(1)。。由故是的递增函数,取到最大可能值时可使达到最大,故的极大似然估计为。由可解得。(2)矩法估计由于,故由和解得。5、由,得。又由于,为了使其最小,即求在条件下的最小值。将代入中易得当时取最小值。6、由于的置信区间为,根据题意有。所以,,即。7、,,,。又由于和的90%的置信区间分别为,。将数据代入有和的90%\n第四章参数估计30的置信区间分别为。8、(1)由,得到的90%的置信区间。(2)由及可得二总体方差比的90%的置信区间为。(五)案例分析题1、这是大样本下总体均值的区间估计。由已知,得样本均值,样本标准差。则置信区间为,即对于置信度0.90、0.95,置信区间分别为。2、这是大样本下总体均值的区间估计。样本平均数,样本标准差。根据给定置信度,可以得到置信区间为\n第五章假设检验41第五章假设检验一、习题(一)判断题1、假设检验先对总体的参数或分布函数的表达式做出某种假设,然后找出一个在假设成立条件下出现可能性甚小的(条件)小概率事件。()2、通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率尽可能小一点。()3、假设检验中的显著性水平是推断时犯第Ⅰ类和第Ⅱ类错误的概率。()4、关于检验水平,在检验实施之前,应该是事先设定的,不可擅自改动。()5、设样本是来自正态分布,其中未知,那么检验假设时,用的是Z检验。()6、右侧检验和左侧检验统称为左侧检验。()7、增大样本容量可以使假设检验两类错误同时减小。()8、检验一个正态总体的方差时所使用的分布为正态分布或者t分布。()9、“拒绝原假设”和“接受原假设”具有相同的可靠程度。()10、假设检验中的P值越大,拒绝原假设的理由越充分。()(二)单项选择题1、假设检验中的显著性水平是()A、推断时犯第二类错误的概率B、推断时犯第一类和第二类错误的概率C、推断时犯第一类错误的概率D、以上都不是2、假设检验中,显著性水平表示()A、为假,但接受的假设的概率B、为真,但拒绝的假设的概率C、为假,但拒绝的假设的概率D、可信度3、假设检验的显著性水平的一般取值为()A、大于0.10B、大于0.01C、小于0.80D、不超过0.104、在假设检验中,当作出拒绝原假设而接受备择假设的结论时,下面说法不正确的是()A、有充足的理由否定原假设B、原假设必定是错误的\n第五章假设检验41C、犯错误的概率不大于D、在为真的情况下发生率小概率事件5、下列说法中,正确的是()A、若备择假设是正确的,做出的决策是拒绝备择假设,则犯了弃真错误B、若备择假设是正确的,做出的决策是接受备择假设,则犯了取伪错误C、若原假设是正确的,做出的决策是接受备择假设,则犯了弃真错误D、若原假设是正确的,做出的决策是接受备择假设,则犯了取伪错误6、假设检验中的P值的意义为()A、拒绝原假设的最小显著性水平B、拒绝原假设的最大显著性水平C、接受原假设的最小显著性水平D、接受原假设的最大显著性水平7、样本容量不变,犯第一类错误的概率减小,则犯第二类错误的概率()A、增大B、减小C、不变D、变化不定8、假设检验时,若增大样本容量,则犯两类错误的概率()A、都不变B、都增大C、减少D、一个增大一个减少9、经过显著性检验,原假设被拒绝了,则()A、原假设是错误的B、备择假设一定是正确的C、是正确的可能性为D、原假设可能是正确的10、对正态总体数学期望的假设检验,若在显著性水平下接受,那么在下对的检验是()A、必接受B、可能接受也可能拒绝C、必拒绝D、不接受也不拒绝11、生产耐高温水杯,至少要能抗住1500C而水杯不变形,这时对产品质量检验所设立的假设应当是()A、B、C、D、12、假设检验中的临界区域是()A、拒绝域B、接受域C、置信区域D、检验域13、下列结论中,不正确的是()A、假设检验的依据是小概率原理B、若,则为犯第一类错误的概率\n第五章假设检验41C、小,则也小D、尽量增大样本容量,可以减小和14、如果是小样本数据的均值检验,应该采用()。A、Z检验B、t检验C、检验D、以上都不对15、如果检验总体方差的显著性,应采用哪种检验方法()。A、Z检验B、t检验C、检验D、以上都不对16、某化工产品的含硫量,其中都未知,取5个样品,测得含硫量为4.28,4.40,4.42,4.35,4.37,检验和(显著水平都是),检验的结果为()A、拒绝,拒绝B、接受,接受C、接受,拒绝D、拒绝,接受17、当总体服从正态分布,但总体方差未知的情况下,,,则的拒绝域是()A、B、C、D、18、从一批零件中抽出100个测量其直径,测得其平均直径为5.2cm,标准差为1.6cm,想知道这批零件是否服从标准直径5cm,因此使用t检验法,那么在显著水平下,拒绝域为()A、B、C、D、19、在假设检验中,若抽样单位数不变,显著水平从0.01提高到0.1,则犯第二类错误的概率()A、提高B、不变C、下降D、可能提高,可能不变20、下列关于单侧检验和双侧检验的说法,不正确的是()A、在显著水平下,检验假设:,的检验,称为双侧检验B、右侧检验和左侧检验统称为单侧检验C、在显著水平下,检验假设:,的检验,称为左侧检验D、在显著水平下,检验假设:,的检验,称为右侧检\n第五章假设检验41验(三)简答题1、什么是假设检验?其作用是什么?2、什么是第Ⅰ类错误,什么是第Ⅱ类错误?3、什么叫做检验统计量、P值?4、陈述假设检验的步骤。5、用Z统计量检验非正态分布的总体指标,其使用依据是什么?(四)计算题1、假设英语四级考试中学生成绩服从正态分布。现随机抽取25名学生的考试成绩,算得平均分为67分,标准差为10分。在显著性水平下,可否认为全体学生的平均考试成绩为72分?2、已知某种元件的寿命服从正态分布,要求该元件的平均寿命不低于1000h,现从这批元件中随机抽取25件,测得平均寿命,标准差S=65h,试在水平下,确定这批元件是否合格。3、某厂生产的某种产品,由以往经验和知其强力标准为7.5kg且强力服从正态分布,改用新原料后,从新产品中抽取25件做强力试验,算得s=9.5kg,问新产品的强力标准差是否有显著变化()?其中,(24)=36.415,(24)=42.98,(24)=40.646,(24)=46.928,(24)=12.401,(24)=9.886。4、根据某地环境保护法规定,倾入河流的废物中某种有毒化学物质含量不得超过3ppm.该地区环保组织对某厂连日倾入河流的废物中该物质的含量的记录为:。经计算得试判断该厂是否符合环保法的规定。(该有毒化学物质含量X服从正态分布)5、给出下面两组数据:(1)0.225,0.262,0.217,0.240,0.230,0.229,0.235,0.217(2)0.209,0.205,0.196,0.210,0.202,0.207,0.224,0.223,0.220,0.201设这两组数据分布来自正态分布,且两总体方差相等,两样本相互独立,问这两组数据是否有显著性差异()?\n第五章假设检验416、甲乙两个铸造厂生产同一种铸件,假设两厂铸件的重量都服从正态分布,各抽取7件与6件产品,测得重量如下(单位:kg)甲厂:93.3,92.1,94.7,90.1,95.6,90.0,94.7乙厂:95.6,94.9,96.2,95.1,95.8,96.3问乙厂铸件重量的方差是否比甲厂的小()。7、机器自动包装食盐,设每袋盐的净重服从正态分布,规定每袋盐的标准重量为500克,标准差不超过10克.某天开工以后,为了检查机器工作是否正常,从已包装好的食盐中随机抽取9袋,测得其重量(克)为:497,507,510,475,484,488,524,491,515问这天自动包装机工作是否正常(显著性水平)?8、总体,,与分别时来自总体的样本,试讨论检验问题.(五)案例分析题1、为研究直肠癌患者手术前后血清CEA含量有无差异,作者收集了资料:术前(24例):31.530.028.639.745.220.337.324.036.220.523.129.033.135.228.926.425.923.830.431.627.933.034.032.7术后(12例):2.03.22.33.11.92.21.51.83.23.02.82.1(1)有人采用了两组独立样本的t检验,结果t=15.92,自由度v=34,P<0.05。从而得出结论:手术前后血清CEA含量有差异,术前CEA含量高于术后。(2)也有人认为应该采用校正t检验,结果:t’=22.51,P<0.05。(3)还有人觉得上述分析方法都不对,应该采用两独立样本的秩和检验,结果为:Z=-4.83,P<0.05。(4)有人将上述三种方法作一比较,认为既然三者结论是一致的,所以采用哪种分析方法都无所谓。对此你有何看法?2、为研究不同药物对肥胖患者的疗效,将BMI≥28的肥胖患者随机分成两组,每组10人,测得他们服药前及服药2个月后体重的变化(见下表5-1)。试评价:①A、B两种药物对肥胖患者是否有效。②A、B两种药物的疗效有无差别。表5-1药物12345678910A服药前75.661.267.877.273.265.480.074.482.668.6服药后73.060.263.672.074.660.869.477.479.663.4B服药前69.489.966.863.470.086.690.474.867.484.4\n第五章假设检验41服药后60.895.561.662.069.478.071.076.658.275.4(1)假设数据服从正态分布,且总体方差齐,在评价A、B两种药物对肥胖患者是否有效时,作者对A、B两组患者分别采用了独立样本的t检验,结果:A组患者服药前后比较t=1.040,P=0.312;B组患者服药前后比较t=1.125,P=0.275。从而得出结论,两种药物均无效。(2)有人认为这种方法不太好,他采用独立样本的t检验,首先比较服药前两组基线水平,结果t=1.533,P=0.160,表明差异没有统计学意义,两组有可比性。进而,比较治疗后两组体重的差异,结果t=0.346,P=0.734,从而得出结论:A、B两种药物的疗效差异无统计学意义。请对以上两种作法发表你的看法。\n第五章假设检验41二、习题答案(一)判断题1-5、√√××√;6-10、×√√×××(二)单项选择题1-5、CBDBC;6-10、AACDA;11-15、CACBC;16-20、DBCCD(三)简答题1、假设检验是先对总体的统计特征提出某种假设,然后利用样本信息判断假设是否成立的过程。它的主要作用在于用差异的大小来反映假设值真实性的大小,即差异小,假设值真实性就可能大,差异大,假设值真实性就可能小。2、当原假设为正确时拒绝原假设,所犯的错误称为第Ⅰ类错误,又称为弃真错误。犯第Ⅰ类错误的概率通常记为。当原假设为错误时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称为取伪错误。犯第Ⅰ类错误的概率通常记为。3、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值,也称为观察到的显著性水平。4、第一,陈述原假设和备择假设;第二,从所研究的总体中抽出一个随机样本;第三,确定一个适当的检验统计量,并利用样本数据算出其具体数值;第四,确定一个适当的显著性水平,并计算出其临界值,指定拒绝域;第五,将统计量的值与临界值进行比较,作出决策;若统计量的值落在拒绝域,拒绝,否则不拒绝(也可以直接利用P值作出决策)。5、当样本容量足够大时,即n>30时,非正态分布的变量近似地服从正态分布,也可选用Z统计量进行检验。(四)计算题1、,因为,|t|=|-2.5|=2.50<2.797=t0.005(24),所以,接受,可以认为平均分是72分。2、由题意,未知,在水平下检验假设:\n第五章假设检验41属于左侧t检验。构造检验统计量。其中。查t分布表可得,。又,即接受原假设,认为这批元件是合格的。3、要检验的假设为,=38.51在=0.05时,=36.415=故在=0.05时,拒绝认为新产品的强力标准差较原来的有显著增大。当=0.01时,=故在=0.05时,接受认为新产品的强力标准差与原来的无显著差异。4、设有毒化学物质含量作为总体,则,从中选取容量为15的样本,测得由题意,设原假设为,备择假设为,构造检验统计量,则,在显著性水平=0.05下,查表可得,即拒绝原假设,接受备择假设,认为该厂不符合环保的规定。5、设题中两正态母体分布记为,,其均值分布为,因而检验问题如下:\n第五章假设检验41选取统计量,其中,在=0.05时,查t分布表可得由题设样本数据可得,从而t统计量值为因而拒绝原假设,认为这两组数据有显著性差异。6、设,分别表示甲、乙两厂铸件重量,,由题意知,,,因为,所以不应该接受,从而接受,即乙厂铸件重量的方差是否比甲厂的小。7、设每袋盐重量为随机变量,则,为了检查机器是否工作正常,需检验假设:及。下面现检验假设由于未知,故构造统计量由于=0.05,查t分布表可得,又由题设计算可得,故统计量取值\n第五章假设检验41即接受原假设,认为机器包装食盐的均值为500克,没产生系统误差。下面再检验假设选取统计量,由于=0.05,查分布表可得,而统计量20.56>,故拒绝原假设,接受,即认为其标准差超过了10克。由上可知,这天机器自动包装食盐,虽没有产生系统误差,但生产不够稳定(方差偏大),从而认为这天自动包装机工作不正常。8.、取统计量,其中,则检验统计量为,当成立时,t有偏大的趋势,故取拒绝域为。(五)案例分析题1、(1)盲目套用两独立样本的t检验,未检查定量资料素芳满足参数检验的前提条件。(2)若定量资料满足参数检验的前提条件,直接用秩和检验会降低检验功效。(3)若定量资料不满足正态性要求,直接用校正的t检验也是不妥当的。(4)应当采用哪种统计分析方法不应仅看结论是否一致,而应根据分析目的、设计类型、资料是否满足参数检验的前提条件等方面综合考虑,事先选定统计分析方法,不能等到计算结果出来了,再确定统计分析方法。正确做法:此案例涉及完全随机设计两小样本资料的假设检验,统计方法的选择。一定要结合数据特征。通过对两组数据进行正态性检验,可认为两样本均来自正态总体(检验的P值分别为0.895、0.190),但方差齐性检验结果表明,两总体方差不等(F检验的P值为P<<0.01),所以最好的办法就是t’检验。此种情况一般不主张采用秩和检验,因为非参数假设检验方法的检验功效会大大降低。2、(1)误用独立样本的t检验取代配对设计定量资料的t检验。(2)本案例中采用独立样本的t检验单纯比较两组治疗后体重有无差异去推断两种药物的疗效差别是不正确的。因为两组肥胖患者治疗前体重可能不同,缺乏组间可比性。因为未充分发挥两组患者服药前的信息,使结论的可信度降低。\n第五章假设检验41正确做法:①欲评价A、B两种药物对肥胖患者是否有效,应分别对A、B两组患者服药前后体重进行配对t检验。利用Excel容易求得检验的P值分别为0.026,0.038,从而可推断A、B两种药物治疗前后体重都存在差异。不过,即使获得了一个较小的P值,拒绝了,下结论也一定要慎重。因为差异有统计学意义并不能说明药物就有效,药物是否有效以及疗效的好坏一方面要结合专业知识方可下结论,另一方面服药前后肥胖患者的饮食习惯、运动情况等因素对体重都会有影响。因此,对同一个体处理前后某项指标进行比较,一定要保证非处理因素在处理前后保持不变,否则难以得出正确的结论。②欲评价A、B两种药物的疗效有无差别,应分别计算出各组治疗前后体重的差值,然后作完全随机设计两独立样本比较的t检验,因为A、B两组样本是从同一总体中随机抽取的,肥胖病没有传染性,两组受试者间是相互独立的,由题中条件可知,定量资料满足正态性和方差齐性的前提条件。等方差假设和异方差假设下两独立样本的t检验的P值分别为0.388,0.391,数据尚不支持A、B两种药物的疗效有差异的推断。总之,如果要分别评价A、B两种药物是否有效,可以首先按照自身对照设计资料,考虑采用配对t检验并结合专业与实际进行推断。另外,可以同时设定一个平行对照帮助推断。如果欲评价A、B两种药物的疗效有无差别,可以采用以下两种方法之一:①分别计算出各组治疗前后体重的差值,然后作完全随机设计两样本比较的t检验;②以治疗前两组体重数据作为协变量的值,采用多重回归扣除治疗前体重的影响。\n第六章方差分析与试验设计68第六章方差分析与试验设计一、习题(一)判断题1、方差分析法所分析的就是方差。()2、单因素方差分析中,F统计量分子的自由度为全部观察值个数减样本数。()3、方差分析所研究的是品质型自变量对数值型因变量的影响。()4、拉丁方设计具有同时分析三个因素对于所研究的测度是否存在显著关系的功能。()5、在完全随机设计中,若原假设为真,则效应均方与误差均方和的比值就应接近1。()6、单因素方差分析的组间误差反映的是随机因素和不同因素的影响。()7、完全随机化试验除了纯随机性质外,还必须具备可重复性。()8、双因素方差分析设计两个分类型自变量。()9、无交互作用的双因素方差分析是指用于检验的两个自变量对因变量的影响是独立的。()10、在方差分析中,如果拒绝原假设,则意味着所检验的各总体均值之间全不相等。()(二)单项选择题1、某生产企业研制了一种新型产品,产品有五种颜色。如果要考察颜色是否会影响销售量,则水平为()。A、6B、2C、3D、52、下列关于方差分析的陈述正确的是()。A、方差分析是对多个总体的均值的比较研究B、方差分析假定所比较的多个总体都服从正态分布,要求方差已知,方差是否相等无所谓C、方差分析对所比较的多个总体并不要求都服从正态分布,只要求各总体方差相等D、方差分析是对多个总体的方差的比较研究3、对方差分析的基本原理描述错误的有()。A、通过方差的比较,可检验各因子水平下的均值是否相等B、方差比较之前应消除自由度的影响C、方差比较的统计量是t-统计量D、方差分析的实质是对总体均值的统计检验4、在方差分析中,()反映的是样本数据与其组平均值的差异。A、总体利差平方和B、组间误差\n第六章方差分析与试验设计68C、抽样误差D、组内误差5、在方差分析中,()反映的是各水平均值之间离散程度的规模。A、总体利差平方和B、组间误差C、抽样误差D、组内误差6、在方差分析中,拒绝原假设,则意味着()。A、的两两组合都不相等B、的两两组合至少有一对不相等C、的两两组合都相等D、的两两组合至少有一对相等7、若方差分析中,所提出的原假设是,备择假设是()。A、B、C、D、不全相等8、在水平个数为,观察值总数为的单因素方差分析中,组内误差的自由度为()。A、B、C、D、9、下列指标中包含有系统性误差的是()。A、SSA  B、SSE C、D、10、如果要拒绝原假设,则下列式子()必须成立。A、B、C、D、11、对某一问题进行实验设计时,若此问题涉及多个因素及水平数,则往往考虑采用()方法。A、完全随机化试验   B、随机化区组设计C、正交实验设计 D、拉丁方设计12、在无交互作用的双因素方差分析中,因素A的水平个数为,因素B的水平个数为,则随机误差项的自由度为()。A、B、C、D、13、在有交互作用的双因素方差分析中,因素A的水平个数为,因素B的水平个数为,为重复独立试验的次数,则随机误差项的自由度为()。A、B、C、D、14、在有交互作用的双因素方差分析中,因素A的水平个数为,因素B的水平个数为\n第六章方差分析与试验设计68,为重复独立试验的次数,则交互作用的偏差平方和的自由度为()。A、B、C、D、15、在双因素方差分析中,()反映了由于随机误差的作用而在数据中引起的波动。A、B、C、D、16、在双因素方差分析中,()反映了由于因素A与因素B的交互作用的存在而在数据中引起的波动。A、B、C、D、17、在判断多个样本的特征值之间有无显著差异时,一般采用()。A、假设检验B、方差分析C、相关分析D、回归分析18、对于完全随机化试验,下列说法正确的是()。A、非随机性B、不可重复性C、存在系统误偏差影响D、不能保证不同水平之间的试验条件或环境完全相同19、下列说法正确的是()。A、随机化区组设计不存在系统性偏误影响B、完全随机化试验的个水平与个试验条件不是固定不变的C、随机化区组设计可容许存在两个方面的条件或环境的差异,考察其对测度的影响D、拉丁方设计可以容许存在两个方面的条件或环境的差异,考察其对测度的影响20、对正交试验结果的分析,下列分析方法中不是通常采用的是()。A、假设检验B、方差分析法C、直观分析法D、极差分析法(三)简答题1、何谓方差分析,其研究内容是什么?2、随机化区组设计与完全随机化试验的根本区别?3、方差分析中有何基本假定,其基本思想是什么?4、简述方差分析的一般步骤。5、简述正交试验设计及其基本步骤和方法。(四)计算题1、为了检验不同教学方法的效果,抽取3间教学方法彼此不同的学校,在每个学校随机抽取5名学生,以学生考试成绩测度教学方法的效果,经过计算得到如下方差分析表6-1:表6-1差异源SSdfMSFP值F临界值组间________307.8____0.000313.88529\n第六章方差分析与试验设计68组内216.4________---------总计____14____---------1)将方差分析表中划线处的数值填上;(2)在下,分析3种不同的教学方法之间有无显著差异?2、考虑4个2水平的因素及交互作用,试在正交表上作表头设计。3、因生产的需要,某制造公司准备购进一批原材料,现有A1、A2、A3三个生产企业愿意供货,为比较它们生产的原材料的质量,从每个生产企业各随机抽取5单位原材料,经试验得其评估分数数据如下表6-2:表6-2试验号原材料生产企业A1A2A315032452502842343303844034485392640试分析三个企业生产的原材料之间有无显著差异?()如果有差异,用LSD方法检验哪些企业之间有差异?4、为了检验5种不同品种的猪和4种不同的饲养方案对收获量的影响,分别采用5种幼猪和4种饲养方案搭配进行试验,取得的收获量数据如下表6-3:表6-3品种饲养方案B1B2B3B4A1129.510.49.7A213.711.512.49.6A314.312.311.411.1A414.21412.512A5131413.111.4\n第六章方差分析与试验设计68检验幼猪的不同品种对收获量的影响是否有显著差异?不同的饲养方案对收获量的影响是否有显著差异?()5、为研究某产品的包装和形状对其销售量是否有影响,分别采用此产品的3种包装和3种形状搭配进行试验,获得的销售量数据如下表6-4:表6-4产品形状(C)包装方法(B)B1B2B3C1457530C2505040C3356550检验不同的形状和不同的包装方法对该产品的销售量是否有显著影响?()6、从五个总体中各抽取容量相同的样本数据,得到如下表6-5资料。试在显著性水平0.05下检验五个总体的均值有无显著差异。表6-5样本1样本2样本3样本4样本529.627.35.821.629.224.332.66.217.432.828.530.811.018.325.032.034.88.319.024.27、为了检验产品设计和销售方案对产品销售量的影响,某公司做了一项试验,考察3种销售方案和2种产品设计,得到的销售量数据如下表6-6所示。表6-6BB1B2AA1812128A222261430A310181814试检验销售方案、产品设计或其交互作用对销售量的影响是否显著?8、5种不同品牌的婴儿奶粉在不同的商场上出售。为研究不同品牌的婴儿奶粉销售量是否有差异,随机抽取了8家商场,记录了一周中各品牌婴儿奶粉的销售量数据(单位:罐。每罐5000克),结果如下表6-7:\n第六章方差分析与试验设计68表6-7品牌商场B1B2B3B4B5B6B7B8C17173666958607061C27178818978859084C37378768674808176C47375738075717372C56266698160646157分析品牌和商场对婴儿奶粉销售量是否有影响?(五)案例分析题1、某企业成立初,其产品产量存在大幅波动,对公司的运营造成了极大的影响。一般说来这一问题可能是生产条件(诸如光照、噪音)的影响。为了找到原因,以便就存在的问题做出相应的对策,生产管理部门在光照效应与噪音效应不同的水平组合下做实验。实验结果如下表6-8:表6-8光照噪音B1B2B3A1151517191916161821A2171717151515192222A3151717181716181818A4182020151617171717试根据上表数据,设计一种方案,判断:(1)光照效应对产量是否有显著影响?(2)噪音效应对产量是否有显著影响?(3)光照效应与噪音效应的交互作用对产量是否有显著影响?(4)对于存在的问题,该公司应采取什么措施?2、某一企业在原有经验的基础上要对影响销售量的因素做进一步的研究,目的是提高企业产品的销售量。考察的因素有产品的形状、产品的大小、产品的颜色、产品的销售策略及产品的售后服务质量,每个因素设置两个水平且第一个水平比第二个水平好。不考虑交互作用,用正交表安排实验,第3,7两列留空,因素按次序上列,试验所得数据依次为:92.3,90.4,87.3,88.0,87.3,84.8,83.4,84.0。要求:(1)对实验结果进行方差分析;(2)求出最优工艺条件下的工程评均;(3)计算最优方案下试验真值的置信区间()。\n第六章方差分析与试验设计68\n第六章方差分析与试验设计68二、习题答案(一)判断题1、×;2、×;3、√;4、√;5、√;6、×;7、√8、√;9、√;10、×(二)单项选择题1-5、DACDB;6-10、BDAAB;11-15、CDCDC;16-20、DBDDA(三)简答题1、所谓方差分析,就是通过将观察数据的总偏差平方和进行分解,利用假设检验理论和方法,对因素的各个水平所对应的正态总体的均值是否相等进行检验的一种方法。其研究内容主要有多个正态总体均值是否相等的检验,总体分布中未知参数的估计。2、随机化区组设计与完全随机化试验的根本区别,就在于K个水平不再与K个实验条件固定不变,而是采用随机的方法随机地确定某个水平在某个条件或场所进行试验。并且将时间上或空间上相近,或者具有某一个共同特征的K个水平的试验构成一个区组。3、(1)因素下各水平所对应的总体服从正态分布;(2)这些正态总体有相同的方差;(3)来自于不同水平下的样本相互独立。方差分析的基本思想:若被考察的因素对试验结果没有显著的影响,即所讨论的各正态总体的均值相等,则试验数据的波动完全由随机误差引起;如果各正态总体均值不全相等,则表明试验数据的波动除了随机误差的影响外,还包含被考察因素效应的影响。为此,通过构造适当的统计量,来描述数据的波动程度。将这个统计量分解为两部分,一部分是纯随机误差造成的影响,另一部分是除随机误差的影响外来自因素效应的影响。然后将这两部分进行比较,如果后者明显比前者大,就说明因素的效应是显著的。4、(1)根据问题的特点建立假设;(2)根据公式计算并得到方差分析表;(3)由给定的显著性水平,查得检验统计量的临界值;(4)做出决策。5、正交设计是利用“正交表”进行科学地安排与分析多因素试验的方法。其基本步骤与方法如下:(1)明确试验目的,确定考察的指标;(2)挑选因素,选水平,制定因素水平表;(3)选择合适的正交表,进行表头设计;(4)明确试验方案,进行试验,测定实验结果;(5)对实验结果进程统计分析,得出因素的主次顺序,确定最优方案或较优方案;(6)进行验证试验,作进一步分析。(四)计算题\n第六章方差分析与试验设计681、(1)615.683221218.0359.417.07(2)F=17.07>,拒绝原假设,即3种教学方法之间有显著差异。2、表头设计如下表6-9。表6-9因素列号12345673、原假设为,备择假设为。统计量为。通过excel进行方差分析有,拒绝原假设即各企业的原材料有显著差异。,拒绝原假设,即A1与A2企业的原材料有显著差异;,不能拒绝原假设,即企业A1与A3的原材料无显著差异;,拒绝原假设,即企业A2与A3的原材料有显著的差异。4、原假设为,;备择假设为:,。统计量为,。通过excel进行方差分析有,拒绝原假设,即猪的品种对最终收获量有显著的影响。,拒绝原假设,即饲养方案对最终收获量有显著的影响。5、原假设为,;备择假设为,。\n第六章方差分析与试验设计68统计量为,。通过excel进行方差分析有,不能拒绝原假设即此产品的形状对销售量没有显著影响。,不能拒绝原假设即此产品的包装方法对销售量没有显著影响。6、原假设为;备择假设为。统计量为。通过excel进行方差分析有,在显著性水平0.05下,基于现有样本,拒绝原假设,即这五个总体的均值有显著差异。7、原假设为,,;备择假设为,,。统计量为,,。通过excel进行方差分析有,,。由此可见,因素销售方案对销售量的影响是显著的,而产品设计及两因素的交互作用对销售量的影响不显著。8、原假设为,,备择假设为:。\n第六章方差分析与试验设计68统计量为,。通过excel进行方差分析有,拒绝原假设即品牌对婴儿奶粉销售量有显著影响。,拒绝原假设即商场对婴儿奶粉的销售量有显著影响。(五)案例分析题1、原假设为,;备择假设为,。统计量为:,。经过计算得到方差分析表6-10。表6-10由此表6-10可见:(1)没有充分的证据说明光照对产量有显著的影响;(2)有充分的证据说明噪音对产量有显著的影响;(3)光照与噪音存在交互作用并对产量产生显著的影响;(4)对于存在的问题,该公司对工作地的噪音进行控制;另外应对光照与噪音的搭配进行重新组合,以提高产量。2、(1)设分别为因素的水平的效应,则检验各因素对实验结果有无显著影响,分别等价于对下列假设:,,,,作出显著性检验。\n第六章方差分析与试验设计68统计量为,其他统计量类似。经过计算得到方差分析表如下表6-11:表6-11方差来源   值 显著性  42.781142.781128.1  18.301118.30154.8  1.20111.2013.1  4.06111.06112.4  0.06110.061   0.94220.471   1.00330.334  从表中可知,因素对试验结果有显著影响。所以因素主次顺序为:;此外,在无交互作用的情形,对试验结果影响显著的因素应该选最好的水平,对于作用不显著的因素可根据实际情况任取一个水平。本例中对不显著因素取,,则优方案为。(2)最优工程平均是总平均加上各显著因素的最优水平的效应即。则。(3),又由最优方案的试验真值的置信区间为。则最优方案的试验真值的95%的置信区间估计为。\n第六章方差分析与试验设计68第七章相关与回归分析一、习题(一)判断题1、相关关系和函数关系都存在某些确定性的依存关系。()2、直线相关系数等于零,说明两变量之间毫无关系。()3、相关系数,用于反映两变量相关关系的密切程度和方向的统计指标。()4、假定变量A与B的相关系数是0.8,变量A与C的相关系数为-0.9,则A与B的相关性要大于A与C。()5、在统计中,不管是一元回归还是多元回归,甚至是曲线回归,估计待定参数的常用方法是最小二乘法的OLS。()6、在进行相关和回归分析时,必须以定性分析为前提,判定现象之间有无关系及其作用范围,然后才能进行定量分析,确定变量间关系的具体形式。()7、回归分析要确定哪个是自变量哪个是因变量,在这点上它与相关分析不同。()8、变量之间的正相关指的是两个变量之间的变动方向都是上升的。()9、回归系数的符号与相关系数的符号,可以相同也可以不相同。()10、进行相关与回归分析时,都必须对相关系数和回归系数进行显著性检验。()(二)单项选择题1、相关分析与回归分析,在是否需要确定自变量和因变量的问题上()。A、前者勿需确定,后者需要确定B、前者需要确定,后者勿需确定C、两者均需确定D、两者都勿需确定2、直线回归方程中,若回归系数为负,则()。A、表明现象正相关B、表明现象负相关C、表明相关程度很弱D、不能说明相关的方向和程度3、简单相关系数和可决系数的关系是()。A、二者的作用完全相同    B、二者数量上没有联系C、二者数量上有密切联系   D、二者的符号相同4、回归系数和相关系数的符号是一致的,其符号均可用来判断现象之间的关系是()。A、线性相关还是非线性相关B、正相关还是负相关C、完全相关还是不完全相关D、单相关还是复相关5、若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为()。A、不相关  B、负相关  C、正相关  D、复相关\n第六章方差分析与试验设计686、已知某工厂甲产品产量和生产成本有直接关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归直线方程是()。A、  B、C、  D、7、对直线趋势,若每增加一个单位,则平均增加()。A、100个单位B、9个单位C、109个单位D、91个单位8、当一个现象的数量由小变大,而另一个现象的数量相反地由大变小时,这种相关关系称为()。A、线性相关B、非线性相关C、正相关D、负相关9、相关系数r的取值范围是()A、-∞
查看更多

相关文章