统计学统计学-典型案例-问题和思想

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

统计学统计学-典型案例-问题和思想

-_经济管理类“十二五”规划教材统计学-基于典型案例、问题和思想主讲林海明\n-_第一章 绪论【引言】我们从如下9个重要事例,说明统计学有什么用。事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军\n-_用钢板加固了这些危险区域,使英军取得了空战的胜利。事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。\n-_事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。这说明了统计学中调查的重要性。事例4:在居民收入贫富差距的测度\n-_方面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,\n-_日本因此成为当时的第二经济强国。该学科现已发展到了6σ质量管理原则。事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。事例7:在产品质量检验方面,英国\n-_统计学家戈赛特(1908)、波兰统计学家奈曼(1934)找到了统计学的t-检验方法,为企业、质量监督部门、消费者的产品质量检验,大大提高了工作效率,t-检验成为二十世纪质量改进的第一次大贡献。事例8:在身高方面,矮父亲儿子的身高有比父亲高的趋势吗?高父亲儿子的身高有比父亲矮的趋势吗?英国统计学家高尔顿(1886)\n-_用德国数学家高斯的最小二乘法(1801)找到了统计学的回归分析方法,解决了该问题。该方法推广应用到经济学中,获得了三届诺贝尔经济学奖。事例9:某些商品或大量商品价格的骤然上涨,会给老百姓的生活带来恐慌,会引起社会的普遍关注,如何及时反映市场商品价格的变化呢?德国经济学家帕歇(1874)找到了统计学的指数分析方法,为政府解决问题提供了政策依据。\n-_上述事例,我们看到了统计学在军事、政治、教育、社会、经济、质量管理、生物学领域的重要应用,看到了学者领袖瓦尔德、毛泽东、洛仑兹、基尼、田口玄一、费歇尔、戈赛特、高斯、高尔顿、帕歇的人文贡献和力量,看到了如下变量的数据:战机空战中的危险区域,革命的主力军和道路,大学的核心,居民收入,产品质量,坦克产量,身高,商品价格。这些事例\n-_的进一步描述是本书一些章节开头部分的典型案例,通过这些典型案例读者可以对统计学的作用有一个较深入的了解,由此衔接各章所要学习的内容。经济学家萨缪尔森认为:在许多与经济学有关的学科中,统计学特别重要。事实上,在诺贝尔经济学奖获奖者中,三分之二以上的成果与统计和定量分析有关。\n-_杜邦公司总经理理查德指出:现代公司在许多方面是根据统计来行事的。2001年,我国经济学家、教育学家顾海良认为,统计学是二十一世纪最有前途的一门学科。鉴于统计学为世界社会经济、科学技术的发展和进步作出了巨大贡献,2010年,第64届联合国大会第90次会议通过决议,每年10月20日为“世界统计日”。\n-_2011年,我国将统计学上升为一级学科。事实上,统计学和数据已渗透到社会生活、科学技术的方方面面。统计学如此重要,那么究竟什么是统计学?统计学是如何解决实际问题的?统计学与数学、经济学等实质性学科有何区别与联系?这些是本章第一节所要介绍的内容。第一节统计学的含义和作用\n-_一、什么是统计学?统计学发展至今已有300多年。历史上,英文中的统计statistics与“国家”同一词根,即自从有了国家,统治者就用统计来管理国家。1846年,比利时统计学家凯特勒在他的《概率论书简》《社会物理学》中\n-_认为:统计学是一门既研究社会现象又研究自然现象的方法论科学。我们将从如下案例来认识统计学的含义和作用:【典型案例1】瓦尔德帮助英军找到了英军战机空战中的危险区域二战时期,英国和德国在英吉利海峡上空的空战非常惨烈,正义与邪恶达到了你死我活的胶着状态,为了提高英国空军的战斗力,英国统计学家瓦尔德被英国空军司令咨询:\n-_飞机上什么区域应该加强钢板?英国统计学家瓦尔德经过他的探索和设计,他和助手拿了飞机模型到机场,查看从空战中返航的军机受敌军创伤的弹孔位置,\n-_在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,几天后,他的飞机模型上几乎布满了有弹孔的区域,因为没有弹孔区域被击中的飞机都没有返航,有弹孔区域被击中的飞机照样返航,故没有弹孔区域是军机的危险区域,于是他提议,把剩下少数几个没有弹孔的区域加强钢板(颠覆了事前哪里有弹孔,钢板就加强哪里的传统做法)\n-_。英国人按此加固了飞机,在最后一次空战后,英国空军司令说:如果德国再发动一次空战,我们就完了……但德国再也没有对英国发动一次空战了,英国胜利了!该案例是军事问题+统计学+智慧的成果,生动而充满人性的力量!瓦尔德因在统计决策领域的贡献而成为该领域的领袖。从典型案例1中分析和提炼有《大不列颠百科全书》中的定义:统计学是收集、处理、分析和解释数据,以便更好决策的一门方法论学科。\n-_数据是反映客观事物的特征及其表现,是统计学的研究对象。当其表现是非数值时,是定性数据,如飞机员的姓名、性别等;当其表现是数值时,是数量数据,如飞机的弹孔位置等;当其表现是图像时,是图像数据,如飞机模型上布满了弹孔的区域等;当其表现是声音时,是声音数据,如飞机的轰鸣声等。分析数据的方法有\n-_描述统计、推断统计。如典型案例1中,“瓦尔德在他的飞机模型上逐个不重不漏地标示从空战中返航军机受敌军创伤的弹孔位置,几天后,他的飞机模型上几乎布满了有弹孔的区域”是描述统计及其结果。描述统计是将所收集的数据处理后,用数值、表格或图形形式表现的有用信息。“\n-_他的飞机模型上没有弹孔区域是军机的危险区域”是推断统计及其结果。英军所有军机称为总体,总体的部分称为样本,推断统计就是根据样本数据特征去估计或检验总体的数据特征。典型案例1的调查有特殊性:所掌握的数据只有样本数据-从空战中返航军机受敌军创伤的弹孔位置,这里的调查是破坏性的,不可能对总体的所有个体都进行观察和实验取得结果,而我们所需要的是总体的数据特征-\n-_英军所有军机空战中的危险区域。这时必须用推断统计来解决问题,这是现代统计学的主要内容。从典型案例1中分析和归纳有统计学的作用:在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。\n-_当然,领袖是少数,执行者和参与者是多数,每个人都有自己的合理位置。面对事例3中美国培养各领域领袖和当今各学科领域尖端知识、技术的严峻挑战,中国各学科领域应努力践行“探索、调查、发现”,培养和拥有自己各领域的领袖,这些领袖能引领中国人在相应的领域获得应有的独立性、自主性、平等性和话语权。各学科领域培养和拥有自己的领袖应该是每个学科领域应有的使命和奋斗目标。\n-_要发现客观世界规律,对统计数据通常有要求:客观性、适用性、准确性和及时性。客观性是指能反映客观事实而不受任何偏见的影响或任何势力的干扰;适用性是指统计数据能适应解决问题的目的;准确性是指统计数据能够反映真实情况,不出现较大的误差;及时性是指统计数据应及时收集、整理、使用。\n-_二、统计学是如何解决实际问题的?古人云:与其给人一堆猎物,不如给人一杆猎枪。因此,统计学解决实际问题的思路(步骤)很重要。从典型案例1中分析和提炼有统计学解决实际问题的基本思路(步骤)是:①提出与统计有关的实际问题;②建立有效的指标体系;\n-_③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据推断给出更好决策的建议。不解决问题时,重复第②-⑥步。学习中,当我们识别了这六步,就有了一个结构较完整的知识理解。上述\n-_第一步尤其重要,数学家哈尔莫斯指出“问题是数学的心脏”,同样我们认为,问题是科学的心脏,因为有问题才知道目的,有问题才知道做什么,有问题才有进步、提高和希望。三、统计学的发展和应用领域上述引言的重要事例中,从统计学的\n-_深入发展看,产生了统计调查、统计分布、参数估计、假设检验、相关与回归分析、时间序列分析、多元统计分析等丰富的统计学理论。从统计学在各领域的应用上看,产生了应用统计学领域及其家族,见表1-1。事实上,只要有数据的地方,就会有统计学的应用,而各个领域都有数据,因此,统计学在各个领域都在发挥发现客观世界规律,更好决策的作用。\n-_表1-1应用统计学一览表军事学经济学政治学营销学金融学社会学教育学贸易学物理学生物学医学质量管理心理学化学军事统计经济统计政治统计营销统计金融统计社会统计教育统计贸易统计统计学物理统计生物统计医学统计质量管理统计心理统计化学统计\n-_统计学理论和应用统计学总是互相促进,共同提高的。统计理论的研究为应用统计提供方法论基础,应用统计学在对统计方法的实际应用中,常会对统计学理论提出新的问题,开拓统计学理论的研究领域。当然,统计学也可从自身不完善的理论中提出新问题。作为经济和管理类的学生,所要学习的统计学主要是社会经济统计学。其\n-_是一门以社会经济现象的数据为特定研究对象的应用统计学。由于社会经济现象所具有的复杂性和特殊性,社会经济统计学不仅要应用一般的统计方法,而且还需要研究自己独特的方法,如核算的方法、指数方法、综合评价方法等。\n-_通过社会经济统计,国家可以准确、及时、全面、系统地掌握国民经济和社会发展情况,对国民经济和社会运行监督和预警,为宏观调控和决策提供依据。企业可以及时了解商品市场和要素市场运行的状况和企业自身的经营动态,为企业营销决策、投资理财决策提供参考。四、统计学与数学、经济等实质性学科的联系与区别(一)统计学与数学\n-_在典型案例1中,数学只用到了空间解析几何的飞机模型。即在统计学解决实际问题的步骤中,在数据的特征描述环节中会用到数学的一些公式和结论,但用得不多,会用就行,基本上不需要数学推导和证明。数学中的概率论等,为统计学提供了数量分析的理论基础。统计学理论以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。\n-_统计学与数学的区别:从成果评价标准看,数学注重从假设到结论逻辑推导的正确性,而统计注重从客观世界发现规律及其更好决策。因此,会出现某些人数学学得差,但统计会学得好的情况。从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则是研究数据\n-_。从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的定量方法,而且还要结合某一专门领域的定性知识。(二)统计学与经济学在统计学解决实际问题的步骤中,在第①②⑤⑥步会与经济学的知识相结合。经济学涉及大量经济数据,因此,\n-_统计学是开展经济研究不可或缺的重要工具。通过统计的实证研究,可以帮助人们认识有关的数据规律,同时检验经济学理论的真实性和完善程度。经济学等实质性学科对经济统计学起着重要的指导作用。不仅统计指标体系的设定离不开经济学科的问题,而且应用统计方法也在很大的程度上受所研究对象性质的影响。它们的区别可从定义、特点中比较。\n-_(三)统计学与相关实质性学科在统计学解决实际问题的步骤中,在第①②⑤⑥步会与相关实质性学科的知识相结合。同样,统计学是开展实质性学科定量研究不可或缺的重要工具,通过统计的实证研究,可以帮助人们认识相关实质性学科\n-_的数据规律,同时检验相关实质性学科理论的真实性和完善程度。相关实质性学科对统计学应用起着重要的指导作用。不仅统计指标体系的设定离不开实质性学科的问题,而且应用统计方法也在很大的程度上受所研究对象性质的影响。它们的区别可从定义、特点中比较。统计学解决实际问题中,都会涉及到上述数据、变量、总体、样本等基本概念,这些是本章第二节介绍的内容。第二节统计学的基本概念\n-_一、总体及其单位统计学解决任何一个问题,都有待认识的客观事物的全体,如典型案例1中英军的所有战机;事例4中的所有居民。统计学将待认识的客观事物的全体称为总体,即统计总体是根据一定目的确定的,由客观存在的、具有某种同质\n-_性的许多个别事物构成的整体。同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。例如,研究某地区居民贫困户的生活状况,那么,该地区贫困线下的居民户则构成了统计总体,贫困线下的居民户是同质的,而贫困线上的居民户是非同质的。\n-_统计总体还应具备大量性,即统计总体应该由足够数量的同质性单位构成。总体单位(简称单位)是组成总体的各个个体。如典型案例1中英军的每架战机;事例4中的每个居民。二、样本统计学解决问题的目的是认识\n-_总体的数据特征。但是,当调查是破坏性的,或者出于成本、时间等因素时,不必要或不可能对构成总体的所有单位都进行调查。如:典型案例1中的所有军机;某企业的轿车产品。这时,需要采用一定的方式,从总体(又称母体)中抽取一部分单位,作为总体的代表加以研究。如:典型案例1中是查看从空战中返航的军机;从某企业制造的轿车中抽取16辆进行调查。这种由\n-_总体的部分单位组成的集合称为样本(又称子样)。构成样本的单位称为样品,样本中样品的数目称为样本容量。三、标志、指标(参数)和统计量统计调查中,都是从总体单位的特征及其表现认识开始的,如:典型案例1中每架英军战机的类型;事例4中每个\n-_居民的收入。我们将这些总体单位普遍具有的属性或特征称为标志。标志按其表现分为品质标志和数量标志两种。品质标志表明单位属性方面的特征,品质标志的表现只能用非数值来描述。如:典型案例1中英军战机的类型,事例4中每个居民的性别。数量标志表明单位数量方面的特征,表现用数值来描述,如:典型案例1中英军战机的弹孔位置,事例\n-_4中每个居民的收入。统计总体具有的数量特征的概念和数值称为统计指标,也称为参数。例如事例4中居民人口数100万人,总收入31.4亿元。统计指标由两项基本要素构成,即指标的概念和指标的取值。指标的概念是对所研究现象本质的抽象概括,也是对总体\n-_数量特征的质的规定性。确定统计指标必须有一定的理论依据,使之与社会经济或科学技术的范畴相吻合。统计指标按表示形式可以分为数量指标和质量指标。凡是反映现象总规模、总水平的统计指标称为数量指标。例如事例4中居民总数100万人、总收入31.4亿元等,这些指标反映现象或过程的总规模和水平,所以也称为总量指标,用绝对数来表示。凡是反映现象相对水平和工作质量的统计指标称为质量指标,例如事例5中企业\n-_职工平均工资5000元、工人出勤率93%等。质量指标是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系和对比关系。单个指标不能反映总体的全貌,这便需要设立指标体系。统计指标体系是由一系列相互联系的统计指标组成的有机整体,用以反映所研究现象各方面相互依存相互制约的关系。例如,企业竞争力指标体系\n-_,居民生活质量指标体系等。样本具有的数量特征的概念和数值称为统计量。如:某汽车制造企业抽取16辆轿车的平均行驶里程50万公里,合格率94%等。人们通常用统计量估计相应的参数。四、数据(一)变量与变量值\n-_将上述标志、指标和统计量的名称进行归纳就是变量。即说明现象的某一事实或数量的特征称为变量,变量的具体表现是变量值,数据就是变量及其表现,也可称为反映客观事物的事实或数量依据。如:收入是一个变量,收入的表现是变量值。将在特定研究过程中收集的所有数据集合在一起,称为数据集。(二)数据的计量尺度\n-_品质标志的居民性别用无序的文字男、女计量,居民的满意度用有顺序的非数值计量,数量指标用绝对数来表示,质量指标用对比的数来表示,因此,收集数据时需要用到以下四种由低到高的尺度:定类尺度、定序尺度、定距尺度和定比尺度,计量尺度的不同决定了不同的数据分析与处理方法。1.定类尺度是说明客观现象\n-_无序类别的计量。定类尺度的主要数学特征是“=”或“≠”。如居民的性别是男、女计量,战机的类型是战斗机、轰炸机、侦察机等计量,这一场合的所使用的数值只作为无序分类的代码。如居民性别用“1”表示男性,用“0”表示女性。在统计处理中,对于不同的类别,可以计算单位数。2.定序尺度是说明客观现象有序类别的非数值计量。\n-_定序尺度的主要数学特征是“<”或“>”。例如,对居民的满意度计量可以分为非常满意、满意、一般、不满意、非常不满意五类,在这里,定序尺度能确切地表明满意高于一般,一般高于不满意……。这一场合的所使用的数值只作为有序分类的代码。3.定距尺度是说明客观现象数值间距有意义的计量。其用确切的数值反映现象之间在量方面的差异,\n-_使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”“–”“×”。如总量指标是定距尺度计量的。4.定比尺度是说明客观现象两个数值比是有意义的计量。定比尺度的主要数学特征是“÷”。如质量指标中的相对数、平均数是定比尺度计量的。定类尺度、定序尺度的数据统称为定性数据,定距尺度、定比尺度的数据统\n-_称为定量数据。定性变量是指带有定性数据的变量,定量变量是指带有定量数据的变量。根据定量变量值连续出现与否,定量变量分为连续性变量与离散型变量。连续型变量是指变量在某一区域内的取值是连续不断的,无法一一列举。如:军机的弹孔位置,产品的寿命\n-_等。离散型变量是指变量的取值是间断的,可以一一列举。例如,产品数,职工人数等。\n-_根据变量值确定与否,变量分为确定性变量与随机变量。确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。如参数。随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量,是变量值不确定、事前不知道、测了才知道的变量。如员工的起床时间,统计量等。社会经济现象既有确定性变量也有随机变量。统计学所认识的对象中主要是随机变量。(三)数据的类型根据对客观现象观察的角度不同,统计数据可分为:横截面数据、时间序列数据和面板数据。例如,2014年全国各省、市、自治区的居民收入总值就属于横截面数据。横截面数据又称为静态数据,它是指在同一时间对同一总体\n-_内不同单位进行观察而获得的数据。例如,“十二五”期间我国按年份顺序的居民收入总值就属于时间序列数据。时间序列数据又称为动态数据,它是指在某一段时期内按时间顺序对同一总体进行观察而获得的数据。面板数据则是同时在时间和截面空间上取得的二维数据。例如2005-2014年30个企业的总产值数据。从某一年份看,它是由30个企业总产值数值组成的截面数据;从某一\n-_企业看,它是由10年企业总产值数据组成的一个时间序列数据。面板数据则由30个企业10年的数据组成,共有300个观测值。
查看更多

相关文章

您可能关注的文档