简明应用统计学统计学绪论ppt课件

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

简明应用统计学统计学绪论ppt课件

简明应用统计学(第2版)1\n第1章统计学绪论1.1引言1.2什么是统计学1.3为什么要学习统计学1.4统计学的类型1.5变量的类型1.6测量的水平1.7数据的收集1.8统计软件2\n学习目标1.理解我们为什么要学习统计学。2.什么是描述统计学和推断统计学。3.区别定性变量和定量变量,区别离散变量和连续变量。4.区别变量的定类、定序、定距和定比测度水平。5.知道数据的四种收集方式。6.知道常用的统计软件。3\n根据最新的研究结果,消费者的行为对自然资源到底有怎样的影响呢?你应该买使用柴油发动机的汽车,还是购买电动车,或者干脆骑自行车呢?报纸、杂志或网络中的统计结果对于你的决定非常关键,这些结果建议你该有怎样的消费观。1.1引言4\n在金融危机发生后,各国政府对于国家经济的现状和对未来经济走势的预测十分关注,每个月都要编制CPI等各类指数以评价通货膨胀情况。有关商品销售额、新开工的住宅、货币流通以及工业生产的信息仅仅是构成预测基础的成百上千类信息的一小部分。我们该如何解读这些数据呢?知道一些统计知识有助于我们知道这些数据是如何与我们的生活息息相关的。假设你是市场部的新任经理,一次广告活动的统计结果摆到了你面前,声称某个结果是“统计显著”的。你如何解释这份报告而又不暴露你对该术语的无知呢?赶快学点统计,这对你和你的事业都非常有用。1.1引言5\n1.2什么是统计学?(statistics)统计学是收集、分析、表述和解释数据的科学(不列颠百科全书)统计是一门收集、分析、解释和提供数据的科学(韦伯斯特国际辞典第3版)统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论(MarioF.Triola,《初级统计学》)统计学是数据的科学和艺术6\n1.2什么是统计学?(statistics)1.收集数据:取得数据2.处理数据:整理与图表展示分析数据:利用统计方法分析数据数据解释:结果的说明得到结论:从数据分析中得出客观结论收集、处理、分析、解释数据并从数据中得出结论的科学7\n1.3为什么要学习统计学2009年8月6日《纽约时报》发表大幅文章《当今大学毕业生的唯一关键词是:统计学》(ForToday‘sGraduate,JustOneWord:Statistics).文章举例说明统计对各行各业的重要性。2009年8月25日华尔街杂志刊登《有利于找工作的5个专业》文章,认为在美国“工程、生命科学、统计学、环境研究和金融”是就业市场最受欢迎的专业。2010年6月3日第64届联合国大会第90次会议通过决议,每年10月20日被联合国确定为“世界统计日”。体现出全世界对统计数据和统计空前的关注和重视。2011年2月美国《科学》杂志以数据为主题出版专刊,学术界对数据和数据分析高度关注。8\n1.3为什么要学习统计学统计在许多学科中得到广泛的应用。比如说,学术研究杂志就依赖于统计结果。在许多学科中,一篇文章是否能够发表在主要杂志上,在很大程度上取决于该文章是否能正确地使用统计方法。除了学术领域,统计在其他领域也被人们广泛使用。统计在工业中得到大量使用,尤其用于研究新产品、质量控制和市场开发中;市场调查也需要统计。9\n统计的应用领域经济学管理学医学工程学社会学…统计学10\n统计的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)11\n统计的应用领域hydrology(水文学)industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)12\n1.3为什么要学习统计学(1)数据无处不在。(2)统计学技术对于我们做出影响日常生活的许多决策都十分有用。(3)无论你以后从事什么工作,你都会面临与数据打交道做出决策的问题。对统计学方法的了解将有助于你更加有效的做出决策。13\n数据收集过程:抽样(sampling)。比如,为了估计某一家超市所有顾客平均年龄,你只需要收集部分顾客的年龄信息,得到平均年龄的估计以后,你就可以针对这个年龄层的顾客,制定相应广告信息。统计涉及两个不同阶段:(1)描述数据集和(2)根据样本信息得出结论(估计、预测等)。统计的应用可以被分为两个部分:描述统计学和推断统计学。1.4统计学的类型\n1.4统计学的类型统计方法描述统计推断统计参数估计假设检验15\n描述统计(descriptivestatistics)研究数据收集、处理、汇总、图表描述、概括与分析等统计方法内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105\n推断统计(inferentialstatistics)研究如何利用样本数据来推断总体特征的统计方法内容参数估计假设检验目的对总体特征作出推断样本总体\n1.5变量(variable)变量是说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等18\n变量(variable)变量的具体表现称为变量值,即数据变量的值(value)通常是对某一特定个体的度量,特定个体可能是指一个人,一个家庭,一个地区,或一个国家。从表中可知,性别变量是以人为个体的观测,孩子的数目是以家庭为个体的观测。变量变量的值个体性别男,女人学历小学,中学,本科,硕士,博士人失业有工作,无工作人孩子数0,1,2,3,…家庭贫困程度严重,一般,边缘,没有地区19\n变量的类型(variable)定性变量(qualitativevariable)或属性变量(attributevariable)定性变量取的值称为水平(level)或者类(class)。比如,姓名、性别、行业、出生地、国籍/地区以及汽车类型都是定性变量。定性数据通常以饼图或者条形图(详见第2章)的形式表示。定量变量(quantitativevariable)定量变量例子比较多,比如年龄、寿命、公司的员工人数、薪水金额等等。定量变量又可以分为连续的和离散的。离散变量(discretevariable)只能取某些特定的值,并且不同取值之间通常都存在着间距。比如具有某种特征的人口(取正整数值)、某种事故发生的次数(非负整数)、足球射门次数等等。连续变量(continuousvariable)的观测值可以遍取某一区间中的任何值。身高、体重、长度等等都是连续变量的例子。20\n【例1.1】下面是关于是否喜欢锻炼的部分调查数据。性别锻炼的态度出生日期身高体重男非常喜欢17065女喜欢17560女一般16561男不太喜欢17970男很讨厌15345男喜欢18065女一般17255女非常喜欢16752表1.1是否喜欢锻炼的部分调查数据表1.1中的姓名、是否锻炼为定性变量。出生日期、身高和体重为定量变量,出生日期是离散变量,而身高和体重为连续变量。变量(例题分析)\n变量(其他分类)随机变量和非随机变量经验变量(empiricalvariables)和理论变量(theoreticalvariables)经验变量所描述的是我们周围可以观察到的事物理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,z统计量、t统计量、2统计量、F统计量等22\n变量及其类型23\n1.6测量的水平数据还可以按照测量水平进行分类。数据的测量水平通常制约着在数据概括和显示时可以选用的计算方法,它还决定着应该使用何种统计检验方法。24\n1.7数据收集通常,可以从下面几个方面获得数据:来自于公开发表资料中的数据统计年鉴有关期刊有关网站实验设计数据调查数据观察数据25\n统计数据的分类统计数据的分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据实验的数据26\n统计数据的分类(按计量尺度分)分类数据(categoricaldata)只能归于某一类别的非数字型数据对事物进行分类的结果,数据表现为类别,用文字来表述例如,人口按性别分为男、女两类顺序数据(rankdata)只能归于某一有序类别的非数字型数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等数值型数据(metricdata)按数字尺度测量的观察值结果表现为具体的数值,对事物的精确测度例如:身高为175cm、168cm、183cm27\n统计数据的分类(按收集方法分)观测的数据(observationaldata)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据实验的数据(experimentaldata)在实验中控制实验对象而收集到的数据比如,对一种新药疗效的实验,对一种新的农作物品种的实验等自然科学领域的数据大多数都为实验数据28\n统计数据的分类(按时间状况分)截面数据(cross-sectionaldata)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2005年我国各地区的国内生产总值数据时间序列数据(timeseriesdata)在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据29\n1.7数据收集:定义变量数据收集的第一个准则是要清楚测量的是什么。换句话说,变量必须有一个明确的适合研究目的的定义。这有时是说起来容易做起来难。如果我们对问题考虑得不全面,那么就没理由指望回答问题的人(一般称为响应者)能按照我们期望的回答问题。在我们做研究之前,对变量必须要有一个清晰、详尽的定义。30\n1.7数据收集:定义变量假定我们在一次食品企业的市场调查中包含了这样的问题"在您的家庭中有多少个孩子?"我们也许认为自己知道想要了解的是什么,但是,没有理由期待响应者和我们有同样的想法。我们也许不加考虑地认为,"孩子"应定义为一个不满18岁并和他(她)的亲生父母一起生活的人。但如果一个家庭中包含大于18岁的亲生子女、前妻或前夫的孩子、养子或养女、过继子女或者其他年轻的亲戚,那该怎么办呢?对于不和亲生父母生活在一起的孩子怎么算呢?对于父母离了婚而共同抚养的孩子怎么算呢?这有很多种发生混淆的可能。因此,我们在调查之前首先需要明确"孩子"的定义。31\n1.7数据收集:数据表数据表通常叫做数据阵或数据文件。下表是一个根据抽样调查得来的数据生成的小数据阵的例子。序号年龄性别态度120男反对223男赞成317女反对438女中立525女赞成643男赞成738男中立851女赞成935男赞成1039女反对32\n1.7数据收集:数据表在计算机分析数据时,需要把数据文件中的描述性文字转化成数字。每一个人都被分配一个身份号码作为名字。年龄变量本来就是用数字测量的,因此不需要任何转化。性别变量的两个取值是“女”或“男”,因此,“女”用数字0代替,“男”用数字1代替。当然还可以使用任何两个别的数字,比如用17代替“女”,用23代替“男”。“态度”这个值可以用三个等级数1、2和3表示反对、中立和赞成。序号年龄性别态度12011223133170143802525036431373812851039351310390133\n1.8统计软件统计软件的发展,使得只要输入你的数据,选一些选项,马上就得到令人惊叹的漂亮结果了。那么,傻瓜式统计软件的使用可以代替统计课程了?当然不是。数据的整理和识别,方法的选用,计算机输出结果的理解都不像使用傻瓜相机那样简单可靠。而且,只要数据格式无误、选项不矛盾而且不用零作为除数,统计软件就一定给你结果,而且几乎没有任何警告。另外,统计软件输出的结果太多。即使是同样的方法,不同软件输出的内容还不一样,甚至有时同样的内容名称也不一样。因此,应该特别留神,明白自己是在干什么,不要在得到一堆毫无意义的垃圾之后还沾沾自喜。34\n1.8统计软件(1)SPSS:这是一个很受欢迎的统计软件,它容易操作,输出漂亮,功能齐全,价格合理。它也有自己的程序语言,但基本上已经“傻瓜化”。它对于非专业统计工作者是很好的选择。2009年4月,SPSS公司被IBM收购后将其重新命名为PASW(PredictiveAnalyticsSoftware,预测分析软件),不过本书仍然使用SPSS名称。(2)Excel:严格说来并不是统计软件,但作为数据表格软件有一定统计计算功能。而且凡是装有MicrosoftOffice的计算机,基本上都有Excel。但要注意,有时在安装Office时没有安装数据分析的功能,则必须安装该功能后才能进行数据分析。当然,画图功能是默认具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用宏命令来编程,这时就没有相应的简单选项了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。(3)R软件:这是一个免费的,由志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,使用很方便。还有不少统计学家和爱好者不断在R网站提供他们编写的各种最新方法的统计软件包和程序。它的所有计算过程和代码都是公开的,不像多数“傻瓜”软件“黑盒子”式的模块。它的函数还可以被用户按需要改写,容易举一反三。对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。35\n统计中的几个基本概念平均数标准差比例参数统计量xsp总体样本36\n本章小节1.统计及其应用领域统计数据的类型统计中的几个基本概念37\n此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!
查看更多

相关文章

您可能关注的文档