《统计学教程》PPT课件

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

《统计学教程》PPT课件

数据分析(方法与案例)作者贾俊平统计学基础FundamentalStatistics2010年\n第1章统计和统计数据1.1统计及其应用领域1.2数据的类型1.3数据来源1.4统计中的几个基本概念2010年\n学习目标统计学的含义统计的应用领域统计数据的类型统计数据的来源统计中的几个基本概念2010年\n你相信这样的一些统计结论吗?吸烟对健康是有害的,吸香烟的男性减少寿命2250天不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天身体超重30%会使寿命减少1300天每天摄取500毫升维生素C,生命可延长6年身材高的父亲,其子女的身高也较高第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱乐磁带或其他曲目做得更好上课坐在前面的学生平均考试分数比坐在后面的学生高漂亮的女性有损男性的智力。男性在看到漂亮女性时智力会下降,这就是为什么大学里的女孩子比男孩子学习好的原因2010年\n1.1统计及其应用领域1.1.1什么是统计学1.1.2统计的应用领域第1章统计和统计数据2010年\n1.1.1什么是统计学1.1统计及其应用领域2010年\n什么是统计学?(statistics)1.收集数据:取得数据2.处理数据:图表展示分析数据:利用统计方法分析数据数据解释:结果的说明得到结论:从数据分析中得出客观结论收集、处理、分析、解释数据并从数据中得出结论的科学2010年\n统计方法统计方法描述统计推断统计参数估计假设检验2010年\n描述统计(descriptivestatistics)研究数据收集、整理和描述的统计学方法内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=1052010年\n推断统计(inferentialstatistics)研究如何利用样本数据来推断总体特征的统计学方法内容参数估计假设检验目的对总体特征作出推断样本总体2010年\n1.1.2统计的应用领域1.1统计及其应用领域2010年\n统计的应用领域企业发展战略产品质量管理市场研究财务分析经济预测人力资源管理2010年\n统计的误用与滥用大约在一个世纪以前,政治家BenjaminDisraeli曾有一个著名的论断:“有三类谎言:谎言、糟透的谎言和统计”。他还说:“图并没有说谎,是说谎者在画图”历史学家AndrewLang说,一些人使用统计“就像喝醉酒的人使用街灯柱—支撑的功能多于照明”统计滥用不好的样本过小的样本误导性图表局部描述故意曲解2010年\n1.2数据的类型1.2.1分类数据、顺序数据、数值型数据1.2.2观测的数据和实验数据1.2.3截面数据和时间序列数据第1章统计和统计数据2010年\n统计数据的分类统计数据的分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据试验的数据2010年\n统计数据的分类(按计量尺度分)分类数据(categoricaldata)只能归于某一类别的非数字型数据对事物进行分类的结果,数据表现为类别,用文字来表述例如,人口按性别分为男、女两类顺序数据(rankdata)只能归于某一有序类别的非数字型数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等数值型数据(metricdata)按数字尺度测量的观察值结果表现为具体的数值,对事物的精确测度例如:身高为175cm、168cm、183cm2010年\n统计数据的分类(按收集方法分)观测数据(observationaldata)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验数据(experimentaldata)在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据2010年\n统计数据的分类(按时间状况分)截面数据(cross-sectionaldata)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2005年我国各地区的国内生产总值数据时间序列数据(timeseriesdata)在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据2010年\n1.3数据来源1.3.1数据的间接来源1.3.2数据的直接来源1.3.3调查方案设计1.3.4设计质量第1章统计和统计数据2010年\n1.3.1数据的间接来源1.3数据来源2010年\n二手数据的来源Internethttp//WWW.中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料2010年\n二手数据的特点收集容易,采集成本低作用广泛分析所要研究的问题提供研究问题的背景帮助研究者更好地定义问题检验和回答某些疑问和假设寻找研究问题的思路和途径收集二手资料在研究中应优先考虑2010年\n二手数据的评估数据是谁收集的?可信度评估为什么目的而收集的?数据是怎样收集的?什么时候收集的?2010年\n1.3.2数据的直接来源1.3数据来源2010年\n数据的直接来源(原始数据)调查数据通过调查方法获得的数据通常是对社会现象而言通常取自有限总体实验数据通过实验方法得到的数据通常是对自然现象而言也被广泛运用到社会科学中如心理学、教育学、社会学、经济学、管理学等2010年\n统计调查方式2010年\n抽样调查(samplingsurvey)1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法总体随机样本2.具有经济性、时效性强、适应面广、准确性高等特点2010年\n普查(census)为特定目的专门组织的非经常性全面调查通常是周期性的我国进行的普查主要有人口普查,每10年进行一次,末尾数字为“0”的年份进行农业普查,每10年进行一次,每逢“6”的年份进行经济普查,每5年进行一次,每逢“3”和“8”的年份进行包括工业普查第三产业普查建筑业普查基本单位普查2010年\n统计报表(statisticalreportforms)1.统计调查方式之一2.过去曾经是我国主要的数据收集方式3.按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据4.有各种各样的类型2010年\n数据的收集方法2010年\n访问调查(personalinterview)1.调查者与被调查者通过面对面地交谈而获得资料2.有标准式访问和非标准式访问标准式访问通常按事先设计好的问卷进行非标准式访问事先一般不制作问卷2010年\n邮寄调查(mailsurvey)也称邮寄问卷调查是一种标准化调查调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指定收集点问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发三种2010年\n电话调查(telephonesurvey)调查者利用电话与被调查者进行语言交流以获得信息时效快、成本低问题的数量不宜过多您好!我是××调查公司的调查员…2010年\n电脑辅助调查(computer—assistedtelephoneinterviewing)又称电脑辅助电话调查电脑与电话相结合完成调查的全过程一般需借助专门的软件进行硬件设备要求较高问卷2010年\n座谈会(colloquia)1.也称集体访谈2.将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料3.参加座谈会的人数不宜过多,一般为6~10人4.侧重于定性研究2010年\n个别深度访问(personalInterviewing)一次只有一名受访者参加、针对特殊问题的调查适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,如政治方面的问题侧重于定性研究2010年\n观察法(observationalmethod)1.就调查对象的行动和意识,调查人员边观察边记录以收集所需信息2.调查人员不是强行介入3.能够在被调查者不察觉的情况下获得资料2010年\n实验法(experimentalmethod)1.在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料2.有室内实验法和市场实验法2010年\n数据来源与收集方法(小结)2010年\n1.3.3调查方案设计1.3数据来源2010年\n调查目的(objectiveofsurvey)1.调查要达到的具体目标回答“为什么调查?”调查之前必须明确2010年\n调查对象和调查单位(RespondentandSurveyunit)调查对象:调查研究的总体或调查范围调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)回答“向谁调查?”调查对象调查单位?2010年\n调查项目(Surveyitems)调查的具体内容通常表现为表格或问卷回答“调查什么?”Q1…………Q2…………Q3…………Q4…………2010年\n方案设计中的其他问题1.明确调查所采用的方法2.确定调查资料的所属时间和调查工作的期限3.调查的组织与实施细则2010年\n1.3.4数据质量1.3数据来源2010年\n统计数据的误差统计数据与客观现实之间的差距有登记性误差和代表性误差两类登记性误差:由于调查者或被调查者的人为因素所造成的误差。理论上讲可以消除代表性误差:用样本数据进行推断时所产生的误差。通常无法消除,但事先可以进行控制和计算2010年\n统计数据的质量要求1.精度:最低的抽样误差或随机误差2.准确性:最小的非抽样误差或偏差3.关联性:满足用户决策、管理和研究的需要4.及时性:在最短的时间里取得并公布数据5.一致性:保持时间序列的可比性6.最低成本:以最经济的方式取得数据2010年\n1.4统计中的几个基本概念1.4.1总体和样本1.4.2参数和统计量1.4.3变量第1章统计和统计数据2010年\n总体和样本总体(population)所研究的全部个体(数据)的集合,其中的每一个个体也称为元素分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的样本(sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量或样本量(samplesize)2010年\n参数和统计量参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示2010年\n统计中的几个基本概念平均数标准差比例参数统计量xsp总体样本2010年\n变量(variable)说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据变量可以分为分类变量(categoricalvariable):说明事物类别的名称顺序变量(rankvariable):说明事物有序类别的名称数值型变量(metricvariable):说明事物数字特征的名称离散变量:取有限个值连续变量:可以取无穷多个值2010年\n几种常用的统计软件(Software)典型的统计软件SASSPSSMINITABSTATISTICAExcelMINITABSTATISTICAExcelSASSPSS2010年\n本章小节统计学的含义统计的应用领域统计数据的类型统计数据的来源统计中的几个基本概念2010年\n结束THANKS2010年
查看更多

相关文章

您可能关注的文档