- 2022-08-13 发布 |
- 37.5 KB |
- 40页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学导论34257
课程意义统计学知识是交通调查的基础(速度、流量、公交、OD等等)统计已经融入到我的生活当中了(各种经济社会参数CPI、失业率;天气预测;比赛结果预测;彩票;帮助我们看透一些新闻报道和调查结果)\n无处不在的统计在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,《经济学》12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。1981年,首届国际《红楼梦》研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为《从词汇上的统计论〈红楼梦〉作者的问题》的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。\n美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的。”(转引自《马夸德特谈统计学家的重要作用》,《统计教育》1994年第3期)。美国总统布什的年薪已经达到40万美元,在各国元首中名列首位,但根据美国《工作等级年鉴》一书的排名,总统一职并未进入最好工作之列。根据该书的统计,在美国,工作环境最好的工作是:统计学家。(转引自2002年3月7日《扬子晚报》)\n统计数字大仲马的作品多曲折感人,而大仲马又多私生子,所以,取笑讥讽他的人,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准,果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说:“所有统计数字都是撒谎的,包括有关本人的数字在内。”听众哄堂大笑。\n圣元奶粉“性早熟”婴儿配方奶粉再一次让国人的神经绷紧。武汉三名消费者声称其宝宝吃了圣元奶粉后出现性早熟,经众多媒体热炒,终于惊动卫生部组织专家调查,公布检验结果称圣元奶粉中未检出外源性性激素,内源性雌激素则在正常范围,三名女婴属于临床常见的单纯性乳房早发育,与圣元奶粉无关。卫生部的权威并没能平息事态。网上的调查结果表明大部分网民都不接受卫生部的结论,认为调查组的专家被圣元公司公关。这些人缺乏统计概念。我们只需做一番简单的计算,就可以说明他们的信念是站不住脚的。武汉人口约900万,出生率约8‰,即每年大约有7万名新生儿诞生,其中一半是女婴。那么现在武汉0~2岁的女婴大约有7万人,其中大约有65%吃配方奶粉,圣元奶粉占的市场份额为10%,也就是说,武汉有大约4500名0~2岁女婴吃了圣元奶粉。单纯性乳房早发育的发病率是千分之二,武汉这些圣元女婴中会有9人碰巧出现单纯性乳房早发育,其中有3人被媒体“曝光”并不算多。反之,如果圣元奶粉的成分真的有问题,就不会只有这几个病例。吃其他品牌的奶粉的女婴当然也有性早熟的,只不过没有引起联想或关注而已。\n住在高压电线附近会导致儿童得白血病吗?美国国家癌症研究所(NationalCancerInstitute)花费5年的时间和500万美元为这个问题搜集资料。结论是:在白血病和暴露在膏药电线所产生的磁场之间,找不到相关关系。\n数据从何而来很重要专栏作家兰德丝问她的读者:如果重新来过的话是否仍要生孩子?而来信回答的人中有70%坚决说“不要”。《美国医学会期刊》曾登过一篇文章,通过对患者的观察,声称将冷却的液体经过管子打进胃里,可以缓解溃疡症状。后来有人起疑,做了适当的对照研究,有些病人接受这项治疗,有些接受安慰剂,结果使用安慰剂这组的“表现”要稍好些。\n小心潜在变量有报道说:设有赌场的县犯罪率较高在网上修课的学生,比在教室里修课的学生表现好受教育多的民众,比起受教育少的民众,赚钱要多得多\n第1章导论§1.1什么是统计学?§1.2统计数据的类型§1.3统计中的几个基本概念\n学习目标1.理解统计学的含义2.理解统计数据与统计学的关系3.了解统计学的应用领域4.了解数据的类型5.理解统计中的几个基本概念\n§1.1什么是统计学?统计学与统计规律统计的应用领域历史上著名的统计学家\n什么是统计学?1.数据搜集:取得数据2.数据分析:分析数据3.数据表述:图表展示数据数据解释:结果的说明收集、分析、表述和解释数据的科学\nstatistics的定义(不列颠百科全书)statistics:thescienceofcollecting,analyzing,presenting,andinterpretingdata.Copyright1994-2000EncyclopaediaBritannica,Inc.(不列颠百科全书)\n统计研究的过程收集数据(取得数据)整理数据(处理数据)解释数据(结果说明)分析数据(研究数据)实际问题\n统计规律(一些例子)正常条件下新生婴儿的性别比为107:100投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6农作物的产量与施肥量之间存在相关关系\n统计方法统计方法描述统计推断统计参数估计假设检验\n描述统计(descriptivestatistics)内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105\n推断统计(inferentialstatistics)内容参数估计假设检验目的对总体特征作出推断样本总体\n描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据\n统计的应用领域统计学经济学管理学医学工程学社会学…\n统计的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)\n统计的应用领域hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)\n历史上著名的统计学家JacobBernoulli(伯努利)(1654-1705)EdmondHalley(哈雷)(1656-1742)DeMoivre(棣美佛)(1667-1754)ThomasBayes(贝叶斯)(1702-1761)LeonhardEuler(欧拉)(1707-1783)PierreSimonLaplace(拉普拉斯)(1749-1827)AdrienMarieLegendre(勒让德)(1752-1833)ThomasRobertMalthus(马尔萨斯)(1766-1834)ThomasRobertMalthus(马尔萨斯)PierreSimonLaplace(拉普拉斯)LeonhardEuler(欧拉)\n历史上著名的统计学家FriedrichGauss(高斯)(1777-1855)JohannGregorMendel(孟德尔)(1822-1884)KarlPearson(皮尔森)(1857-1936)RonaldAylmerFisher(费歇)(1890-1962),JerzyNeyman(1894-1981)EgonSharpePearson(皮尔森)(1895-1980)WilliamFeller(费勒)(1906-1970).FriedrichGauss(高斯)JohannGregorMendel(孟德尔)\n分类数据、顺序数据、数值型数据观测数据和实验数据截面数据和时间序列数据§1.2统计数据的类型\n什么是统计数据?(data)对现象进行计量的结果不是指单个的数字,而是由多个数据构成的数据集不仅仅是指数字,它可以是数字的,也可以是文字的\n统计数据的分类统计数据的分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据试验的数据\n统计数据的分类(按计量尺度分)分类数据(categoricaldata)对事物进行分类的结果数据表现为类别,用文字来表述例如,人口按性别分为男、女两类顺序数据(rankdata)对事物类别顺序的测度数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等数值型数据(metricdata)对事物的精确测度结果表现为具体的数值例如:身高为175cm、168cm、183cm\n统计数据的分类(按收集方法分)观测的数据(observationaldata)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验的数据(experimentaldata)在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据\n帮助领福利金的母亲找工作大部分领福利金的成人,是有幼儿的母亲,对福利金妈妈做的观测研究显示大部分人有能力可以增加收入,脱离领福利金的行列,有些人会利用自愿参加的工作训练计划,来增进自己的工作技能。是不是应该要求所有体格健全的福利金妈妈,都参加工作训练和寻找工作的计划呢?在妈妈们开始申请福利金时,从当中选两组相似的人,要求其中一组参加工作训练,另外一组不参加,若干年后比较两组人的收入以及工作记录,就可以看出,参加工作计划是否有效?\n统计数据的分类(按时间状况分)截面数据(cross-sectionaldata)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2002年我国各地区的国内生产总值数据时间序列数据(timeseriesdata)在不同时间上收集到的数据描述现象随时间变化的情况比如,1996年至2002年国内生产总值数据\n§1.3统计中的几个基本概念总体和样本参数和统计量变量\n总体和样本总体(population)所研究的全部元素的集合,其中的每一个元素称为个体分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的样本(sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量\n参数和统计量参数(parameter)研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示统计量(statistic)根据样本数据计算出来的一个量所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示\n变量(Variable)说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据变量可以分为分类变量(categoricalvariable):说明事物类别的一个名称顺序变量(rankvariable):说明事物有序类别的一个名称数值型变量(metricvariable):说明事物数字特征的一个名称离散变量:取有限个值连续变量:可以取无穷多个值\n学生某门课成绩姓名主修分数等级张三大众传播90A李四历史80B王五文学70C陈六心理60D赵七心理50F\n统计中的几个基本概念平均数标准差比例参数统计量xsp总体样本\n几种常用的统计软件(Software)典型的统计软件SASSPSSMINITABSTATISTICAExcelMINITABSTATISTICAExcelSASSPSS\n本章小节1.统计学与统计规律统计的应用领域统计数据的类型统计中的几个基本概念\n结束查看更多