《数据与统计学》PPT课件

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

《数据与统计学》PPT课件

商务与经济统计主讲 李海东\n统计的普遍存在STAT一、政府部门(政策及规划制定、大众服务、信息传播等)[例]人口数具有大学毕业文凭的财经人员数前苏联2.6亿人60万人(1978)中国9.6亿人0.6万人(1978)[例]在美国-西班牙战争期间(1898年),美国海军的征兵广告为:据统计,战争中美国海军的死亡率是9‰,而同期纽约市居民的死亡率为16‰,因此,参加海军是安全的。二、法律诉讼(定刑量罪、产权鉴定、腐败测评等)[例]中世纪的英国法律规定:凡偷窃满12英镑的罪犯将被处以极刑。然而若干年后,当一个小偷恰好偷了12英镑之后,却未招致没顶之灾,原因何在?若干年后的极刑标准:12×130%=15.6(英镑)\n统计的普遍存在STAT三、医疗保健(诊断、血缘关系鉴定、药物疗效检验等)[例]广告:专家研究表明,经过“抗组织胺药物”治疗之后,相当大比例的感冒能够治愈。亨利·G·菲尔森指出:服用此药的确能在一周内治愈感冒,但即使不服用,一般而言,感冒也能在七天之内痊愈。[例]《美国医学期刊》曾刊文声称让病人吞下一个连接着管子且放了气的气球,然后将一种冷冻溶液注入之,可显著减轻胃溃疡病人的痛苦。据调查82位病人中有34%的病情改善(实验组)。对照组:78位病人中,同样的过程但不冷冻→38%的病人改善。四、住户个人(终身决策、明智投资、日常生活和民主选举)[例]中国冰箱生产的发展过程:(1)大冷藏小冷冻;(2)小冷藏大冷冻;(3)大冷藏小冷冻。据统计:人们平均每天开关冷藏室30多次,而冷冻室仅5次。\n统计的普遍存在STAT[例]某研究所致力于家庭和睦与幸福方面的研究。该研究所随机抽取了一个1000对夫妇的样本,尔后分别测度每个家庭的“结婚年数”和“争吵次数”,结果如下:\n统计的普遍存在STAT五、研究领域(科学技术、文学艺术、考古、历史)[例1]《骆驼祥子》。总共107360字,由2413个不同汉字组合,其出现频率(写作风格)为:“的”→4.12%;“他”→2.40%;“祥”→778次,“虎”→220次,“妞”→174次。[例2]《红楼梦》聚类分析(复旦大学李贤平教授,1985)。六、军事领域(战略制定、后勤供应等)[例]朝鲜战争中美军总司令李奇微的“磁性战略”。战役进攻持续天数战役进攻持续天数第一次战役12第三次战役9第二次战役11第四次战役7第二次战役宋时轮第九兵团伤亡情况:兵员15万人,战斗减员19202人,冻饿减员28954人,减员总数48156人。\n统计的普遍存在STAT《商务与经济统计》学习要求通过学习,要求1、能看懂统计资料;[例1]某地2003年比2002年凶杀案件上升了50%;[例2]很久以前,当约翰·霍普金斯大学开始招收女生时,一个不赞成异性同校的人有一个惊人的报道:约翰·霍普金斯大学三分之一的女学生嫁给了本校老师。[例3]某种刹车装置的故障率仅为万分之一。分析:该地人口数为10万人,2003年凶杀案件为3件,2002年为2件(3/2)1=50%;总共只录取了3名女学生,其中1人嫁给了老师。据统计,出租汽车司机平均每天刹车次数为100~120次。\n统计的普遍存在STAT2、掌握基本理论、方法和技能——会调查、整理和分析;3、准备一台函数电子计算器;4、独立完成作业BB网络教学平台。卜算子·叹统计无名难难难,数学统计真难算。叹叹叹,乱发渐欲迷人眼。微分线概挂两篇,如今尚未过关,还需奋战!时间蹉跎入大三,前途渺茫望不见。今朝统计又来羞人脸,叹叹叹,思绪乱乱乱。时值公元2006年元月12日,望老师同情同情,给个及格则万分感谢!资料来源:2006年元月12日《统计学》考试某同学试卷。\n第一章数据与统计学STAT本章重点1、统计的产生与发展;2、统计调查方法体系;3、统计整理。本章难点1、统计学基本概念、调查方案和统计分组。参考书目1、李心愉:《应用经济统计学》,北京大学出版社;2、[美]DavidS.Moore:《统计学的世界》,中信出版社;3、[美]MarioF.Triola:《初级统计学》,清华大学出版社;4、[美]戴维R.安德森等:《商务与经济统计》,机工出版社;5、网站:UNSD、OECD、IMF、NBER、中国国家统计局。\n第一章数据与统计学STAT第一节“统计”的三种不同涵义[例]军马贝吉的墓志铭:在服役的10年期间,共踢了1位上将、2位中将、7位少将、25位上校、38位中校、51位少校、72位上尉、85位中尉、101位少尉、175位军士、346位士兵和1颗炸弹。一、统计资料(statisticaldata,统计数据、统计信息)。二、统计工作(statisticalwork):设计调查整理分析。[例]请统计中国的国土面积与人口数资料。三、统计学(statistics)。\n第一章数据与统计学STAT第二节三对基本概念(P5)※一、总体与个体(一)(统计)总体(population):客观存在的①,在同一性质基础②上结合起来的许多个别事物③的整体④。特征(1)同质性;(2)大量性;(3)差异性统计的前提。(二)个体(element,总体单位):构成总体的个别事物。[例]统计研究目的:江西财经大学学生(谁→“总体”)的学习情况(什么→“特征”);中国常住居民的可支配收入与消费支出的关系。\n第一章数据与统计学STAT二、标志与指标(一)标志(mark):反映个体特征的名称。(A)性别民族身高年龄(B厂)产值职工人数男汉1.75211000万元50人1、标志表现:标志在各个个体的具体表现(数据)。2、种类(1)品质标志:反映属性特征→“定性数据”;(2)数量标志:反映数量特征→“标志值”或“定量数据”。(二)指标(indicator):反映总体数量特征的名称。[例]2004年①A地区②所属500家工业企业年产值③为100亿④元⑤,职工人数为56万人。1、构成:(1)时间限制,(2)空间限制,(3)指标名称,(4)指标数值,(5)计量单位,(6)计算方法。\n第一章数据与统计学STAT2、指标的分类(1)数量指标总体总规模、总水平[例]2004年A地区所属500家工业企业年产值为100亿元,职工人数为56万人。表现形式:绝对数、有名数。(2)质量指标现象间数量联系表现形式:相对数或平均数;无名数或复名数。总量指标(绝对数指标)、相对指标、平均指标。\n第一章数据与统计学STAT三、变异与变量(一)变异(variance):个体不断转换自身状态的现象。(二)变量(variable):可变的数量标志与指标。[例]2000年A地区25个县的GDP为120亿元,人口数为800万人。1、离散变量:取值是间断的。2、连续变量:取值是连续的。\n第一章数据与统计学STAT三者之间的关系(统计学的框架)统计学:以现象的数量特征为研究对象,利用自身特有的方法,发现现象应有规律的一门方法论科学(P1)\n第一章数据与统计学STAT[附1]统计数据的类型(Scalesofmeasurement,P7)(一)定名数据(Nominalscale,定名测度)1、数据是“类型名称(文字)”。2、无特定顺序→统计处理:分类、计数(频数)和众数。(二)定序数据(Ordinalscale、定序测度)1、数据是有序的“类型名称”→统计处理:中位数。\n第一章数据与统计学STAT(三)定距数据(Intervalscale、定距测度)1、数据是有计量单位的数值。2、“0”≠“没有”,乘除无意义→统计处理:均值、方差等。(四)定比数据(Ratioscale、定比测度)1、“0”代表“没有”的定距尺度→统计处理:乘除。\n第一章数据与统计学STAT[附2]统计学的基本研究方法(P8)一、大量观察法\n第一章数据与统计学STAT二、综合分析法:分析分组;综合汇总\n第一章数据与统计学STAT三、归纳推断法1、演绎推断:一般(总体)个别(个体)。[例]甲班同学的身高<1.85米,A是甲班的A的身高<1.85米。(1)前提正确结论正确;(2)前提范围>结论范围。2、归纳推断:个别(个体)一般(总体)。[例]甲班的A同学身高<1.85米,B同学身高<1.85米甲班同学的身高均低于1.85米。(1)前提正确结论未必正确;(2)前提范围<结论范围。3、预测与推断:参数估计、假设检验、相关与回归等。4、推断与臆测的区别:误差程度的控制、概率保证的推算。\n第一章数据与统计学STAT第三节统计调查方法体系一、概念(P11)1、定义:搜集统计资料(数据)的工作过程。[例]统计目的:欲获得A班50名同学的平均年龄。(1)向班主任(学工处)查寻获得平均年龄为18.2岁/人。(2)自己动手获得平均年龄=总年龄/总人数2、资料的类型(1)原始资料:未经加工整理的资料“个体”。(2)次级资料:已经加工整理的资料“总体”。[例]1990年济南市人口出生数:“四普”→87891人;公安部门→76680人;计生部门→66179人。\n第一章数据与统计学STAT二、统计调查的种类(一)按调查对象所包括的范围分类1、全面调查普查、全面统计报表。2、非全面调查重点调查、抽样调查和典型调查。(二)按调查登记工作是否连续进行分类1、经常性调查:间隔<1年2、一次性调查:间隔≥1年[例]年产值=12个月产值=365天产值;(三)按调查的组织形式分类1、统计报表制度:“自上而下”→“自下而上”。布置:国家省、市、自治区地区县乡;上报:国家省、市、自治区地区县乡。2、专门调查:普查、重点调查、抽样调查和典型调查。普查:专门组织的一次性的全面调查。\n第一章数据与统计学STAT三、统计调查方案(P15)※(一)明确调查目的(Why)[例]人口普查:准确查清人口的数量、地区分布、构成和素质状况及其变化情况。(二)确定调查对象与调查单位(Who)1、调查对象:调查研究的总体。[例]人口普查:具有中国国籍并在中国境内常住的自然人;农村生育率调查:农村15~49岁的女性人口。\n第一章数据与统计学STAT2、调查单位:调查研究的个体(总体单位)。[例]A企业职工住房面积调查;B企业设备完好状况调查。(三)确定调查项目和调查表(What)1、调查项目:调查内容。2、调查表单一表:一个单位用一张表;一览表:多个单位共一张表。制作:上下粗线、中间细线、两边开口\n第一章数据与统计学STAT全国城市老年人口基本情况调查表\n第一章数据与统计学STAT(四)确定调查时间(When)1、调查时间:资料(数据)所属时间。[例]欲派员调查某局所属100家企业2005年的产值及年末职工人数情况,要求资料在2006年1月底之前上报。调查时间:2005年、2005年年末。2、调查期限:调查工作的起止时间。调查期限:2006年1月。(五)组织实施计划(How)具体包括:调查人员的选择、组织与培训;调查文件、表格、调查员手册的印刷,调查宣传工作,必要调查工具的准备;调查经费的来源和开支预算等。归纳:Why、Who、What、When、How“4W1H”。\n第一章数据与统计学STAT四、专门调查(P14)(一)普查1、定义:专门组织的一次性的全面调查。[中国]逢“0”人口普查,逢“3”第三产业普查,逢“5”工业普查,逢“7”农业普查1次/10年。2、注意的问题(1)标准时点(间):普查登记时所依据的统一时点。[例]我国第四次人口普查的标准时间为1990年7月1日零时,第五次人口普查为2000年11月1日零时。[例]工业企业设备普查,假定南昌的普查时间为4月29日,上海为5月10日。若一台设备5月1日从南昌运出,5月5日运抵上海,则该设备必被()登记;若一台设备5月8日从上海运出,5月12日运至南昌,则该设备必被()登记。\n第一章数据与统计学STAT[例]第五次人口普查中,2000年10月31日23时出生,11月1日凌晨2时死亡的婴儿;10月31日23:55逝世的人,均应记入人口数。[附]标准时间的确定原则:人口流量小、气候较适宜的时刻,避开寒冬和炎夏,避开节假日和旅游季节。[例]印度为3月1日日升时,美国为4月1日,日本为10月1日,芬兰、比利时和西班牙为12月31日零时。(2)同时进行,尽快完成。“爱晖—腾冲”线(胡焕庸线):线东国土面积占36%,人口数占94%;线西国土面积占64%,人口数占6%。(3)普查项目一经确定,不得任意改变或增减。1953年人口普查:5项;1964年人口普查:9项;1982年人口普查:19项;1990年人口普查:21项;2000年人口普查:59项(草案)\n第一章数据与统计学STAT[附]五普(草案)部分项目设置:上班使用的交通工具、上班途中平均所需时间、住宅内有无厕所、住宅内有无洗澡设施、炊事燃料种类、本户生活垃圾处理方式等。(二)重点调查1、定义:对重点单位进行的调查。2、重点单位:总体中一小部分单位的数量特征占总体该方面数量特征的比重足够大。3、注意的问题:客观性;非推断性。[例]经研究决定,对A班同学身高做一重点调查。\n第一章数据与统计学STAT3、方法(1)“解剖麻雀”式;(2)划类选典[例]某年级100名同学某门课的成绩可区分为三类:先进一般后进人数:107020选典:A(95分)B(78分)C(34分)(三)典型调查1、定义:对典型单位进行的调查。2、种类\n第一章数据与统计学STAT[附1]随机化应答技术(Randomizedresponsetechnique,1965)1、基于西蒙斯模型(1967)的学生作弊调查[提问]“真”问题:你作弊了吗?“诱饵问题”:你是男生吗?2、前提:随机取样;被调查者说真话。回答真问题,1/2回答诱饵问题,1/2是,a否,1-a是,b否,1-b\n第一章数据与统计学STAT[附2]统计估算[盐份的统计研究]1947年,刚刚独立的印度民族矛盾尖锐,一个少数民族逃到红色城堡(RedFort)避难,政府提供资金给承包商,由其提供食物,但产生了巨额开支。由于政府指派的统计学家与难民分属不同的政治派别,故无法进入调查难民人数。承包商提供的资料:米、豆类和盐的购入量R、P和S。统计学家的估算思路:搜集测算常人每天的消耗量a、b和c,则[人口估算]据称中国三年自然灾害(1959~1961)期间饿死了一些人。某学者的研究表明三年应增人口与实际人口之差为4522万人,或者说三年少增加人口4522万人。问题:如何使用更简便的方法对上述数据进行验证?\n第一章数据与统计学STAT一、意义(P17)1、定义:使资料由个体特征过渡到总体特征的工作过程。2、整理对象:调查资料(原始、次级)。[例]通过调查得某班平均成绩为3.5分/人统计整理5:100=3.5:x,∴x=70分。第四节统计整理[例]统计目的:了解2010年A地区100家工业企业的生产情况。1000+1250+=50亿元50亿元/100家=5000万元/家\n第一章数据与统计学STAT二、步骤(一)统计审核1、准确性审核(1)逻辑推理法例如:A:性别(女)、与户主关系(父子);B:年龄(5岁)、文化程度(大学本科);C:年龄(8岁)、婚姻状况(已婚);D:某商场7月份零售了棉大衣10万件。(2)变量关系推算法加总法:某班学生人数52人,其中男同学38人,女同学15人。乘除法:某商品单价为50元/件,销量为125件,所以其销售额为6750万元。\n第一章数据与统计学STAT平衡法:某资产期初存量581万元,当期积累138万元,所以期末存量为729万元。比较审查法:A地区居民户数为2万户,人口数为1.8万人。2、全面性审核3、及时性审核(二)统计分组※1、分开总体、了解差异。[企业]所有制、产值、职工人数、资产存量、劳动生产率等;[人口]身高、体重、文化程度、籍贯、年龄、收入、职业等。(三)统计汇总(四)统计制表\n第一章数据与统计学STAT三、统计分组※(一)概念与作用(P15)1、概念:将统计总体按一定的分组标志(准)区分为若干个性质不同的组或类。[例]对会计08班的50名同学进行分组A、按专业分组B、按年级分组C、按性别分组D、按籍贯分组2、过程:分“总体”;合“单位”。3、分组结果:组内同质、组间差异。[例]9人年龄:5,7,72,14,55,16,19,59,9。(5,7,9),(14,16,19),(55,59,72)4、分组原则:不重复(互斥性),不遗漏(穷尽性)。\n第一章数据与统计学STAT[例]对某班同学按成绩进行分组,结果如下,何种正确()(1)按成绩分组(2)按成绩分组55以下55-6565-75…60以下60-7070-80…(3)按成绩分组(4)按成绩分组60以下60-6870-80…58以下58-7065-80…[关键]合理选择分组标志,正确确定组限。\n第一章数据与统计学STAT(二)分组标志的选择及分组方法1、分组标志的选择原则(1)目的性准则[例1]研究产业工人的文化素质及业务素质情况。文化程度工人数技术水平工人数大学中学小学文盲半文盲一级工二级工三级工四级工等[例2]研究产业工人的劳动身体素质。年龄:青年、中年、中老年等;健康状况:良好、一般、较差等。\n第一章数据与统计学STAT(2)反映现象本质特征准则[例1]研究职工生活水平的变化情况A、按职工工资水平分组B、按职工家庭人均收入水平分组人均收入水平(元)工人家庭数(户)平均消费支出(元)1000以下1000-20002000-30003000-40004000-50005000以上\n第一章数据与统计学STAT[例2]对12岁以下的儿童按年龄进行分组婴儿幼儿学龄前儿童小学(3)历史条件标准企业规模:职工人数、产值、固定资产原值、劳动生产率等。[发达国家]产值、固定资产原值;[发展中国家]职工人数。[例]中国各历史时期对人口的分组。\n第一章数据与统计学STAT原因:文化大革命时期→“一切以阶级斗争为纲”;现在→“一切以经济建设为中心”。2、分组方法(1)品质分组A、简单的品质分组:对人口按性别进行分组男性组、女性组\n第一章数据与统计学STATB、分类[例1]产品按用途可分为工业用和民用“煤”?[例2]人口按职业可分为工人、农民、军人、医生等“军医”?[例3]农业可分为种植业、林业、牧业和渔业,下列产品何种属于种植业产品()A、西瓜B、桑叶C、松脂D、蜂蜜[例4]下列货物中哪些属于固定资产()A、奶牛B、矿物勘探C、种牛D、蛋鸡(2)数量分组[例]企业按产值分组、人口按年龄分组、住户按收入分组。(1)简单分组:只按一个标志分组。\n第一章数据与统计学STAT[例]对中国人口进行简单分组(2)复合分组:按两个或两个以上的标志层叠起来进行分组。[例]对人口按性别、文化程度进行复合分组。\n第一章数据与统计学STAT课堂练习1、下列变量中,何为连续变量?A、身高B、体重C、年龄D、毕业生人数E、学分F、设备台数G、设备利用率答:A、B、C、G2、若对全国工业企业生产设备的使用状况进行普查,则统计总体为()A、全国企业的所有生产设备B、全国工业企业每台生产设备C、全国工业企业每台设备D、全国工业企业所有生产设备答:D。\n第一章数据与统计学STAT3、某学生某门课考试成绩为80分,则“成绩”是()A、品质标志B、变量C、变量值D、标志值4、某学生某门课考试成绩为80分,则“80”分是()A、品质标志B、变量C、变量值D、标志值5、全国人口普查时,()A、全国人口数是统计总体B、每个人是总体单位C、全部男性人口数是统计指标D、人口的性别是总体的标志E、人的年龄是变量答:B、C、E6、下列名称何为品质标志?A、职业B、成绩C、健康状况D、女性E、姓名答:A、B、C\n第一章数据与统计学STAT7、了解全国人口数量应采用哪一种调查方式()A、全面调查B、抽样调查C、重点调查D、典型调查答:A8、对居民消费心理的调查宜采用全面调查。()答:错,抽样调查。9、统计调查方案中首要的问题是()A、确定调查对象B、确定调查单位C、确定调查项目D、明确调查目的和任务答:D10、专门调查均属于非全面调查。()答:错\n第一章数据与统计学STAT11、某班学生按性别和政治面貌层叠分组的结果,男生30人、女生20人;党员3人、团员39人、非党团员8人。这是一种复合分组()答:错,两次简单分组。12、在统计分组时,分组标志()A、只能是品质标志B、只能是数量标志C、可以是品质标志也可以是数量标志D、只能是可变标志E、只能是不变标志答:C、D
查看更多

相关文章

您可能关注的文档