- 2022-09-01 发布 |
- 37.5 KB |
- 40页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
《描述统计学》PPT课件
1课前热身:检查第一章课后实践题的完成情况1.关于北京卫视某档节目收视率调查的调查总体(调查对象)和个体(单位)的确定问题。(提问2~3名学员回答)2.统计表的编制(一名学员到黑板做)\n2第二章数据描述方法1:表格和图形方法学习目标掌握质量数据和数量数据的概括方法。学会用统计常用图表表现各类数据。了解探索性数据和交叉列表的基本知识。\n3案例讨论(课后进行):1.这个案例都告诉了我们哪些信息?2.通过阅读这个案例你受到哪些启发?\n4习题1.P23-24.P32-182.P25-95.P36-223.P31-156.P41-32\n5第一节质量数据的概括一、频数分布频数分布(Frequencydistribution)是用数据概括表的形式来列示各组中每组数值出现的次数(频数)。编制频数分布表的目的:提供更进一步了解原始数据的信息。\n6[例2-1]从表2-1观察哪种软饮料购买的数量最多?(P21)表2-2购买软饮料的频数分布表软饮料频数(次)古典可乐19健怡可乐8彭伯碳酸饮料5百事可乐13雪碧5合计50\n7二、相对频数分布和百分比频数分布相对频数分布(Relativefrequencydistribution)是一数据集的表格汇总法,显示在若干个组别中每一组的项目总数的相对频数,即分数或比例。计算公式:(2.1)\n8百分比频数分布(Percentfrequencydistribution)是一数据集的表格汇总法,显示在若干无重叠组别中每一组的项目总数的百分率。每组百分比频数是该组相对频数乘以100%教科书强调是相对频数乘以100,我强调乘以100%\n9表2-3购买软饮料的相对频数和百分比频数分布表软饮料相对频数百分比(%)古典可乐0.3838健怡可乐0.1636彭伯碳酸饮料0.1010百事可乐0.2626雪碧0.1010合计1.00100?相对频数的计量单位是什么(x/1)相对频数是否有计量单位?\n10从表2-3我们可以获得以下有用信息:在种软饮料中,购买次数最多的是古典可乐,占5种软饮料购买总次数的38%。购买次数最少的是彭伯碳酸饮料和雪碧,各占总购买次数的10%。依购买次数多少排序依次为:古典可乐、百事可乐、健怡可乐、彭伯碳酸饮料和雪碧。购买次数最多的前3种软饮料占全部购买次数的比重已达80%(38%+26%+16%)。\n11三、条形图和饼图条形图(Bargraph/Barchart)是用条形的固定宽度表示变量,不同长度表示频数、相对频数或百分比频数分布的一种图示方法。\n12图2.1购买软饮料次数的条形图\n13饼图(Piechart)是用圆形及圆内扇形面积来表示数值大小的图形,它主要用于表示总体中各组成部分所占的比例。\n14图2.2软饮料购买次数图\n15第二节数量数据的概括一、频数分布分组(Group)根据特定目的,对一组数据所进行的归类。利德会计师事务所提供的数据提供了该所在完成20个客户样本的年终审计所需要时间的具体数据。\n16表2-4年终审计时间(天)1214191815151817202722232221332814181613分组的具体步骤:(1)确定组数采用斯特格斯(Sturges)提出的经验公式来确定。\n17\n18(2)确定组距\n19(3)确定组限●欧美教材处理方法:组与组之间的组限互不重叠,即每组之间的数据是断开的。10-14,15-19,20-24,25-29,30-34●国内教材处理方法:1`离散变量:第一种方法:间断型组限。如:10-14,15-29,20-24…\n20第二种方法:重叠型组限。如:10-15,15-20,20-25,25-30…对于重叠型组限,为避免重复将同一数据分配到不同组,规定“上限不包括在内”。2`连续变量:强调必须做重叠型组限。(4)将各个数据分配到相应组中去,形成一个数量数据频数分布表。\n21表2-5审计时间数据频数分布审计时间(天)频数(个)10~15415~20820~25525~30230~351合计20教科书P27表2-6采用间断型分组,不如重叠型分组好。\n22表2-5的频数分布为我们提供了以下简单信息:审计时间发生最频繁的是15—20天这一组。在20个审计时间中属于这一组的有8个。只有一次审计时间需要30或更长的时间。\n23二、相对频数分布和百分比频数分布表2-6审计时间数据的相对频数分布和百分比频数分布审计时间(天)相对频数百分比(%)10~150.202015~200.404020~250.252525~300.101030~350.055合计1.00100\n24三、直方图直方图(Histogram)是一种通过在横轴上放置组距,在纵轴上放置频数来描述数量数据的频数分布、相对频数分布和百分比频数分布的图形。\n25图2.4审计时间数据直方图(单位:天)注意:本课件的直方图与教科书(P28)直方图的区别。\n26四、累积频数分布累积频数分布(Cumulativefrequencydistribution)对数量数据集的表格法汇总,显示数值小于或等于每组上限的项目数。或者显示数值大于或等于每组上限的项目数。\n27(一)由最小数值向最大数值累积方法(显示数值小于每组上限的项目数)表2-7审计时间数据的累积频数分布审计时间(天)频数(个)累积频数(个)10~154415~2081220~2551725~3021930~35120合计20-\n28(二)由最大数值向最大数值累积方法(显示数值大于或等于每组下限的项目数):表2-8审计时间数据的累积频数分布审计时间(天)频数(个)累积频数(个)10~1542015~2081620~255825~302330~3511合计20-\n29审计时间(天)频数(个)向上累计频数(个)向下累计频数(个)10-1515-2020-2525-3030-35485214121719202016831合计20————表2-9审计时间累计频数表\n30第三节探索性数据分析探索性数据分析(Exploratorydataanalysis)是用茎叶显示(Stem-and-leafdisplay)图形来反映概括性数据的一种统计技术。\n31一、茎叶显示图的绘制方法:第一步:把每个观察值分成茎和叶两个部分。茎包括了除了个位数之外的所有数字,叶就是个位数字。第二步:把茎由小到大,从上往下写成一列,并且在这一列右边画一条直线。第三步:把每片叶子写在它所属的茎的右边,并由小到大排成一行。\n32[例2-3]表2-10是某证券公司对应聘某一职位50人参见面试时,回答所提出的150个问题正确回答的测试结果。表2-10能力测试回答正确的问题数目112726997107739276867312612811812712482104132134839210896100921157691102819514181801068411911398756898115106951008594106119\n33689272335666801123456891222455678811100024666789112355899712467841324211图2.5能力测试回答正确问题数目茎叶显示图\n34二、茎叶显示图的含义第一行:表明在回答问题正确数目在60个以上,69个及以下的人数有两个。其中一个答对了68道题,另一个答对了69道题。第二行:表明在回答问题正确数目在70个以上,79个及以下的人数有6个。他们答对题的数目分别为:72,73,73,75,76,76。……\n35第四节交叉分组列表和散点图一、交叉分组列表交叉分组列表(Crosstabulation)对两个数据的表格汇总。一个变量的组用行来描述,另一个变量的组用行、列来描述。\n36表2-11300家洛衫矶饭店质量等级和菜肴价格交叉分组列表质量等级菜肴价格(美元)合计10~1920~2930~3940~49好42402084很好3464466150极好214282266合计781187626300\n37二、散点图散点图(Scatterdiagram)表示两个变量之间关系的图形方法。一个变量列在横轴上,另一个变量列在纵轴上。[例2-4]美国旧金山某音响商店广告次数和销售额的数据如下:\n38表2-12立体声音响设备商店样本资料周次广告次数(x)销售额(百美元)y12502557314143545454613875638348945910246\n39图2.6立体声音响设备商店样本资料散点图\n40Question???QuestionsandCommentsarewelcome…THANKSHaveagreatDay!查看更多