- 2022-08-24 发布 |
- 37.5 KB |
- 24页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
统计学课后答案解析
第一章1.举出你所知道的统计应用的例子。答:期末考试后统计班里同学的成绩,从而进行排名等;人口普查统计,从而得知男女人口比例,年龄分布等;统计一个生态系统里某种物种的密度;统计股票市场上某一天的各种数据;统计某个城市的人均收入水平,人民幸福指数,对某一电视节目的看法等。2.解释定性数据和定量数据的区别,分别给出一个定性数据和一个定量数据的例子。答:定性数据和定量数据的区别:定性数据是由于我们考虑的是取值为类别的变量,对这些类别用数字来分别代表就得到定性数据;定量数据是我们所考虑的变量的取值为数值,它将在某个区间上连续取值,或在某个区间上取离散的值。定性数据的例子:例如考察某幼儿园10个人的性别,定义1=男,2=女,则所得到定性数据为:1,1,2,2,2,1,2,1,1,1.定量数据的例子:考察某幼儿园10个人的身高,则此变量取值区间为(0,200)(单位:cm)3.解释样本和总体的区别。答:总体是根据一定目的和要求所确定的研究事物的全体。为了了解总体的分布,我们从总体中随机地抽取一些个体,称这些个体的全体为样本。样本和总体的区别在于总体是要考虑对象的全体,而样本是从总体中抽取出的一部分具有代表性的个体,从而通过对样本的研究得出关于总体的一些结论。4.解释离散型变量和连续型变量的区别,并各举一例。离散型变量是指其数值只能用自然数或整数单位计算。例如:某企业里职工的人数连续型变量是如果所考虑变量可以在某个区间内取任一实数,即变量的取值可以是连续的。例如:生产零件的规格尺寸。5.阐述四种主要的收集数据方法的区别。答:观测,访问,问卷,实验区别:观测数据的研究者尽量不干涉研究对象的行为模式;访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。\n6.举出一些观测数据和实验数据的例子。答:(1)观测数据:证券分析人员可能会记录某即将收购的公司在被收购的前一天的股市收盘价,并与宣布被收购的当天的收盘价比较。(2)试验数据:研究某药物是否具有特定效用,将所有志愿者分成治疗者和控制组。治疗组每天服用一片该药物,而控制组则服用一片大小形状颜色与前一药物相同或相近的安慰剂。7.答:(1)是样本。所有的CEO的收入排行榜上的数据是总体,我们从中抽取的500名CEO的收入排行榜上的数据是样本。(2)其中CEO所在公司所属行业是定性变量,而上一年全年CEO总收入(百万美元),过去5年中CEO的总收入,公司所持有的股票份额(百万),CEO的年龄(岁),CEO的效率评分是定量变量。8.答:定类水平:性别定序水平:人可以根据年龄分为幼年、少年、青年、中年、壮年、老年定距水平:温度定比水平:身高,收入9.答:根据这个样本知:约有80%的顾客认为此药膏非常好,约有6.4%的顾客认为此药膏一般,而约有13.6%的顾客的反应不明朗。10.\n\n第二章1.(1)两个班考试成绩的柱形图如下所示:(2)甲班和乙班考试成绩的饼图分别如下所示(2)两个班考试成绩分布的特点:成绩在优和良的等级上乙班人数要多于甲班,在中等级别甲班人数多于乙班,在及格和不及格级别上乙班人数少于甲班。很明显,乙班成绩要比甲班好。2.(1)反映评价等级的分布的条形图如下所示:(2)帕累托图如下:\n3.(1)国产车和进口车销售量的对比条形图:(2)国产车销售量帕累托图\n进口车销售量帕累托图:4.答:首先认为是雇员盗窃以及高价买入导致存货缩水。帕累托图如下所示:\n.5.由图可得,对汽车经销商的投诉是最多的。6.\n7.8.\n910.11.12.\n第三章1.答:频数分布表比较清晰的展现出在每个分组中的数据占样本数据的百分比。2.答:频数分布图便于对数据的主要特征(高点,低点,集中点等)得到直观的印象。3.答:相对频率很容易可以看出每组的频数,而累积频率可以方便的看出该组数据之前的累积频率。4.(1)9组;(2)10组;(3)18组;(4)15组。5.0组。6.组。7.(1)组距:10(2)数据趋向于集中到58(3)数据呈左偏态尖峰分布。(4)相对频数分布为组频数相对频数15~2412.5%25~3425.0%35~44512.5%45~541025.0%55~641537.5%65~74410.0%75~8437.5%\n8.(1)答:5名员工由于生病每年缺勤的天数少于3天。17名员工由于生病每年缺勤的天数少于6天。(2)累积频数分布缺勤的天数累计频数累积频率0~3510%3~61734%6~94080%9~124896%12~1550100%(3)根据累积频数折线图,75%的员工每年由于生病而缺勤的天数不超过37.5天\n9.柱体图如下:10答:线图如下:从下图可看出1990—2007年每年的人口呈递增的趋势,且在1998年以前增长速度较快,1998年以后人口增长速度相比以前有所下降。\n11.答:(1)建议分成6组;组距为2。(2)直方图如下所示:直方图说明大多数人上网时间在4到7个小时之间;也有一部分人上网时间在1到3个小时之间或者是8到10个小时之间。12.答:茎叶图展示数据如下:年龄Stem-and-LeafPlotFrequencyStem&Leaf\n1.004.03.004.7994.005.01244.005.68993.006.1231.006.72.007.133.007.6893.008.0441.008.7Stemwidth:10Eachleaf:1case(s)13.答:茎叶图展示数据如下:冰层厚度(厘米)Stem-and-LeafPlotFrequencyStem&Leaf2.004.395.005.188895.006.489996.007.0022252.008.01Stemwidth:1.0Eachleaf:1case(s)14.答:用散点图表示数据如下:\n15.答:散点图如下:16.答:袋中苹果数量的均值为:21.71,中位数为:22.\n17.答:该机器每天被使用的次数的均值为70.53。18.答:(1)售价的均值是:1.6380(2)售价的中位数是:1.4500(3)售价的众数是:1.4919.答:地震等级的中位数是:7.050地震等级的均值是:6.967死亡人数的中位数是:1100,死亡人数的均值是:5607.79地震等级选择均值作为集中趋势的度量;死亡人数选择中位数作为集中趋势的度量。20.答:(1)(2)数据显示不存在异常值。21.答:(1)样本均值是:4.154万元;样本标准差是:0.5317(2)中位数:4.200;上四分位数:3.750;下四分位数:4.650(3)样本中每个员工获得5%的加薪后集合的样本均值为:4.3615,样本标准差为:0.55827(4)月薪的样本均值为:0.3462,样本标准差为:0.04431(5)用不同的度量来衡量数据的变异所得结果是不同的。22.答:(1)数据的均值是:49.23数据的中位数是:46.50(2)茎叶图:\n(3)数据呈右偏态,扁平分布。23.答:(1)女生体重差异大,因为男生体重的变异系数比女生的小;(2)平均数(kg)标准差(kg)男生13211女生11011(3)68%(4)95%24.答:此位应试者A项测试更为理想。25.答:国内乘客的变异系数为CV1=4.5/21x100%=21.4%海外乘客的变异系数为CV2=6.8/35X100%=19.4%根据两组乘客的行李重量的变异系数可以看出,国内乘客携带行李重量的相对离散程度更高,而海外乘客的相对离散程度则比国内更低一些。26.答:(1)因为这是两组不同水平的变量,均值相差很远,使用变异系数可对离散性进行有意义的比较。(2)市盈率的变异系数为:0.165,投资收益率的变异系数为:0.208,这说明投资收益率的相对离散程度比市盈率的大。27.答:(1)使用标准差和方差来反映风险(2)商业类股票,因为商业类股票方差较小,离峰值较集中(3)选择高科技类股票,因为两类股票峰值左侧的频数都较少,而峰值及其右侧的频数较多,其中高科技类股票的收益率更\n高,选择它有更大几率获得更多利润。\n第四章1.答:(1)(2)利用等可能事件求概率的方法。(3)掷一枚骰子的结果中1点到6点的结果是相等的,互斥的。2.答:(1)(2)使用相对频数的方法3.答:(1)古典概率(2)古典概率(3)主观概率4答:(1)一共有36种可能结果,具体组合略。(2)利用古典概型求概率。5答:(1)(2)6.答:(1)实验是对40个学生进行问卷调查。(2)40个学生中有23个回答“是”是一个可能的事件。(3)0.25(4)不一定7.答:(1)实验是对驾驶员违章进行的调查。(2)有1910名驾驶员违章数为0。(3)0.009(4)使用了相对频数的方法。8.答:概率是0.159.答:不是,如果电池是另一辆车上的,则概率是0.02,这是因为这两件事是相互独立的。.10.答:这是公平的,抽签的次序并不影响公平性。证明如下:第一次抽到的概率:第二次抽到的概率:第三次抽到的概率:第四次抽到的概率:\n第五次抽到的概率:因此,任何一次抽中的概率都是0.2.11.答:这从概率的方面讲是公平的,因为在未抽签之前每个人抽到的概率都是0.2.12.答:(1)在15次实验中至少3次成功的概率是:0.18(2)在10次实验中最多1次成功的概率是:0.74(3)在12次实验中,成功次数至少3次最多5次的概率是:0.1113.答:恰有3个航班晚点的概率是0.129,最多有4个航班晚的点概率是:0.9914.答:(1)0.724(2)0.171(3)0.10515.答:(1)0.251(2)0.8(3)0.00816.答:蛋糕上葡萄干的平均粒数是:317.答:该种汽车的耗油量近似服从正态分布。这是因为我们通过所给数据画出直方图如下,可看出所给数据近似服从正态分布。\n18.答:思路:在Excel中改变n和p值,可以得到这四个二项分布图像,再与正态分布比较。(1)(2)\n(3)(4)19.答:学生成绩不及格的概率和处于65~80之间的概率是0.6520.答:40984元。\n第五章1.答:[51.32,58.68]2.答:[38.91,41.09]3.答:(1)0.556(2)[16.90,23.10]4.答:=1.445.答:(1)总体均值的点估计是20元。这是因为样本均值是总体均值的无偏估计。(2)[18.60,21.40]6.答:(1)[18.78,21.22](2)这是因为样本量增大了。7.答:(1)总体均值的点估计是:80.60(2)[79.84,81.36](3)(2)的结果的意义是:在100次抽取60笔交易时会有99次总体均值落在(2)的区间内。8.答:全体学生中,每篇文章平均拼写错误的单词数目的95%置信区间是:[59.29,60.81]9.答:(1)总体均值是20.样本均值是总体均值的最佳估计。(2)这是因为总体的方差未知,总体分布形态未知,且样本量少于30.需要的假定是:1,观测是独立的;2因变量总体服从正态分布。(3)t(19)分布的上侧0.025分位数是:0.032(4)总体均值的95%置信区间是:[19.99,20.01](5)认为总体均值是21只是不合理的,认为是25只也是不合理的。10.答:总体均值的98%置信区间是[29.99,38.14]解释:在100次抽取15个人的样本中总体均值有98次会在区间[29.99,38.14]中。11.答:(1)总体比例是:0.8(2)样本比例的标准误是:0.04(3)总体比例的95%的置信区间是[0.7216,0.8784](4)在100次抽取100个样本容量的样本时,有95次总体比例取值在(3)所示的区间内。12.答:总体比例置信水平为90%的置信区间是:[0.18,0.28]\n总体比例置信水平为95%的置信区间是:[0.17,0.29]13.答:(1)90%的置信区间为:[-19.51,29.51](2)95%的置信区间为:[-24.20,34.20](3)99%的置信区间为:[-33.38,43.38]14.答:(1)95%的置信区间为:[1.29,2.71](2)95%的置信区间为:[1.86,2.14](3)95%的置信区间为:[-5.06,9.06](4)95%的置信区间为:[1.86,2.12](5)95%的置信区间为:[-3.10,7.10]15.答:需要的样本量是:9716.答:需要的样本量是:6017.答:需要的样本量是:9618.答:需要的样本量是:16519.答:应该调查38位观众20.答:应该抽取10个顾客作为样本。查看更多