- 2022-08-13 发布 |
- 37.5 KB |
- 11页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
社会统计学81289
下列可做乘除运算的是(A)。A.定比数据B.定类数据C.定距数据D.定序数据测量后可做排序运算的尺度有(ACD)。A.定比尺度B.定类尺度C.定距尺度D.定序尺度统计分组的作用是( ACE )A、划分社会现象类型B、说明总体的基本情况C、研究总体的结构 D、说明总体单位的特征E、分析被研究现象总体诸标志之间的联系和依存关系下列哪些变量需采用组距式分组(BCD )A、学生按满意程度分组 B、罪犯按年龄分组C、儿童按身高分组D、家庭按收入水平分组E、人口按地区分组均值的作用是(ABD)。A.反映总体在某一变量上的一般水平B.对总体各单位进行平均C.测定总体各单位的离散程度D.测定总体各单位分布的集中趋势E.反映总体的规模众数是(ABCD)。A.集中值B.总体中出现最多的变量值C.不受极端值的影响D.适用于总体单位数多,明显集中趋势的情况中位数是(ADE)。A.由变量值所处的位置决定B.由变量值出现的次数决定C.是总体的平均水平D.是总体一般水平的代表值E.不受极端数值的影响如果所有变量值的频数都减少为原来的1/5,而变量值仍然不变,那么算术平均数(A)A不变B扩大到5倍C减少为原来的1/5D不能预测其变化下列说法中(ABCD)是正确的。A应该用均值来分析地区间工资水平B宜用众数来描述流行的服装颜色C考试成绩中位数的含义是有一半考生的成绩超过此数D在数据高度偏态时,宜用中位数来作为集中值受极端值影响比较大的集中值是(A)。A.均值B.中位值C.众值当一组数据属于左偏分布时,则(D)。A.均值、中位值与众数是重合的B.众数在左边,均值在右边C.众数的数值较小,均值的数值较大D.众数在右边,均值在左边11\n将某地区100个工厂按产值多少分组而编制的频数分布中,频数是(C)。A、各组的产值数B、各组的工人数C、各组的工厂数D、各组职工人数众数是(D)。A、唯一的B、总体中居于中间位置的标志值C、受极端值的影响D、适用于总体单位数多,有明显集中趋势的情况定序数据的集中趋势值有(AB)。A、众数B、中位数C、四分互差D、标准差数据呈不太严重的右偏态分布时,(AC)。A.均值到众值的距离大于中位值到众值的距离B.均值到众值的距离小于中位值到众值的距离C.中位值到众值的距离是均值到中位值距离的两倍D.均值到中位值距离是中位值到众值距离的两倍离中趋势指标中,最容易受极端值影响的是(B)。A、异众比率B、极差C、标准差D、四分互差有甲、乙两个数列,若甲的全距比乙的全距大,那么(D)。A、甲的标准差一定大于乙的标准差B、甲的标准差一定小于乙的标准差C、甲的标准差一定等于乙的标准差D、全距与标准差并不存在上述关系在两组数列中,若甲数列的标准差小于乙数列的标准差,则(B)。A、两数列平均数代表性相同B、甲数列平均数代表性高于乙数列C、乙数列平均数代表性高于甲数列D、不能确定哪一数列均数代表性高区间估计表明的是一个 (B) A绝对可靠的范围 B可能的范围 C绝对不可靠的范围 D不可能的范围评价估计值的优良标准有(ADE) A无偏性 B数量性 C有偏性 D一致性 E有效性无偏性是指 (A) A为估计值的样本统计量的平均数等于被估计的总体参数B样本容量n充分大时,作为估计值的样本统计量充分靠近总体参数C随着n的无限增大,作为估计值的样本统计量与未知的总体参数之间的离差任意小的可能性趋于实际必然性D为估计量的方差比其他估计量的方差小11\n显著性水平与拒绝域之间的关系是:(CD)A、显著性水平提高,意味着拒绝域缩小B、显著性水平降低,意味着拒绝域扩大C、显著性水平提高,意味着拒绝域扩大D、显著性水平降低,意味着拒绝域缩小若在显著性水平为0.01时下接受了原假设,则当显著性水平改为0.05时,则下列说法正确的是:(CD)A、必接受原假设B、必拒绝原假设C、可能接受也可能拒绝原假设D、犯第一类错误的概率增大假设检验中,显著性水平表示:(D)A.P{接受H0|H0为伪}B.无具体含义C.置信度D.P{拒绝H0|H0为真}在样本容量n固定时,(BCD)A.缩小α,就扩大了拒绝域,从而增加犯第一类错误的可能性B.缩小α,可缩小拒绝域,从而减小犯第一类错误的可能性C.缩小α,可缩小拒绝域,从而增加了犯第二类错误的可能性D.要同时减少两类错误是不可能的相关关系按自变量的多少分为 (B) A正相关与负相关 B单相关与复相关C线性相关与非线性相关 D不相关、完全相关与不完全相关一个因变量与多个自变量的依存关系是 (D) A单相关 B线性相关 C非线性相关 D复相关若两变量的变化方向相反,则属于 (D) A线性相关B非线性相关 C正相关D负相关若∣r∣在0.3~0.5之间,则表明两变量 (C) A无直线相关 B显著相关 C低度相关 D高度相关r的取值范围是 (D) A<1 B>l C(一1,+1)D[一1,+1]在回归分析中,要求两变量 (B) A都是随机变量 B自变量是确定性变量,因变量是随机变量C都是确定性变量 D因变量是确定性变量,自变量是随机变量每一吨铸铁成本y(元)与铸件废品率x(%)变动的回归方程为:yc=56+8x,这意味着(C)A废品率每增加1%,成本每吨增加64元 B废品率每增加1%,成本每吨增加8%C废品率每增加1%,成本每吨增加8元 D废品率每增加1%,则每吨成本为56元简答一.描述统计测量尺度的四个层次及各自特点。1.定类尺度:对事物性质差异进行辨别和区分,说明事物类型11\n特点:①变量取值只有类别属性之分,不同类型地位平灯光,没有高低优劣之分②定类变量确切的表示是以文字变数,不以数字表述2.定序尺度:对事物的顺序性差异进行辨别和区别特点:①变量取值除了类别属性之外,还有等级次序的差别,表述时不能随意排列②顺序性差异无法准确测量,只能说明哪个高、哪个低,无法说明高多少、低多少③用文字表示3.定距尺度:对事物绝对尺度差异进行辨别和区分特点:①变量取值除了类别、次序属性之外,不同类别之间的顺序性差异可以用标准化的距离去度量②均以数字表示4.定比尺度:对事物的绝对和相对差异进行辨别和区分特点:①除了以上三种属性之外,取值还可以构成一个有意义的比值②均以数字表示二.试比较众值、中位值和均值的适用范围和各自的优缺点。众值适用于定类、定序和定距变量。任何层次的变量,只要知道频次,尤其适合单峰对称的情况。优点:适用范围广;不受极端值的影响缺点:三者中,众值对资料的使用最不完全中位值适用于定序和定距变量优点:在严重偏态情况下,中位值最能作为集中趋势的代表值缺点:不适合做定类变量的集中值均值仅适用于定距变量优点:对资料的使用最完全;由于其不仅和变量的频次有关,还与变量大小有关,所以它最灵敏。缺点:在严重偏态情况下,均值失去代表性;受极端值影响大三.相关系数r与回归系数b的比较。二者含义是不同的:回归系数b与变量单位有关,反映变量之间具体的变动关系,即自变量x对因变量y的影响有多大;相关系数r是个抽象的数,反映变量间相互依存的密切程度。二者的检验是等价的:如果对ρ通过了检验,也必然导致β检验的通过。四.试说明置信区间与置信度之间的关系如何。在样本容量一定的情况下,置信区间与置信度是相互制约的,置信度越大(估计的可靠性越大),则相应的置信区间也越宽,估计越不精确11\n五.假设检验中的两类错误分别是什么?第一类错误:弃真错误。当原假设为真,我们却拒绝了原假设。大小为显著性水平α。第二类错误:纳伪错误。当原假设为假,我们却接受了原假设。大小用β来表示。六.简述直方图与条形图的区别。1.直方图的宽度和高度都有意义;而条形图的长度有意义,宽度没有意义2.直方图是连续排列,不可分开;而条形图可以分开排列3.直方图主要显示定类变量的分布;而条形图主要显示定量或定序变量的分布七.简述评价估计值的三个标准。1.无偏性。如果(Q帽)是总体参数Q的估计值,要求(Q帽)分布的均值等于被估计的总体参数Q。即E()=Q2.有效性。如果存在多个满足无偏性的估计值,要求作为优良估计量的方差应该比其他估计量的方差小。3.一致性。随着样本容量n的增大,一个好的估计值能够以更大的概率去接近被估计的总体参数值。八.简述中心极限定理的主要内容。如果χ~N(μ,σ2),从该总体中随机抽取容量为n的样本,其所有可能样本的样本平均数的分布也服从均值为μ,方差为的正态分布。即~N(μ,)。若总体变量χ不服从正态分布,但是其均值和方差已知,为μ,σ2。那么从该总体中随机抽取变量为n的样本,当n足够大时,其样本平均数也服从均值为μ,方差为的正态分布。即~N(μ,)计算题●1.下表是某市商业企业协会会员的年销售额分布资料:年销售额(万元)商业企业数(个)100--1504150--20016200--25040250--3002811\n300--35010350--4002(1)商业企业年平均销售额是多少?(均值)(2)一半商业企业的年销售额在多少万元以上?(中位值)(3)商业企业数分配最多的年销售额是多少?(众值)(4)四分互差、异众比率、标准差?解:(1)∴商业企业年平均销售额是240万元(2)∴一半商业企业的年销售额在237.5万元以上(3)商业企业数分配最多的年销售额是225万元(4)四分互差的位置是=25的位置是=75===-异众比率标准差≈52.2●2.某企业6月份奖金如下:11\n月奖金(元)职工人数100—1506150—20010200—25012250—30035300—35015350—4008合计86求:均值、众值、中位值,并比较三者位置,说明月奖金的分布态势。解:均值≈263.95众值月奖金在250-300元职工人数最多,所以为275。中位值≈271.43∵∴说明月奖金的分布态势呈左偏分布●3.据某地区100户的随机抽样调查,居民用于食品的费用平均占总收入的比例为0.8,标准差0.2。问:有关食品费用占总收入的比例,平均为0.75的说法是否成立(α=0.05)?拒绝域解:α=0.05查表可得∵2.5>1.96∴拒绝原假设所以,有关食品费用占总收入的比例,平均为0.75的说法不成立●4.有两个生产小组,都有5个工人,某天的日产量件数如下:甲组:810111315乙组:1012141516求:各组均值、极差、标准差,并说明哪组均值更具代表性。解:甲组11\n≈2.4乙组≈2.2∵∴乙组的均值更具代表性●5.下表是某旅行社对其泰国五日游线路游客在泰国购物花费所做的抽样调查结果:(6分)某旅行社泰国五日游线路游客在泰国购物支出调查购物支出(元)人数500元以下4500—1000211000—1500301500—200062000元以上4合计65该旅行社营销部经理希望根据此项调查了解该路线全部游客在泰国的购物支出情况,置信水平为95%。解:由题意可得:≈1134.6≈462.2∵95%,查表可得Z=1.96∴∴该路线全部游客在泰国的购物支出情况为[1022.2,1247]11\n●6.以下是生活期望值与个人成就的抽样调查:(8分)生活期望值108764321个人成就791042132求:(1)相关系数r。(2)用最小二乘法建立回归方程,并解释回归系数的意义。解:(1)将生活期望值与个人成就用变量xy表示,列表可得:生活期望值x个人成就yxy107701004989726481710704910064243616428164313912364912214由上表可得=0.79(2)用最小二乘法建立回归方程∴回归方程为回归系数b的意义是生活期望值增加一个单位时,个人成就增加0.87。●7.设甲.乙两单位职工的工资资料如下:甲单位乙单位月工资(元)职工人数月工资(元)职工人数600以下2600以下1600—7004600—7002700—80010700—8004800—9007800—90012900—10006900—1000611\n1000—110041000—11005合计33合计30求:比较哪个单位的职工工资差异程度小。解:=819.7≈138=866.7≈124∴乙单位的职工工资差异程度小●8.已知甲、乙两个班学生的成绩资料如下:甲班的平均成绩为78.5分,成绩标准差是9.58分;乙班的资料见下表:乙班学生成绩资料按成绩分组60以下60~7070~8080~9090以上合计人数(人)612208450计算:(1)乙班学生的平均成绩、成绩标准差。(2)哪个班的平均成绩更具有代表性?为什么?解:(1)≈10.84∴乙班学生的平均成绩为73.4分,成绩标准差约为10.84(2)甲班的平均成绩更具有代表性,因为。●9.以下是子代和父代受教育年限的抽样调查:父代246810子代45879求:相关系数与回归直线,并解释回归系数的意义.解:将子代和父代受教育年限用变量xy表示,列表可得:父代x子代yxy11\n2484164520162568483664875664491099010081由上表可得=0.92(2)用最小二乘法建立回归方程∴回归方程为回归系数b的意义是父代受教育年限增加1年时,子代受教育年限增加0.6年。11查看更多