社会统计学习题

2022-08-13 发布 |
37.5 KB |
6页

申明敬告： 本站不保证该用户上传的文档完整性，不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

社会统计学习题

社会统计学复习题一、名词解释1、社会统计学2、中位数3、众数4、点估计：所谓点估计，就是根据样本数据算出一个单一的估计值，用它来估计总体的参数值。5、区间估计：所谓区间估计，就是计算抽样平均误差，指出估计的可信程度，进而在点估计的基础上，确定总体参数的所在范围或区间。6、置信区间：置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。7、消减误差比例：变量间的相关程度，可以用不知Y与X有关系时预测Y的误差，减去知道Y与X有关系时预测Y的误差，再将其化为比例来度量。将削减误差比例记为PRE。8、因果关系：变量之间的关系满足三个条件，才能断定是因果关系。1）连个变量有共变关系，即一个变量的变化会伴随着另一个变量的变化；2）两个变量之间的关系不是由其他因素形成的，即因变量的变化是由自变量的变化引起的；3）两个变量的产生和变化有明确的时间顺序，即一个在前，另一个在后，前者称为自变量，后者称为因变量。9、正相关与负相关：正相关是指一个变量的值增加时，另一变量的值也增加；负相关是指一个变量的值增加时，另一变量的值却减少。10、散点图：将相关表所示的各个有对应关系的数据在直角坐标系上画出来，以直观地观察X与Y的相互关系，即得相关图，又称散点图。11、同序对：在观察X序列时，如果看到，在Y中看到的是，则称这一配对是同序对。12、异序对：在观察X序列时，如果看到，在Y中看到的是，则称这一配对是异序对。13、大数定理：当我们的观察次数n趋向无限时，随机事件可能转换为不可能事件或必然事件。即，在大量观察的前提下，观察结果具有稳定性。二、选择题6．下面能进行除法运算的测量尺度是（）A定比尺度B定类尺度C定距尺度D定序尺度7．教育程度是（）的测量。A定比尺度B定类尺度C定距尺度D定序尺度8．智商是（）的测量。A定比尺度B定类尺度C定距尺度D定序尺度9．籍贯是（）的测量A定比尺度B定类尺度C定距尺度D定序尺度10．在社会统计学中，（）是反映集中趋势最常用、最基本的平均指标。A中位数B算术平均数C众数D几何平均数11．关于学生t分布，下面哪种说法不正确（B）。A要求随机样本B适用于任何形式的总体分布C可用于小样本D可用样本标准差S代替总体标准差12．在统计检验中，那些不大可能的结果称为(D)。如果这类结果真的发生了，我们将否定假设。A检验统计量B显著性水平C零假设D否定域13．在用样本指标推断总体指标时，把握程度越高则（B）。A误差范围越小B误差范围越大C抽样平均误差越小D抽样平均误差越大14．当x按一定数额增加时，y也近似地按一定数额随之增加，那么可以说x与y之间存在（A）关系。A直线正相关B直线负相关C曲线正相关D曲线负相关15．评价直线相关关系的密切程度，当r在0.5～0.8之间时，表示（C）。A无相关B低度相关C中等相关D高度相关16．相关分析和回归分析相辅相成，又各有特点，下面正确的描述有（D）。A在相关分析中，相关的两变量都不是随机的；B在回归分析中，自变量是随机的，因变量不是随机的；C在回归分析中，因变量和自变量都是随机的；D在相关分析中，相关的两变量都是随机的。17．关于相关系数，下面不正确的描述是（B）。A当01时，表示两变量不完全相关；B当r=0时，表示两变量间无相关；C两变量之间的相关关系是单相关；\nD如果自变量增长引起因变量的相应增长，就形成正相关关系。18．欲以图形显示两变量X和Y的关系，最好创建（D）。A直方图B圆形图C柱形图D散点图19．两变量X和Y的相关系数为0.8，则其回归直线的判定系数为（C）。A0.50B0.80C0.64D0.9020．在完成了构造与评价一个回归模型后，我们可以（D）。A估计未来所需样本的容量B计算相关系数和判定系数C以给定的因变量的值估计自变量的值D以给定的自变量的值估计因变量的值21．两变量的线性相关系数为0，表明两变量之间（D）。A完全相关B无关系C不完全相关D不存在线性相关22．身高和体重之间的关系是（C）。A函数关系B无关系C共变关系D严格的依存关系23．在相关分析中，对两个变量的要求是（A）。A都是随机变量B都不是随机变量C其中一个是随机变量，一个是常数D都是常数24．在回归分析中，两个变量（D）。A都是随机变量B都不是随机变量C自变量是随机变量D因变量是随机变量25．一元线性回归模型和多元线性回归模型的区别在于只有一个（B）。A因变量B自变量C相关系数D判定系数26．以下指标恒为正的是（D）。A相关系数rB截距aC斜率bD复相关系数27．下列关系中，属于正相关关系得是（A）。A身高与体重B产品与单位成本C正常商品的价格和需求量D商品的零售额和流通费率28、下列变量中属于定序变量的是（）A、门牌号B、学生学号C、职称等级D、身高29、用具有频数最多的变量值来表示变量的集中值被称为（）A、众值B、中位值C、均值D、四分位差30、标准差数值越小，则反映变量值()A、越分散，平均数代表性越低B、越集中，平均数代表性越高C、越分散，平均数代表性越高D、越集中，平均数代表性越低31、下面不属于正态分布图特征的是（）A、有一条对称轴B、有一条渐近线C、有一个顶点D、有2个单位的面积。32、直方图具备的特征是（）A、高度代表频次B、宽度代表频次C、面积代表频次D、各分段组可以分开33、采用回置法，从一副52张扑克牌里抽取两次，抽中两张红桃的概率为（）A、1/52B、1/16C、1/13D、1/434、下列属于定类层次相关分析法的是（）A、斯皮尔曼系数B、Lambda系数C、Gamma系数D、eta系数35、当样本量n=25时，我们对其进行均值检验时，应该选用（）方法进行。A、Z检验B、F检验C、T检验D、上述三者都可以36、如果，Xi＞Xj，Yi＜Yj，那么，就称被调查者i和j这一配对为（）。A、异序对B、同序对C、X的同分对D、Y的同分对37、一般认为：积差系数r值等于0.3为（）。A、完全相关B、高度相关C、中等相关D、无相关38、下列变量中不属于定类变量的是（）。A、车牌号B、手机号C、学历D、性别39、数列2、3、5、1、7、9、2的中位值是（）。A、5B、3C、2D、140、两个正态分布分别为：N（1，25）和N（5，36），将两个正态分布作图，下列说法错误的是（）。A、前者图形的顶端更细小B、前者图形更靠左\nC、后者图形的顶端更细小D、后者图形更靠右41、直方图里，频次由（）来表示。A、面积B、高度C、宽度D、组距42、从一副52张的扑克牌中抽一张牌，抽到一张红桃或者方块的概率是（）。A、1/5B、1/4C、1/3D、1/243、下列属于定类层次相关分析法的是（）A、斯皮尔曼系数B、Lambda系数C、Gamma系数D、eta系数44、从某公司抽取200名员工作为样本进行调查，进行推论分析时，除了（）外，其他三个都是我们采用Z检验法的原因。A、样本容量数符合小样本要求B、总体符合正态分布C、满足大数定理要求D、样本容量达到大样本要求。45、如果，Xi＞Xj，Yi＞Yj，那么，就称被调查者i和j这一配对为（）。A、异序对B、同序对C、X的同分对D、Y的同分对46、区间估计里，置信区间内的置信度大小为（）。A、αB、βC、1-αD、1-β47、简单线性回归分析中，两变量的层次分别为（）A、定类—定类B、定类—定序C、定序—定距D、定距—定距三、填空题1．（）是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。（）是指经他人加工整理，可以在一定程度上被引用来说明总体特征的资料。2．（）和中心极限定理为抽样推断提供了主要理论依据。3．抽样推断中，判断一个样本估计量是否优良的标准是（无偏性）、（一致性）、（有效性）。4．在一副扑克牌中单独抽取一次，抽到一张红桃或K的概率是（1/4）；在一副扑克牌中单独抽取一次，抽到一张红桃K的概率是（1/52）。5．不论总体是否服从正态分布，只要样本容量n足够大，样本平均数的抽样分布就趋于（正态）分布。6．统计检验时，被我们事先选定的可以犯第一类错误的概率，叫做检验的(显著性水平)，它决定了否定域的大小。7．假设检验中若其他条件不变，显著性水平的取值越小，接受原假设的可能性越（大），原假设为真而被拒绝的概率越（小）。8．参数估计，即由样本的指标数值推断总体的相应的指标数值，它包括点估计和（区间估计）。9．变量间的相关程度，可以用不知Y与X有关系时预测Y的全部误差E1，减去知道Y与X有关系时预测Y的联系误差E2，再将其化为比例来度量，这就是（削减误差比例）。10．依据数理统计原理，在样本容量较大的情况下，可以作出以下两个假定：（1）实际观察值Y围绕每个估计值是服从（）；11．根据资料，分析现象之间是否存在相关关系，其表现形式或类型如何，并对具有相关关系的现象之间数量变化的议案关系进行测定，即建立一个相关的数学表达式，称为（回归方程），并据以进行估计和预测。这种分析方法，通常又称为（回归分析）12、变量层次一般分为、、和。13、统计按其内容主要包括两个方面：分析和分析。14、定类层次主要的集中趋势法是，定序层次主要的离散趋势法是。15、统计推论分为参数估计和，其中参数估计又分为和。16、置信区间与可信度之间是成关系，即估计的区间越大，则可信度也就越。17、根据样本计算出来的一切统计数字特征值被称为，总体值称为。18、众数运用层次变量的集中趋势分析，中位数用于层次变量的集中趋势分析，均值用于定距层次变量的分析，标准差用于定距层次变量的分析。19、正态分布图的形状和位置主要由和决定。20、测量两个变量的相关系数时，首先考虑的是变量的，其次考虑变量间是否对称，最后最好选用具备意义的相关系数。21、以样本的统计值来估计总体的参数值，有两大类做法，一类是，另一类是，二者均要求样本是以方法抽取的。22、某一孕妇生男生女纯属偶然现象，但全市出生的婴儿性别比例一直维持在50%左右，这种现象称为定理。23、假设检验时，首先需要做出假设和被择假设，并以假设为基础进行数据推导，如果我们的统计检验值落在，我们就应该接受被择假设。\n三、判断题1．社会统计描述，即通过部分研究对象的统计资料对研究对象的总体的性质进行推论与归纳。（×）2．推论统计需要的统计资料相对而言较少，所以在人力、物力及时间等方面比较经济，研究和应用的范围也拓宽了许多。（√）3．无论分布曲线是正偏还是负偏，中位数都居算术平均数和众数之间。（√）4．在同样的显著性水平的条件下，单侧检验较之双侧检验，可以在犯第一类错误的危险不变的情况下，减少犯第二类错误的危险。（√）5．统计检验可以帮助我们否定一个假设，却不能帮助我们肯定一个假设。（√）6．检验的显著性水平(用表示)被定义为能允许犯第一类错误的概率，它决定了否定域的大小。（√）7．第一类错误是，零假设H0实际上是错的，却没有被否定。第二类错误则是，零假设H0实际上是正确的，却被否定了。（×）8．每当方向能被预测的时候，在同样显著性水平的条件下，双侧检验比单侧检验更合适。（×）9.进行区间估计，置信水平总是预先给定的。（√）10．由于削减误差比例的概念不涉及变量的测量层次，因此它的优点很明显，用它来定义相关程度可适用于变量的各测量层次。（√）11．不管相关关系表现形式如何，当＝1时，变量X和变量Y都是完全相关。（√）12．不管相关关系表现形式如何，当＝0时，变量X和变量Y都是完全不相关。（×）13．通过列联表研究定类变量之间的关联性，这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话，必然存在着Y的相对频数条件分布相同，且和它的相对频数边际分布相同。（×）14．如果众数频数集中在条件频数分布列联表的同一行中，系数便会等于0，从而无法显示两变量之间的相关性。（√）15．从分析层次上讲，相关分析更深刻一些。因为相关分析具有推理的性质，而回归分析从本质上讲只是对客观事物的一种描述，知其然而不知其所以然。（×）16、离散趋势是测量数据间的差异程度。（）17、两个定类变量间的相关系数范围在[－1，1]间。（）18、相关系数r等于－1，说明变量之间不存在相关关系。（）19、标准正态分布的曲线对称轴为X=0。（）20、当样本量n＞30时，无论n如何增大，样本的统计值倾向稳定。（）21、参数估计就是在一定的抽样误差内设一个可置信的区间，然后联系到这个区间的精度，将样本的统计值推断为总体的参数值。（）22、假设检验与参数估计最终关心的都是总体的参数状况。（）23、利用样本对总体进行区间估计时，置信度越高，则区间就越窄。（）24、假设检验过程中，如果统计检验值大于临界值，则拒绝零假设。（）25、在积矩相关分析结果r=0，则说明两变量不呈直线相关。（）26、根据研究需要，可以将定距变量降格为定类变量进行分析。（）27、某公司员工的月收入标准差为100元，说明该公司员工收入差距大。（）28、直方图用于定类层次的变量作图。（）29、推论统计关注的是样本的统计值而不是总体的参数值。（）30、对大样本的假设检验选用Z检验法，主要是因为它满足正态分布。（）31、两端假设检验中，否定域的大小为α。（）32、样本容量多少与研究容许的误差大小呈正比。（）33、从同一总体中抽出的多个大样本的均值组成的数列满足正态分布。（）34、如果两个变量是呈相关关系，那么它们一定呈因果关系。（）35、在积矩相关分析结果r=0，则说明两变量不相关。（）四、计算题1．某工厂50名职工每周工资数分配情况如下表，试求：（1）算术平均；（2）中位数；（3）众数。工资数（元）人数60－62363－651066－682069－711372－744\n合计502、某车间职工工资分布情况如下表，求该车间职工的平均工资，职工工资的中位数以及标准差。按月工资分组100-120120-140140-160160-180180-200工人人数1518302163、某单位统计报表显示，人均月收入为3030元，为了验证该统计报表的正确性，作了共100人的抽样调查，样本人均月收入为3060元，标准差为80元，问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α＝0．05)。4、某地区成人中吸烟者占75％，经过戒烟宣传之后，进行了抽样调查，发现了100名被调查的成人中，有63人是吸烟者，问戒烟宣传是否收到了成效？（α＝0.05）5、从某校随机地抽取81名女学生，测得平均身高为163厘米，标准差为6．0厘米，试求该校女生平均身高95％的置信区间。6、对某市市民按老中青进行喜欢民族音乐情况的调查，样本容量为200人，调查结果示于下表，试把该频数列联表：①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表；③指出对于民族音乐的态度与被调查者的年岁有无关系，并说明理由。对于民族音乐的态度（Y）年岁（X）Σ老中青喜欢不喜欢383830153346Σ7、以下是婚姻美满与文化程度的抽样调查的结果，请计算婚姻美满与文化程度之Gamma系数。文化程度婚姻美满大学中学小学美满9165一般83018不美满3478、两变量X、Y之间的关系如下表，X24681012Y14109754（1）求回归方程；（2）求相关系数。【Y=-0.957X+14.867】【r=0.98】9、试就下表所示资料，计算关于身高和体重的皮尔逊相关系数。N0身高（厘米）体重（千克）1234567891016016116516516717017217417618051565966637069738065\n10、某工厂50名职工每天工资数分配情况如下表，试求：（1）众数所在的组；（2）中位数；（3）平均数。工资数（元）人数70－79380－89990－9920100－10914110－1194合计5011、下表是对40位员工工作满意度和企业归属感的调查数据，请求出其Gamma系数，并解释其意义。归属感（Y）工作满意度（X）Fy低（1）中（2）高（3）低（1）84315中（2）65112高（3）44513Fx181394012、在一个正态总体中抽取一个容量为25的样本，其均值等于52，标准差S=12，求置信水平为95%的总体均值的置信区间。13、一位研究者试图检验某一社会调查所运用的抽样程序，该项调查是由一些缺乏经验的访问员进行的。研究者怀疑属于干部和知识分子的家庭抽得过多。过去的统计资料表明，该街区的家庭收入是7500元，标准差是1500元；此次调查共抽取100个家庭，样本平均收入是7900元。问：该研究人员是否有理由怀疑该样本有偏估？（选用α=0.05）14、设x为一般正态分布的变量，请计算：（1），如果=5，S=2；（2），如果=500，S=300；（3），如果=10，S=0.2；（4），如果=10.73，S=0.25。15、为了研究受教育年限和职业声望之间的关系，设以下是8名抽样调查的结果，试求职业声望与受教育年限的回归方程。调查对象X（受教育年限）Y（职业声望）XYX211270216803950419865219061065754481275总数(∑)16、为了验证统计报表的正确性，作了共50人的抽样调查，人均收入结果有：`X=871元，S=21元，问能否证明统计报表中人均收入m=880元是正确的(显著性水平a=0.05)。17、已知初婚年龄服从正态分布，根据9个人的抽样调查有：x=23.5(岁)，s=3(岁)问：是否可以认为该地区平均初婚年龄已超过20岁(a=0.05)。

社会统计学习题

文档介绍

相关文章

您可能关注的文档