- 2021-05-13 发布 |
- 37.5 KB |
- 7页
申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
模拟卷高考制度改革的统计学探讨
Using the research method of literature, means of observation, behavioral approach, conceptual analysis and the pattern of information-seeking of local and overseas were analyzed and compared, Basic pattern strategies of technology information-seeking 高考制度改革的统计学研究 (江苏省教育考试院 厉浩) [摘要] 高考制度改革是一件牵涉全社会利益的事情。本文利用统计学的思想,探讨与高考有关的措施办法是否需要改革,对拟采用的改革措施可能产生的各种结果进行定量的预测或验证,从而提高高考改革的实施效果。 [关键词]高考 改革 统计学 实证研究 Abstract: Reform of national college entrance examination system is an very important thing to our social life. The article uses the thinking of statistics to discuss the need for reform of college entrance examination measures, to forecast or authenticate the results of reform measures quantitatively. Thus the results of the reform implementation will be improved. Keyword: college entrance examination, reform, statistics,empirical Study 我国自1977年恢复高考以来,高考制度基本上是在稳步中求发展,在继承中求创新。但最近十多年来,随着社会转型的加剧和教育事业整体发展的加快,高考制度面临着越来越多的质疑与责难,高考改革的呼声也一浪高过一浪。特别是在新课程改革推行以来,为与新课程改革理念相配套,高考改革更是迫在眉睫。 高考改革的任务是在素质教育和新课程理念之上,建立更加有利于高校选拔合适生源的高考制度。目前的一些改革措施,多是通过理论研讨的办法,从定性研究的角度在宏观层面得出的结论。本文拟从定量分析的角度,在微观层面对相应的高考样本数据进行探讨,对高考制度革措施可能产生的各种结果可以有一个定量的预测,从而提高改革措施的实施效果,另外也给有关领导和专家开展宏观研究提供相应依据。 一、 高考改革中的统计学思想 高考制度改革的过程,可以看作是一个连续“比较”的过程:首先比较现有考试招生制度对不同考生人群中是否存在不公平,相比其它考试制度是否不科学等,然后经过研究探讨提出一种新的制度,再比较新的制度是否更公平、更科学,并保持一定的稳定性,等等。从考试统计学的理论来看,这种“比较”,在本质上就是不断地进行着“假设检验”[1]。比如“文科生吃亏”就是一个假设,首先对这个假设进行检验,如果检验结果确实如此,那就要提出改革措施,再对“实施改革措施后的理科生与文科生是公平的” 的假设进行检验,如果检验结果是正确的且不引起其它的不良后果,就可以考虑实施这个措施。 假设检验分为两个阶段:统计假设与统计检验。统计假设是指当对情况不太清楚的总体无法作出肯定性的或否定性的结论时,即根据样本信息对未知总体分布(或总体参数)情况作出相应的假定性判断。统计检验是指通过已知样本信息,对原假设H0作出接受(肯定)或拒绝(否定)的统计决策过程,具体地说,是在假设H0成立的前提下,建立一个合适的统计量及其抽样分布,并将该检验量的实际观察值计算出来,与理论临界值进行比较,最终作出统计决策。 统计学中常用的抽样分布有标准正态分布(Z分布)、t分布、(读“卡方”)分布等,其相应的检验量有Z值、t值、值,其对应的统计检验即称之为Z检验、t检验、检验。使用什么类型的统计检验更为合适,要根据拥有的数据情况、研究类型和统计推断目的等要求来加以判断。在高考研究中,经常要对如“英语科目平均分”等平均值或“本科上线率”等比率进行检验,一般使用Z检验或检验。 1.Z检验 根据统计学中心极限定理,来自于同一个总体的相互独立的随机变量(譬如某省各位考生的高考成绩)X1,X2,X3,…,Xn,满足如下性质:当n充分大时, 近似地服从标准正态分布。其中为随机变量的样本数据的均值,为总体的数学期望,为总体的方差。 在有关高考的研究中,研究对象(考生成绩)的数量一般都是巨大的,能够满足“充分大”的要求,故可以认为近似服从标准正态分布,也可以用样本方差S代替总体的方差。记Z=,Z检验即为对样本数据计算的值,并与标准正态分布的理论临界取值进行比较的过程。 对于两个总体均值(譬如理科生平均成绩X1和文科生平均成绩X2)之间的比较的检验,有如下分析:当充分大时,和近似服从标准正态分布,则近似服从标准正态分布,可按Z=进行Z检验。 2.标准分 当高考成绩严格服从正态分布时,如考生原始分为X,则z=即为他的标准分。标准分具有科目之间的等值性和科目成绩的可加性等优点[3]。在实际研究中,因各科目成绩有时会偏离正态分布,故一般先对各科目成绩进行正态化转换,如下办法计算标准分:先将全体考生按原始分从高到低排序,算出每一个原始分以下的考生占全体考生总数的百分比,再按这个百分比检索正态分布表,找出它的正态分数z。这样计算出来的标准分z,均值为0,有的考生的标准分为正数,有的为负数。为符合人的习惯,一般作t=a+bz的转换, 根据正态分布的规律,可以使考生的标准分均值t为a,且99.99%以上考生的标准分分布在a-4b和a+4b之间,取合适的a,b值,即可认为所有考生的标准分均为正数。 3.检验 分布为标准正态分布变量Z的平方和的分布。检验一般用于比率性质的检验。直观地理解,当样本(与总体的)比的分布呈正态分布时,如果两个样本比之间几乎没有差异,那么它们的差就应该很小且也服从正态分布,差的标准化统计量z值也应该很小,相应的值也应该比较小。如果说根据所提供的资料计算出来的值居然大于相应的理论临界值(显著性水平),那么就有理由怀疑两个样本比之间是否真的没有显著差异。 一、 高考改革实证研究 本文抽取近年来高考样本数据,采用假设检验等统计技术来论证目前的考试招生办法是否需要改革,同时也对相应改革方案的效果进行预测或检验。 某省普通本科线为540分,重点本科省控线为570分,620分以上(全省8000名左右)为最高分段。研究者抽取部分普通本科线上考生总分分布如表1所示,认为本科线上考生成绩分布(按分数段划分)与考生的科类可能有关联,由此引出文理科考生放在一起录取的办法是否需要改革的论题: 表1部分普通本科线上考生总分分布 >=620 570-619 540-569 合计 理科 798 3211 2656 6665 文科 14 513 1157 1684 合计 812 3724 3813 8349 根据统计学原理,高考的“上线率”等比率性资料的样本分布属于二项分布(譬如考生要么上线了,要么不上线,不可能还有第三种情况)。而根据统计学中心极限定理,当样本数量足够大时,二项分项逼近正态分布。如果样本数据是以如表一的行列表形式表示的,那么根据二项分布的分布函数特点及分布的定义,可以推导出值的计算公式,从而进行检验: 假设行列表共k行,l列。第r行样本总数为nr,Ar1为其中第1列的数值。 公式1 其中Arc为表中每格(第r行、第c列)内的实际数,Trc为相应的理论数。 根据中心极限定理,当样本数量足够大,可以认为=nc/n, 代入公式1,得 公式2 在本例中,635以上分数段理科生有7247人,文科生有225人,理科生与文科生比例约为为33:1。本科以上总人数之比约为3:1,两个比例相差较大,其原因既可能是高分段确实是文科生偏少,也有可能是由抽样误差(如此上述考生并不能代表全体考生的总体情况)所造成。现要求从统计学角度看,究竟是哪一种误差的可能性较大。 (1)提出统计假设 运用统计学的方法,对上述两种可能作出相应的假定性判断:若是主要由抽样误差引起的,那么重点本科上线文理学生比例与全体考生的文理学生比例还是基本一致的;如果确实是各分数段文理科学生成绩分布不同引起的,那么重点本科上线文理学生比例将与全体本科考生的比例之间将确实存在差别。 相应的两种统计假设可以表述为: H0:考生成绩分布与科类无关,即文理考生成绩的各分数段构成比相同。 H1:考生成绩分布与科类有关,即文理考生成绩的各分数段构成比不同。 (2)建立检验统计量 根据问题性质,假设H0进行X2检验。 对上例用以上公式2计算X2值: =8349*(7982/(6665*812)+32112/(6665*3724)+26562/(6665*3813)+142/(1684*812)+5132/(1684*3724)+11572/(1684*3813))-8349 =511.25 如果不区分是否处于高分段,将重点本科线上考生合并计算(即将表一中第一、第二 列值相加),则 =451.12 而显著性水平a=0.05,自由度为2(即研究对象为两类)的相应的临界值为5.99。 因此本例中X2值远大于临界值。 (3)作出推断结论 在上例中,两个样本比之间没有差异的概率P<0.05,故拒绝两个样本比之间没有显著差异的假设。也就是说,本科线上考生成绩分布(按分数段划分)与考生的科类应当是有关联的。 三、高考制度改革的价值取向 高考制度改革中应树立的正确的指导思想和必须遵循的基本原则,即为高考改革的价值取向。本文选取某省高考录取抽样数据,针对高考改革中几个重要的价值取向问题,进行统计学分析。 (1)公平性 高考的公平性首先在于接受高等教育的机会均等。也就是说,高考能为人们提供平等的受教育的机会并为此提供保障,不考虑人与人之间的差异性,使一切参加高考的人能在完全相同的竞争环境中展开竞争,让相同学习能力的考生具备大致相当的入学机会,体现“分数面前人人平等”[4]。那么,在全国各省份陆续进入新课程改革试验,考生参加考试的模块甚至科目不同的前提下,如何鉴定有“相同的学习能力”呢。根据美国sat考试[5]的考察内容,以及上海高考改革的经验,考生共同考试科目中的语文、数学标准化分之和的高低,基本上可以作为“一般学习能力”,标识一名考生学习能力的强弱。 根据表1中的数据,各科目组考生各语文、数学标准化分之和(按照满分150分,利用公式t=75+15Z计算)如表2所示(表中每格数值为(平均分/人数)): 表2 文理科生语数标准化分之和 重点本科线上 普通本科线上 本科线下专科线上 理科 199.08/4009 177.86/2656 152.63/7853 文科 198.46/527 178.99/1157 140.50/10656 笔者使用以上数据对假设=进行Z检验,在三个分数段,Z值分别为2.83、-8.38和133.26,而a=0.05相应的临界Z值为1.96。因此,在各个分数段,理科生的语数标准分之和与文科生都有差别,而且两类学生的语数标准分的高低在不同的分数段还有不同的体现,因此,原制度在公平性上有所欠缺,应当予以改革。 (2)科学性 高考改革的科学性的一个重要体现,是在新的高考制度有助于高校录取到素质更全面的学生,同时要保证不能因为改革措施的实施而使所录取学生的文化学习能力下降。在承认学生的语数标准分之和可以基本上标识一名学习能力的强弱的前提下,就是要保证新制度下录取的学生的语数标准分之和不低于旧制度。 表3 两种高考录取制度上线情况统计表 重点本科线上 普通本科线上 本科线下专科线上 旧制度 199.00/4536 178.20/3813 145.65/18509 新制度 202.24/4536 180.72/3813 146.22/18509 笔者使用以上数据对假设>进行Z检验,Z值分别为30.58, 31.83, 8.21,而a=0.05相应的单边检验临界Z值为1.64。在新高考制度下,各分数段考生的语数标准分之和将比旧制度要高,尤其是本科以上分数段学生。因此,从提高拟录取学生的文化学习能力的意义上看,新制度具有明显的科学性。 (3)稳定性 稳定性反映在统计数据中,就是高考制度的改革对考生的上线与录取情况应该影响不大。也即在原来的高考制度下能上线的学生,在新的制度下也能上线。高考制度改革要保持稳定性,是一个相对的概念,如果要保持绝对的稳定,那不做任何改革最稳定,也并非说对学生的上线与录取结果影响最小的改革措施就是最好的,相反地,为了提高高考的公平性和科学性所作的改革是必需。因此,如对涉及稳定性的假设进行检验,a值可以取小一些,比如a=0.01。 在上例中,假如拟对该省高考实施某项改革措施,改革前后文理考生的上线数据分别如表5和表6所示。 表4 高考制度改革前后文科生上线人数统计 本一线上 本二线上本一线下 合 计 改革前 527 1157 1684 改革后 672 1542 2214 表5 高考制度改革前后理科生上线人数统计 本一线上 本二线上本一线下 合 计 改革前 4009 2656 6665 改革后 3864 2271 6135 运用公式2进行计算,本一线上=20.21, 本二线上=85,本科线上=94.01,而显著性水平a=0.01、自由度为2(即研究对象为两类)的相应的临界值为9.21,因此如单纯采用此项改革措施,在改革后,本一、本二线上的文科考生将有明显增加。因此,如实施该项改革,应当采取其它配套措施,以在一定程度上保持录取结果的稳定性。 事实上,考试领域的统计技术有很多种,比如说可以用相关分析来说明在英语科目中设置听力考试是否对理科学生、农村学生不公平?选择使用假设检验作为统计手段,主要是因为笔者认为,在我国现阶段,中学和各级地方政府部门和社会上将“均分”和“升学率”(具体表现为合格率、上线率和录取率等)作为衡量高考成果的重要标准,于是对高考制度改革的评价自然也离不开对上述指标的分析。而根据统计学原理,Z检验和卡方检验恰恰就适用于对各种均值和率的比较。在另外一方面,虽然笔者考虑到社会的关注程度,主要是以文理考生、本科线上的数据为例进行讨论。事实上,城乡差异、性别差异、民族差异、省际差异都可以作为高考制度改革的考虑因素,但总的方法基本上是一致的。 四、 结束语 本文利用统计学中有关技术,对高考制度改革中涉及的政策以及高考价值取向进行实证研究,从定量分析的角度对高考制度的改革进行一些有益的探讨,给领导和相关研究人员提供改革决策依据。 [参考文献] [1]盛骤,谢式千,潘成毅.概率论与数理统计(第三版)[M],高等教育出版社,P213-219. [2]凌云. 考试统计学[M],华中示范大学出版社, P228. [3]张亚萍,谢家功.建立高考标准分制度的思考,教育发展研究,1998,(3) [4]郑若玲. 公平——考试变革的主旋律[J]. 江苏高教, 2007, (3). [5]陈晓莹.美国SAT 考试的最新改革[J].比较教育研究, 2004, (10).查看更多