初中英语口语测试实验研究

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

初中英语口语测试实验研究

.初中英语口语测试实验研究听说过吗?躺在床上能和外教一对一练英语口语!!!!超牛!!免费体验史上最牛英语口语学习,太平洋英语www.pacificenglish.cn内容摘要本论文从英语教育改革的需要出发,从素质教育的要求出发,提出了在初中阶段实施英语口语测试的主张,和测试的具体操作方法,以期英语测试真正成为展示学生才能,同时对初中A语教学有良好的反拨作用—让初中英语教学真正从听说入手,遵循听说领先的原则,从而彻底地根除哑巴英语这一顽疾。这将有利于中华人民共和国教育部制订的《全日制义务教育、普通高级中学英语课程标准》真正地得到贯彻和执行。在研究方法上,本文使用了文献法、实验研究法,问卷调查法和访谈调查。在尽可能广泛地、全面地收集国内外研究成果的基础之上,立足于我国初中英1吾教学之现实,进行口语测试之实验、问卷调查,同时就测试情况进行师生访谈,力求使口语测试方案符合我国初中英语教学之现实需要,使考试服务一J二教学,引导教学朝素质教育的正确方向前进。本论文首先对语言测试及口语测试的发展做了历史回顾,重点谈了交际法测试的特点,常用题型,评分方法;然后探讨了对日语测试本身的评估,重点谈测试信度和效度的研究。接着本文探讨了初中英语口语测试:初中英语口语测试的目的、内容、一般方法和注意事项,重点探讨适合初中生的朗读、根据图片讨论、角色扮演、自我介绍和日常会话和小组讨论等五种测试方法。再接着探讨初中英语口语测试的评分标准及操作,分别讨论了评分方法、评分员的选择和培训、评分等级、评分的信度保证四个方面。重点讨论适合初中英语口语测试的等级描述和信度保证措施,因为信度的问题不解决,口语测试就没人相信,也就没有人会采用,也就不可能实施。最后本论文如实地记录了这次口语测试实验的计划、安排和具体操作过程,描述了测试的结果,并对这次测试实验及其结果进行了分析,得出了以下结论:初中英语口语测试宜实行等级制,就象大学英语四、六级一样,初中英语按《标准》规定设卜5个等级,1-2级代表小学英语水平,3-5级分别代表初中一、二、三年级学完时应达到的水平;在每一个级别里又分别有不及格、及格、优秀(或者A,B,C)三个档次:不同地区根据本地区的实际情况,可以灵活处理,提出不同的要求,例如,上每可要求初三学生达到五级优秀水平,而处于西部的某些省份考虑到地区特点,可以要求初三学生口语达到五级及格水平;另外等级考试采用自愿报名,一年两至四次的形式,使口语测试真正成为学生乐于参加,敢于展现他们才能的一个地方;最后,口语测试试题的指导语要清楚明确使考生看后知道该二「洲么,而不会产生误解。Bl]吕由于经济全球化的影响,国际政治、经济、文化的交流也日益频繁。信息社会的到来使这种交流更加便捷,以至于跨文化交流充满了世界的每一个角落。中国加入WTO前后,我们忽然发现我们的英语教学远远落后于经济发展的需要。上海电视台报道“我台对在沪的独资及合资企业作的调查显示,..\n.大约有70%的企业对大学毕业生的英语水平,尤其是口语水平表示不满。”(转5泊蔡基刚2002)。邵永真在《大学外语教学通讯[J],1998,2))中描述说“用人单位对近几年来毕业的大学生的英语综合能力普遍感到不满意,对口语及写作能力更为不满。例如,他们认为口语能力强或非常强的仅为5%;差的或极差的为37%;能胜任或基本胜任参加国际会议讨论的仅为7%;能胜任或基本胜任参加对外业务谈判的仅为14%."(转自蔡基刚,2002)。对这种现象,蔡基刚同志的看法是,任何一个班级,极优秀的学生总是少数,只有5%的毕业生口语能力非常强属于正常、自然之事。我的观点恰好相反,原因有三:第一,经过中学6-7年(许多地区实施初中4年制),大学4年,(城市的孩子小学还要学3年左右的英语)十几年的刻苦训练,却只有5%的口语能力强,无论如何也说不上正常;第二,我们应该承认我们的英语教学己经远远落后于经济的发展,我们要做的是大力改革;第三,如果把初中、高中的大量考试模拟训练,大学的四、六级考试的应试训练中花费的时间和精力用在听、说、读、写基本能力的训练上,结果必然不同。我们现实的教学目标(在中学是考高分,在大学是通过四、六级)与社会对英语教育的要求的不一致才导致了只有5%的学生口语能力强。对学生英语口头表达能力较弱的批评,自然会引出对英语测试的批评。刘润清教授认为,“在听、说、读、写四种语言技能中,说的技能无论怎么强调恐怕也不过分,因为学习语言的最终目的是把它作为一种工具来进行交际,而交际首先指的是口头交际。语言教学今天所强调的交际教学,首先是口头交际。从社会对外语人才的需求来看,一个人的口语能力无疑是十分重要的。所以说,没有口语测试的语言测试是不全面的,或者说不能称其为语言测试。”(刘润清等.1991:156)但口语测试又是最难实施的。因为它不能象笔试那样同时大面积进行,所以需要大量的时间和人力。(Heaton,2000:81)另外,口语测试属于主观性AM试,所以更加让改革者却步。本文认为,口语测试应该边实施,边改进。再笨拙的口语测试总比没有的好!社会的需要就是最大的改革动力。‘综观测试的改革和变化,人们总可以总结出一条规律:先改革,后研究。英国的普通教育证书考试、多项选择题的采用都证实了先有改革,后刁会有相应的测试研究。"(Wood,2001:F30)实际上,很多地区,特别是经济发达地区关于口语测试的实验从未停止过。早在1994年,南京师大接受高校外语专业教学委员会英语组的委托,Jf始了“个国英语专业口试可一行性研究”这一课题。(刘秋芳,1999:1)清华大学1996年进行的英语测试改革,针对本科生的英语1考试,以100分为摹准,客观题型占40%,其中听力理解占10%,阅读理解占20%,词汇占10%:主观题占60%,其中to试占15%,听短文回答问题占10%,阅读回答问题占10%,英译中占10%,作文占15%0(罗立胜,2002:9)“上海市参加高考口试的学生人数任逐年剧增:1999年参711上海市高考英语口试的考生4万3千人,2000年猛增至6万3千人!”(徐,次幸,2000:30)但到目前为止,对高考英语口试、专业英语口试研究得多,而对初中阶段,英语学习的起始阶段,更需要口试的阶段,实验少,研究更少!初中英语学习中,听说能力的培养是首位的。它强调英语教学要从听说入手,遵循听说领先的原则。这一特点也决定了初中英语测试中口试应该占有举足轻重的地位。否则,初中英语素质教育改革便步履维艰,甚至寸步难行。这一选题曾遇到不少质疑。例如:英语专业学生要求较高的口语水平,..\n.非专业学生能看懂就可以了;耗时费力的口试是浪费;口试的重要性人人皆知,可迟迟不能实施,是条件不具备啊;现在研究口试,不合“天时”、“地利”,也不会有“人和”等等。感谢我的导师陈佑林教授,他给了我充分的理解,鼓励我按自己的思路去做。第一章口语测试的研究成果综述口语测试的历史很长。早在公元前5世纪中叶,希腊出现了第一批职业教师—智者(Sophist)。他们从一个城邦到另一个城邦,传授知识,教授辩论术。(戴本博,1989:74)在当时,不管是教学的方法、内容还是检验学生水平的的方法,辩论都是主要的形式。可惜后来这一传统没能得到发扬。至于外语口语测试,在我国可以追溯到1865年:10月i1日到19日,京师同文馆的英语馆举行了第一次大考,并进行了口试。当时的口试是“密出汉语条子,令考生口译成外语”(付克,1986:17)这种口试方式在当时是先进的。也是符合当时外语教学培养翻译这一教学目的的。要对口语测试有一个全面的了解,还是要从语言测试的历史发展入手。1.1语言测试理论及口语测试的发展根据陈佑林教授的语言测试的讲义和杨惠中教授在《语言测试的设计与评估》(LanguageConstructionandEvaluation)中的导读,以及文秋芳教授1999土编的《英语口语测试与教学》,本文把语言测试的发展大致分为三个阶段:前科学时期(Pre-scientificPeriod).结构主义语言学时期(ThePeriodofStructuralLinguistics)和交际法语言测试IIf期(CommunicativeTestingPeriod).1.1.1前科学时期(Pre-scientificPeriod,1940s以前)这一时期的测试以传统对比语言学(Traditional&ComparativeLinguistics)为理论基础。以1-lermannPaul为代表的语言学家认为:书面语一言是最纯净的(purest),而口头语言是第二性的·(王立非,2000:1粗旦1而这一时期的考试只有书面测试,考试方式以翻译、写作为主,没有口语测试。因为这一时期的考试没有明确的理论指导,与练习没有明确区分,缺乏信度和效度,所以被称为前科学时期。1.1.2结构主义语言学时期(ThePeriodofStructuralLinguistics1950---1960)结构主义语言学认为:语言是由语音、词汇、语法构成的一个系统,这一系统是可以分解的。因此,可以设计出离散的题目(discreteitems),以逐项测验学生是否掌握了这些分解的元素。结构主义测试的典型题型为多项选择题。行为主义心理学对这一时期的语言学习、测试理论也有较大影响。行为主义心理学认为语言是一套习惯,语言测试就是对这种习惯的客观、科学的评价。这一时期口语测试开始出现,但由于“结构主义测试深受行为主义心理学的影响,强调测试的科学性、准确性和可靠性”(文秋芳,1999:33),而口语测试从测试方法到评分标准都不可避免地受人的主观影响,被认为是不客观,不科学的,故不受重视。这一时期的口语测试的题型为了能符合行为主义的科学、客观的要求,以朗读(readingaloud)、复述(retelling),补全对话(completingdialogue),看图说话(picture-cuedconversation)、口头报告(individualpresentation)和问答(answeringquestions)为主。结构主义口语测试通常采用的模式为单向表达和双向单回合表达,比较机械,而缺乏真实性和交际性。其评分方法通常采用从语音语调、语法、词汇、流利程度和内容等方面分项打分的分析法。结构主义口语测试评分的侧重点是语言的准确..\n.性和技能的熟练性。(文秋芳,1999:38-42)1.1.3交际法语言测试时期(CommunicativeTestingPeriod.1980以来)。“自七十年代中期起,语言测试界开始重视所谓总体综合法的研究。这一时期被称为语言测试的心理语言学和社会语言学时期(Psycholinguistic-sociolinguisticera)"(Alderson.2000:F12)英国的语言学家韩礼德(Halliday)提出了语言的七项基本功能:I具功能(Theinstrumentalfunction)、调节功能(Theregulatoryfunction)、代表功能(Therepresentationalfunction)、互动功能(Theinteractionalfunction)、个性功能(thepersonalfunction)、启发功能(theheuristicfunction)、想象功能(theimaginativefunction).(王立非,2000:21-22)自此,人们对语言的功能,特别是交际功能的研究越来越重视,交际法测试理论也随之出现。交际法测试理论指出,掌握一门语言指在一定的语境中能够使用所学语言进行有效的交际、交流思想,达到互相沟通的目的.巴克曼(LyleF.Bachman)的交际语言能力(communicativelanguageability)模式(Bachman.1990:81-109)被国际语言测试界广泛接受。这一时期的口语测试受到了越来越多的关注。下面重点讨论一下交际法口语测试的特点、常用题型和评分方法。1.交际口试的特点交际口试更加重视语言的社会交际功能,语一言使用的得体性和有效性。(文秋芳,1999:43)根据李筱菊(1997)、贾志高(1998)、秋月(1993)和徐强(1992)的观点交际法口语测试的特点可以归纳如下:(1)情境性:口语考试试题往往设置一个交际的情境,让考生明确各自的角色,从而考察考生使用语言的得体性。(2)交互性:结构主义口语测试中的信息交流属于单向或双向单回合交流,而在交际法口试中考生能就某个话题与考官或其他考生进行双向多回合的交流,不断地交换听、说的角色,从而完成交换信息的任务。(3)真实性:口语测试题应该体现出交际的真实需要。为此,交际双方之间必须存在信息差(informationgap),而且双方都有愿望通过交流,得到自己所需要的信息。口语测试的设计者应该结合考生的实际生活,设计出最大限度得接近现实的交际任务,从而最大限度地测试出考生在现实生活中可能表现出来的语言交际能力。(4)功能性:口语测试试题要突出使用语言的任务性,例如,使用语台表达感谢、不同意见,征求别人的意见等等。(5)综合性:交际法口语测试按照考生完成交际任务的综合效果来评定成绩,这主要体现在评分方法上。评分时,针对每一个等级给予总体描述,评分员根据等级描述和他对考生的总体印象确定其成绩的等级。2.交际法口试常用的题型根据交际口试情景性、交互性、功能性、真实性和综合性的特征,我从NicUnderhill的二十种测试题型(elicitationtechniques)中选出以下九种(Underhill,2003:46-76):(1)讨论/对话(discussion/conversation)这被认为是最自然、最真实的一种测试方式。理想的状况是交谈的双方或小组成员都很放松并充满信心,能主动开始谈话,提问题,表达不同意见,很接近于日常交谈。为了达到这一理想状态,考试的地点应该是一个学生感到亲切、愉快和熟悉的地方,例如教室、校园等,而不是一个紧闭着门的神..\n.秘的小屋:测试员要和考生应该平等相处,决不能摆出居高临下的威严架势,5最好测试员之一就是考生的任课教师。(2)考生与考生之间的共同讨论/做出决定(Learner-learnerjointdiscussion/decisionmaking)两个或更多的考生共同参加测试,讨论时不需要主持面试者的参与。考生们必须设法保证讨论顺利进行。一般给考生提供有简洁清晰的讨论的材料如文献、表格等。这种测试方式可以鼓励以学生为中心的学习方式。(3)角色扮演(role-play)给考生一个卡片或其他书面提示,定下一个具体的情景和各考生扮演的角色,另外给考生明确的交际任务。为了保证考生语言的输出量,任务的规定应具体,如“至少问三个问题”等。(4)面试(interview)面试是一种很常用的方法。它的特点是程序比较固定,每一步都是安排好的。主持面试者一直处于主动地位。其优点是测试的效率较高:主持面试者可根据情况改变话题或要求沉默者发言。我国的大学英语口试基本上属于这一方式。口语面试很适合考察中低水平的考生。它的一般步骤是:a.相互介绍,以轻松气氛。b.了解考生水平,进行系列提问和不同话题讨论,根据等级标准确定考生水平。c.检测评定,问一些高于和低于考生水平的问题,以确认评估准确。d.结束面试,与考生相互道别。(5)考生之间的描述和再创作(Learner-learnerdescriptionandrecreation)考生甲描述一个模型的设计或构造,考生乙利用他手中的材料,在没有看到模型原型的情况下根据描述重新构建该模型。考生乙可以提问以确认和得到更多信息。交际的成功与否看考生乙完成的准确程度。这一方式可检测考生描述事物的能力。由于同一模型不得重复使用,故它只适合班级内小规模的口试,而不宜用于大规模的口试。(6)填充表格(form-filling)这也是一种具有较高程度的真实性的口语测试方式。考生回答考官的询问,提供有关个人的信息,如姓名、年龄、住址、爱好和喜欢的食品、音乐电视节目和度假方式等。它的变式是由考生互问互答,完成表格的填写。(7)做出适当的回应(makingappropriateresponses)为考生提供一系列短小、不相关的情景,这些情景可以从日常生活中选取如游客问路、事后道歉等。考生被要求设想处于每种情况下并提供他认为恰当的口头回应。这种方式适合测试学生对语言的功能的掌握情况。(8)使用图片或图片故事(Usingapictureorpicturestory)在测试前给考生一张图片或图片故事,让考生准备2分钟。然后让考生描述他手中的图画或叙述图片中的故事。在考生叙述完之后考官可以就图片问几个事先准备好的问题。当然还可以让考生甲、乙互相提问,搞清楚对方图画或故事的内容,再向考官汇报,更能使测试活动具有明确的任务性,因而更具有真实性。对于刚开始学语言的幼儿,还可以利用图片说词汇,但这经不太具备交际的真实性了。..\n.(9)给出说明/描述/理解(Givinginstructions/description/explanation)给考生少量的准备时间((2分钟),让考生描述一个大家熟悉的物体或常活动,然后进行讨论。也可以让考生陈述个人的观点和态度,然后与考官或其他考生进行讨论。由于日常聊天我们常常要描述我们的所见所闻所思所以这类题目具有一定的交际性和真实性。当然,以上各种题型也可以根据实际情况进行一定的变化,或者两个或几个题型结合起来使用。3.交际法口试的评分方法交际口语测试的一般采用等级评分制,即按照交际的有效程度,将考生的水平分成等级,每个等级均有总体概述。它描述的不是在语言、语法、词汇等各方面的特征,而是对每个等级水平的交际总体特征。下面以英国的国际英语考试中心对C7语水平九个等级的文字说明为例(许强,1992:145-146):9.Expertspeaker:Speakswithauthorityonavarietyoftopics.Caninitiatexpandanddevelopatheme.8.Verygoodnon-nativespeaker:Maintainseffectivelyhisownpartofdiscussion.Initiates,maintainsandelaboratesasnecessary.Revealshumourwhereneededandrespondstoattitudinaltones.7.Goodspeaker:Presentscaseclearlyandlogicallyandcandevelopthedialoguecoherentlyandconstructively.RatherlessflexibleandfluentthanBandSperformerbutcanrespondtomainchangesoftoneortopic.Somehesitationandrepetitionduetoameasureoflanguagerestrictionbutinteractseffectively.6.Competentspeaker:Isabletomaintainthemeofdialogue,tofollowtopicswitchesandtouseandappreciatemainattitudemarkers.Stumblesandhesitatesattimesbutisreasonablyfluentotherwise.Someerrorsandinappropriatelanguagebutthesewillnotimpedeexchangeofviews.Showssomeindependenceindiscussionwithabilitytoinitiate.5.Modestspeaker:Althoughgistofdialogueisrelevantandcanbebasicallyunderstood,therearenoticeabledeficienciesinmasteryoflanguagepatternsandstyle.NeedstoaskforrepetitionorclarificationandsimilarlytobeaskedforthemIacksflexibilityandinitiative.Theintervieweroftenhastospeakratherdeliberately.Copesbutnotwithgreatstyleorinterest.4.Marginalspeaker:Canmaintaindialoguebutinaratherpassivemanner,rarelytakinginitiativeorguidingthediscussion.HasdifficultyinfollowingEnglishatnormalspeed;lacksfluencyandprobablyaccuracyinspeaking.Thedialogueisthereforeneithereasynorflowing.Nevertheless,givestheimpressionthatheisintouchwiththegistofthedialogueevenifnotwhollymasterofitMarkedLIaccent.3.Extremelylimitedspeaker:Dialogueisadrawn-outaffairpunctuatedwithhesitationsandmisunderstandings.Onlycatchespartofnormalspeechandunabletoproducecontinuousandaccuratediscourse.Basicmeritisjusthangingontodiscussiongist,withoutmakingmajorcontributiontoit2.Intermittentspeaker:Noworkingfacility;occasional,sporadiccommunication.1/0.Non-speaker:Notabletounderstandand/orspeak...\n.“测试体系虽然在历史上有产生的先后顺序,但这并不意味着消亡的顺序。特别从实践的角度来看,新旧体系可能共生共荣,可能此起彼伏,也可能相互交融。”(文秋芳,1999:35)尤其是在我国现阶段的实际外语教学中、外语测试中,没有纯粹的结构主义、交际法之分。由于我国的现实条件和已有传统,这两种测试方式是混杂在一起的。为此,在借鉴西方的先进的理论时,宜紧密结合我国的现实,否则,邯郸学布,无所适从了。1.2.口语测试的评估要了解一次口语测试成功与否,或多大程度上成功,就需要对之进行评估对一次测试的评估,传统上从信度、效度、难度和区分度等四个方面进行。也有人提出加上一条“教育性”。我认为,一次效度较高的测试本身就是与测试目的,从而也是与教学思想相吻合的,其教育性自然很强,所以加上这条没有必要。1.2.1信度(reliability)对口语测试最大的指责是信度不高。信度指测试的结果的可靠程度。(王道俊,1989:298)如一个测验在反复使用(同样对象)或以不同方式使用仁如换成等值试题进行)都能得出大致相同的可靠结果,则说明它的信度高。信度的影响因素有测验的长度、试题的指导语是否清楚、考生的状态、测试时间、评分标准,评分员的状态等等。在口语测试中,评分员打分时是否保持一致,即是否具有评分员内部信度(intra-markerreliability)?不同的评分员对同一份试卷打分是否一致,即是否具有评分员间信度(inter-markerreliability)?这是口语测试信度保证的最关键的因素。1.2.2效度(validity)效度是指测验达到测验目的的程度,即是否测出了它所要测出的东西。(王道俊,1989:298.)要保证测验的效度,首先要有清晰的测验目标。另外它与测试方式有关。如客观性测试宜于判明学生的知识掌握情况,不宜测定他们的能力发展水平。(王道俊,1989:298.)口语测试是要测出学生运用口语进行跨文化交际的能力,所以不宜采用客观试题,而采用以主观试题为主的测试方式,例如面试(interview).效度又分为表面效度(facevalidity)、内容效度(contentvalidity),结构效度(constructvalidity)、同期效度(concurrentvalidity)和预期效度(predictivevalidity).表面效度是指测试表面上看是否像一次理智的测试?了解表面效度的最好方法就是问测试者和考生以及授课教师,他们认为好不好。如果他们认为不好,测试则不可能有好的效果。内容效度指测试的项目和任务是否与测试总体目的相符,测试中生成的语言与教学计划的内容相比是否一致。所以明确的教学目标、计划很重要。结构效度是指测试是否与其理论一致。这次测试是否与你对语台学习的观点相一致?实际上,结构效度与内容效度联系很密切。同期效度是指同期举行或者时间前后相隔不远的两次或多次测试的成绩是否一致。一般测试的方式应该是一样的,例如两次都是口语测试。预期效度是指这次测试是否能反映考生将来语台实际运用能力的情况。但预测效度很难解释:因为有很多因素都会影响考生在将来的能力和表现。1.2.3难度..\n.难度是指测验包含的试题的难易程度。试题过难、过易都不易测定考生的真实水平。做到难易适中的方法是难、适中、易的题目各占一定的比例,如l:3:6。另外,还要注意难易搭配,由易到难,以便准确地测定考生的最高水平。进行口语测试时,测试员的提问应该由易到难,逐渐达到或略超过考生的最高水平,然后再降低问题的难度,让考生恢复信心。测试的程序安排,要先进行简单的项目,如朗读、自我介绍等,再到小组讨论等挑战性较强的项目。1.2.4区分度区分度是指测试对考生的不同水平能够区分的程度.一次好的测验学生的成绩应该呈正态分布。区分度与难度有关,难易适中的试题往往有良好的区分度。它也与题型、内容有关。题型怪诞、内容与测试目的相去甚远,则不但不能区分优、差生,还会颠倒黑白。口语测试属于分级测试,主要衡量学生是否达到一定的标高,区分出及格、不及格和优秀即可,对区分度要求不是很高。这也是主观性评分的要求:第二章初中英语口语测试2.1初中英语口语测试目的要回答这个问题首先要回答英语学习的目的是什么。如果追本溯源的话,就要问到什么是语言的问题。所以李筱菊(1997)和文秋芳(1999)都指出任何测试的背后都有一定的语言观和语言学习观在指导着。王立非(2000)在总结了以前的语言学大师的种种定义以后指出,目前,人们普遍接受的语言的定义是:“语言是一个为了人类的交际而存在的一套任意的声音符号系统。”(王立非,2000:23)语言的本质就是为了交际活动的顺利进行而存在。学习语言就是要获取运用语言进行交际的能力。在我国学习英语,不仅是养成交际能力,更要是养成跨文化交际的能力。文秋芳教授在总结了卡内耳一斯魏恩(Canale&Swain,1980:1-47)的交际能力模式、巴克曼(Bachman,1990:81-109)的交际能力模式和李筱菊(1997)的交际能力模式的基础之上,提出了跨文化交际能力(Cross-culturalCommunicativecompetence)模式。(文秋芳,1999:9)(见下图表)具体到初中英语教学的任务,我的理解是:(1)学生传输尊重不同文化,适应不同习俗的态度(即“入乡随俗”“见啥人说啥话”):(2)掌握基本的语法知识和运用语法知识组织语言表达感情、传递信息的能力;(3)培养语言前后衔接、连贯的能力;(4)得体地运用语言的能力,使言语符合自己的身份和当时当地的环境;(5)在交际困难时能通过询问、重复、运用副语言(手势、表情等)、拖延等策略使交际得以继续的能力。初中英语口语测试目的就是要测出学生以上五种能力的发展水平。跨文化交际能力Cross-culturalCommunicativeCompetence跨文化能力交际能力..\n.Cross-culturalCommunicativeCompetenceCompetence语言能力语川能力策略能力敏8性}宽容性灵i云性LinguisticPragmaticStrategicCompetenceCompetenceCompetenceSensitivityIToleranceFlexibility2.2初中英语口语测试的内容初中英语口语测试的目的定下来了,口试的内容就要体现这一日的。由于口语测试更重视地方文化色彩和学生的个性表现,所以没有必要规定一个非常明确的、全国统一的考试内容。《新标准》对初中说的要求较抽象以三级要求(相当于初一学完应达到的水平)为例,归纳如下:1.口语活动中语音、语调基本正确;2.运用日常用语(如问候、告别、致谢、致歉等用语),能就个人情况和个人经历交谈,能表达简单的情感或感觉〔如喜欢或不喜欢);3.英语歌曲15-20首,能背诵一定数量的歌谣、小诗,能讲简单的小故事;4,根据图片提示简单地描述一件事情或进行对话;5.教师的指导下进行简单的游戏和角色扮演活动;当然,一个地方的口语测试内容可根据这些抽象的描述和本地区英语教育使用的教材,制定更详细的考试大纲,例如详细要求会描述哪类图画,做哪些游戏,讨论哪些话题等。2.3初中英语口语测试的一般方法根据1.1.3.2“交际法口试常用的题型”的讨论,结合初中英语教学的现买,我选择了朗读(readingAloud)(这应该属于结构主义口试的范畴)、根据图片讨论(talkingaboutpictures)、角色扮演(card-cuedrole-play).自我介绍和1刁常会话(self-introductionandeverydayconversation)和小组讨论\group-discussion)等五种题型。每个年级又可在这五种题型中选择3-4种进汀口试。由于各年级对学生的口语水平要求不同,测试的重点也不同,所以呀种题型在不同年级还应该有不同的权重。各种题型权重的确定的标准有:1.多大程度上适合于初中学生的水平;2、测试的信度、效度;3、是否有利于i!=作。例如在初中一年级,学生的语音语调和日常会话能力是口语训练的重点,初一的题型和权重可以初步这样定:朗读占30%:角色扮演占20%;自我介绍和日常会话占30%;图片讨论占20%.2.3.1朗读(readingaloud)朗读可以检查考生对语音、语调、意群的掌握及流畅地大声阅读的能力。《全日制义务教育、普通高级中学英语课程标准(实验稿))}〔以后简称《新课程标准)))中对朗读有明确的要求,如二级标准中,“……并养成按意群阅读的习惯;能正确朗读所学故事或短文”二三级要求:“能正确地朗读课文,”;四级:“能连贯、流畅地朗读课文。”;“能在上述口语活动中正确的语音、语调”;五级:“能在以上口语活动中语音、语调自然、语气适当”。(《中小学外语教学》2001,11)(可见,正确、自然的语音、语调的培养是初中英语教学的重点之一,不可忽视,自然也该是考查的重点之一。测试时一般提前1分钟给考生朗读材料(可以是音标、单词、句子、对话和短文)。结构主义口..\n.试把朗读能力分成各种技能:既有对语音、语调、重音、重读、连读和意群等朗读知识和技巧的考查,又有对考生理解对话人交际意图,用语音、语调表达感情的能力的考查。经常用英语进行交际的学生朗读起来更富有感情色彩,更具有生活味道的、自然的语音语调。不常使用口语会话的考生的英语则会显得僵化。以对话作为朗读的内容在一定程度上克服了朗读的缺点:i.B.Carroll:“手持闪闪发光的高尔夫球棒的人并不总是赢球。(It'snotalwaystheplayerwiththeshinestgolfclubswhowinsthegame.)”(董晓红,1995)‘懂得了各项朗读知识,不一定能在实际活动中加以运用,朗读水平不能代表交际能力的发展水平。这只说明了朗读不宜单独用来进行口语测试,但作为口语测试的一部分,如果运用得当,效果会很好。因为它具有时间统一、内容统一、操作方便、可重复评分的优点,既便于大面积实施,又有较高的信度,很适合初中英语{〕试的要求。另外,朗读特别适合对英语刚入门的考生,如初一学生。对他们来说,养成正确的发音习惯非常重要。为避免考生背诵,朗读材料不能照搬学生的教材,要接近考生生活实际。如下例:Mary:Goodmorning,Mr.An?Mr.An:Goodmorning,MissSmith.Mary:I'msorry.I'mlate,butthismorning……Mr.An:Youarealwayslate……Mary:ThismorningMr.An:MissSmith,pleasebehereat8o'clock,or1'1lcallyourfatheragain!Mary:Yes,Mr.An.2.3.2图片讨论/描述(talkingabout\describingpictures)“有时用一张画,有时用一组画。应让受测者有几分钟时间作准备,然后进考场。用英语描述画中的内容或者根据图画编出故事,口头讲出来。”(高兰生,1996:183)对图画的描述能力和讲故事的能力在《新课程标准》中有明确的要求,如三级:"4,能利用所给提示(如图片、幻灯片、实物、文字等)简单描述一件事情;·一6,能讲述简单的小故事;”,又如四级:“3,能在教师的帮助下或根据图片用简单的语言描述自己或他人的经历;”等。图画要精心选择,以帮助控制考生需用的基本词汇和句型。图片可有广告、招贴画、卡通画和场景画等,让学生描述或叙述。如在初一阶段可选择一幅风景画,让考生用“therebe”的句型;也可选一幅生活画面,己考生用现在进行时态和一般现在时进行描述。如果给不同的学生不同的图画,让学生通过讨论,找出图画的差别,或者通过问答,了解对方的图画,则这一测试方式就更加具有交际性了。2.3.3角色扮演(card-cuedrole-play)《新标准》对初中英语教学中的说明确提出:“能在教师的指导卜进行简单的游戏和角色扮演活动”(三级);“能表演简单的童话剧”(二级);“能用英语表演短剧”(五级)。一般测试的过程是用卡片(有汉语或英语提示)或图片告诉考生所处的情境及交际的任务(让他干什么)。例如考生甲手中有-..\n.张卜片,上面列有需要采购的食品,考生乙的卡片是一张价格表。两位考生拿到卡片之后各准备2-3分钟,但两人不许商量。然后两考生分别扮演店员和顾客,运用所学的英语使购物活动顺利、愉快地进行石卡片如下:一卜片A卡片BPricesrice:meat¥0.5/kg¥3/kgbanana:onion:'Y1.0/kgY4.0/kgchicken:milk:Y12/kg¥0.8/bagcarrots:¥1.5/kgpears:Y2.0/kgeggs:Y3.0/kg:Y1.0/kgcoke:Y2.0/bottle由于这是一种很好的以任务为中心的交际法口语测试的方式之一,采用这一测试方法对英语教学有很好的反拨作用。2.3.4自我介绍和日常会话(self-introductionandeverydayconversation)自我介绍、日常问候和询问、讲述家庭背景、兴趣爱好等,比较简单。用英语进行日常会话是最基本的能力。《新课程标准》一级中明确要求:"2能相互致以简单的问候;3,能相互交流简单的个人信息,如:姓名、年龄等4,能表达简单的情感和感觉,如:喜欢和不喜欢;”,二级中明确要求:"2能就所熟悉的个人和家庭情况进行简单对话;3,能运用一些最常用的日常套语(如问候、告别、致谢、致歉等):”,三级要求:"5,能提供有关个人情况和个人经历的信息;’,。自我介绍和日常会话常用于面试开始时。它既可考查考生运用英语进行基本的会话能力,又可起到热身(warmingup)之功能,使考生逐渐地轻松起来,以便在后来的口试活动中自由、充分地发挥自己的水平。自我介绍和日常对话在2-4个考生之间进行,以显得更加自然、真实。(一般安排在同组的考生来自不同的学校或班级,互不认识,所以存在信息差。)例如:(注:T1:考生1:T2:考生2;T3:考生3)TI:MynameisWangMing.Mynumberis20021208.T2:MynameisLiuLi.Mynumberis20023306.T3:MynameisZhangXiaomei.Mynumberis20026105.TI:Hi,ZhangXiaomei!Hi,LiuLi!Nicetomeetyou!T2,T3:Nicetomeetyou,too.TI:MyEnglishnameisRobert.IcomefromXiangfanNo.4MiddleSchooDoyouhaveEnglishnames?T2:MyEnglishnameisLucy.IamfromXiangfanNo.7MiddleSchool.IlikEnglish,andIlikelistingtoEnglishsongsaswell.Bytheway,whatareyohobbies,ZhangXiaomei?T3:YoucancallmeRebecca.IamfromXiangfanNo.3MiddleSchool.Mhobbiesaredancing,watchingfootballgamesandshoppingsometimes.Wh..\n.aboutyou,Robert?2.3.51)、组讨论(groupdiscussion)在进行完个人介绍、日常对话之后,紧接着进行小组讨论效果会更好。一般小组由3-4人组成,考官提出某个话题之后,退出交谈,考生围绕该话题发表各自的意见。话题要符合学生的现实生活,以免过于抽象,学生无话可说。讨论要在友好、合作的气氛中进行。虽然对思维流畅、表达灵活的考生以高分,但不鼓励一言堂,对考生引导他人发言成功者予以加分,因为这z然更符合日常交际原则。如有必要,考官可以在适当的时候插入,给没有表现出自己水平的考生以发表意见的机会,以确保侮位考生都表现出自己的最高水平。如果考官认为己经足以看出每个考生的口语水平,可宣布考试结束,与考生道别。由于口语测试重点是考察考生成功地进行交际的能力,所以对其观点的正误不应予以过多重视。“模棱两可的表述,话语意思含糊不清,缺乏中心主题都是平时聊天的特点”(Underhill.2003:48)但这并不否认对有明确观点,有很强说服力的考生的肯定。2.4初中英语口语测试的注意事项].创设轻松自然的气氛,使考生能充分地发挥。2选择安静的环境。3.如果考试的规模大,注意考试内容的保密,有时需要几套等值的试题,使上午与下午的试题不同,第一天与第二天的试题不同。第三章初中英语口语测试的评分标准及操作3.1评分方法评分的方法根据评分的方式可分为两种:分析评分(analyticmarking)和综合评分(holisticmarking)或Qt{印象评分(impressionmarking)(文秋芳,1999:7邻分析评分是根据学生的表现,从语音、同汇、语法、流利程度和总体可理解程度逐项评分,然后相加得出总分。其特点是信度较高,诊断性强。评分标准容易把握,对评分员要求不是太高。但它明显的缺点是费时,而且对学生的交际能力的表现重视不够。所以分析评分法比较适合对结构主义曰语测试进行评分。本次实验对朗读就采用了分析评分法。综合评分是按考生交际的有效程度的总体印象给考生打分。它适合于交际法等级评分制,所以初中英语口语测试的评分主要采用综合评分法。3.2评分员3.2.1评分员选择的标准日语测试的评分员往往同时担任测试员,其责任重大。所以评分员的选择一定要严格。评分员工作具有即时性〔有时需要当场打分),艰巨性(工作时间长,且需要精力高度集中)和责任大等特点。根据这些特点,好的评分员起码要具备下列条件:1.有一定的发音质量;语音、语调清晰、自然,没有本族语口音;能对较广泛的话题进行流畅、灵活的、连贯的交谈。这是对评分员口语水平的基本要求。2.对测试理论有相当程度的理解。这是对评分员理论水平的要求。3身体健康,性格热情、开朗。4.热心于口语测试工作。3.4条是保证评分员内部效度的要求。..\n.5.熟悉初中英语教学。6.通过一系列的培训课程,在口试工作中表现稳定,较少失误,没有重大失误。3.2.2评分员培训的课程和计划安排培训课程包含测试理论和评分经验的积累。培训的计划可以一次两个小时,每周一到两次。下面是根据NicUnderhill的培训计划改编的:1.理论学习((1小时)。学习测试原理,测试的目的、方法和常见问题,测试的信度和效度原则。培训的方式为讲座。2.学习测试的引导和提问技巧,评分的要求几评分的等级。评分的等级可以参考公开出版及标准参考书中的评分等级,也可以是改编后的等级标准。时间为2小时,培训的方式是讨论。3.根据录音评分、讨论。根据前面学习的等级标准给考生的口试录音打分,然后一起讨论,直到达成一致意见。4.试测,录音、讨论。培训的重点是测试员对引导技巧和评分等级的掌握。第3,4步在以后定期进行。3.3评分等级在参考了《新标准》的要求和其他日语测试的等级描述之后,我对三级(相当于初中一年级学完时应达到的水平)日语测试的标准描述如下:3.3.1对朗读的分析法评分的等级描述:优秀及格41及格语气有0-4个错误,但不影响听者有5-10处Mix.基本不影响听错误很多,听起来怪腔怪卑词发音理解。者理解。调,听者不能理解。济晰,签本没有汉语口音(如发音较清晰,有一些汉语口音,完全是汉语日音,或怪腔语音词尾辅音重,辅音连缀中加有但不严重.怪调。元音等).语its自然,重音、重读、连读重读、弱读区分较明显,但有一重读和弱读小明显,象数的处理正确,意群间的停顿合些错误,连读、失去爆破的习惯豆子.不会处理连读和失飞吾调理,升、降调正确、自然。尚未完全养成,升、降调和意群去爆破,停顿大部分不仓停顿不够好。理。语速朗读流畅,基本没有不必要的朗读较流畅,有2巧处不必要的不流畅,停·项较多.停顿。停顿。3.3.2对角色扮演、看图讨论、日常会话、小组讨论的等级描述。由于这四项测试方式交际性较强,所以更适宜采用综合评分法。优秀可以就10个左右的话题较流畅地交谈,能引起、扩展话题。表达清晰,有时不太灵活,但前连贯,较自然地运用英语进行交际。有时有些犹豫,但仍能成功地完成交际任务。及格..\n.不时有停顿、犹豫。错误较频繁、但基本可以听值,有时需要重复一下。缺乏灵活性和主动但基本上能完成交际任务.不及不能理解别人和被理解错误太多,停顿频繁,只能就话题说一两句机械的话。话语不连贯格合会话原则,基本上不能使交际进行下去。对“有时”、“较多”、“频繁”、“太多”等描述语的把握,唯一的办法通过评分实践,取得真实的理解。例如,针对单词发音的错误,朗读130的对话,错误不超过3%(4个)称:“有时”;如果错误在3-10%(4-13个已经证明其英语朗读水平不太好,可称为“较多”;当错误在10-30%(13-个)己经可以称为“频繁”,因为这时己经使听者难以理解了;错误在30%上时可以称为“太多”,让人无法忍受了!当然,对于停顿、犹豫等的频繁可以用另外一个比例了。从以上标准可以看出,初中口语测试对初一年级学生的要求并不太高这有可能使口试在起始阶段让学生对自己充满信心,教师对教学充满信心随着学生的口语水平的提高,对学生的及格水平标准要更高一些。3.4评分的信度“口语测试迟迟得不到广泛推广,除了测试工作量大之外,还因为口语试评分最主观,信度往往较低。”(刘润清,1991:198)但也有学者提出同的观点。如英国的NicUnderhill认为,“口语测试,因其需要由人做出观判断,信度有可能会受到影响;但本书同时指出评分中的人为因素恰恰得口语测试更有价值和更可取。当我们检测一个人运用外语的能力时,我是想了解他与他人的交流能力而不是设立一个被称为语言测试的人造标。·一我们就将最佳测试适合某个特殊语境的理念作为切入点,在人和计学方法之间寻求平衡.”(Underhill,2003;6)为了达到这一目标,Underhill提出了以下提高评分信度的措施:1评分人数(Thenumberofassessors)“角q决评分中缺乏信度的唯一最有效的方法是采用两个以上评分人参加。"(Underhill,2003:97)在测试结束后,两个评分人可以通过协商给一个共同的分,或者两个人分别给分,取平均分。由于初中口语测试只有三个等级可以采用各自评级,一致则罢,不一致则通过协商解决,有时需要由评分组长协调。I.评分人的选择和培VII(Theselectionandtrainingofassessors)通过评分员的选择和培训,可以保证评分员间信度(inter-markereliability)和评分员内部信度(intea-markerreliability).3.录音评分(markingrecordedoraltest)有了录音,对有争议的考生可通过录音再评分,以达成一致意见。还可以通过录音随机抽查以确认评分信度。4.制定评分标准(markingprotocols)预先尽可能详细地制定出评分标准,使每个评分员知道对每个问题和每项任务如何打分。无疑,这会使评分过程更快,信度更高。j.评分类别(markcategories)评分类别即评分人逐项打分。这主要是针对分析评分法。例如,给考生的朗读评分,评分员甲可给单词发音和语音两项打分:评分员乙给语调和语速两项打分,然后将分类打分的成绩加在一起给出总分。这样评分人的注意..\n.力集中在更少的语言技能上,从而提高评分的信度。6.加权(weighting)利用分类评分方法为口试评分比较容易,而且稳定,但我们知道各个项目并非同等重要.为了准确地反映考生水平,应该给不同的项目以不同的权重。例如,语音(10X2),即权重是2;语调(IOX3),即权重是3;单词发音(10X3);语速(IOX2)e7.评分等级(ratingscales)评分等级是对一系列不同水平语言能力的描述。评分等级越少,则评分越易,评分的信度越高。例如采用三个等级(优秀、及格和不及格)比采用九个等级,评分更能保证信度。另外,对级别的描述宜简洁明了。通过评分实践,修改等级描述,把不必要的描述去掉,以使评分员在打分时可以较容易地把握住评分标准。8.凭印象评分(Impressionmarking)凭印象评分又称为综合评分。它的优点是快捷而月_能准确地反映考生的交际能力。“认真仔细地凭印象评分是实际生活中最直接最具有权威的反映,这在口试中是可行的。”(Underhill,2003:110)但印象评分法需要评分员有较高的语1彗水平和丰富的评分经验,否则反而不能保证评分的信度第四章初中英语口语测试的实验及结果分析4.1口语测试的实验4.1.1试卷的制定任何测试都是围绕试卷进行的。因此,命题是保证考试质量最重要的一个环节。要保证初中英语口语测试试卷的质量,除了要对测试理论有一定的理解,还要吃透《新课程标准》,了解学生学习中的困难,在此基础之上选择合适的考试内容和形式。如果可能,测试的内容要尽量接近学生的日常生活,与其环境相符。例如,针对乡村的学生和大城市的学生,测试的题目应该有所区别。下面根据第二章第二节对初中英语口语测试的内容的分析,以初二年级英语口语测试为例,谈谈试卷的制定。1.朗读:朗读的内容可以是对话、儿歌、童谣、小诗、小故事等等。鉴于口语测试的目的是通过朗读来评价学生在日常交际中的语音、语调是否正确,话语的感情色彩是否得体,本次口试实验设计的朗读材料取自于学生日常生活的对话。(见后面的“附件2”中的第一大题。)2.角色扮演:角色扮演是一种典型的以任务为中心的模拟交际活动。根据学生所学的教材,我们可以挖掘出许多这种活动,购物、相互介绍、师生对话、同学聊天、结交外国朋友、电话请假、电话约会等等。只要话题不超出学生所学范围,这些都可以作为很好的角色扮演活动。3.日常会话:考官可以根据具体情况和学生进行一些真实的交流。例如,和学生互致问候,让学生做简单的自我介绍,了解学生的老师、谈论天气和学生的兴趣爱好等。4.1.2实验样本的选择由于条件的限制:一方面是时间仓促,又没有实验经费,另一方面,口语不作为中考内容,绝大多数学校不愿进行这方面的实验,本次实验样本不可能做得很大,选择的是襄樊市襄阳区双沟中学初二年级1700多人中随机抽出8%的学生,共计136人。..\n.4.1.3实验的环境控制口试教师的选择:安福勇、梁志爱、周开书、陈寻和周香林。以上几位教师的英语表达水平相对较高,如果再进行一定的口语测试理论和实践培训,可以成为合格的考官。另外,几位教师都有丰富的中学教学经验,对中学教学内容和学生水平很了解。口试时间:英语口试一般不超过30分钟,否则引起学生和口试教师疲劳。时间最短不宜少于5分钟,否则学生不能充分地表现自己的口语水平。“经验表明,10分钟到15分钟就足以全面地了解考生的口头表达能力。”(胡春洞,1996:179)其中朗读准备和朗读分别为1分钟;角色扮演的准备时间为2分钟,进行时间为5分钟;日常对话的时间为2--5分钟。口试的设备:语音室和教室(一个大教室做候考室,一个小教室做备考室,另外两个小教室做考室)。4.1.4实验的具体操作2003年1月22日至24日,笔者在双沟中学对初一6名学生实行了试测。为了避免学生出现紧张情绪,预测以“口语培训”为“掩护”,使学生比较坦然地表现自己的口语水平,另一方面,又可以在测试前让学生熟悉口语测试的过程和形式,避免因缺乏应试技巧而不能正常发挥其水平。参加预测的6名学生来自不同的班级,水平也各有不同。测试的题目的内容和难度以初一上学期的人民教育出版社的英语教材为主要的参考对象。2003年2月19日至22日,在双沟中学进行了正式的口语测试。2003年2月19日—20日,笔者把口语测试的目的、交际法口语测试的主要思想、评分标准及考官常用语、常问的问题拿出来,与梁志爱、陈寻、周香林、周开书四位老师进行讨论,取得共识。然后找6位学生进行试测,讨论测试的实施过程及评分结果,统一评分标准。2003年2月21日上午9:00--9:40进行录音测试。参考学生先在备考室(校阶梯教室),主考官讲解考试程序、注意事项;然后由梁志爱老师组织学生抽取朗读试题,准备1分钟,进语音室,由周开书、陈寻老师组织学生入座,帮助学生正确使用录音设备,保证录音质量。2003年2月21日上午10:00---11:40;下午2:00-5:30;2月22日上午9:00-11:40及下午2:00-5:00进行面试。面试分两个考室,分别由笔者和陈寻老师任主考,周开书、周香林老师任副主考。梁志爱老师组织、编组(两人一组,根据学生平时成绩编组,原则上让成绩接近的学生为一组,便于学生配合,充分发挥其水平),安排学生进入相应的考室,并让考完的学生填写调查表格,同时不与未考学生进行交流。学生先在梁志爱老师处抽题,进入备考室,准备2分钟,但不允许互相讨论。2分钟后学生进入考室。主考官先要求学生进行自我介绍,然后进入日常会话,接着要求学生进行角色扮演,最后与学生道别。如果学生之一没有能力配合,主考官则扮演该学生的角色,与另一学生进行表演,确保每个学生表现出最佳水平2003年2月22日晚上6:00-10:40,分两组给朗读录音评分,两位考官一组,评分后同组考官比较分数。因为没有出入,不再抽查。两组交换录音,随意抽出6位学生的录音进行评分,然后进行对比。因为没有出入,不再重复评分。4.2结果分析4.2.1结果统计..\n.(1)预测的结果:1一一一一一一一一一~优秀及格不及格一一一一一一一一~总体成绩141朗读330角色扮演042日常会话及图片讨论l4】这里有一个新问题:有一位学生角色扮演不及格,但总体成绩为何是及格?还有一位学生的角色扮演及格,但总成绩为何是优秀?另有两位学生朗读成绩优秀,为何总成绩是及格?朗读、角色扮演和日常会话及图片讨论这三项成绩不一致,如何量分,确实是我预先没有想到的一个难题。根据交际测试评分方法的思想,笔者把后两项作为一个整体来量分,即给一个总体的印象分。对朗读部分的量分仍然按照结构主义评分方法,先分项打分,再根据各项的权重进行计算,得出朗读的总分。如果一个学生的朗读是优秀,后两项的总分也是优秀,则其总体成绩就为优秀;如果这两个分数均为及格或者有一个是优秀,另一个是及格,总体成绩则为及格;如果这两个分数有一个为不及格,则总体成绩为不及格。(2)正式测试结果:(总参加测试人数:136人)优秀及格不及格一一一一一一一一一一总体成绩9(6.5%)59(43.5%)68(50%)朗读17(115%)115(84.4%)4(3.1%)角色扮演、日常会话及图片讨论13(9.5%)55(40.5%)68(50%)(3)问卷调查结果:对参与口试的学生的调查表:1、难易程度1、很难2、较难3、适中4、不太难5、一点儿小难评价朗t卖5(32%)6](45.1%)6](45.1%)9(6.5%)角色扮演26(18.7%)72(53.1峋30(22010)8(6%)自我介绍与日常会话82(60%)41(30%)13(10%)2、对准各时1、报本不够2,不太够3、适中4、较多5、太多了间的评价36(267移毛)91(66.7%)9(6.6%)3,紧张程度I,很紧张2,较紧张3、一般4,不紧张5根本小紧张一语音室录音34(250!0)55(40.60!0)43(31.2%)4(3%)面试6(4.5%)41(30%)45(33.3%)44(32.2%)!、根本不能发2、发挥了3,发挥80%的4、发挥了自己4、水平发挥挥自己水平50%的水平水平的水平的程度13(9.3%)72(53.1%)51(37.6%)4.2.2信度分析朗读部分:同组的两位考官在及格、不及各、优秀的评分上没有一例冲突,而在及格+·、及格一(分别代表及格中的较好、较差)的判断上有一些分..\n.歧。这说明:评分等级较少,如三个,则评分较容易,信度较高;随着评分等级的增多.如五个,评分的难度加大,评分员间信度下降。交换录音评分,两组间评分,以三个评分等级来看,没有一例出入。面试部分:以三个评分等级来操作,同组的两位老师的量分没有一例出入。由于对同一学生连续进行两次面试不妥当,所以不同组别之间没有进行评分对照。由于没有进行第二次口试,学生的表现是否稳定无法确定。但从书面调查来看,超出一半的学生认为没有发挥出自己的应有水平,也就是说,如果两周后再进行一次类似的测试,或者用另外的题型进行测试,他们认为自己的成绩可能提高。原因分析:1,学生对考试形式不熟悉,没有任何应试技巧,致使水平可能没有正常发挥;2,学生因未得到口语训练,口头表达能力极差,他们对自己的口语水平极为不满。例如,有近三分之二的学生对考官的“Goodmorning.\Goodafternoon."等问候语无动于衷,在考官重复该问候语后仍然女有反应。如果让他们做选择题,他们肯定会选出“Goodmorning.\Goodafternoon.”这一正确答案的。在与教师的座谈中,大部分教师认为测试的成绩基本上反映了学生的能力水平,但同时教师们也指出,如果有针一对性的进行一周每天半个小时的训练,学生的口语水平肯定会有较大提高。4.2.3效度分析任何测试是否有较高的效度,是针对某个测试目的而言的。(Anytestmaybevalidforsomepurpose,butnotforothers.)(Alderson,2000:170)对这次口语测试的效度分析也是针对测试初中生的运用英语进行交际的能力这一目的来展开讨论的。表面效度:在与参加口语测试的学生的英语老师们的座谈中发现,老师们对这次口语考试的形式很满意,认为只有这样才可以考出学生运用英语进行口头表达的能力,认为考试的结果比较能反映出学生的口语水平:学生们对自己的考场发挥虽然不够满意,但也认为如果经常进行这样考试,老师就会重视口语训练,他们的口语水平肯定能够提高很快。内容效度:从测试的任务设计来看,这次口试与测试的总体目的是一致的。例如,角色扮演的任务有:同学间的聊天、中国学生与外国学生交朋友、购物等,这些都是模拟学生生活中可能出现的交际活动,因而对测量学生的英语语言交际能力是有效的。第五章结论51口语测试实验结论:1、这次口语测试的评分信度较高,这是主观性测试最核心的问题。针对目前中国中学英语教师口语水平不是太高的现状,在口语测试的评分中,本文提出只区分出优秀、及格和不及格三个档次(或者A,B,C三个档次)是恰当的。这可以解决对口语测试评分信度不高的担忧。这对我国在初中阶段大面积普及口语测试是极为重要的。2,测试前准备工作很重要,如让考生了解口试的程序、量分原则、根据考生的笔试成绩编组等。这可以帮助考生尽可能地发挥出他们的水平。3、口语测试前应该进行口语培训,或者平时教学方法与测试力一法应保持相当程度的一致性,这样有助于学生适应口试的方式。由于学生第一次参加这种测试,缺乏应试技巧和经验,所以有9.3%的学生认为根本不能发挥自己..\n.的水平,有53.1%的学生认为仅发挥了50%的水平,仅有37.6%的学生认为发挥了80%的水平,没有一个学生认为发挥了自己的全部水平。而在预测中正因为进行了简单的口语培训,学生熟悉口试的形式和过程,所以六位参加预测的同学都认为较充分地发挥了他们的水平。同时这也是口语测试又」英语教学的良好的反拨作用之所在。4、这次口语测试,从试题的拟订,口试形式到评分的方法综合分析,效度较高。这为初中英语口语测试的大面积实施提供了一个理论框架和粗略的操作模式。5、每年应该进行2-4次口语测试。口语水平的发挥易受到考生的健康J清绪,主考官的状态等众多因素的影响,从而影响口试的信度。每年多进行儿次口试,对此会是一个很好的弥补。6、试题的指导语一定要明确、具体,不会令学生费解。这次测试就是因为想当然地认为学生知道角色扮演该怎么做,结果指导语过于简单,造成不少学生拿到卡片不知如何是好,有的竟然用英语描述卡片、翻译上面的汉语提示。以附件2中的角色扮演卡片2为例。应该把CARDA卜|1卜shoppinglist|Lrice:10kgmeat:3kg|Jchicken:1kgmilk:10bags.recoke:11bottlescarrots:7kgA应母亲之命到市场购买蔬菜。他带了100元和一张购物单。改为:CARDA你的妈妈让你去买菜,给了你100元钱和一张购物单(见下表)。准备2分钟用英语有礼貌地完成买菜的任务。至少问5个得体的问题。shoppinglistrice:10kgmeat:3kgchicken:Ikgmilk:10bagscarrots:7kgcoke:11bottles5.2目前尚需解决的问题:在初中阶段进行英语口语测试己迫在眉睫,但还有不少问题是这次测试实验无法解决的:1、高中录取新生,如何对待口语测试的成绩?建议:设立一个低限,如重点高中要求口语水平必须达到四级优秀(即初二优秀的水平);达到五级的学生加15分;达到五级优秀的学生加30分。这样口语成绩相当于在英语测试中占30%的分量。当然,这需要高考和大学英语考试同样重视口语测试,英语教学和测试的改革只可能是“一条龙”的(戴维栋,2002:10)..\n.2、口语测试的严肃性问题。如何避免口试腐败?这是任何形式的考试都面临的问题,但口语测试中的问题很可能要严重得多!因这次口语测试实验不涉及到学生升学,所以腐败问题没有被凸现出来。这需要有关部门制定详尽的考场规范、考官职责、口语考试实施细则等。参考文献AldersonJ.Charles.etal.LanguageTestConstructionandEvaluation[M].Shanghai:ForeignLanguageTeachingandResearchPress,2000:F12,F22.170Bachman,L.FundamentalConsiderationsinLanguageTestingfM].Oxford:OxfordUniversityPress.1990.81一109.Canale,M.etal.Theoreticalbasesofcommunicativeapproachestosecondlanguageteachingandtesting[J].AppliedLinguistics,1980,(1):1-47.Heaton,J.B.WritingEnglishLanguageTests[M].Beijing:ForeignLanguageTeachingandResearchPress,2000:81Wood,Robert.AssessmentandTesting:ASurveyofResearch[M].ShanghaiForeignLanguageTeachingandResearchPress,2001:F30.安得希尔(Underhill,Nic.)(郑新华,刘玉珍译)口语测试药方.(TestingSpokenLanguage:ahandbookoforaltestingtechniques)[M].天津:南开大学出版社,2003.6,48,46-76,97,110.蔡基刚.如何评价大学生的英语口语能力[[7l.外语界,2002,(1).戴本博etal.外国教育史(上)[M].北京:人民教育出版社,1989:74.戴炜栋etal.构建具有中国特色的英语教学“一条龙”体系[[J].中国高等教育.2002,(11):10董晓红,关于英语口语测试[J].解放军外语学院学报,1995,(2).付克.中国外语教育史[[M].上海:上海外语教育出版社,1986:17.高兰生etal.英语测试论【M〕南宁:广西教育出版社,1996:183胡春洞etal.外语教育心理学[明.南宁:广西教育出版社,1996:179.贾志高.从剑桥英语交际技能考试看交际英语测试的特点闭.外语界,1998,(3).李筱菊.语言测试科学与艺术[[M].长沙:湖南教育出版社,1997:6-8.刘骏.后方法时代教学法概念的重新构想[A].胡鉴明.交际法和中国英语教学【C].广州:广东教育出版社,2002:333...
查看更多

相关文章

您可能关注的文档