思行合一:一名小学英语教师课堂教学的思与行
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

“2012香洲区七年级学科核心能力测试”英语测试分析

测试与教学的关系密不可分。语言教学的任务是培养学生的语言运用能力,语言测试是为语言教学服务的,通过对学生的抽样,对学生的语言能力进行客观的、准确的、公正的评价。不管哪种类型的测试,都不应该机械地测量学生对语言形式的掌握,而应测量学生实际用语言交际的能力(Heaton, J.B., 韩宝成导读, 2000)。

对语言测试来说,不同的语言观不但决定考什么,而且决定怎么考。七十年代以前,在语言测试界占主导地位的是分析法。其语言学理论基础是结构主义语言学。该理论认为,语言是由语音、词汇、语法构成的一个系统,这一系统是可以分解的,因此,可以设计出离散的题目,以逐项测验学生是否掌握了这些分解的元素。在这一时期,语言测试中使用得最为广泛的题型就是多项选择题。这种离散的语言测试往往忽视了语言的构成元素在交际语境中的相互作用;七十年代中期起,社会语言学家提出了语言交际能力,认为使用语言不但要能够按照语法规则构造出合格的句子,而且还必须具有在不同语境中合理地使用这些句子的能力。这一点是通过孤立地测试语言点的单纯离散题做不到的。这一时期采用比较多的是综合题,如完形填空、听写、口试、作文等;自八十年代中期以来,交际法语言测试受到了愈来愈多的重视。从语言作为交际工具来看,进行有效的语言交际,仅仅掌握语言形式是不够的,语言测试必须在真实的语境中运用语言达到交际目的的意义,并以此来判断学生的语言水平(Anderson, J.C. 杨惠中导读, 2000)。

一项测试的好坏,首先要看它的效度(Validity)。效度指测试是否考了想要考的内容,效度的高低是语言测试的基本出发点。比如是否考了考试大纲规定要考的、是否以科学的语言观为依据等。

区分度(Item discrimination)也是评价测试质量的又一重要指标。它指的是一个题目区分学生能力的程度。如果有一道题水平高的学生都答对了,水平低的学生都答错了,这道题的区分能力就强。为保证整个测试有较高的区分度,测试中各种难度的题目都应该有,包括最难和最易的题。

难度值(Item difficulty)是答对考生人数与考生总人数的比。测试中难度值的理想指标应为0.5,难度值在0.7 至0.3之间的题目都可接受。

考试结束后得到的结果是每个考生的分数。这些分数称为原始分数(raw marks)。如果孤立地去看待每个分数,显然是没有意义的,只有把成绩和他人的成绩比较才能做出判断;平均数是用来描述分数分布集中趋势最常用的一种方法,但描述一组数据的特征仅用集中量数是不够的,还需考虑其分散情况。标准差(Standard deviation)就是表示一组数据的离散情况。比如两个班平均分都是80分,如果A班的标准差为4.08, B班为8.96,表明 B班学生两极分化严重。

下面我将结合 “香洲区学科核心能力测试”一次英语测试的相关数据,尝试从本次英语测试的效度、区分度、难度和标准差进行较为客观的分析,希望对英语学科教师有一定的启示。

一、命题介绍

本次香洲区学科核心能力测试试题较灵活、开放,贴近生活,其中英语部分占40分,试题情况如下:

表1:香洲区七年级学科阅读能力测试英语阅读与写作基本情况一览表

从上表可看出,本次测试主要检测学生的综合语言运用能力,包括学生阅读技巧的运用,如利用插图和上下文猜测词义、使用寻读策略获取所需信息,以及根据所读表达观点等。

二、考后分析

以下是学生在本次测试中的小题得分情况:

表2:学生得分情况

该数据由香洲区教育科研培训中心提供

标准差表示一组数据的离散程度,标准差越大,表明学生之间的成绩差距越大,两级分化越严重。从以上的标准差可看出,本次测试19——23小题(回答问题)学生分数差距较大,第23小题(写作)尤为严重。回答问题要求学生首先能读懂问题,然后从文本中寻找所需信息点作答,这与之前的选择作答(13——16小题)比较,难度有增加;写作部分重点考察学生的综合语言运用能力,该题对学生的语言水平有较高的要求。

试题的难度是答对该题的考生人数与考生总人数的比。较为理想的平均难度值应为0.5,难度值在0.3与0.7之间的题目也可接受。

从表2可以看出,第13小题较容易,第19、20题不太容易,第17、21、23小题很难。 第19、20小题是阅读“Susan 因肥胖烦恼”短文后,学生回答如下问题:

19. How heavy does Susan weigh?

20. Why is Susan not happy?

以上两小题学生可以分别从文本中找到信息点:(文本第2行)You're only 110cm tall but you weigh 30kg. You're too heavy; (文本第5行) At school, some boys and girls call Susan ‘Fatty'. Susan does not like it. She is not happy. 这表明相当部分学生还不懂得根据阅读问题,在文本中寻找关键信息;另外,由于回答问题涉及了书面表达,增加了一定的难度。

根据难度值,第21、23、17小题是学生认为最难的三道题。第17题要求学生写一写:What's your favorite snack? 在这里,snack是一个新单词,学生需要根据短文提供的插图和相关句子(文本第1行)猜测该词义。短文提供了清晰达意的插图(见图1),如果学生能认真观察插图,应该可以正确猜出该词的意思,然后作答,如:I like Coke/chips等。

图1

Susan likes watching TV. When she watches TV, she likes eating snacks.

第23小题要求学生阅读有关“Susan 因肥胖烦恼”的短文后,给Susan写一封信,建议她在暑假应该怎么做:What should Susan do in her summer holiday? Please write a letter to Susan.该题在语言水平和能力上对学生的要求较高,如学生需要用You should/ shouldn't…相关词句给Susan提建议,并简单表达理由,如It's good to… It's bad to…还需要懂得写信的格式等。

第17小题要求学生阅读短文后回答问题。学生阅读以下对话: Charlie打电话与爸爸商量给奶奶准备生日礼物,Charlie说服爸爸给奶奶买个花瓶,因为Charlie今早在奶奶房间玩耍时不小心把奶奶的花瓶打碎了。学生根据所读写一写:What do you think of Charlie? Charlie ________________________. 该小题没有统一的标准答案,要求学生在理解大意的基础上思考归纳,如:Charlie loves his grandma./Charlie likes playing in grandma's room等。如果学生能理解题意的话,也可以从短文中找到相关词句作答:Charlie is a naughty boy.(文本第12行: Dad: You naughty boy! What else did you break? )第17小题很难,很可能的一个原因是相当部分学生没能理解题意。

区分度指一个题目区分考生能力的程度。区分度指数越靠近+1,区分度越高。试题的区分度在0.4以上表明此题的区分度很好,区分度0.19以下表明此题的区分度不好应该被淘汰(百度文库)。从表2得知,本次英语试题区分度比较理想。区分度较强的是第20小题,该题可以从文本中找到信息点(文本第5行),但该题的零分率为43.72%,相比难度大的第23小题,零分率为25.76%,表明不少学生已经出现了“阅读无助”,他们可能对英语阅读失去了信心。在今后的阅读教学中,教师应该如何教会学生使用阅读技巧,重建他们的阅读自信心,很值得我们去思考。

三、命题建议

本次测试能较科学、合理地检测学生的阅读和综合语言运用能力。但为了体现评价的激励功能,建议命题时能适当降低难度。比如第17和21小题,我们可以通过提供不同的选择项让学生完成,如:

21. What's your favorite snack?

A. Chocolate B. Chips C. Biscuits

又如,第23题可以考虑补充中文指令语,以提高试题的效度,如:

What should Susan do in her summer holiday? Please write a letter to Susan.写一封信,建议Susan在暑假应该怎么做。

另外,我们还可以探讨是否给学生提供写作参考词句,如 You should…. It's good to… / You shouldn't… It's bad to…

四、教学启示

教师在日常教学中要重视培养学生的综合语言运用能力,比如教学每个单元要联系实际思考学生可以用英语做些什么,应该让学生在运用语言的过程中理解和掌握语言功能;教师在今后的阅读教学中要渗透训练学生使用阅读技巧,如寻读、结合插图帮助理解、利用上下文猜测词义、根据所读表达简单观点等;语言知识的学习和积累固然重要,但要改变传统的以传授语言知识为主的教学模式。因此,为了让学生对英语发生兴趣,教师需要在课堂教学中创设语境,引导学生在语言实践活动中体验和感悟语言的形式和意义。