第2章 成长和成长评估
学习,不仅要追求“达标”,更要追求“成长”。对于一些基础好的学生,实现“达标”并不一定能够实现“成长”;对于一些基础薄弱的学生,即使暂时“达标”有困难,仍然可以通过学习获得“成长”。这就是新的“达标+成长”的教育理念和教育测量模型。
成长模型,是指一组定义、计算方法和规则,可以根据学生在两个或多个时间点的表现,做出与学生、班级、教师和学校有关的解释。
“成长”是相对于“状态”(status)而言。所谓“状态”,是指一个学生或一组学生在一个特定时间的学习成就水平。而“成长”是指两个或多个时间点之间学习成就水平的发展变化。“状态”好像是一张静态的照片,而“成长”则类似于一段动态的“录像”。
表2-1是某校的数学成绩统计表。表中的每个数据反映了各个年级的学生在特定年份的“状态”。
表2-1 某校学生的数学平均成绩统计表
从表2-1中的每一列数据中都可以看出数值的增长。但是,这些数据都来自一个时间点,来自位于一个时间点的不同年级的学生。例如,第一列成绩是2007年各个年级学生的数学成绩,不是来自同一组学生。这种数值的增长,只能被解释为2007年各个年级在校学生之间的差异,并不能被解释为“成长”。
从表2-1中的每一行数据中也可以看出数值的增长。但是,这些数据都来自不同时间相同年级的学生。例如,第一行成绩是历年3年级学生的数学成绩,也不是来自同一组学生。这种数值的增长,只能被解释为各年3年级在校学生之间的差异,也不能被解释为“成长”。
所谓“成长”,是指一名学生或一组学生的学习表现随时间流逝所发生的变化。在表2-2中,对角线(灰色标记)上的数据才反映了一组学生的成长。这些数据属于同一组学生,反映了同一组学生从2007年到2012年,即从3年级到8年级的学习表现变化。从表中可以看到,这个班学生的平均分从2007年3年级的320分,上升(成长)到8年级(2012年)的840分。
表2-2 某校学生的数学平均成绩统计表
“成长评估”是借助数学和统计学的方法,对一位学生或一组学生的学习成绩水平在两个或多个时间点之间变化的描述,包括根据这种描述做出关于学生未来发展趋势的预测。
“成长评估”与“达标评估”的主要区别在于,后者是单一时间点的测试,而前者则至少要包含两个时间点。借助一个时间点的观测,可以了解学生与学生之间当下的差异。只有通过两次测试,才可能看到学生的变化趋势之间的差异,才可能看到学生的“成长”,也才可能对学生的未来发展做出一些合乎逻辑的预测。
有条件的时候,还可以进行多于两个的更多时间点的测试。表2-2中对角线所体现的,就是对一个班的学生在6个不同时间点的测试。
美国教育改革强调的“成长”,其主要的着眼点是那些可能掉队的学生,是力图帮助那些“达标”有困难的学生获得“成长”,鼓励那些帮助这些学生获得一定程度成长的教师和学校。中国与美国的国情不同,我们强调的“成长”,主要的着眼点应是那些基础较好的学生,力争帮助他们不仅“达标”而且获得实际的“成长”,鼓励那些帮助这些学生获得进一步成长的教师和学校。
进行成长评估,不仅可以更准确地了解学生学习的实际成效(outcome),而且可以更准确、清晰地了解教师、学校对学生成绩的提高所产生的实际影响。
关于成长模型,需要展开讨论的基本问题包括:
(1)成长模型最能够支持的基本解释是什么?
(2)成长模型的统计基础是什么?
(3)某个成长模型需要什么样的数据?
(4)某个成长模型可以支持关于何种团体(班级,学校,学区,市)的分数解释?
(5)关于成长的期望水平或充分性,怎样设定合格标准?
(6)对某种成长模型的常见误解是什么?这种模型在问责过程中可能出现的负面后果是什么?