电子阅卷机误人子弟 如今的考试都流行“电子阅卷”。最近公布的一份研究报告总结说,计算机甚至能够给美国标准化考试的作文评分,效果和人工阅卷一样好。 有人却觉得,一旦我们了解了电子阅卷机的“偏好”,就不难在考试中取得高分。 美国麻省理工学院写作项目部主任莱斯·佩雷尔曼就尝试了这样一件事:他通过研究并完成了一份试卷,轻松地从电子阅卷机那里,拿到了一个作文满分。
机器阅卷节约人力 美国阿克伦大学教育学院院长马克·谢尔米斯曾做过这样一件事:他收集了六个州的1.6万多篇人工打分的初高中考试作文,然后用自动化阅卷系统重新给这些作文评分。 最后他得出结论:“电脑阅卷准确度几乎与人工阅卷结果完全相同。事实证明,在某些情况下机器比人更加可靠。”美国某“高等教育内幕网”为此还公开了一篇博客文章,将这整件事情总结为“阅卷机器的胜利”。 根据美国培生教育集团估计,人工阅卷最快的速度,大概可用1小时给30篇考试作文打分。 而美国教育考试服务中心研究部主任大卫·威廉姆森则表示,该中心开发的自动化阅卷机“电子评分器”,可以在20秒内评阅1.6万篇作文。 开发这种阅卷机的原因,原本就是因为该中心每年开展和管理包括美国大学的各种入学考试约有5000万次,实在安排不了那么多人力阅卷。
评卷方法误人子弟 麻省理工学院写作项目部主任莱斯·佩雷尔曼在研究了这种“电子评分器”的思维方式后,却认为这种机器阅卷明显会误人子弟。 虽然他的研究结果带有局限性,因为目前只有美国教育考试服务中心开发的这种“电子评分器”允许他进行测试,但他的观点却有普遍意义。 他指出,自动阅卷机其实很容易骗。只需要经过一些考前准备,考生面对电子阅卷机时就很容易过关,因为那些机器对什么是好作文设定了一个非常狭隘、僵化的标准。这种机器最终可能会迫使教师简化写作教学。 佩雷尔曼说,电子评分器的最大问题是不能鉴别内容的真实性。他说,批改作文的电子评分器只被设定要求句子结构正确、语法正确等问题,却不会去认真核对写作内容的准确性。 “如果考生把1812年的战争写成始于1945年,电子评分器也不会在意。” 佩雷尔曼还发现,“电子评分器”喜欢长文章。他写了篇716个单词的文章,把十几句不知所云的话堆在一起,得到了最高分6分;而另外一篇逻辑通顺、行文优美的567个单词的作文却只得到5分。 他还指出,电子评分器不喜欢短句子或短的段落。它们也不喜欢以“or”和“and”开头的句子,或结构不完整的句子。不过,它们喜欢连词,比如“however”。 根据程序设定,这类词汇显示了作者的思维复杂性。此外,复杂的词汇在任何情况下都有效,因为电子评分器视其为词汇量丰富的表现。 他说,自动阅卷机能够计数,因此它能设定一个好句子有多少个单词、一个好段落有多少个句子。“一旦你了解了电子评分器的偏好,就不难提高你的考试成绩了。”