王双:美国学前教育质量评级与提升系统的元评价研究述评

原标题:美国学前教育质量评级与提升系统的元评价研究述评

作者简介:王双,四川幼儿师范高等专科学校管理工程系(四川 绵阳 621000)。

内容提要:美国以州政府为主体实施的学前教育质量评级与提升系统(QRIS)通过质量评级、财政激励和技术支持来提升各州学前教育质量,并引导学前教育领域的市场选择。在QRIS发展的二十余年中,各州持续开展元评价研究以检验QRIS各项内容实施的有效性。这些元评价研究关注质量基本概念、质量测量、评级结果以及学前机构等级与儿童发展水平的关系,并反映出美国各州QRIS的具体实施情况及改进措施。这些元评价研究在研究方法和研究结论方面也有一定的局限性。

关 键 词:美国 学前教育 质量评级与提升系统 元评价研究

基金项目:绵阳职业教育研究中心重点项目“绵阳市学前教育评定系统改革的探索性研究”(项目编号:MYZY201603)。

质量评级与提升系统(Quality Rating and Improvement System,简称QRIS)是美国以州政府为主体实施的一项学前教育机构质量评级与提升的综合性项目。[1]作为一个有多重目标并体现政策性发展的复杂系统,其最终目标是通过提升学前机构教育质量来促进儿童发展。

近年来,QRIS已成为美国各州提升学前教育质量的重要政策性工具。QRIS国家学习网(QRIS National Learning Network)发布的信息显示,截至2016年5月,包括哥伦比亚特区在内的44个州已实施QRIS(其中阿拉巴马州正进行试点工作),包括夏威夷州在内的7个州正计划实施QRIS。各州自实施QRIS以来持续对其开展元评价研究,以指导QRIS的设计与改进,记录并检验其实施情况。

这些研究关注质量评级与提升系统中的质量基本概念、质量测量、评级结果、质量评级与儿童发展水平的关系,其研究内容与研究结论有助于我们深入了解美国各州QRIS的实施情况与改进措施,同时对我国学前教育评价工作及相关研究有一定的借鉴意义。

一、QRIS的实施内容及其元评价研究的作用

(一)QRIS的实施内容

美国各州QRIS实施的具体情况有所差异,但根据美国儿童教养信息与技术支持中心(NCCIC)出台的标准,各州QRIS的实施通常包括五项基本内容:质量标准(Program Standards)、绩效责任测量(Accountability Measures,包括质量测量与问责制)、技术支持(Technical Assistance,包括学前机构质量提升方案与教师专业支持等)、财政激励(Financial Incentives,包括教师奖学金、财政津贴、分层补贴等)、家长教育(Consumer Education)。各州QRIS使用一系列质量标准对参与QRIS的学前机构进行质量测量与评级,引导学前机构根据质量标准来提升教育质量。[2]参与QRIS的学前机构可获得生源和财政支持等方面的收益(如特殊儿童补贴、分层补贴、质量提升方案、教师培训等)。同时,QRIS向家长提供学前机构评级的信息,并确保州学前教育政策和财政支出合理有效。其对政府和家长行为的引导,间接提升学前机构的教育质量,从而对政府、机构和家长发挥多重作用力,并最终促进儿童发展。[3]

我们以北卡罗莱纳州的QRIS实施情况为例来说明。北卡罗莱纳州是最早开展QRIS的几个州之一①。该州的QRIS委托第三方评级人员对学前机构质量进行系统性测量,根据测量得分从1星到5星对学前机构进行评级。测量得分来自三个维度:学前机构资质(最高7分),教职工受教育水平及师幼互动(最高7分),以及1分的额外质量得分(例如,教职工是否获得教师资格证、班级规模、是否采用州政府建议使用的课程等)。测量总分取三个维度得分的平均分,并依据总分决定学前机构的星级:1~3分为1星;4~6分为2星;7~9分为3星;10~12分为4星;13~15分为5星。随后评级人员会进一步搜集信息,出具评级报告。技术顾问根据评级结果有针对性地为学前机构制定质量提升方案。学前机构星级及其他教育信息通过宣传告知家长。同时州财政的“分级补贴”及其他财政支持在评级结束后会陆续到位,QRIS学前机构评级结果与财政补贴挂钩。星级越高的学前机构补贴额度越高。同时,北卡罗莱纳州立大学、州政府及相关机构持续地联合开展元评价研究以指导QRIS实施及改进。

(二)元评价研究在QRIS实施中的作用

QRIS实施的核心内容是学前教育机构教育质量的评级,有效的机构评级对QRIS至关重要。在过去几十年中,美国各州在QRIS实施过程中持续开展了大量的元评价研究,研究假设学前机构质量及质量差异可根据一系列质量标准与指标得到精确测量,其目标为指导、检验评级工作的实施,验证质量标准与评级结果是否可靠(详见下页图1)。[4]研究数据与成果可为QRIS提供理论与实践方面的指导,对QRIS的设计、实施与改进具有以下重要意义:

首先,元评价研究可用来建立QRIS质量标准,并验证质量标准的有效性。例如,如果某个质量标准的学前机构得分差异不大,或是无法得到精确测量,再或是对儿童发展没有促进作用,那么该质量标准需被移除或修订。其次,持续的元评价研究与QRIS复查工作同步进行,可以提升其测量与评级的有效性。例如,肯塔基州、科罗拉多州和田纳西州组织专家在QRIS实施过程中通过复查、焦点小组和资料验收等工作来指导测量与评级工作。[5]再次,元评价研究引导政府学前教育政策的制定,同时指导QRIS的修正或再设计。每个州的QRIS可通过元评价研究确保学前机构良性运转并记录儿童、家庭和学前机构的发展,为州政府制定学前教育政策给予引导的同时兼顾教育公平的诉求。[6]最后,元评价研究可产生两个额外收益:一方面,元评价研究向家长、学前机构和政府提供相关信息,使家长与学前机构工作人员以及政府决策者的经验得以匹配,并加强互信;另一方面,对于那些需要进行改进的机构,质量测量反馈的信息有助于提升其教育质量,而低教育质量的学前机构逐渐减少或最终退出教育市场。

二、QRIS的四类元评价研究

(一)QRIS四类元评价研究概述

笔者通过对近十年QRIS元评价研究的目的及内容的分析,并参考塞尔曼(Zellman)等人于2001年对QRIS元评价研究的分类,归纳出四类QRIS元评价研究,具体为:(1)考察质量的基本概念的有效性;(2)考察质量测量的有效性;(3)考察学前机构评级结果的有效性;(4)考察学前机构评级与儿童发展水平的关系。表1为四类元评价研究的概述。

(二)第一类元评价研究:考察质量基本概念的有效性

第一类元评价研究考察QRIS中的质量基本概念是否准确、有效,并最终对其进行筛选与审核。质量基本概念包括质量成分(Quality Component)、质量标准(Quality Standard)和指标(Indicator)。

质量成分是QRIS使用的较为宽泛的质量范畴,诸如资格认证、家园合作和班级环境等。每个质量成分由一系列质量标准构成,质量标准是对质量进行定义的具体项目,如课程建设等。每个质量标准有一个或多个指标来解释,指标是指每项质量标准的测量度量。例如,田纳西州QRIS“教职工资格”(Staff Qualifications)质量成分中的一个质量标准为“对教师在课程和儿童评估方面进行专项训练”,与该质量标准相关的指标为“50%以上的教师完成每学期两项州立课程的学习和儿童评估训练”。各州通常根据学前教育和儿童发展方面的专家经验及最新的研究文献,来考察、评判质量的基本概念,并指导QRIS的改进。

1.对质量基本概念的三方评价

考察质量基本概念的元评价研究可通过专家、家长与学前机构人员的三方评价来进行。一些州会根据专家经验对本州QRIS的质量标准进行验证与筛选。特拉华州、罗德岛州、明尼苏达州、弗吉尼亚州、缅因州等州使用“系统性专家审核”来确定哪一项质量成分(以及构成每个质量成分的质量标准和指标)入选该州QRIS评级系统。学前机构人员和儿童家长也会参与对质量成分、质量标准和指标的讨论。例如,明尼苏达州采用家长焦点小组的研究方法来构建质量评级与提升系统所使用评估工具的试用版(Minnesota Department of Education and Minnesota Department of Human Services)。

对质量基本概念进行三方评价的一个典型是缅因州QRIS开展的“概念地图”(Concept Mapping)研究。南缅因州立大学与州政府相关机构等的人员通过“概念地图”研究来指导质量标准的选择,并建立概念框架以指导QRIS的设计与改进。[7]该研究主要包括以下几个方面:(1)通过对儿童家长和学前机构人员的8次焦点小组研究、问卷调查及访谈出具的有关质量标准的报告,讨论出质量基本概念的初步内容与结构,参加焦点小组的人员包括州早期儿童教育与保育(Early Childhood Education and Care,简称ECEC)专家、儿童家长以及全州各类型的QRIS学前机构代表;(2)通过参与者和专家的专题讨论对报告进行整理及评审,24位以上的州早期儿童教育与保育专家会对报告进行评判;(3)一系列的质量成分和质量标准建立起来,并最终通过州政府的正式评审;(4)研究小组使用计算机软件绘制由质量基本概念的内容与结构组成的“概念地图”。绘制软件也会以插图的形式展示质量基本概念之间的相关程度,让质量评级与提升系统中的学前机构可以形象地辨别出专家和家长最为看重哪些质量成分。

图2展示了一个通过“概念地图”的处理来生成的“模式匹配”:让家长和学前机构人员使用五点量表分别对质量标准的重要性进行评分,家长组和机构组在对质量标准评分时产生了一定的相似性与差异性。家长组和机构组中最高评分的概念均为“家园关系”(家长组和机构组的平均分均为4.44),两个组最低评分的概念均为“教室环境创设”(家长组平均分为3.69;机构组平均分为3.81)。其中“师幼互动”的评分差异最大。然而,该数据资料显示,无论是对于家长组还是机构组,这些概念的评分差异都非常大,这也和印第安纳州QRIS类似研究的结论相一致。

2.文献研究

此类元评价研究也会通过文献研究来考察某一质量成分(包括构成该质量成分的质量标准和指标)与教育目标之间的关系。普度大学通过对大量文献的研究来检验印第安纳州QRIS的质量标准,其目标是形成科学有效的“质量之路”(Paths to Quality,此为印第安纳州QRIS的名称)。这些文献被称为“质量指南”(Quality Indicator),主要包括以下内容:(1)具体的、可用理论证明的儿童教育课程或实践;(2)国家政策或权威报告中被认定的最佳实践项目;(3)学前教育和儿童发展的研究文献。普度大学研究团队通过对“质量指南”文献的考察,深入分析了印第安纳州QRIS的十项质量成分②及质量标准和指标,每个质量标准可能被列为“限制性证据”,或“稳定性证据”,或“实质性证据”:(1)有1~2个研究支持的质量标准被列为“限制性证据”类别;(2)有3~5个研究支持的质量标准被列为“稳定性证据”类别;(3)有5个以上研究支持的质量成分被列为“实质性证据”类别。研究保留了75%的拥有“实质性证据”和“稳定性证据”的质量指标,并对其进行了修改,其分析结论向州质量评级与提升系统规划委员会报告。[8]

(三)第二类元评价研究:考察质量测量的有效性

质量测量是指QRIS使用质量测量工具对学前机构进行质量测量,并实施复查与检验的过程,它是QRIS绩效责任测量的重要组成部分。第二类元评价研究主要考察质量测量的有效性,主要内容包括:指标测量能否反映测量的内容、指标能否有效地区分质量水平、指标的观察测量和编码是否准确且有测量学意义,缺少测量学意义的指标将被取消或与其他指标合并。所研究的数据主要包括“指标测量的得分分布”“指标的多次测量结果是否一致”“各指标测量之间的相关”等内容。此类研究可以帮助QRIS设计者和政府人员考察指标使用的情况,对学前机构质量评级有至关重要的意义。加利福尼亚州、明尼苏达州及肯塔基州将此类元评价研究的结论作为学前机构评级的重要依据。

1.考察观察性测量的信度

绝大多数州的QRIS通过现场观察测量来对学前机构的过程性质量进行评估。大多数州将两种及两种以上的测量工具合并在一起进行现场观察测量,这些测量工具主要有:《课堂互动评估系统》(CLASS)、《婴儿、学步儿学习环境评量表》(ITERSR)、《幼儿学习环境评量表》(ECERS-R)、《幼儿学习环境评量表(课程增订本)》(ECERS-E)、《家庭儿童保育环境评量表》(FCCERC)、《师幼互动量表》(CIS)、《学龄期的教养环境评价量表》(SCAERS)等。虽然各州采用的测量工具有所不同,但各州QRIS均通过清晰的质量指标定义、定期的信度复查、评分者间信度检验,来保证评级过程的测量信度。

考察复查信度。在考察测量的研究中,考察同一测量工具先后两次测量之间的相关程度及测量误差在评估QRIS测量有效性方面很重要。每次测量不仅有助于整体质量评估,也能提供不同类型学前机构的质量信息。大多数州的QRIS假设观察性测量随时间的流逝相对稳定,这种假设对于广泛使用的测量工具(如ECERS-R)来说与经验性证据相一致。

考察评分者间信度。考察质量测量的另一项元评价研究关注评分者间信度。陶特(Tout)等人于2013年回顾了20个州的QRIS发现,几乎所有州的QRIS都要求ECERS-R测量有0.80~0.85的评分信度系数,但该信度不能消除测量误差。例如,两位评价者其中一位给一个班级打出3.5分,另一个给该班级4.5分,这种差异会影响学前机构的最终等级。[9]

2.考察各指标测量之间的相关

考察测量的元评价研究也会讨论QRIS指标之间的关系,以帮助QRIS设计者和政策制定者掌握指标使用的情况。只有在各指标间有适度(偏弱)相关的情况下,指标测量才能为学前机构评级提供有用的信息,如果两个指标彼此高度相关,那么它们可能提供相似的质量信息,对于评级工作来说则是多余的。

表2显示了弗吉尼亚州中心式学前机构质量评级与提升系统指标测量之间的相关:教师资格与师生比之间无相关;师幼互动与师生比之间有适度相关;教师资格与班级环境(通过ECERS-R测量)及师幼互动(通过CLASS测量)之间有显著相关;班级环境和师幼互动之间有较高相关,说明两个指标有交互作用,需要进一步研究。

3.考察指标测量的得分分布

此类元评价研究还会检查一系列指标测量的得分分布及其变异。通过检验指标得分分布,来验证该指标测量能否提供较好的质量区分度,并鉴别测量是否存在缺陷。如果分布为偏态分布或缺少变异,那么测量则不能很好地区分质量水平,需进一步研究,但一般情况下,只有掌握质量评级与提升系统中的学前机构的特征才能够更好地理解分布。图3显示了明尼苏达州QRIS部分指标的得分分布:家庭关系的得分分布为偏态分布,高分机构居多,需进一步研究;在儿童学业水平得分分布中,机构或倾向于得分较低,或倾向于得10分,需进一步研究;教师培训与进修得分分布则呈现出扁平化,需进一步研究;教学材料与教学策略得分类似正态分布,较为理想(详见下页图3)。

(四)第三类元评价研究:考察质量评级结果的有效性

第三类元评价研究是对QRIS评级结果(评级得分、评级分数线、评级分布等)进行考察,主要考察具体指标得分、学前机构最终得分及质量评级的分布模式与变异来确定评级工作是否有效。同时考察不同质量等级的QRIS学前机构相互区分的程度,以解决“质量评级4星学前机构是否比3星机构拥有更高的教育质量”等问题。各州的QRIS工作人员会根据元评价研究结论来调整指标、测量和评级分数线,从而达到有效区分学前机构质量水平的目的,并为进一步考察学前机构质量等级和儿童发展水平之间的关系奠定基础。

1.通过额外测量检验QRIS评级结果

此项元评价研究利用QRIS评级中未使用的测量工具对QRIS质量成分进行二次测量(即“额外测量”)来检测两次测量中的差异,并与评级结果比对来检验评级结果是否合理有效。通常情况下,此项元评价研究会检验额外测量数据与评级数据的皮尔逊相关,并对额外测量得分进行方差分析。笔者将通过总结印第安纳州和明尼苏达州③两项元评价研究进行说明。这两个州的研究者均采用QRIS评级中未使用的ECERS-R量表对评级结果进行检验(额外测量)。

检验额外测量数据与评级数据的皮尔逊相关。印第安纳州的研究者使用ECERS-R和CLASS量表对学前机构质量进行测量,并与QRIS评级结果进行比较。结果显示,每个质量等级的学前机构的ECERS-R得分与其QRIS评级数据相关(r=0.45,p<0.01),而CLASS得分与学前机构等级有弱相关(r=0.24,p<0.01)。明尼苏达州的研究同样使用ECERS-R进行测量以比对评级结果,ECERS-R的总平均分为3.82(SD=0.79;n=350),只有25%的学前机构得分在4分以下,其余大部分机构得分在4~5.81分之间,其ECERS-R每个等级的平均分和其QRIS评级数据之间的皮尔逊相关为0.44(p<0.01)。[10]

对额外测量得分进行方差分析(ANOVO)。印第安纳州和明尼苏达州QRIS元评价研究对每个等级水平上ECERS-R平均分进行方差分析,检验两个州不同质量等级间的ECERS-R得分是否存在显著性差异,并进行错误率判断族为0.05的事后检验。每个等级要求包含10%以上的机构以便于分析,例如,弗吉尼亚州QRIS仅有1个学前机构获得5星,2个学前机构处于1星,因此1星和5星在方差分析中被分别归为2星和4星之中,明尼苏达州QRIS只有4个机构获得1星,因此1星在方差分析中被删除。印第安纳州的方差分析显示,ECERS-R平均分在不同质量等级之间有显著性差异(F=4.96,p<0.01)。事后检验显示,相比1级和2级,4级学前机构ECERS-R得分较高,且在1级和4级之间得分有显著差异,3级与其他级别的学前机构(1级、2级和4级)相比无显著性差异。总体来说,该结果显示出印地安纳州QRIS评级可以区分质量水平。明尼苏达州的方差分析显示出ECERS-R平均分在不同质量等级之间存在显著性差异(F=5.83,p<0.01)。事后检验显示,2星学前机构ECERS-R得分著低于3星和4星学前机构,且只有最高质量等级(4星)的学前机构和其他质量等级(2星或3星)的学前机构之间,得分才有显著性差异。其中2星学前机构平均分为3.33(SD=0.78;n=28),4星学前机构平均分为3.90(SD=0.70;n=67)。

2.考察QRIS评级分数线

在各州质量评级与提升系统的评级过程中,每个质量等级都有评级分数线(Cutscore)。通过调整评级分数线及评级规则可以确定QRIS的评级分布,从而使不同质量的学前机构能够分布在不同的质量水平之中,因此对评级分数线的考察是设计QRIS等级的重要参考。

2012年,卡罗里和塞尔曼(Karoly & Zellman)使用搜集的数据来初步设计加利福尼亚州QRIS模型,数据来自2007年对学前机构的调查。经过训练的观察者于2007年对251家为0~5岁儿童服务的学前机构进行调查,目的是通过调整评级分数线来确定QRIS学前机构评级分布,检验质量成分之间的关系并找出异常情况,避免高质量机构得分偏低的现象。研究检验了学前机构的CLASS得分和ECERS-R得分之间的关系,来帮助政策制定者通过建立评级分数线来调整评级分布,并确定技术支持的工作目标。[11]

3.考察各类型学前机构的评级分布

另一个对评级结果的考察是研究各类型学前机构质量的评级分布。一个合理的QRIS学前机构质量评级分布中,每个质量等级都应有一些学前机构。印第安纳州和缅因州的元评价研究揭示了质量评级的分布。如图3所示,在QRIS实施的头三年期间,印第安纳州和缅因州的QRIS学前机构主要集中在1级和2级质量等级上。在最近一项对五个州QRIS深入的研究中,有四个州中40%~76%的学前机构处于QRIS较低的质量等级。[12]要获得一个良好的评级分布,需要调整质量标准、评级规则以及评级分数线。

在美国各州QRIS评级结论中,不同类型的学前机构往往质量差异较大。印第安纳州QRIS的元评价研究发现(详见下页图4),拥有经营许可的中心式学前机构均匀地分布在四个质量水平(1~4级)中,而拥有经营许可的家庭式学前机构往往处于1级水平,并在2~4级水平上明显下滑。3级和4级中心式学前机构的高比例现象归因于人们对中心式机构社会认可方面的传统认知,同时,QRIS质量标准也倾向于反映中心式学前机构的质量而非家庭式机构的质量。没有获得经营许可的学前机构④,往往在质量评级中处于较低的级别,这表明未获得经营许可的学前机构也应积极参与QRIS。同样的情况也出现在缅因州的QIRS中。缅因州大量的中心式学前机构处于4级(最高质量水平)之中,而处于4级的家庭式机构则很少。缅因州的家庭式机构工作人员认为,一些质量标准并不适合它们,中心式学前机构在社会和政府层面更被认可,也更具公信力。[13]宾夕法尼亚州的调查也显示出该州QRIS不同等级的学前机构体现出服务与机构类型方面的质量差异。

4.考察QRIS质量评级的计算方式

各州QRIS对学前机构进行质量评级时通常采用3种评级计算方式:等级制(学前机构在达到某一级别所有标准后晋升下一级)、总分制(根据质量标准评分,之后根据各质量标准的权重加出总分)、混合制(低层次质量标准中使用等级制,高层次质量标准中使用总分制)。多项元评价研究发现,评级计算方式是影响早期QRIS评级分布的重要变量。陶特等人2014年的研究发现,在采用等级制计算形式的QRIS中,大多数学前机构的质量评级都很低;在采用总分制或混合制计算形式的QRIS中,评价为高质量的学前机构较多,可见,QRIS评级的计算方式会对QRIS评级分布造成影响。当前,越来越多州的QRIS开始使用混合制的评级计算形式,以兼顾不同质量等级及特点的学前机构。

5.评级结果的家长评价

一些州的QRIS也会通过家长评价来检验评级结果。例如,缅因州开展的一项元评价研究通过家长评价来验证QRIS质量评级的结论是否合理。该研究选择一批儿童家长,要求他们完成一项匿名测验,测验内容为家长对机构服务的感受。测量采用15项的《Emlen量表》,三年研究的样本回收率约为26%(n=1478)。结果显示,高质量学前机构的家长评价会更高。[14]缅因州QRIS将家长作为QRIS的关键参与者,搜集家长评价的信息以进一步改进QRIS,这种做法值得借鉴。

6.考察获得质量提升的学前机构的数量

最后一个对整体质量评级的考察是研究获得质量提升的学前机构的数量。该研究假设:如果QRIS有效,那么会有一些学前机构获得质量水平的提升。缅因州QRIS的设计假设是:学前机构在QRIS的实施过程中,会普遍提升其质量水平。[15]然而一项于2008-2011年实施的纵向研究设计的元评价研究发现:约80%的QRIS学前机构(n=1118)在缅因州QRIS实施期间并没有质量提升的表现,103个质量提升案例中的95家是从1级提升至2级(其中大部分为中心式学前机构,家庭式学前机构质量水平几乎没有变化),学前机构类型(p=290)和区域位置(p=195)两个因素在解释“学前机构从1级升至2级”方面较为显著,学前机构类型是唯一解释“学前机构从3级升至4级(最高质量水平)”的主要的协变量,家庭式学前机构在质量水平提升方面的概率相比中心式机构明显偏低。在印第安纳州,在评级过程中学前机构可获得专业指导,从而达到“以评促教、以评促改”的效果,研究显示,19%的拥有经营许可的中心式学前机构、24%的拥有经营许可的家庭式学前机构和27%的未获得经营许可的学前机构,在QRIS评级的6个月之中能够提升一个质量等级。如果这种提升模式能够持续进行,最高质量水平的质量标准和指标也会不断修订,促使学前机构质量再上一个台阶。

(五)第四类元评价研究:考察质量评级与儿童发展水平的关系

第四类元评价研究聚焦在儿童发展水平(如认知发展、情绪和社会性发展等)方面。大量研究证明了儿童教育机构的质量某种程度上可预测儿童发展水平,高质量教育与高水平认知、高学业水平以及更加积极的情绪社会性行为相关。此类元评价研究主要考察QRIS质量评级与儿童发展水平之间的关系,以及教育质量(如班级环境)与儿童发展水平之间的关系,回答诸如“QRIS高质量学前机构中的儿童发展水平是否比低等质量的要好”等问题,亦可推断QRIS质量成分对儿童发展的影响。

1.QRIS质量评级与考察儿童发展水平的关系

质量评级与提升系统基于学前机构质量深刻影响儿童发展水平这一共识,致力于通过提升学前机构质量来促进儿童发展。因此,考察学前机构质量评级与儿童发展水平是否存在某种程度上的关联,是元评价研究的任务之一。此项元评价研究往往对学前机构评级与儿童发展水平的关系进行纵向研究,从而跟踪诸如读写、早期算数和情绪社会性发展等儿童关键发展领域的起点与变化。然而,此项研究要求研究者能够对质量评级与提升系统及其所有质量成分的运作情况有深刻的理解,有很大的挑战性,因此,此项研究的结论应置身于该研究的背景之中并关注教育质量对发展领域的作用。[16]

一些元评价研究显示,儿童发展水平与QRIS质量评级之间存在一定的关联。弗吉尼亚州QRIS元评价研究显示,学前机构质量等级(3星和4星)与学前儿童早期读写能力的发展水平相关。另外,该研究的描述性部分展示了学前机构等级和儿童特定技能发展的关系,例如,3星和4星学前机构中有较高比例的儿童是西班牙语和英语学习者,而2星机构有更多非洲裔美国儿童,同时学前机构星级也与儿童的家庭收入和社区环境有某种程度上的关联,这说明不同星级学前机构中儿童的特征性差异可能在某些方面解释了早期读写能力的差异。密苏里州的元评价研究则指出,高等级QRIS学前机构中的儿童比低等级机构中的儿童情绪与社会性发展的测量得分更高。[17]在另一项QRIS元评价研究中,斯特尼(Hestenes)等人于2014年采用ECERS-R、ECERS-E和CLASS三种量表对北科罗拉多州1749所QRIS学前机构的教学环境和儿童情绪与社会性发展的测量发现,学前机构星级能够区分高质量和低质量的课堂教学,且能够预测儿童情绪与社会性发展水平。[18]

也有一些元评价研究显示,QRIS评级与儿童发展水平没有显著相关。印第安纳州研究者评估了QRIS学前机构的557名儿童(包括249名婴儿和308名幼儿,样本儿童在1星至4星机构中随机选取)的发展情况,同时对儿童家长进行关于儿童入园前发展水平、父母受教育水平的访谈,目的是探索“高质量学前机构对儿童认知及社会性的发展是否比低质量水平的机构更好”。通过ECERS-R及CLASS量表测量发现,QRIS评级与儿童发展水平没有显著相关,认知、语言和情绪社会性等方面的儿童评估与QRIS评级之间只有微弱的、局部的关联,但这些关联没有显著的统计学差异。这些以家长受教育水平和家庭收入为控制变量的研究也有一些局限性,如样本较小、每个质量等级水平上的观察变量过多等。此外,巴科纳尔(Bacchanal)等人2011年的元分析文献指出,机构教育质量和儿童语言、学业水平和社会技能及行为问题之间存在弱相关,但这些相关的适用范围较小。海森(Hyson)等人2001年的元分析文献发现,学前机构质量只与低认知水平儿童的社会技能水平相关。

2.考察学前机构的观察性质量与儿童发展水平的关系

学前机构的观察性质量是指采用观察性测量工具(如ECERS-R、CLASS等)描述的学前机构质量。探索学前机构的观察性质量与儿童认知、情绪及社会性等方面发展的关系,也是元评价研究的重要议题。此类研究通常跟踪采集学前机构的观察性质量和儿童各领域发展水平的数据,利用多层线性模型的方法探索观察性质量与儿童各领域发展的复杂关系。

在学前机构观察性质量的测量方面,很多元评价研究使用ECERS-R和ECERS-E量表来进行初步测量,之后的评估往往采用多种调查工具(如CLASS量表等)重测以增加测量的有效性。对儿童发展水平的评估涉及儿童动作、认知及学业水平、入学准备、情绪与社会性发展等多个领域。其中,儿童认知领域的评估涉及语言表达、阅读理解、问题解决、早期算数和儿童学业水平等方面,通常采用《伍德考克—约翰逊学业成绩测验(第三版)》(WJ-Ⅲ)、《皮博迪图片词汇测验(第4版)》(PPVT-Ⅳ)、《语音识别与阅读能力问卷》(PALS)、《学龄前儿童早期读写能力测试》(TOPEL)等量表测量。儿童情绪与社会性发展水平的评估包括儿童情绪表达与控制、社交能力、问题行为与自我效能感等内容,主要采用《社会性技能提升量表》(SSIS)与《社交能力与行为评估量表》(SCBE)等量表测量。起初,很多QRIS元评价研究侧重于对儿童认知及学业水平(诸如读写能力、计算能力等)的评估。一些研究只将儿童社交技能和情绪能力视为儿童学业发展服务的基本技能,因为情绪与行为的自我管理、注意力控制及亲社会行为可以帮助儿童建立同伴关系并稳定地参与学习活动,而出现情绪或行为问题的儿童往往学业表现较差。当前,越来越多的研究直接聚焦于儿童情绪与社会性发展水平和学前机构的观测性质量的关系。

尽管很多州的QRIS质量评级不能预测儿童发展水平,但特定的学前机构质量的观察性测量却能预测儿童发展水平。斯特尼等人2014年通过多层线性模型(Hierarchical Linear Modeling)统计方法考察了北卡罗莱纳州QRIS学前教育机构的班级环境质量和儿童情绪及社会性发展的关系。研究通过ECERS-R、ECERS-E、CLASS以及《儿童满意度量表》(C5)考察学前机构的班级质量,通过SSIS量表考察儿童情绪及社会性发展水平,并将儿童性别、年龄以及每周受教育时间作为控制变量。结论显示,班级C5消极量表得分能够正向预测SSIS儿童外向行为问题(即班级消极氛围越强,儿童外向行为问题越多),班级ECERS-E得分和C5消极量表得分负向预测儿童内向行为问题,班级CLASS教学支持得分显著预测儿童社会技能,班级ECERS-R得分和CLASS教学支持得分显著预测儿童自我效能感。另外,印第安纳州的元评价研究显示,一些过程性质量,如高质量的“师幼互动”,能够预测婴幼儿高水平的社交技能(包括更积极的、有回应性的师幼互动),并能预测高水平的认知及语言发展。ECERS-R语言/推理子项目中得分较高的学前儿童表现出更高水平的语言能力,ECERS-R家长/教师子项目中得分较高的学前儿童表现出较少的行为问题。明尼苏达州的质量评级与提升系统检验了该州儿童认知发展得分与学前机构观察性质量得分(ECERS-R得分和CLASS得分)之间的关系,发现观察性质量得分能够预测儿童数学能力发展,但不能显著预测儿童语言/词汇发展水平。同时,对描述儿童攻击性行为的教师报告进行研究可以发现,在读写方面发展显著的学前儿童,其早期算术和社会性发展不一定显著,这些描述性数据可用来鉴定局部地区学前机构教师培训和技术支持的开展情况。

三、对QRIS元评价研究的反思

美国各州在QRIS实施过程中花费大量的人力物力来持续进行元评价研究,其目的是确保QRIS实施的有效性。然而,各类元评价研究在研究方法和结论方面也存在一定的局限性。

从研究方法上看,第一类元评价研究局限于现有资料和数据之中,缺乏经验性证据,且各方利益团体可能干扰研究的结论。例如,某一质量成分的利益相关者(如学前机构食品供应商、资格认证部门等)可能支持该质量成分入选QRIS评价系统,而不考虑研究证据是否支持。第二类元评价研究的局限性来自研究者的局限性,其选取的研究样本往往低质量水平的学前机构较多,高质量水平的机构较少,样本范围有时不尽如人意。第三类元评价研究则非常依赖质量成分、质量标准和指标的测量的合理置信水平,QRIS测量与额外测量的比较往往受限于测量工具的选择,且测量方法受到研究成本的限制。对于第四类元评价来说,其研究实施起来比较困难,且成本高昂。正如埃利克和索恩伯格(Elicker & Thornburg)于2011年所指出的:“这样的研究实施起来很有挑战性。首先,儿童可能会更换学前机构,此项变化因素不可控;其次,不同等级和类型的QRIS学前机构的儿童在年龄、能力、文化和语言背景方面有较大差异,因而测量难度较大,且有特定要求和期望的家长可能会选择特定类型的机构,从而影响儿童某方面技能的发展;最后,QRIS学前机构的质量评级会有变化,该变化对研究信度会产生影响,综合这些重要的背景因素来解释学前机构评级和儿童发展之间的关系时,可能产生误导性结论。”[19]事实上,美国各州QRIS的质量标准大多不包含对儿童学习和发展成果的评价,一些学者不赞成学前机构质量标准与儿童发展的评估标准相结合,其原因就在于,对儿童发展水平的评估耗时耗力,信效度难以保证,儿童发展水平与学前机构质量之间的关系也难以测量,对儿童发展水平的评估很难准确地反映学前机构质量,且以儿童发展水平作为学前机构评价标准有可能导致教育的功利化倾向。[20]

此外,当前绝大部分QRIS元评价研究描述的是变量之间的线性关系,研究的设计只依据线性因果关系和多元分析研究的应用,非线性关系方面的研究几乎没有,而非线性关系方面的元评价研究能够向QRIS提供多方面(学前机构、政府、家长、儿童等)综合发展的指导。

从研究结论上看,尽管质量测量的有效性是元评价研究的重点,但很多研究在某些测量得分方面缺少变异,或产生测量得分的偏态分布,况且在有些州的QRIS中,观察性质量测量在学前机构评级中所占的比重较少,这显示一些元评价研究需要进一步改进其研究设计。同时,关于儿童发展水平测量的元评价研究显示,儿童发展水平与QRIS学前机构评级、质量成分之间的联系也不明显。此外,在研究实施过程中也给学前机构各方面带来一定的负担,甚至造成“为评价而教”的局面。

成功的元评价研究可作为指导QRIS的设计与改进、持续提升学前机构质量的重要工具。塞尔曼和菲纳(Zellman & Fiene)认为,对于QRIS,元评价研究不会产生“对”或“错”的回答,如何利用元评价研究数据指导学前机构质量提升才是关键。因此,QRIS元评价研究必须首先建立“研究如何更好开展及使用”的清晰的框架,研究者应与州政府、QRIS利益相关者形成研究同盟,来支持元评价研究的实施,并进一步支持QRIS的发展(该过程也是检验和解释元评价研究的过程),只有这样,研究结果才能有效应用。同时,在州QRIS持续实施过程中,应鼓励QRIS管理者和利益相关者积极参与元评价研究,逐渐达成共识并实现有效的教育服务。另外,测量的实施方案可能对元评价研究的结果产生影响,例如,改变观察班级的数量、观察时长、观察发生的时间段(刚开学时或其他时间段)都有可能影响研究的有效性,因此,改进观察评价的可靠性也是重要议题。

在我国,当前诸如国家认证认可监督管理委员会立项的《学前教育机构服务认证要求》等教育评级方案开始建立学前教育及服务质量的科学量化的评级。美国QRIS实施的元评价研究可以给我国学前教育评级工作提供些许启示:建立更加科学完善的、系统化的学前教育质量评价与提升系统;各地持续开展学前教育评价的元评价研究,并使研究科学化、系统化;鼓励地方政府、高校、科研单位及幼儿园积极参与元评价研究,从而使研究结论更好地引导学前教育政策的制定及实施,并提升地区学前教育质量。

注 释:

①美国各州政府会对学前教育机构进行“准入式”资格认证。美国大多数州的QRIS与学前教育机构的资格认证是相互独立运行的,除了北卡罗莱纳州、俄克拉荷马州等少数州强制要求具有资格认证的学前机构加入QRIS之外,其他州QRIS大多要求学前机构自愿参与,QRIS评级结果与学前机构的资格认证无关。

②这十项质量成分是:管理、教师教育/培训、健康与安全、结构性质量、过程性质量、特殊儿童服务、机构管理者的专业性、家长沟通、计划性课程和资格认证。

③明尼苏达州QRIS质量评级分为4个等级,从1星至4星;印第安纳州QRIS质量评级也分为4个等级,从1级至4级。

④在印第安纳州,存在一些有宗教隶属关系、但没有获得州政府资格认证的学前教育机构。

参考文献:

[1][18]Linda L.Hestenes,Victoria Kintner-Duffy,Yudan Chen Wang,Karen La Paro,Sharon U.Mims,Danielle Crosby,Catherine Scott-Little,Deborah J.Cassidy.Comparisons among quality measures in child care settings:Understanding the use of multiple measures in North Carolina's QRIS and their links to social emotional development in preschool children[J].Early Childhood Research Quarterly,2015,30(7):199-214.

[2]Tout,K.,Starr,R.,Soli,M.,Moodie,S.,Kirby,G.,Boller,K..The child care quality rating system(QRS)assessment:Compendium of quality rating systems and evaluations[EB/OL].[2016-05-18].http://files.eric.ed.gov/fulltexT/ED566258.pdf.

[3]Zellman,G.L.,Brandon,R.N.,Boller,K.,Kreader,J.L..Effective evaluation of quality rating and improvement systems for early care and education and school-age care[EB/OL].[2016-06-10].http://www.acf.hhs.gov/sites/default/files/opre/improv_systems.pdf.

[4]Zellman,G.L.,Fiene,R..Validation of quality rating and improvement systems for early care and education and school age care[EB/OL].[2016-06-12].http://files.eric.ed.gov/fulltext/ED534457.pdf.

[5]Isner,T.,Soli,M.,Rothenberg,L.,Moodie,S.,Tout,K..Alternative rating structures for Kentucky STARS for KIDS NOW,Evaluation Brief[EB/OL].[2016-06-18].http://qrisnetwork.org/sites/all/files/resources/gscobb/2012-07-09%2004:41/Report.pdf.

[6]Tout,K.,Starr,R..Key elements of a QRIS validation plan:Guidance and planning template[EB/OL].[2016-06-18].http://www.docin.com/p-1720084786.html.

[7][9][14]Michel Lahti,James Elicker,Gail Zellman,Richard Fiene.Approaches to validating child care quality rating and improvement systems(QRIS):Results from two states with similar QRIS type designs[J].Early Childhood Research Quarterly,2014,29 (5):11-22.

[8]James Elicker,Karen M.Ruprecht,Carolyn Langill,Joellen Lewsader,Treshawn Anderson,Melanie Brizzi.Indiana Paths to QUALITY[TM]:Collaborative Evaluation of a New Child Care Quality Rating and Improvement System[J].Early Education and Development,2013,24(1):42-62.

[10]Karoly,L.A.,Zellman,G.L.,Perlman,M..Understanding variation in classroom quality within early childhood centers:Evidence from Colorado's quality rating and improvement system[J].Early Childhood Research Quarterly,2013,28(3):645-657.

[11]Karoly,L.A.,Zellman,G.L..How Would Programs Rate Under California's Proposed Quality Rating and Improvement System? Evidence from Statewide and County Data on Early Care and Education Program Quality[EB/OL].[2016-07-10].file:///C:/Users/yang/AppData/Local/Microsoft/Windows/INetCache/IE/KW7X8GS1/RAND_DB647.pdf.

[12]Mathematica Policy Research.Defining and measuring quality:An in-depth study of five childcare quality rating and improvement systems[EB/OL].[2016-07-15].http://www.whitehouse.gov/sites/default/files/omb/budget/fy2011/assets/management.pdf.

[13][15]Lahti,M.,Cobo-Lewis,A.,Dean,A.,Rawlings,S.,Sawyer,E.,Zollitsch,B..Maine's quality for ME-child care quality rating and improvement system(QRIS):Final evaluation report[EB/OL].[2016-08-27].file:///C:/Users/yang/AppData/Local/Microsoft/Windows/INetCache/IE/LZBZB1PH/QRISEVALRPRT_FINAL.pdf.

[16]Michel Lahti,Terri Sabol,Rebecca Starr,Carolyn Langill,Kathryn Tout.Validation of Quality Rating and Improvement Systems (QRIS):Examples from Four States.Washington,D.C.:Research-to-Policy,Research-to-Practice Brief OPRE[EB/OL].[2016-06-12].http://crisnetwork.org/resource/2013/validation-quality-rating-andimprovement-systems-qris-examples-four-states.

[17]Thornburg,K.,Mayfield,W.A.,Hawks,J.S.,Fuger,K.L..The Missouri Quality Rating System School Readiness Study[EB/OL].[2016-09-10].http://mucenter.missouri.edu/MOQRSreport.pdf.

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();