再谈CIPP模型“作为改进系统的策略”

B站影视 日本电影 2025-04-12 13:48 2

摘要:斯塔弗尔比姆的《评估模型》被误读或忽视,以致目前许多研究矮化或误用了CIPP模型。为此,需要重新审视CIPP模型,确定它是如何追求“改进”、针对“系统”和作为“策略”的。CIPP模型注重全面性和客观性,在理论上扩充了泰勒目标模式的内容,在实践中强调分阶段地对项

感谢您关注“永大英语”!

林传舜 刘子绮

斯塔弗尔比姆的《评估模型》被误读或忽视,以致目前许多研究矮化或误用了CIPP模型。为此,需要重新审视CIPP模型,确定它是如何追求“改进”、针对“系统”和作为“策略”的。CIPP模型注重全面性和客观性,在理论上扩充了泰勒目标模式的内容,在实践中强调分阶段地对项目开展评估,切实服务项目“改进”。CIPP模型诞生于大型项目,主要针对大型“系统”。评估者应按照在形式上拆解、在内容上细化、在方法上综合,以及在利益上兼顾的“策略”来应用此模型。近年来,美国评价学界出现了若干新趋势,这应与斯塔弗尔比姆的本意区分开来;我国评价的现实需求日益复杂,经典模型的意义日益凸显,因此,有必要对经典评估模型进行更多探讨。

一、 问题的提出

1983年,斯塔弗尔比姆(Daniel L. Stufflebeam)出版了经典著作《评估模型》。该书详细介绍了CIPP评估模型,收录了泰勒(Ralph W. Tyler)、斯克里文(Michael J. Scriven)、克隆巴赫(Lee J. Cronbach)等评价学家的重要文章,对于理解评估模型的内涵及发展史具有重要意义。今天,该书已走到了“不惑之年”。然而,斯塔弗尔比姆的一些重要观点,如CIPP模型“作为改进系统的策略”(as a strategy for improving systems)仍未被深入研究,这导致CIPP模型经常被过分简化或矮化。

为了澄清CIPP模型的正确用法,本文借鉴了伦德伯格(Ian Lundberg)等学者的方法,通过分析权威期刊刊发的论文内容来展示误用情况。[1]本研究对国内教育学领域权威期刊进行了普查,根据主题相关度、“CIPP”一词的出现频次等进行了综合筛选,最终选定《教育发展研究》为研究对象,该刊由上海市教育科学研究院与上海市高等教育学会联合主办,聚焦教育管理与实践问题,在业内具有较高的权威性和影响力,其刊载的论文为剖析CIPP模型的应用情况提供了丰富且典型的样本,因此适合作为本研究的对象。[除《教育发展研究》外,笔者还分析了《教育研究》等刊物上的文章。由于《教育研究》等刊物上相关文章较少且本文篇幅有限,这里不再呈现分析结果。]据分析,《教育发展研究》自创刊至本文收稿,共有33篇文章提到了CIPP模型,其中有16篇论文简单地提到了该模型而没有深入讨论或应用它,对剩余的17篇文章进行了精读和分类(见图1)。

结果显示,有高达35.3%的论文(6篇)将CIPP评估模型用作指标体系中的一级指标,有11.8%的论文(2篇)按照背景因素、输入因素、过程因素和结果因素对问卷内容进行拆分。这些均不符合斯塔弗尔比姆设计该模型的本意。将CIPP模型用作一级指标的方式过度简化和矮化了该模型,将消弭模型的许多重要优势。CIPP模型同样不宜用于问卷设计。斯塔弗尔比姆曾特别强调,“它(CIPP模型)的重点不是指导个人研究的开展,而是为机构的决策者提供持续的评估服务。”[2]62在所有文章中,只有17.6%的文章(3篇)规范地使用了CIPP模型,其中2篇明确声明了对模型的化用,仅有1篇遵循了斯塔弗尔比姆的原意。在唯一遵循了原意的文章中,评价者分阶段、分环节地开展了评估,并且在每个环节中综合运用了多种评价方法。[3]

显然,CIPP模型经常被误用。与此同时,以往的研究或教科书对CIPP模型的阐述语焉不详,[例如,涂艳国在《教育评价》一书中指出,CIPP模型“包括背景评价(context)、输入评价(input)、过程评价(process)、成果评价(product)四个方面,它强调这四种评价为决策的不同方面提供信息。背景评价为确定目标提供信息,主要包括描述教育目标以及确定教育目标的适当性和可行性。输入评价就是……”显然,这只是一种简单的概述,读者还需要更多的细节。为了提供更多信息,下文将省略教材中的内容,重点讨论其他内容。对于被省略的部分,读者可自行查阅王景英或涂艳国出版的教材。]以至于读者难以有效理解和利用它。因此,重述CIPP模型的理论要旨和实践要点是至关重要的。下文各个部分将依次讨论CIPP模型的理论要旨、使用情境、实施要点、应用案例、研究趋势和现实启示。教育学报2025年第1期再谈CIPP模型“作为改进系统的策略”

二、 追求“改进”:CIPP模型的理论要旨

追求“改进”是CIPP模型的出发点和落脚点,是该模型最关键的理论特征。CIPP模型通过对泰勒目标模型和其他评价模型的批判性继承确立了其追求“改进”的理论要旨。因此,要把握CIPP模型的核心理论特征,就必须考察它与泰勒模型或其他模型的关联,了解它是如何超越“证明”并寻求“改进”的。

(一) 超越“证明”

“评估最重要的目的不是证明(prove)而是改进(improve)”[4],要理解CIPP模型追求“改进”的理论意义,首先应当讨论CIPP模型与泰勒目标模式的关系。在斯塔弗尔比姆看来,泰勒目标模式的“证明”特征面临着实践的挑战。在开展评估的过程中,斯塔弗尔比姆逐渐认识到传统目标模式的两大缺陷:一是确定评价目标非常困难,往往需要投入大量人力和财力。因此,确定目标不应作为理论的起点,而应该作为理论模型的过程性目标之一。二是管理者容易对目标模式产生庸俗化的理解,将目标等效于可量化的成绩目标,从而损害项目质量。项目目标难定和目标容易被庸俗化理解这两个困难使得泰勒目标模式难以服务实践。相对而言,斯塔弗尔比姆的CIPP模型更注重考察评估目标和进行全面的信息搜集。这使其能够克服泰勒目标模式的流弊,为评估实践提供更好的指导。

然而,强调“改进”不等于放弃“证明”,也不等于否定泰勒目标模式。1989年,斯塔弗尔比姆参编了泰勒文集。其间,他提出泰勒目标模式的某些内部缺陷“将教育引向了错误的方向”[5]。但在后来,他改变了看法。在2008年的一次访谈中,他分享了与泰勒共同设计底特律学区小学评估任务的经历。当时,二人分别与不同的人交谈以收集信息,结果泰勒收集的各类信息“不同而且更好”。经过这次合作,斯塔弗尔比姆发现泰勒不仅非常善于获取信息,而且对评估的重点了然于胸,“我开始相信拉尔夫专注于评估的方法非常合理”[6]。可见,如果使用得当,泰勒的目标理论也能有效地指导评估实践。

总之,在理论层面,CIPP模型拓展和补充了泰勒目标模式的内容。斯塔弗尔比姆曾提出:“只有当评估者需要超出现有信息的信息时,他们才应为CIPP模型中的每种评估类型收集新信息。”[7]当项目的需求侧重于结果评估时,仅使用泰勒目标模式也是完全合理的。在实践层面,CIPP模型的“改进”取向可以超越泰勒目标模式的“证明”取向。它能更好地指导评估任务,尤其是那些大型评估任务。泰勒将评价定义为“一个确定实际发生的行为变化程度的过程”[8],但由于被误用等原因,泰勒目标理论无法有效指导实践,而追求“改进”的CIPP模型则可以帮助一线评估者更好地适应不断变化的现实。

(二) 寻求“改进”

寻求“改进”是CIPP模型根本有别于其他类别的评估模型的地方。斯塔弗尔比姆曾梳理了22种重要的评估模型并将它们分成了4个大类(见下页表1)。其中,CIPP模型属于“决策导向的研究”。在4个大类中,“伪评估”是指受政治支配的、不追求公正合理的结果的评估。“准评估”是指只聚焦于某些技术问题而不会尝试对某事的优点和价值进行广泛评估的方法。与之相比,“提升/以问责为导向的评估方法”则更加重视全面性,评估者通常会关注所有相关的结果,而不仅仅是那些与计划目标相关的结果。“以社会议程为导向/倡导方法”是从追求社会改良、追求信息平权等动机出发的,它们常以某种后现代主义哲学强调文化多元化、道德相对论和现实的多重性。

CIPP是“提升/以问责为导向的评估方法”大类中的一种评估模型。该类模型具有客观性和全面性两大特点,因而能够切实促进项目“改进”。一方面,这类模型强调要全面收集和组织信息以改进服务,这使它有别于伪评估和准评估技术。此外,CIPP模型客观主义的思想基础使其能够更好地在复杂的大型项目中提供用于决策的信息,给出必要的价值判断,这使其与以社会议程为导向/倡导方法区别开来。此外,与此类别中的其他方法相比,CIPP模型提倡分阶段、分环节地探讨项目的有效性、优劣势、成效和问题。这使得CIPP模型在实施要点方面有别于另外两种模型和方法。总之,CIPP模型强调要分阶段进行评价,注重收集大量的数据,并在整个评价过程中做出关键的价值判断。这些为项目“改进”提供了有力支撑。

综上所述,CIPP模型追求“改进”的理论要旨可以被理解为:CIPP模型在理论上扩充了泰勒目标模式的内容,在实践中,它比泰勒模型能更好地指导大型项目评估。CIPP模型具有全面性和客观性的特点,强调分阶段、分环节地开展评估,因而可以切实服务项目决策和改进。

三、 针对“系统”:CIPP模型的使用情境

CIPP模型的理论要旨是在大型项目评估的实践中逐渐生成的。同时,CIPP模型的特点也决定了它更适用于大型项目评估。一言以蔽之,CIPP模型主要针对的是大型“系统”,最佳适用对象为大型项目。

(一) 诞生于大型评估项目

CIPP模型是基于美国俄亥俄州哥伦布市的公立学校评估项目而提出的,该项目是一个耗资、耗时甚巨的大型评估项目。1965年的《中小学教育法案》(Elementary and Secondary Education Act of 1965,ESEA)提出,联邦政府要加大投资以提高弱势群体的学业成绩。[9]据统计,仅法案第一编(Title I)的总投入就达2600万美元。[10]为确保资金得到有效使用,各州迫切需要招募能够满足该法案要求的评估人员。其中,俄亥俄州哥伦布市在最初申请660万美元的资金却因计划不充分而被拒绝后,聘请了斯塔弗尔比姆来制定计划及开展评估。

在评估过程中,斯塔弗尔比姆发现“我需要提供信息帮助人们做出关于……如何让它走上正轨的决定”[11]。在这种认识的基础上,他对传统的评价方法进行了改进。后来,又有专家建议他对评估目标负责。在实践经验和专家建议基础上,斯塔弗尔比姆提出了从背景(Context)、输入(Input)、过程(Process)和结果(Product)四个方面展开评估的构想。在他的学生梅里曼(Howard O. Merriman)的提议下,该模型被命名为CIPP模型。该模型满足了评估大型项目的评估需要,能够更好地服务项目决策和改进,因此,它一经提出就“得到了广泛的支持,尤其是来自美国教育办公室、几个大型学区和研发机构以及许多教育行政人员的支持。”[2]156

可以看出,CIPP模型的出现与大型评估项目的激增密切相关。传统的评估方法专注于评估结果的准确性和可靠性,而斯塔弗尔比姆则在20世纪60年代将评估的重点转移到了寻找满足广泛社会需求的有效方法上。这一时期,教育投资急速增长,催生了旨在提升决策效能和改善财政资源使用效率的大型评估项目。缘此,CIPP模型应运而生,明确了目标和结果之外的评价要素,强调了为决策服务的重要性,对一线的评估工作者来说更具实用性。

(二) 适用于大型评估项目

CIPP模型被用于大型项目时最为有效。从理论层面看,如果把那些比较简单的方法看作一种极端,把清单(checklist)这种融合了多种要素的“多模型”(multimodel)看作另一种极端,那么根据斯克里文的说法,“复杂的CIPP模型是一个重要的中间案例(intermediate case)”[12]。这意味着,与简单方法相比,CIPP模型的全面性使其更适合复杂的评估需求。与“多模型”方法相比,它能够提供更实用的指导。总之,CIPP模型更像是一种指南,在不限定具体步骤和方法的情况下指出评估的方向,因而更适用于大型评估项目。

从实践层面看,西密歇根大学评估中心及其工作人员(包括斯塔弗尔比姆)经常将该模型用于大型项目。事实上,该中心已经使用CIPP模型对10个类别的41个评估项目进行了评估。图2给出了部分示例。例如,高等教育类别下原有7个评估项目,图中展示了其中3个项目,分别是“对希尔家庭基金会提高高等教育生产性的项目的评估”,“帮助西密歇根大学开发全校项目审查系统的技术援助项目”和“西密歇根大学教育学院关岛校外博士项目评估”。这些项目耗资、耗时均较多,属于大型项目。

四、 作为“策略”:CIPP模型的实施要点

CIPP模型主要是为大型评估项目设计的,但也可以应用于较小的评估项目。为了解如何将CIPP模型作为一种“策略”进行应用,下面将分阶段详述CIPP模型在大型项目中的实施要点,并简要介绍其在小型项目中的应用方式。

(一) CIPP在大型项目中的实施要点

要在大型项目中有效运用CIPP模型,评估人员应根据背景、输入、过程和结果四类别对评估项目进行拆解和细化,并依据类别分配评估人员,制定详细的评估计划。在背景、输入、过程和结果的所有部分,评估者应当灵活采取多种方法进行数据收集。同时在项目评估的全过程,评估者应当兼顾过程性评估与总结性评估,注重整合不同主体的利益诉求。下面将分阶段来详细解释CIPP模型的实施要点。

1. 计划阶段

制定适当的评估计划往往是开展评估的第一步。为此,将首先介绍制定计划阶段的两项实施要点。

要点一,在形式上拆解。要使用CIPP模型制定评估计划,应当首先根据背景、输入、过程和结果将项目分解为子项目。这种拆分适用于整个评估项目,而不仅仅是研究工具。不应把它作为拆分指标体系或调查问卷的依据。拆分项目后,还可以根据背景、输入、过程、结果将评估人员分成子项目组,或者为每个子项目制定详细的计划。这种拆分有助于明确评价内容,保证过程的有序性,并形成高质量的研究计划。

要点二,在内容上细化。当项目被拆解后,细化背景、输入、过程和结果等各个领域的任务是至关重要的。其中,背景评估和输入评估并不是轻而易举可以完成的,它们需要评估者仔细关注。在最终的评估报告或论文中,这些评估的结果也不容忽视。一般来说,背景、输入、过程、结果各个领域下都会包含相当复杂的评估任务。

2. 实施阶段

在制定完评估计划后,评估者就需要按照CIPP模型的基本要求落实评估计划。在这一阶段也有两项重要的实施要点。

要点一,在方法上综合。在项目实施过程中,CIPP模型兼顾描述性和判断性信息的收集与应用,兼顾定性资料和定量数据的收集。CIPP模型不是单一的、简单的评价方法,它要求在背景、投入、过程和产品所有部分采取多种方法进行评估。只有综合使用多种方法来搜集数据,才能为项目的改进提供有益的数据支持,才能提高评估过程的可信度和系统性。

要点二,在利益上兼顾。CIPP模型强调整合各利益相关方的诉求,强调过程性评价和总结性评价的结合。在使用CIPP模型开展评价时,不仅要为个人研究服务,还应考虑客户和管理者的利益。在操作层面,评估者应通过定期提交过程性和总结性报告等方式与客户和管理者保持密切联系。

(二) CIPP在小型项目中的实施要点

CIPP模型在小型和大型项目中的应用有许多相似之处。CIPP模型在国内实践中常被用于小型项目,但在评价过程中并未被妥善应用。学者们要么将背景、输入、过程和结果作为一级指标,要么将其用作只针对单一评价问题的简单方法。为了更好地说明CIPP模型在小型项目评价中的应用,斯塔弗尔比姆和同事提供了一个在小型教育项目中使用该模型的例子。[14]94他们强调CIPP模型尤其适合在复杂的、动态的社会环境中评估一些项目,如“服务学习项目”(Service-learning projects),旨在探索社区服务与学术课程的整合方式。在该项目的评估框架中,他们衡量了“服务学习”对学生、教师、社区和机构的影响,随后几年间,此评估框架又历经了两次修订和完善。在数据搜集方面,斯塔弗尔比姆团队在背景、输入、过程和结果评估部分均采用了问卷调查、电话访谈、走访观察相结合的数据收集方法。由此可见,CIPP模型在小型项目中依然需要作为系统性的评估指南。评估人员应注意判断项目是否有效,及时向管理人员提供反馈,并努力实现项目的持续改进,满足利益相关者的要求。

五、 CIPP模型的应用案例

为了更好地理解CIPP模型的实施要点,将以斯塔弗尔比姆主持的两项评估项目为范例,解读CIPP模型的应用方式。具体而言,以美国海军陆战队的绩效考核系统评估项目为例介绍如何制定评估计划,以康苏洛基金会的自助房项目评估为例介绍如何实施评估。

(一) 制定计划

在美国海军陆战队的绩效考核系统评估项目中,斯塔弗尔比姆及其团队需要评估美国海军陆战队的绩效考核系统,确定其优势和劣势,并开发一个新的系统。该项目预算为44万美元,期限为6个月。他们基于CIPP模型撰写了一份评估计划书,并赢得了该项目。[15]

在制定计划阶段,斯塔弗尔比姆及团队首先按照背景、输入、过程、结果对该项目进行了拆解。团队被分成了3个任务小组,分别负责项目管理、背景评估和输入评估。各项目团队共确定了5项主要任务,并需要依据任务时间表的规划提交评估报告。具体的评估任务如下:“项目组织机构和背景评估”“当前绩效考核系统的背景评估”“输入评估,以确认和分析备选绩效评估系统,并进行文献研究”“形成并上报新绩效考核系统的结论和建议”“着手为开发和运行新的绩效考核系统制定计划”。

在将项目拆解为子项目后,斯塔弗尔比姆为每个子项目分配了专门的评估小组,并制定了更详细的项目执行计划。这里仅以“当前绩效考核系统的背景评估”这项任务为例进行说明。斯塔弗尔比姆为该任务设计了10项更具体的任务,内容如下:(1)通过电话会议与司令员就将要应用到人事评估系统中的专业标准达成一致;(2)紧接在上个任务的电话会议之后,对商定的标准进行编辑汇总,并分发给所有的项目参与者……(9)准备1份关于当前绩效考核系统评估的背景评估报告,提出新系统需要满足的要求,并向项目经理提交一份报告;(10)向美国海军陆战队提交1份最终的背景评估报告。实际的项目执行计划还规划了每位领导成员在每个任务上投入的天数,这里均已省略。最终,斯塔弗尔比姆和他的团队根据详细的评估计划成功完成了任务,并获得了军方的集体嘉奖令。

可以看出,斯塔弗尔比姆大致按照背景、输入、过程和结果的类别拆分了项目并对评估团队进行了分工。此后,斯塔弗尔比姆又为每个子项目制定了极为细致的任务。最终,这份高质量的计划不仅帮助团队赢得了客户的信任,更确保了评估项目的顺利完成。

(二) 实施评估

康苏洛基金会的自助房项目的评估专为夏威夷的75个低收入家庭设立,旨在激励他们置办自助房并逐步形成一个秩序良好的社区。斯塔弗尔比姆及其团队曾对该项目进行了为期8年的评估。[14]57[16]在斯塔弗尔比姆及其团队的努力下,评估项目取得了成功。多年后,斯塔弗尔比姆再次访问该社区,他发现尽管周围地区的发展每况愈下,但从该项目中受益的社区仍然很繁荣。在这次评估后,斯塔弗尔比姆确定了对其成功至关重要的11个关键要素。在这些要素中,“多种数据收集方法”和“过程性和总结性报告”与项目的实施直接相关。因此,下面将重点介绍这两个要素在实践中是如何发挥作用的。

斯塔弗尔比姆曾综合运用了多种方法来搜集数据(见表2)。1994年至2002年,评估人员每年至少会使用三种方法来收集数据。同时,在背景、输入、过程和成果评价各个类别中,每个类别至少会涉及两种方法。其中,“项目概要”(project profile)法注重综合呈现评估项目的各项具体要素,包括任务、目标、计划、组成部分、人员、时间表、资源、进展、认可度等。“巡回式观察者”(traveling observer)方法被用来调查和汇总工作人员在不同地点的项目执行情况。随着项目评估的深入,评估人员运用“案例研究”法,对参与家庭进行了反复的访谈。此外,他们还运用“利益相关者访谈”,对自助家庭、项目工作人员、承包商等不同群体进行了访谈,以确保所有利益相关者都能从评估中受益。

斯塔弗尔比姆还对数据搜集的过程提出了明确要求。他曾制作一份评估清单(checklist),以帮助生成过程性和总结性的评估报告,并整合不同利益相关者的利益诉求(见表3)。“过程评价”清单是10个子清单之一,为了完成过程性报告,评价者需要认真了解每个利益相关群体的要求。在评估任务完成时,评估报告会被提交给基金会董事会、评估方人员、其他外部团体等利益相关群体,以向他们展示项目价值。此外,在项目全部完成后,客户有权访问和使用项目概要中的所有信息,包括资金使用情况信息。这使得客户可以管理、记录或监控整个评估过程,也体现出了对不同利益相关者的尊重。

可见,斯塔弗尔比姆在背景、输入、过程、结果各类别的调研中都综合运用了多种方法。对于每个类别,他都要求考虑到不同主体的利益诉求,并确保生成过程性和总结性报告。这些措施使得评估能够显著提高项目质量。

六、 CIPP模型研究趋势与现实启示

CIPP模型推出至今已有四十年,在这四十年间,评估领域发生了重大变化。下面将讨论学术界一些值得注意的新趋势,并简要概述CIPP模型如何为我国当代教育评估提供理论启示。

从美国的CIPP模型研究史来看,有关该模型的研究曾发生过“综合化”的范式转向。在CIPP模型最初诞生的二十世纪七八十年代,美国学者经常以单一的CIPP模型为理论依据开展对大型项目的评估研究[18-20]。然而,这种方法随着时间的推移逐渐衰落。如今,西方社会的许多大型评估项目都融合了CIPP和其他模型的主要思想,而非依靠一种模型作为理论基础。此外,近期项目评估的教材和专著较少关注评估模型或理论,而是强调需求分析、数据收集、成本核算等细节。[21-23]概言之,最近的美国评价界已经把重点从使用单一的模型转移到进行全面综合的评价研究。这与斯塔弗尔比姆的观察是一致的:“我确实认为有必要对评估有更广泛的理解,对该领域进行更深入的理论分析……我强烈建议应该朝着理论发展和理论检验,而非构建概念模型的方向发展。”[11]

在美国评估学界的各种“综合化”思潮中,有一种“指标化”的趋势特别值得一提。如前所述,国内不少学者将CIPP模型简化为一级指标,这可能是通过OECD组织间接受到了美国“综合化”趋势的影响。OECD在1994年的一份报告中指出了当时美国的教育评估新趋势,“美国采用的‘成果’、‘资源’和‘背景’指标框架是一个混合体……指标是根据属于CIPP谱系(CIPP lineage)的决策模型构建的”[24]。后来,OECD吸收了这一趋势并将其应用到了教育发展指标(OECD Indicators)中。但严格来说,教育发展指标并非“基于CIPP模型的”[25],而是基于美国学者对CIPP模型的推广。因此,区分CIPP“指标化”趋势和斯塔弗尔比姆的思想很重要。除非另有说明,否则CIPP模型应指斯塔弗尔比姆所倡导的评估框架。

美国评价学界这种范式转向的意义主要在于,综合性的评价研究可以克服单一理论的限制,更灵活地处理实际问题。不过,这也可能导致初学者无视现有的理论模型和思想,导致评估沦为低水平的试错工作。对我国的研究者来说,转向美国当前的综合性范式是一种选择,但不是唯一选择。未来,我国学者可以根据对现有评价模型的了解,创造新的更适合我国教育现状的评价范式,以满足具体的评价需求。当应用各类新范式时,应准确解释CIPP模型与新范式之间的关系,而非把斯塔弗尔比姆的CIPP模型与新范式混为一谈。

最后,有必要简要探讨CIPP模型对我国评价事业的启示。从变化趋势来看,评价模型正在从具体走向抽象,美国学界对CIPP等单个模型的研究也正从单一走向综合。这些从根本上反映了实际评估需求的日益复杂。在这种情况下,期望以简单的方式解决现实世界的评估问题是不现实的。研究者必须充分吸收现有评价模型的思想,以全面灵活的范式应对不断变化的评价环境。现有的评价模型虽然各有优缺点,但它们之间并没有严格的线性“进化”关系。因此,应加强对现有模型的研究,对特定模型进行系统、深入地理解,以便在正确的条件下正确应用。例如,对于CIPP模型,拆分项目、细化环节、多元方法、兼顾利益等方面对评估大型项目具有重要意义。要立足实际,在正确认识CIPP等模型的基础上,有效运用模型的思想服务评价实践。总的来看,评价的现实需求日益复杂,评价的经典模型的意义日益凸显,因此,有必要对经典评价模型的思想进行更全面地研究和探讨,以便更好地服务于现实。

参考文献

[1] LUNDBERG I, JOHNSON R, et al. What is Your Estimand? Defining the Target Quantity Connects Statistical Evidence to Theory[J]. American Sociological Review, 2021, 86(3): 532-565.

[2] STUFFLEBEAM D L, SHINKFIELD A J. Systematic Evaluation: A Self-instructional Guide to Theory and Practice[M]. Dordrecht: Kluwer-Nijhoff Publishing, 1985.

[3] 李宝敏, 闫寒冰.基于CIPP评估模型的教师远程培训质量评估: 一项案例研究[J].教育发展研究, 2017,37(18):30-36.

[4] STUFFLEBEAM D L. Foundational Models for 21st Century Program Evaluation[M]. STUFFLEBEAM, D L. Evaluation Models. Viewpoints on Educational and Human Services Evaluation Second Edition. Norwell: Kluwer Academic Publishers: 2002:33.

[5] MADAUS G F, STUFFLEBEAM D L. Educational Evaluation: Classic Works of Ralph W. Tyler[M]. Norwell: Kluwer Academic Publishers, 1989: preface xiv.

[6] oral history project team. The Oral History of Evaluation: The Professional Development of Daniel L. Stufflebeam[J]. American Journal of Evaluation, 2008, 29(4): 555-571.

[7] STUFFLEBEAM D L. The CIPP Model for Evaluation[M]//STUFFLEBEAM D L. Evaluation Models. Viewpoints on Educational and Human Services Evaluation Second Edition. Norwell: Kluwe0072 Academic Publishers: 2002:279

[8] 拉尔夫·泰勒.课程与教学的基本原理[M]. 施良方,译,瞿葆奎,校.北京:人民教育出版社,1994:85

[9] Elementary and Secondary Education Act of 1965, Title I Planning Handbook [EB/OL]. [2022-06-25]. https://archive.org/details/ERIC_ED073198.

[10] KIRST M, JUNG R. The Utility of a Longitudinal Approach in Assessing Implementation: A Thirteen-year View of Title I, ESEA[J]. Educational Evaluation and Policy Analysis, 1980, 2(5):17-34.

[11] STUFFLEBEAM D L. Interview: An EEPA Interview with Daniel L. Stufflebeam[J]. Educational evaluation and policy analysis, 1980, 2(4): 85-90.

[12] SCRIVEN M. Evaluation Ideologies[M]. STUFFLEBEAM D L. Evaluation Models. Viewpoints on Educational and Human Services Evaluation Second Edition. Norwell: Kluwer Academic Publishers: 2002:275.

[13] KELLAGHAN T, STUFFLEBEAM D L, et al. International Handbook of Educational Evaluation Vol.9 [M]. Dordrecht:Kluwer Academic Publishers, 2003:58.

[14] STUFFLEBEAM D L,ZHANG G. The CIPP Evaluation Model: How to Evaluate for Improvement and Accountability[M]. New York: The Guilford Press,2017.

[15] STUFFLEBEAM D L, CORYN C L S.评估理论、模型和应用[M]. 2版.杨保平,杨昱,等译,杨海强,审校.北京:国防工业出版社,2019:315.

[16] STUFFLEBEAM D L, GULLICKSON A, et al. The Spirit of Consuelo: An Evaluation of Ke Aka Ho’ona[EB/OL]. [2023-03-04]. http://rszarf.ips.uw.edu.pl/ewalps/teksty/consuelo_eval.pdf.

[17] STUFFLEBEAM D L. CIPP Evaluation Model Checklist[EB/OL].(2007-03-17)[2022-06-27].https: //wmich.edu/sites/default/files/attachments/u350/2014/cippchecklist_mar07.pdf.

[18] MICHAEL M E. Planning and Evaluating Library System Services in Illinois Using the CIPP Model[R]. Urbana-Champaign: Library Research Center of University of Illinois Urbana-Champaign, 1976.

[19] ROSS G H, MIDDLETON M. Evaluation of a Local District Developed Spelling Program Based on Fifty Years of Research[EB/OL].[2023-03-04]. https://eric.ed.gov/?id=ED185595.

[20] FORGIONE F D,KAPLAN B A, et al. Evaluation of Compensatory Education Programs: Problems, Promising Strategies and Recent Trends[EB/OL].[2023-03-04]. https://eric.ed.gov/?id=ED175933.

[21] NEWCOMER K E,HATRY H P, et al. Handbook of Practical Program Evaluation 4th Edition[M]. San Francisco: John Wiley & Sons, 2015.

[22] POSAVAC E J. Program Evaluation: Methods and Case Studies[M].8th Edition. New York: Routledge,2015.

[23] OWEN J M. Program Evaluation: Forms and Approaches[M].3rd Edition. London: Routledge, 2020.

[24] TUIJNMAN A, BOTTANI N. Making Education Count: Developing and Using International Indicators[R]. Paris: Centre for Educational Research and Innovation (of OECD), 1994:62.

[25] 张国强.OECD教育发展指标体系分析及启示——以《教育概览:OECD指标(2003)》为例[J].外国教育研究, 2006(11): 24-28.

(本文首次发表在《教育学报》2025年第1期)

来源:永大英语

相关推荐