教育评价科学化问题反思

所属栏目:教学管理论文 论文作者:/
摘要

  教育评价自 20 世纪 80 年代引入我国以来,迅速在学业水平评价、学校评价和教育综合评价等微观、中观和宏观层面得以广泛应用,并对促进教育质量的提高产生了积极影响。但随着教育评价实践的持续深入,社会大众对其诱发的负面导向的质疑也不断出现,如 “分数成了命根” “升学率大于天” “一考定终身”等,有关教育评价改革的呼声也一直不绝于耳。在规划层面, 《国家中长期教育改革和发展规划纲要 (2010-2020 年) 》明确提出了 “改革考试评价制度和学校考核办法,建立科学的教育质量评价体系,改进教育教学评价”的总体发展目标。而在实践层面,新一轮的高考招生和学业评价改革、学校管理考评机制改革和高校评估模式变革也正式拉开了序幕。

  围绕着如何建立科学的教育评价体系这一目标,首先无法回避的是怎样看待教育评价科学化这一问题。时至今日,不少学者仍在不断反思和追问: 教育评价作为一种主观性很强的价值判断,到底有无科学性可言?

  而种种与人们教育初衷背道而驰的负面效应究竟是因为教育评价本身不够科学还是太过科学所导致? 科学化能否成为教育评价改革的唯一追求和取向? 笔者从教育评价的本质和特征入手,对教育评价科学化的问题进行了辩证反思,并据此提出了改革建议。

  一、教育评价的本质和特征

  教育评价活动的复杂性一直以来都被人们所公认,因此透过现象把握本质对教育评价改革显得意义重大。虽然学界普遍认同: “评价是对人或者事物进行的价值判断”,但如果我们考虑到一项评价活动完整的 “发生-发展”过程,这一描述似乎又显片面。正如皮亚杰 (Jean Piaget) 在《发生认识论》中所提出的那样: “传统的认识论只顾及到高级水平的认知,换言之,只顾及到认识的某些最后结果……任何关于认识发展的研究,凡追溯其根源,都会有助于对认识最初是如何发展这个尚未解决问题提供答案。”

  从发生学的角度考察,评价活动是主体能动地对客体进行认识并进行价值判断的完整过程。脱离了对客体能动的认识,仅有价值判断就是纯粹的无源猜想; 而仅有认识和反映没有了价值判断,那就不称其为对客体的评价。从这个意义上说,教育评价的本质也应是: 教育评价主体根据一定的教育价值观或教育目标,能动地认识评价客体并作出价值判断的完整过程。教育评价的特征由其本质决定,主要表现在以下三个方面。

  第一,评价对象的多维性。教育评价不同于一般评价,其最大的特点在于教育评价的对象不仅是教育活动中的客观存在,更包括教育活动的参与主体---教育者和被教育者的主观意识、价值观等。教育的本质是有目的培养人的活动,特别是当今教育学的发展,对于 “人”的关注更是达到了前所未有的高度。叶澜教授这样阐述: “教育是直面人的生命,通过人的生命,为了人的生命质量提高而进行的活动。”因此,从这个意义上来说,教育评价最核心的内容也应该是整个教育活动开展过程中对人的评价,它既包括对教育活动中人的客观行为与结果的评价,也应包括对人主观意识和情感需求达成的评价。

  第二,评价方法的多样性。既然教育评价的本质是在能动地认识教育活动的基础上进行的价值判断,那么评价主体如何认识教育活动显然是进行评价的第一步。这种认识对象既包括了教育活动中现象和人的客观存在,更包括人的主观能动性和精神层面、价值层面等。正如瑞典国际知名学者胡森 (T. Husen) 在 《国际教育百科全书》中指出的那样: “在教育研究领域中,本世纪初就已经显现出两个主要范式之间的冲突。一种是模仿自然科学,强调适用于用数学工具来分析的经验的、可定量化的观察,研究确认因果关系并做出解释。另一种范式是从人文科学中推衍出来的,所注重的是整体和定性的信息以及方法说明。”从这个意义上说,对教育活动本身的认识方法决定了其教育评价,在认识教育评价这一环节上也应该存在至少两种不同的范式。

  第三,评价主体的多元性。随着我国社会经济的持续快速发展,教育对整个社会和个人的重要作用也日趋凸显。与教育活动相关的主体也越来越多,如学生、教师、家长、政府、企业等。

  这也使得社会各界不同主体对参与教育评价的渴望和需求日益强烈。与此同时,教育作为一门有着自身发展规律的活动,亦需要我们遵循其理论指导作出评价。因此,教育评价主体价值的多元化也成为其显著特点之一。由于评价是基于主体能动认识客体前提下的价值判断,那么评价主体对客体的认识不仅受主体认识水平的限制,同时更是受主体需求和立场的制约,其多元文化和价值选择亦会随着社会的发展和进步而更趋丰富多彩。

  二、辩证地反思教育评价改革进程中的科学化问题

  (一) 教育评价具有科学性

  一般来说,广义的科学指的是人们对世界万物进行分门别类的研究,亦指研究中所形成的系统性的知识体系。而狭义的科学,则指的是近代科学革命以来,从哲学母体中分离出来建立在经验归纳和数学实验基础上的、系统化的、具有严密逻辑性的知识体系,主要指自然科学。而作者探讨的显然是狭义上的科学,其特征是强调认识和客观规律的吻合,在方法上强调经验的归纳、实验和可以被验证。教育评价是一个进行认识和价值判断的活动。前者是主体能动地对评价客体描述和反映的过程,而后者是根据评价主体的标准进行价值判断的过程。因此,教育评价的科学性也主要体现在对评价客体科学的认识方法和以科学为标准进行价值判断两个方面。

  第一,科学地认识被评客体。在教育研究领域认识教育活动的一种范式是靠模仿自然科学,强调适用于用数学工具来分析经验的、可定量化的观察,研究确认因果关系并作出解释。另一种范式是从人文科学中推衍出来的,所注重的是整体和定性的信息以及方法说明。因此,当我们在教育评价过程中认识被评客体时,我们完全可以采取科学量化的方法,运用教育、心理测量等学科的相关理论去测评了解个体情况,然后通过教育、心理统计等学科知识在一定置信区间内去推断和掌握总体现状。而这也使我们对教育活动的认识和评价由全凭主观经验去判断,进入了根据科学测评方法所描述的结论去作出判断的阶段。

  而从第一代教育评价理论的诞生与教育、心理测量的运用紧密相连来看: 当教育评价主体采取科学的方法认识客体时,教育评价便有了科学性的一面。而随着自然科学的不断发展,知识的累积,加之教育理论的不断成熟和丰富,教育评价不再像古代那样是随意的和非制度性的,而是逐步演变成一项科学性与技术性并重的专业活动。

  第二,科学的价值判断标准。以科学标准进行价值判断就是评价主体在对客体进行能动的反应之后先进行事实判断然后进行价值判断的过程。

  同价值判断一样,事实判断也是一种判断,但它不是对人的需求和客体客观属性的满足关系的判断,而是一种人对客体的认识是否符合客观规律的判断。事实判断不附带主观价值需求,但是受到主体认识水平的限制,事实判断的标准是 “客观、真实”.

  在实然层面,教育评价中的价值判断并不一定以事实判断为基础,因为事实判断是对客体客观与否的判断。在实际的教育评价中,特别是自然科学大力发展的今天,科学标准成了大多数人进行价值判断的主要标准之一。人们往往评价某个教育活动是科学的 (事实判断) ,因为我们应该遵循客观规律 (科学标准) ,所以得出 “这个活动是好的”结论 (价值判断) ; 但同时也会有人评价这个活动是科学的 (事实判断) ,但因为并未能够很好地满足个体的主观需求,而得出 “这个活动不一定好”的结论 (价值判断) .从逻辑上来说,教育评价中的事实判断与价值判断之间并没有必然的联系。因此,教育评价的科学性还表现为评价主体主观上选择科学为标准来实施价值判断。

  在我国各级各类教育实践和改革推进过程中,教育科学对教育评价在标准建立和选择上的指导意义不言而喻。只有建立了科学的、符合客观规律的评价标准,才能够发挥教育评价的积极作用,不断促进教育质量的提升。我国基础教育课程改革通过科学论证和统一规划,制定了相应的课程评价标准就是很好一例。反之,不科学、甚至是“拍脑门”而得出的教育评价标准则会误导教育的计划和实施,进而对质量造成损害。

  (二) 教育评价改革应避免 “唯科学化”倾向

  科学自文艺复兴时期从哲学的母体中分离出来以后,一路不断发展、高歌猛进,特别是在当今社会已经形成了一种主义甚至是信仰。科学不仅成了人们生活中行为处事的绝对准则,更是各学科发展追求的终极目标。在这个大的时代背景下,是否意味着科学也是教育评价改革的唯一导向和发展目标呢? 我觉得需要不断提升教育评价的科学化水平,但也应该避免在整个教育评价过程中追求全盘 “唯科学化”,这是由教育评价的本质所决定的。

  首先,科学主义范式在教育评价过程中有其自身局限之所在。随着后现代的哲学思潮以及多元化成为整个教育学研究的基本底色,如批判教育学、现象教育学以及实践教育学、身体教育学、冲突教育学、女性主义教育学等研究,都体现出了多元文化的价值观选择对教育评价 “唯科学化”追求的现代颠覆。而在方法上,对本质主义方法论的否定,现象学、解释学、人类学、系统科学、叙述研究、行动研究、体验、理解与构建等后现代人文研究范式已经与传统的客观的自然科学研究范式展开博弈,并逐步体现出其对教育活动研究的优势。

  因此,我们在认识教育现象和教育活动过程中也应该重视不同方法论之间各自的特点和侧重。科学的方法主要是用以描述和发现教育现象中的客观存在,而人文的方法则更倾向于对教育过程中人的价值、情感的把握。而在进行价值判断的过程中,我们既要强调所认识、描述的教育现象是否符合客观事实,教育活动的开展是否遵循了客观的规律; 同时我们也应该评价和反思教育活动是否强调、尊重和弘扬人的自身价值以及国家和社会的要求。因此,在教育评价过程中,我们既要采用科学的方法去认识和评价教育中的客观现象,亦要运用人文学科的研究方法去反思和评价教育中人的价值和主观能动性。正如日本 20 世纪 60 年代开展的关于教育评价科学性之争的反思总结那样: 教育评价一方面要求的是科学、客观、可信和妥当严谨的办法; 但首先应考虑从教育的基本目标和教学过程中的各种需求出发,来考察学生的现实状况和达到的目标程度。

  从这个意义上来说,科学测量不过是教育评价的工具而已。也就是说,考试、检查、教育测验等是根据教育目标把握学生的实态,并将其结果作为改善教学依据的方法和手段。那种单纯地追求科学量化后的分数,而不顾及学生成长幅度和学习进展情况的测验,和教育评价的本质风马牛不相及。倘若这种测验使得学生丧失了学习信心,挫伤了学习积极性,则更是与教育评价的思想背道而驰。

  其次,应该接受和支持多元价值观对教育评价产生的影响。在进行价值判断时,教育评价的科学性主要体现为在认识客体的基础上我们要以科学的标准去衡量,也就是对客体科学性、真实性的判断,即事实判断。而价值判断是一个主体带有主观能动性的判断,不同的人即便在相同的认识方法与相同的事实判断的基础上都会由于主体价值观的异同、甚至可能是因为所处的位置与利益不同而产生不同的评价结果。在当今这个多元的社会里,除了尊重社会的、整体的利益,我们同时还应该重视个体的价值与选择。因此价值判断的主体性差异我们是不能、也无法用科学来量化的,正是由于主体的千差万别,才构成了我们这个多彩的社会。正如美国学者古巴 (E. G. Guba) 在其创建的第四代评估理论中所提倡和强调的那样:

  评价的意义在于促进发展。为了使评价有利于服务对象的个性发展,教育评价的期望不是单一群体,而是诸多相关群体的期望集合。评价的过程实际上是一个不同评价主体之间相互交流和理解的过程。

  三、我国教育评价改革与发展的建议

  基于以上分析,围绕着如何建立科学的教育评价体系这一改革目标,我们应从科学与人文的辩证统一上来分析改革路径,主要有以下四个方面的建议。

  (一) 不断改革和提高教育评价的科学化程度

  1. 大力推进教育评价的理论与应用研究

  教育评价的有效实施往往需要综合学科理论的支持和指导,因此在理论研究层面,需进一步加大对教育评价学及其相关学科的投入和研究,如教育测量学、教育统计学、考试学。在实践层面,我们一方面应重视和不断提高每一次教育评价的信度和效度; 另一方面应依据教育评价的目的、要求以及客观情况,全面、系统、科学地选取评价指标或革新测量方法。例如,在评价班级教学质量时,除了采用常规的集中量数 “平均分”之外,亦可加入表示差异量数的 “标准差”或“差异系数”来全面掌握班级教学质量多维度的客观水平,打破单一评价指标带来的认识误区和片面导向。又如,2014 年部分省市高考英语命题改革后,测量性质由 “常模参照”变为了 “目标参照”,相应的高考命题质量评价指标也应进行改变,过去选用的试题 “区分度”等指标以及考试成绩的 “正态分布”取向已不再适切。

  2. 科学发挥教育评价的多重功效

  “激励与导向、监测与诊断、区分与优选、反馈与改进”是现代评价科学不断发展和总结出的功能集合。而在一个完整的教学或教育管理循环中,通过适时开展 “诊断性评价” “形成性评价”和 “总结性评价”,并根据结果分别做好对质量的前馈控制、过程控制以及结果控制,便能够科学地将教育评价的多重功效发挥至最大。但遗憾的是在教育实践中,教师和管理者们不仅对 “诊断性评价”和 “形成性评价”不够重视,即便是对在期末考试或年终考核等 “总结性评价”中所采集到的数据信息往往也仅限于 “将学生的成绩排排名、将学校的总分选选优”.能够对评价结果进行分析并提出针对性反馈意见来指导教育教学改进的则是凤毛麟角。因此,这就要求我们的教育工作者要学习和认识教育评价的意义和功能,充分利用每一次教育评价所收集到的宝贵信息,将其功效发挥至最大。为此,大量的督导评估应大力开展发展性评价或形成性评价,充分利用每一次评估中收集到的信息,以发挥导向作用。教师在一门课程讲授之前,可以先开展 “诊断性评价”,组织摸底测验,了解学生基础,明确教学的重难点; 在学期授课中可以开展 “形成性评价”,对前期的教学效果进行检测,修正教学内容和进度; 在课程结束后可开展 “总结性评价”,将班级学生的测验分数按 “题型”“知识点”甚至是“性别”等有可能存在差异的特质进行分层分类的量化分析,为自己的下一次教学提供多维度、有针对性的改进意见。

  (二) 重视人文精神在教育评价改革中的影响

  1. 注重人文方法的选择

  有别于科学的测量,教育评价还应采取更多的情感体验与对话交流等人文方法去认识和了解被评价对象的主观意识及价值追求等。特别是在基础教育中开展的学生学业水平评价,除了量化的考试分数外,还应主动采取包括对话在内的多种方式去全面了解和评价学生的学习。例如,可以观察学生学习的行为表现,访谈学生对学习的态度、想法及形成学习动力或障碍的各种因素,通过家访了解学生成长环境对其造成的影响等,最终对学生的学习状况和效果以及影响因素做出分析与评价。在实际操作过程中,我们可以借鉴西方 20 世纪 90 年代 “教育评价改革”运动中兴起的 “档案袋评价”法,将反映学生努力情况、进步情况、思想改变和学习成就的一系列作品进行汇集整理,使教育评价能够真正地伴随学生成长、激励学生发展。

  2. 重视人文关怀的体现

  教育评价应该更多地倾听和关注来自不同评价主体和客体的利益诉求,并在教育评价方案设计、评价指标体系构建和评价操作管理的过程中得以适切体现。这也与党中央在 “十八大”上提出 “办人民满意教育”的总体发展目标和教育部《关于普通高等学校本科教学评估工作的意见》等文件所提倡的 “不同评价主体参与教育评估”是紧密联系的。而今年启动的高考英语命题改革,将原本 “一考定成绩”的考核方式改革为 “数考选成绩”的水平测验,亦是体现了对广大考生的人文关怀。在各级各类教育评估中,广大教师和教育管理者对学生、教师和学校的评价应明确教育评价的本质和目的,以促进学生、教师和学校的发展为出发点,在编制调查问卷及测验或考核内容时要充分考虑各方需求,在结果反馈时须站在被评的角度,多以改进教学和管理的角度切入,真正做到 “以生为本”“以人为本”.

  (三) 培育和发展教育评价专业组织和机构

  我国的教育评估中介组织始建于 20 世纪 90年代,以 “高等学校科研院所学位与研究生教育评估所”的诞生为标志。随后又有 “上海市高教评估事务所”与 “江苏省教育评估院”等一大批高等教育评价中介机构纷纷成立,并在我国高等教育评估理论研究和实践探索中发挥了积极作用。

  但受限于社会认可度和自身业务水平的局限,其功用发挥也打了折扣。为了能够更好地辅助评价主体克服自身对教育活动认识水平的局限,在提供客观事实判断基础上,帮助主体实施更为科学、有效的价值判断,政府部门应进一步培育和支持我国专业教育评价中介机构的发展,并引导他们将研究和服务的面向定位由过去的以高等教育评估为主,适时、有序地转向或辐射至更为广阔的基础教育领域。

  (四) 加大元评价研究

  元评价是以教育评价理论和实践为对象而开展的评价或反思。教育评价一词自 1930 年由教育评价之父泰勒 (R. W. Tyler) 在主持美国 “八年研究”项目中提出后,其内涵至今仍处在不断的发展和丰富过程中,而且不同教育评价理论或流派所采取的评价形式、手段及方法更是层出不穷。

  如果我们只是一味地满足与停留在借鉴国外先进教育评价方法手段层面,不去对这些教育评价理论本身进行反思和批判,不去对教育评估的本质进行深入的思考,不结合我们自身的客观情况进行实践,那么我们的教育评价理论永远也只能是在借鉴和学习中,无法取得真正的发展。只有在把握本质和明确目的的前提下,从各种评价理论和模式中汲取最佳、最适合的部分,才能体现教育旋律的复杂性,即限制下带有自由,大众品味中有个人幻想,固定模式中有机动的处理,传统的永恒中有瞬间的新奇创造以及同中有异等。

  参考文献:
  [1]杨晓江 . 教育评估的科学性与科学的教育评估[J]. 教育研究,2000(8) :33 -36.
  [2]刘尧 . 论教育评价的科学性与科学化问题[J]. 教育研究,2001(6) :22 -26.
  [3]陶西平 . 教育评价辞典[M]. 北京: 北京师范大学出版社,1998:55.
  [4]皮亚杰 . 发生认识论原理[M]. 王宪钿,等,译 . 北京:商务印书馆,1996:17.
  [5]叶澜,郑金洲,卜玉华 . 教育理论与学校实践[M]. 北京: 高等教育出版社,2000:137 -140.
  [6]胡森,等 . 教育大百科全书: 教育研究方法[M]. 张斌贤,等,译 . 重庆: 西南师范大学出版社,2006:387.
  [7]全国教育科学规划领导小组办公室 . 全国教育科学“十一五”规划学科发展报告[M]. 北京: 教育科学出版社,2011: 42.
  [8]梶田叡一。 教育评价[M]. 李守福,译 . 长春: 吉林教育出版社,1988:1.
  [9]古贝 埃贡,林肯 伊冯娜 . 第四代评估[M]. 秦霖,蒋燕玲,译 . 北京: 中国人民大学出版社,2008:29.

'); })();