测评的概念(教育测评概念合集7篇)

2024-02-14 15:25:00 来源 : haohaofanwen.com 投稿人 : admin

下面是好好范文网小编收集整理的测评的概念(教育测评概念合集7篇)，仅供参考，欢迎大家阅读！

测评的概念

教育测评概念第1篇

学生的“学”和教师的“教”是在教育改革中显而易见的两个观察点，但却是最不容易评说的两项内容。学生学得是否高效？教师教得是否有创新性？课程和教学的“手术”应从哪里“落刀”？在地方常规考试、观课、评课中，往往众说纷纭，莫衷一是。多年来，浙江省以教育前沿理论为指导，以实验研究为手段，将“高效”与“创新”变成了可观察、可对比的现实。本栏目将陆续推出他们课程和课堂评价实证研究成果，以飨读者。

10年来，浙江省教育厅教研室组织了一大批国内知名专家，设立了由50多名专职人员组成的项目组，搭建了由30多台服务器同时支撑的技术平台，从2所学校试点，到28所学校实验，再到272所学校规模运用，一步一个脚印地开展了关于教学有效性的理论探索、实验比对和应用推广，现已达成了这样的共识：利用现代测评技术捕捉前概念和过程性数据促进有效教学，是提高教学质量的一条关键性途径，它必将对教学起到革命性的作用。

一、背景与意义

1.国内外现状之一

奥苏贝尔(David P. Ausubel)在其《教育心理学》扉页上这样写道，“假如要我把所有的教育心理学原理浓缩为一句话，那我会说：影响学习的最重要的、唯一的因素就是学生已经认识了什么，弄清楚它，然后进行教学”。在教学过程中，教师只有重视并有效捕捉了学生的前概念，才有可能帮助学生真正掌握知识。显然，捕捉学生的前概念，是实现有效教学的关键性环节。

前概念(Preconception)是存在于人们头脑中相对于新知识的已有认知。它可能是正确的，也可能是模糊或错误的。人们在学习任何概念性知识之前，都已经有了前概念。无论是哪一个年龄段，也无论是对哪一门学科知识的学习，都是这样。

国外对前概念的研究可追溯到20世纪初。1929年，皮亚杰（Jean Piaget）出版了《儿童关于世界的概念》，涉及前概念的早期研究。20世纪50～60年代，西方一些国家的学者采用调查问卷、访谈、作业分析等方法，捕捉学生已有的前概念。到20世纪80年代，对前概念的研究转向讨论学生形成前概念的成因。

国内对前概念的研究相对较晚且研究不多，主要集中在物理、化学等教学领域。国内学者一般都认同前概念是教学有效性的主要障碍，但在如何有效捕捉前概念的策略研究上几乎为空白。

综合国内外对前概念的研究，不难发现存在这样一些情况：从“前概念”研究涉及的范围看，国外较多涉及心理学、哲学、医学等领域，而国内则聚焦在物理、化学教学上，很少有人在其他学科进行探索。从“前概念”产生途径的研究看，比较有代表性的观点是将形成前概念的心理途径归结为：先入为主的日常生活经验，知识的负迁移，旧有概念的局限，由语词带来的曲解，进行不当的类比等。从“前概念”捕捉策略的研究看，国内只有本项目组的成员从2005年开始至今有过研究和实践，其结论是“用好互联网教育数据服务平台是一条可行之路”。

2.国内外现状之二

教育质量监测与评估，是监控有效教学的主要手段。它至少涉及这样几项基本要素：测评目的、测评样本、抽样过程、数据采集、数据分析。

我国20世纪90年代中期就已经开展义务教育质量监测，但这项研究存在一些问题：主要服务于上级决策，对一线教师提高教学质量的帮助明显不足；监测样本的数量偏少，形成的评估意见缺乏针对性；抽样过程不一定客观；数据采集较困难，无法常态化；相关因素纷繁复杂，仅靠人工手段无法进行较为深入系统的运算、分析和预警。

在国外，尤其西方国家，教育质量测评工作的主体通常不是教育行政部门自己，而是第三方水平测评机构。其主要特点有：为一线教学质量服务；也采取小样本，也很难形成有针对性的指导意见；抽样过程不可控；数据采集也无法常态化；人工手段无法进行深入分析。

综合上述国内外现状，可明显看出：常规情况下由于存在几乎无法克服的困难，人们在做教学质量测评时，无可奈何地采取了小样本；无可奈何地偶尔使用一下测评这一教学质量监控的主要手段；无可奈何地在采集到的海量数据面前望洋兴叹，白白浪费了99%的有用信息；无可奈何地形成自知针对性不强的教学评估指导意见。

3.发展趋势

在学科教学领域，课堂教学的有效性取决于教师备课的针对性，而备课的针对性又取决于教师真正了解学生的程度。因此，能否在重视并有效捕捉每一个学生的前概念、形成有价值的分析等关键环节上有所突破，将是未来各学科教学质量能否实现飞跃的关键所在。

在教育评价领域，近年来，无论是国内还是国外，都相当重视测评，但问题是怎样规避抽样中的人为因素？评估报告给谁看？期望报告阅读者看出什么来？因此，建立一个科学、公平、客观、有效的质量监控体系，将是未来教育评价工作的一项重要使命。

在教育技术领域，近年来，国内教育技术学和教育信息化工作似乎遭遇了瓶颈，鲜有突破。因此，能否突破当前教育信息化发展应用瓶颈，利用信息技术解放教育生产力，将是对教育技术学和教育信息化价值测评技术的重大考验。

在互联网应用领域，我国自1995年第一个网站诞生以来，从只是浏览网页，到今天实现网络汇款，从只有几十个用户，到今天拥有4.5亿网民，互联网发展迅猛。然而互联网对教育的应用价值还远远没有被发掘出来。因此，让强大的互联网为教学过程、教学评价、教学研究提供强有力的支撑，将是未来互联网发展的一个重要方向。

4.研究意义

“利用现代测评技术捕捉前概念和过程性数据促进有效教学”的研究意义，可以用下面这幅图来简要表示。

二、实践与方法

2008年浙江省教育厅教研室与浙江大学现代教育质量监测与服务研究所共同成立了“利用互联网技术实施教育质量监测”课题组。在前7年研究的基础上，课题组用了3年时间对浙江省11个地区272所小学、初中的20万学生和相关的教师、家长、教育行政领导使用网络平台，监测教育质量，提高有效教学的情况进行了实验。

1.教育质量监测从专业化走向普适化

利用互联网技术实施的教育质量监测可以对学生学业进行常态化、全方位检测，及时查找、反馈，从根本上解决学生怎样学习的问题。利用互联网技术实施的教育质量监测不仅可以进行专业化的施测，也可以帮助学校、教师随时进行自我检测，包括对学生的平时作业、综合素质、学习兴趣与动机、师生关系以及影响学生学业质量的学校、家庭、社会等相关因素的测评。它在技术上实现零门槛，实施教育健康体检，任何测评项目间的数据可以任意组合分析，实现教育质量监测科学化、平民化、普适化，成为一种辅助教育教学及学校管理的日常工具。

2.捕捉学生前概念，实现以学定教的重大突破

前概念指学习者在接受正式的教育之前，在现实生活中通过长期的经验积累与辨别式学习而获得的一些感性印象、一些缺乏概括性和科学性的经验，以及一些与科学知识相悖或不尽一致的观念和规则。传统的教学过程中，教师了解学生前概念的渠道有限、覆盖面窄。教师课堂提问环节由于时间限制往往只能顾及少数学生，学生反馈的信息可能因受到干扰而不真实。互联网技术为突破传统教学瓶颈带来了重大突破。

（1）了解学生的前概念。教师可以课前在互联网平台专有的“讨论”模块中第二天需要学习的讨论题目或前置性作业，每个学生都在没有受到任何干扰的情况下将潜藏在头脑中的“前概念”表达出来。如此一来，教师上课不再仅凭简单的主观猜测来断定学生的已有认识。学生的前概念是丰富多彩的，不同的学生有不同的前概念，教师只有充分了解学生头脑中真实的前概念，才能有针对性地设计教学活动，才能更好地为学生的学习提供指导和帮助。

（2）有针对性地设计不同的学习活动。教师将“讨论”模块中所有学生对某一问题的各种认识归类，理出几种认识模式，有针对性地设计不同的学习活动，最终实现个性化教学、分层教学。

（3）关注可测性或量化。利用网络平台，课前捕捉学生的前概念，就使教师的教学目标非常明确、具体，学生的学习结果实现自动分析，教师的教学效果和工作效益易于检验。在过程与结果中定量与定性的检测，更全面、客观、科学地显现出学生的学业成就与教师的工作表现。

（4）让教师具备一种反思的意识。利用网络平台，课前捕捉学生的前概念，就使得教师可以根据学生的回答，反思以往的教学是否恰当：是否给学生造成了错误、片面的前概念；是否有效地纠正了学生错误的前概念；自己以学生的前概念为教学起点，为实现教学目标或教学意图而采用的一系列具体的问题解决行为方式是否有效。

3.以学生为中心，关注学生全面发展

在新课程的背景下，将过程性评价纳入学生学业评价体系的观点得到了广泛的认同和重视，它有利于改变终结性评价占比过重，一考定终身的现状。过程性评价认为，凡是学习过程中产生的信息都应当得到评价，而不管这些信息是否在预定的目标范围或预期结果内。常规手段下，教师一般都是依据自己的经验对学生进行观察、记录，或者调动学生进行自评、他评和互评，但是由于教师的工作压力和工作负荷、学生作为评价者的专业能力不足和对评价的片面认识，传统的过程性评价在实际操作中比较混乱，收效并不理想。网络平台可以将过程性评价定位到每一个学生，并对每个学生每一天的学习、情感、态度进行跟踪记录，统计分析记录数据，并自动将分析结果推送给教师。教师能够准确及时地掌握每一个学生每一天的学习发展、心理成长等问题，从批改作业等大量简单的劳动中解放出来。教师根据分析结果，重点进行有针对性的差异化教学设计，提高了劳动价值。

网络平台可以实现把每个评价对象的过去与现在进行比较，或者把个体的有关侧面进行比较，实现个体内差异评价。基于互联网的过程性评价是一个过程，通过评价过程得到的不是一个等级或评语，而是大量经过价值判断，反映被评价对象工作或学习质量和水平的、定量和定性的数据和资料。评价的反馈和导向作用，使学生获得最大收益。

基于网络平台的过程性评价是一个综合性评价体系，它不仅有延续性的一面，也有阶段性的一面。从延续性的一面看，评价关注的是在发展过程中的情感态度和行为表现；从阶段性的一面来看，评价关注的是每一阶段的学习效果，包括智能的与情态的效果。

三、成果与创新

1.在学科教学方面

项目组基于多年设计经验，设计研制了有效捕捉每一个学生前概念的平台模块，教师可以打开平台直入个人首页。如，点击讨论模块布置讨论题。学生利用学校的网络教室和信息技术课程活动时间，互不干扰、完整地表达自己的前概念。

在两组对比性公开课上，对照组没有参与过本项目实践，实验组授课教师均来自项目学校。两堂课的结果可谓大相径庭：实验组教师由于在课前捕捉了每一个学生的前概念，知道了多少学生会，多少学生不会，会的程度如何，不会的有几种类型等，使课堂教学效果大大提高；而对照组教师在课堂的前20分钟几乎是浪费时间。这一现场对比令与会代表惊讶不已。

2.在教育评价方面

项目组基于多年的研究实践，大胆提出了“基于互联网的现代测评理念及其技术支撑体系”――基础教育质量监测与评估现代公共服务体系，设计并研制了承载着现代测评理念、方法、技术的基于互联网的教育数据服务平台。

（1）目标定位：服务并促进一线教学质量的提高，兼顾为宏观决策提供数据支持。

（2）样本来源：项目覆盖到的所有学校及其所属全体实名制的教师、学生、家长。

（3）数据采集。基础类信息：姓名、性别、出生年月、民族、籍贯等。过程类数据：前概念表达，平时作业，自助式体检(知识点检测、单元检测)，在线考试，综合实践活动记录，学习兴趣与动机、心情变化等。分析类数据：按出错频率分类的错题本、按教学内容分类的错题本、按地域分类的错题本、任意时间段的作业分析报告、学习跟踪曲线、电子成长记录等。

（4）分析内容：集中趋势、远离中心程度、分布形态等，难度、区分度、积差相关、效度、信度等，最高分、最低分、难度值、能力值、离均值等，方差分析、回归分析、主成分分析、因子分析等。

（5）监测预警。所有与用户强相关的信息或预警信息，会以设定的方式被数据库抓取并自动推送到相应用户的个人首页。

项目组在近3年的时间里为实验学校展开了以前概念、平时作业、心情、学习兴趣与动机、师生关系等为主要指标的过程性数据的跟踪，提供了学习质量分析报告、错题本、相关知识点错题补练、自助式学习“体检”等服务，基本形成了一个能适应区域、学校、教师、学生、家长的基于现代技术的基础教育质量监测与评估体系，实现了全样本跟踪、差异化教学、促进教学质量提高等现代测评的基本要求。

3.在学校发展方面

对教师来说，利用现代测评技术捕捉前概念和过程性数据促进有效教学的研究，实现了课前了解所有学生在不受任何干扰及影响情况下头脑中真实的“前概念”，教师据此进行针对性、差异化教学，从而大大提高了课堂教学效果，提高了教学质量；实现了可根据教师自定义的跟踪提醒规则实行自动跟踪提醒服务；实现了随时关注班里每一个学生的学习动态及走势，分析相关性；实现了可关注到平时最容易疏忽的中间群体和临界群体，确保整体提高；实现了可利用该数据跟踪系统为教科研提供发展性数据，使教科研上一个新台阶；实现了用带有自动批改、补练功能的网上作业系统进行自动采集数据，减少了工作量。

对学生来说，利用现代测评技术捕捉前概念和过程性数据促进有效教学的研究，实现了对每个学生个体的关注；实现了将错题归入错题本并可标注经验教训，使学生复习上一个新台阶；实现了在时间控制下做作业，提高了做作业的效率，使作业习惯上一个新台阶；实现了在当天就发现漏洞并在当天补上漏洞，使学习的有效性上一个新台阶。

对学校来说，利用现代测评技术捕捉前概念和过程性数据促进有效教学的研究，实现了可根据学校自定义的监控提醒规则实行自动跟踪提醒服务；实现了由跟踪数据支撑的发展性过程评价、教学质量监控、教育科学研究；实现了对全校教学状况，尤其是平时作业这个看似普通但实为关键一环的全面掌控；实现了借助平台加强教育质量的过程性管理而使教学质量管理上一个新台阶。

教育测评概念第2篇

作者简介：黄小平，华南师范大学公共管理学院博士研究生，助理研究员；胡中锋，华南师范大学公共管理学院教授，博士生导师，副院长。（广州/510009）

*本文系2012年广东省软科学研究重点项目“广东省科技创新型人才素质结构与评价标准研究”（项目编号2012B070300050）资助成果。摘要：教育评价效度的主要问题是将教育测量的效度概念框架系统照搬至教育评价的效度概念系统，适合于教育评价理论与实践需要的效度概念系统尚未真正建立。本文依据教育评价自身的内在属性特征建构了8个教育评价的效度概念：目的效度、建构效度、内容效度、交叉效度、主体效度、过程效度、功能效度、结果效度，并对其依据及其内涵进行了阐述。

关键词：教育评价；效度；构建一、问题的提出

教育评价是根据一定的教育价值或教育目标，运用可行的科学手段，通过系统地搜集信息、分析解释，对教育现象进行价值判断，从而为不断优化教育和教育决策提供依据的过程。[1]在教育评价实践中，一般要考察教育评价的结果多大程度上实现了既定的教育价值或目标；在具体评价时要考察教育评价指标反映教育目的的实现程度；在搜集各类教育评价信息时，特别是在运用评价工具和评价方法时要考察其能在多大程度上有效实现了对教育对象的测评；在实施某一评价活动时，如何控制影响评价结果有效性的各种误差变量，进而保证评价的内在效度；做教育决策时多大程度上可以将教育评价的结果推广至更大的被评价对象的情境、范围和领域，从而保证教育评价的外在效度等等诸如此类问题。从根本上说，一切教育评价活动的实现程度都必须通过教育评价的效度（validity）来进行评估和检验，并以此来判断教育价值或教育目标的实现程度。

二、教育评价效度的问题概述

（一）将教育测量的效度概念系统照搬至教育评价的效度概念系统

教育测量是对教育中的各种客体在某个或者多个属性上的特征的描述。其独特性在于测量是一种量化的描述，即运用数字系统对教育对象的属性的量加以刻画。在教育测量学的概念系统中，效度（validity）的经典定义是“指人们测量到了所想测量的东西的程度”[2]。因此，研究者在考察教育客体的效度类型时通常非常强调四种效度：结构效度（construct validity）、内部效度（internal validity）、统计结论效度（statistical conclusion validity）、外部效度（external validity）。概括而言，结构效度表示的是实际测量到的结构与预设的理论或构念（construct）相吻合的程度；内部效度表示的是变量与变量之间的确定性关系的程度；统计结论效度意指结论能够被解释并反映事物属性的程度；外部效度意指测量的结果能够被推广到其他情境的程度。

而教育评价是在某种标准（目标）之下对教育对象的价值或者特征的评判。价值在教育评价中不仅可以成为评价的对象，如考察某个教育对象的价值，还可以成为教育评价的标准，如评价标准的选择和确定。因此，从这一点而言，教育评价在评价中具有一定的主观性，是主观估计与客观测量的统一，而且教育评价活动往往比教育测量活动要复杂得多，从教育评价构成的系统要素而言，一项评价活动包括了价值目标和标准、组织机构和人员、评价方法与技术、评价对象与评价人员的心理调控等。从教育评价的客体（教育对象）以及关注的评价内容要素而言，教育评价远比教育测量关注的内容维度、评价方法、判断依据、价值判断等方面要丰富和复杂得多。因此，在考察教育评价的效度评价时我们不能忽略了教育评价与教育测量两者的联系，但同时更应当看到两者之间的区别，在实际应用时不能将教育测量中的效度概念移用至教育评价的效度概念体系当中。另一方面，应根据教育评价的研究对象及自身属性特征来确立其内涵及其概念，并建立教育评价特有的效度概念体系。

（二）适合于教育评价理论与实践需要的效度概念系统尚未真正建立

建立教育评价的效度概念系统是教育评价理论和实践发展的需要。在国内，少有研究者对教育评价的效度理论进行专门系统性的研究，较有代表性的研究有顾志跃[3]，他从提高教育评价质量的角度出发，详细考察并分析了影响中小学教育评价质量的三个效度因素：外在效度，表现为评价结果与目的分离；内在效度，主要表现是信息与事实的之间存在偏差；结构效度，主要表现为指标体系与评价对象的非同构现象。这些效度概念仍然是建立在教育测量学的概念体系范畴之内，并未对教育评价的效度概念和体系做出更大程度上的拓展和建构。某种程度上而言，对教育评价的效度概念关注的甚少影响制约着我国教育评价理论朝着纵深方向发展。

而国外尤其是美国的研究者对效度理论的研究非常丰富，在教育测量与评价领域内，现代意义上的效度理论已经完全不同于传统的效度理论，如：（1）现代效度理论被定义为不是测量工具本身的属性，而是对测验分数进行解释和使用的支持程度。（2）Messick[4]（1989）在对教育考试的效度研究中提出了“效度整体观”（the unified conception of validity）的概念，并为效度验证（validation，简称效验，以下同）提出了具体的指导。（3）效验被认为是一个评价的过程。效验需要使用定量和定性的方法搜集足够多的证据来支持基于测试分数做出的推断。（4）传统效度理论中信度与效度的概念不同。在现代效度理论中，信度作为效度的证据来源也是效度的一个不可或缺的重要组成部分。在现代效度理论下，效验要求对测验从编制到解释、再到使用后果的整个程序进行拷问，因为“每个环节都是效度证据的重要来源”[5]。教育评价是否真实有效，需要“搜集证据”来验证是否达到了既定的教育目的或目标。因此，从教育评价理论发展的实际需要和国外现代效度理论发展的实际来看，需要根据教育评价本身的特点和属性来构建其概念系统。

·教育管理· 论教育评价的效度及其构建三、教育评价效度概念的建构

由于教育评价所涉多个价值标准，因此较难依据一种价值标准来判断教育评价的效果，应从多个维度对教育评价的效度进行拓展并构建。

本文以构成教育评价系统的要素作为逻辑基点，分别考察评价过程中的目标、体系、内容、标准、方法、功能、主体、过程、结果等要素特征的有效性来论述建构教育评价的效度概念体系。

（一）目标效度，即某种教育评价目标以及教育理念的实现程度

目标效度即教育评价达到了某个既定的教育目标或价值的程度，这是教育评价最根本的价值体现，因为效度本身就是以“目的或目标”的实现程度来进行考察的。因此，目标效度是以针对“教育目标、教育目的”的实现为判断依据的。如果某项教育评价结果在实践中有证据表明达到既定的目标，实现并完成了最初所设定的教育目标价值，那么即认为评价项目具有一定的目标效度。从根本上说，目标效度所要考察的是教育评价的总目标以及总目标下的各个评价维度的子目标的实现程度，反映了教育评价的根本目的和价值要求。

（二）建构效度，即评价体系的目标和教育对象之间的一致性程度

Messick[6]认为现代效度理论中最核心的效度是建构效度，并不存在几种不同的效度，如内容、实证、结构、概括化、外部和结果。我们认为将所有的效度类型都归结为一个建构效度显然太过于笼统，不利于对各种使用目的不同的效度做出区分，也不太符合教育评价的实际情况。因此，在教育评价领域中，建构效度不同于教育测量学的建构效度的含义，它通常是以设定的某个评价体系和编制的评价量表（测验工具）来表征和反映被评价对象。比如抽象的概念如创造力、智能；评价对象所在的水平状态如教育质量水平以及所包含的各要素的实现程度。建构效度所关注的是评价体系中的各个行为指标、要素特征、评价维度是否真实反映了评价的客体对象，最终要表达的是教育评价体系中的目标和教育对象之间的一致性程度。

因此，建构效度不仅是要关注理论或构念系统（有时可能并不需要某个构念系统，如依据一项结果是否达到教育政策的要求来给予评价），更要关注评价体系是否真实反映了评价客体的心理状态、行为取向、能力水平各方面的变化。同时一个具有良好建构效度的教育评价工具还可以准确地将一组被试和另一组被试区分开来。比如，一个评价工具要检测学生面向社会收集信息的能力，在检验这一评价结果时，如果所设计的评价项目能够将收集信息能力强与能力弱的学生分别开来，那么这个评价工具就有了建构效度。反之，如果评价的体系、维度不能反映学生在收集信息方面真实存在的能力差别，这个评价工具就没有建构效度。

（三）内容效度，即教育评价需要考察的内容或行为样本的适当程度

教育评价在实际操作时，需要对教育评价的总目标进行分解，总目标又具体分解为具体的教育子目标，而子目标又规定了哪些内容需要被考察以及相应的权重大小如何。因此，内容效度是对于要考察的内容或者行为样本的适当程度。在实际的评价过程中，内容效度是通过对评价目标以及具体的可操作的内容维度目标来进行检验的：一是反映总目标的维度内容的充分代表性，即维度目标是否被覆盖了所要考察的全域范围中的总目标要求；二是要评价的项目应是已界定好内容范围的代表性样本；三是要对每个项目所要评价的具体行为（如知识与技能）与上一级评价目标应保持一致，同时各子目标要相互独立，不能重叠，要力图反映总目标的要求。考察内容效度可采用复本法、再测法或者经验判断法。

（四）交叉效度，即各种教育评价方法相互检验和验证的一致性程度

实际评价中，多元性评价标准给评价带来了一定的困难。有时候，评价者在操作层面上将不同的标准加以融合是出于某一实用的动机，但往往忽略了“程序或技术的方法”与“逻辑证明的方法”之间的区别，对自己使用的方法背后的方法论缺乏自觉和反省。[7]结果，专家群体则很难对他们的研究进行质量评价。由于标准不同，这时在评估教育评价的效度时需要充分考查各种评价方法和标准的交叉效度。三角互证法可以用来检验不同的证据来源或不同的资料收集方法，其目的是为了在不同的标准之间进行相互证实。因此，可将此方法用作评估检验交叉效度的一种方法。

在教育评价中一般有两种基本评价方法：量的评价方法（亦称量化评价方法）和质的评价方法（亦称质性评价方法）。由于这两种方法采用不同的研究范式，因此，在研究方法、路径和步骤等方面具有很大的差异，评价效度的类型也有本质差异。如表1所示归纳了两种不同研究范式下的代表性方法以及据此建立的评价效度类型。

有必要指出的是，当两种方法整合在一起使用，这时如何考察评价方法的效度？其总的原则是在讨论量的评价结果时，则应考虑按数学概率的规则。将研究的结果推广到从中抽样的总体当中的适当性。在讨论质的评价结果时，则要根据质的研究目的、研究方法和策略以及研究步骤采用不同的效度评价标准及效度类型。如表1所示。无论是量的评价方法还是质的评价方法都需要从多方面寻找“效标证据”，同时考虑效度的测量指标的易获取性和可能性等因素。

（五）评价主体效度，即各种评价主体对评价客体评价结果的正确性和公平性

现代教育评价实践中，往往存在多个评价主体和多个利益相关者。因此，不同评价主体的评价目的不同，评价观念、评价标准、评价方法、评价工具的使用都可能带来很大的差异甚至相反，从而使评价失去效度。从本质上说，评价效度是针对于目的而言，不同评价主体由于评价目的、价值观、立场、标准不同，其评价效度可解释的范围、目的、价值性以及评价本身的意义都会不一样。因此，我们在对某项教育活动进行评价时，保证评价主体的一致性对于保证同一目的效度的评价就很重要。当然，即使是同一评价主体，其主体成员之间也存在着个体间的差异，在对某项教育目标评价时也可能因为个体之间对评价标准把握的不一致性从而带来评价者信度较低的可能，进而影响到评价的整体效度。

因此，在教育评价活动结束后，要考察教育评价的主体效度，对于评价主体效度要一分为二的来看待。

一方面，当存在多个评价主体时，此时就存在着多个评价主体效度，不同主体的评价效度之间还可以作为相互补充，便于教育决策者可以在多个效度之间合理筛选和评价，也便于集思广益，从而有利于教育决策者获得更多的教育评价信息，广开言路。

另一方面，由于存在多个评价主体，这会给效度评价带来一定的困难，使教育评价结果及解释存在着较大模糊性和不确定性，因而带来不同教育评价结果。尤其涉及到评价利益关系时，更会影响到教育评价活动的公平和公正，进而影响评价结果的有效性。因此，在重视评价主体效度的多元性对教育评价结果的促进作用的同时，还要根据教育评价使用的目的来对教育评价主体效度进行区分、比较和鉴别，选择评价结果效度较高的评价主体。

（六）过程效度，即教育评价收集各种评价信息和资料过程的有效性

教育评价的过程是由评价者组织实施，综合运用多种评价方法和工具，收集评价数据和信息的过程。评价活动的过程还是一个不断累积式、动态化评价的过程。因此，评价过程的效度关注的焦点是被评价者的“动态发展过程”，更加注重的是被评价者在既定评价目标下成长发生的经历，以及在整个教育活动中的历史和现实的绩效总和。如利用档案袋评价方法收集学生的优秀作品进行的表现性评价，再如对学校的发展性评价采用的增值性评价方法等。另一方面，教育评价的过程是整个教育评价活动开展的重要的评价步骤和实施依据，评价过程中的任何一个环节和关键评价要素，如对评价指标把握的宽严、对同一指标评价时产生的误差等都可能会影响到整体评价效度。又如在收集资料时，是采用问卷调查还是结构访谈的方法？是采用量的分析方法还是质的研究方法？一旦使用了不同的方法，那么评价的策略和重点就不相同。因此，在评价过程中需要综合运用多项效度指标。

过程效度如何考察需要综合来看。当收集被评价者的评价信息时，更多的则要关注资料的内部效度。当构建指标时，要充分考虑指标的科学性、完备性、独立性的同时还要考虑指标的区分效度以及各测量指标是否反映了总体目标程度的内容效度。要考察现有测量工具的预测效果时，则要考察某个工具的即时效度。当使用测评工具如某个心理量表时，则要关注测评工具的构念（construct）效度。当要对学生进行学业能力水平的形成性评价时，则要用到认知诊断评价工具，还要更多关注模型与方法的统计结果效度。因此，对于评价过程的效度评价而言，则是在各种综合效度都比较高的情况下作出的整体综合性的效度评价，有必要对评价过程当中使用到的方法、工具进行再评价，再检验（亦称为元评价），以确保评价的过程效度。

（七）功能效度，即实现教育评价目标既有功能的程度

教育评价具有选拔、鉴别、遴选、判断优劣、排序等功能，因此我们要考察教育评价的功能效度。功能效度是指实现了教育评价的既有功能的程度，体现的是教育评价的效用性（utility）。功能效度评价的内容具体主要表现为要体现教育评价增量性的指标，且要体现可行性、容易理解也便于操作。因此，功能效度关注的焦点是与教育评价功能直接相关的“结果性指标”效度。比如高考的评价功能是选拔，那么功能效度则具体表现为高考的入取率、重点大学入取率等功能性的可考察指标，这些指标可以作为效度评价的最重要依据。事实上，教育评价的功能效度直接体现了教育评价目标的实现。持有何种教育目的实际上决定了评价者使用何种评价功能，也因此决定了评价的功能效度。

（八）结果效度，即教育评价结果的实现程度

功能效度和目的效度以及最终表现的结果效度都是一脉相承的，即评价结果在多大程度上实现了预期评价目的、评价目标，体现出评价者使用意图以及教育目标价值，同时也能更好反映被评价者的评价需求，并能在实践中取得成效。因此，概括起来，结果效度可以从以下四个方面进行考察。

第一，结果效度要反映评价者使用评价的目的，即满足目的的需要。

第二，评价信息的反馈要反映被评价者的各种需求，特别是教育评价的结果要让被评价者得到认同，这样才能达到教育评价的最初设想和目的，也才能更好的发挥教育评价的督导作用。

第三，评价的结果要能在实践中得到验证和应用，并最终取得一定的教育成效，即效用（utility）。

第四，教育评价结果可推广到的目标团体和范围。

因此，结果效度的内容包括：满足评价目的，得到被评价者的认同需求，有教育成效，可推广性。

综上所述，教育评价的效度概念的内涵是非常丰富的。因此，构建效度评价的指标应当是多维的、多视角来综合考量的。与教育测量的效度概念相比，教育评价的效度概念被赋予的内涵远比测量的效度要深刻丰富得多。通过以上分析论述，教育评价的效度可概括为以下八个基本方面：（1）目标效度——某种教育评价目标以及教育理念的实现程度。（2）建构效度——评价体系的目标和教育对象之间的一致性程度。（3）内容效度——教育评价需要考察的内容或行为样本的适当程度。（4）交叉效度——教育评价方法、标准相互检验和验证的一致性程度。（5）评价主体效度——各种评价主体对评价客体评价结果的正确性和公平性。（6）过程效度——教育评价收集各种评价信息和资料的过程的有效性。（7）功能效度——实现了教育评价目标既有功能的程度。（8）结果效度——具体表现为教育评价最终的价值实现程度和满足主客体的价值实现程度，具体评价的维度又可分解为目的效度、需求效度、成效效度以及外在效度。

四、结语

以上仅从教育评价本身的属性特点建构了教育评价的效度概念，并试图拓展和构建了教育评价效度的内容及其评价的方法。实际上，由于教育评价活动本身的丰富性、复杂性和多元性，决定了教育评价效度的评价方法也存在着多元化，正如巴顿在《效用为本的评价》中所提到的那样，“要确保评价具有效用、可行性、理性和准确性，就必须具有情境的敏感性、方法的灵活性，评价者角色的多元化、良好的政治修养和创新”[9]。为此，我们还要在实践中不断寻找出具有可实际操作性和可考量性的效标评价依据。

注释：

①表1中有关效度概念的分类是由Maxwell（2002）在定义“定性研究中的效度”时提出来的。描述性效度指的是准确性（研究者间的一致性，对于物理和行为事件存在的认同的一致性，如频数）。解释效度指的是从参与者的角度揭示行为或行动的意义。理论效度针对的是研究者的构念，包括独立构念和构念之间的因果关系。推广效度指的是将结论推广至本社区的人、组织或者机构。评价效度从价值观的角度评价行为或者事件的适合性。

参考文献：

[1]胡中锋主编.教育测量与评价[M].第2版.广州：广东高等教育出版社，2006.11.

[2]胡中锋，莫雷.心理与教育测量中效度理论的重建[J].华南师范大学学报（社会科学版），2007（12）：82-90.

[3]顾志跃.对我国中小学教育评价的质量分析[J].上海教育科研，1992（6）：19-23.

[4][6]Messick S.Validity[M].In：R.L.L.inn （Ed.）. Educational measurement.New York： American Council on Education / Macmillan publishing Co.（3rd ed.），1989：13-103.

[5]Downing S.Twelve steps for effective test development[M].In： S.Downing & T.Haladyma （Eds.）.Handbook of Test Development.Mahwah，NJ：Lawrence Erlbaum Associates，2006：3-25.

[7]陈向明.质的研究方法与社会科学研究[M].第1版.北京：教育科学出版社，2000.475.

教育测评概念第3篇

刘尧

提要本文针对教育评价相关关系不清的总是从多角度对此进行了辨析，并对教育评价学科群的建设，提出了许多有益的建议。

关键词教育测验教育测量教育评价

作者刘尧浙江师范大学教科所副研究员（金华 321004）

教育评估、教育评价是20世纪30年代在美国兴起，60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年，但理论

研究的进展不大，学科的成熟度不高，与我国广泛开展的教育评价活动很不适应．我国各省市都有考试院（中心），也成立了许多评估、评价机构，广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟．尤其值得重视的是教育评价与教育研究和发展，以及对教育评价实践的指导．鉴于此，本文对与教育评价相关概念进行简述和辨析．

一.关于教育评价相关概念简述

教育测验：即为考试，它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统，它由主考、

被考（考生）、试卷（试题的集合及其评分标准）、考分四要素组成。考试的过程就是主考组织编制试题，通过试题作用于被考，将正确答案、评分标准与被考的反应（答案）相比较，然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用，可分为常模参照性考试和标准参照性考试。按考试对象分，有学业的成就考试、学术能力倾向测验（其目的在于测量考生学习的潜在能力、发展倾向，如音乐能力倾向测量）、人格测验（如测量态度、兴趣、情绪、性格等）．按测验人数分，有个别测验、团体测量．接测验方式分，有纸笔测验（用笔时试卷作答）和非纸笔测验（如口试、实验操作、表演等）。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验（其成绩的使用有权威性，要求严格，标准化程度高）、教师自编测验（即教师自编用于课堂教学的测验）等．[1]

教育统计（学）：运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理，准确地掌握教育

情况，为制定教育方针、政策提供科学依据，为开展教育科学研究，探索教育规律，制定教育方案，检查教育效率提供科学方法，也为教育管理和教育评价提供有效的工具．它分为两大类：一是描述统计学，研究简缩数据和描述这些数据，二是推断统计学，用数据进行统计检验，统计分析和非参数统计法作出决策。前者只是分析某一样本的特点，而后者则是通过抽取母体的一个样本，并以此样本为根据来分析母体的特点．它是在教育问题的研究中，描述样本，分析样本，分析样本与总体的关系，从而进行教育科学推论的一种原理和方法．其研究方法一般有：大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量（学）：研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具，根据教育目标或教学计划的要求，研究如何测量和评价教育效果，如何编制测量计划，各种类型试题的优缺点，衡量一个学业成绩测验好坏的数量指标，如何进行测验结果的统计分析，测验分数的解释和评价等．其主要内容包括：测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估：是一种有系统地去寻找并搜集资料，对评估对象作预测性、估计性的评判，以便协助教育决策者从若干种可行的策略中择一而

行的过程．在我国教育评估与教育评价不作严格区别，在实践中具体运用时，不同的范围和场合有不同的习惯用法．如高等教育中多用评估，在督导部门也称督导评估，而在普通教育领域多用教育评价不过两个概念是有一定区别的．评估有估价的含义，较为模糊粗略，而评价相对而言是较为精确的价值判断，评估多用于群体或单位的状态及效果的估价，而评价则既有对群体和单位的价值判断，也有对个人的判断．教育评估的一个重要目的就是为教育决策提供重要依据，国家教育管理部门要根据教育评估的结果，及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料，而不是行动纲领．[4]

教育评价（学）：以教育为对象，研究各类教育目标与相应的教育现象之间的关系，并给予一定的价值判断的学科．它的研究范围可划分

为：宏观教育评价（研究教育思想评价和教育制度评价）和微观教育评价（研究学校教育系统内部各类教育思想和教育活动的评价，如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等）。它的基本范畴是：教育评价的对象，教育评价的范围，教育评价的模式，教育质的规定性评价，教育量的规定性的评价，教育质和量变化的度的评价，教育评价的指标体系，教育评价的类型．其研究的基本原则有：客观性原则、理论联系实际原则、发展性原则和联系性原则．其种类包括目标评价、过程评价、条件评价、贡献评价等．[5]

教育评价（学）：教育评论学是研究教育评论现象和教育评论活动规律的科学．或者说它是研究教育评论的历史、现状，教育评论现象的

本质联系，教育评论工作的性质、任务和作用，以及教育评论工作的原则、方法的科学．教育评论学是与教育理论、教育史并列的一门教育学科．要建立教育评论学的学科体系，必须解决两大难题，即建立教育评论学的范畴体系和概念体系，并给予科学的揭示和阐述，使这些概念和范畴形成一个有机整体．同时，还要运用这些概念、范畴及其所固有的内在联系，采取科学的方法论证教育评论活动中最普通、最一般的科学原理；从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务，从根本上规定了教育评论学的学科性质和范畴．首先，教育评论活动是一种教育科研活动，它的直接结果是鉴别、评判教育文化的优劣，进而对教育界产生社会舆论导向作用；而教育文化本身及其所产生的依附于受教育者身心的精神产品，都属于意识形态范畴，可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律，建立完整的教育评论学学科体系。所以，教育评论学也属于基础理论学科。再次，教育评论学的研究对象决定了教育评论学涉及整个教育领域，内涵十分丰富。也可从不同视角，针对不同范畴建立多部门、多层次的分支学科（如：教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等），所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系：教育测验是对人的知识、技能和能力以及其他某些心理特征的检测，是教育评价的一种手段，确切地说它是

教育评价获得评价信息的工具之一．教育评价获取信息的测验法就是来自于教育测验．

教育评价与教育统计的关系：教育统计是运用数理统计的原理和方法研究教育现象中的数量关系，通过数据的分析和处理确切地掌握教育

情况，也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系：教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定，为教育评价提供依据，是教育评价信息的主要来源．如果没有教育测量提供的资料，教育评价将成为无源之水，失去了作价值判断的依据，其科学性、准确性便无从谈起。另外，教育测量的结果只有通过教育评价才能获得实际意义，成为改进教育工作有参考价值的信息．[7]

教育评价与教育评估的关系：教育评价与教育评估是非常相近的两个概念，在许多场合是通用的。评价是精确的价值判断；而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著，以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面，对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系：教育评论是对教育文化的反思和展望，它的对象是以教育文化中的精神文化和制度文化为主的，以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差，但它与教育评价分属于教育科学的不同领域，有着重大区别。比如，教育评价是一种管理活动，而教育评论则为观念活动；教育评价由评价机构按严密的程序实施，而教育评论则由教育评论家个人采用灵活多样的方式方法评述；教育评价有明确的指标体系并要求量化，而教育评论无需指标体系更不用量化，教育评价的对象是具体的可控的，而教育评论的对象是抽象的，不可控的；教育评价的结果多用于改进工作，而教育评论的结果则多用于改变观念；等等。这不是说教育评价与教育评论一点关系都没有，它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论，而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为，价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的，它探讨客体“是怎样的“、”是什么“，探讨事物的现象、本质和规律等实体属性，即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象，它探讨客体的价值属性，即客体的社会意义------对社会需要意味着什么，它以多种意识形式-----认识（价值与事实判断）、情感（对价值的态度体验）、意志（对价值的自觉保证）等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出，教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析，而且要进行质的分析，

把所有考查绩效的材料和分析综合起来，在多大程度上达到了预期的目的作出价值判断。从这里可以看出，教青评价行为是建立在事实判断基础上的价值判断．教育评价中的事实判断在于诊断与鉴别教育的性状，价值判断则是对诊断鉴别而得的结果或结论，按其价值取向进行合乎目的的推断和判断；事实判断是价值判断的基础，价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向，对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程，我们不能说教育测验丝毫没有价值判断，如在测验什么不测验什么的问题上是有价值判断的；同样，我们也不能说教育评论就无点滴的事实判断，教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系，尽管概念、体系有待完善，但已为下一步的研究打下了坚实的基础。与此相应的考

试学（研究教育测验的学科）、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展，形成了一个共生的教育评价学科群。21世纪，要使这个学科群得到良好的发展，我认为首先对各个学科的研究范围有个明确的划分，尤其是对教育评价学要有合理的定位，不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围，要让它们以独立的学科更好地为教育评价学服务。另外，教育评价学还要把属于教育精神文化、制度文化类的抽象的，教育评价无力评价的范围还给教育评论学，让教育评论学更快地发展．同时，要把教育评估与教育评价的关系处理好，可将两者合二为一，形成统一的学科．其次，各学科要明确自己的研究对象，形成概念体系和学科体系，把一些已成熟的概念和理论约定俗成稳定下来，逐步形成相对稳定的学科知识和概念体系。第三，要处理好理论与实践的关系，加强理论研究，使其适应实践的要求，要积极总结实践经验并升华为新的理论，丰富和发展教育评价学学科体系．第四，要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论，还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践，进行修正使其“本土化”和“教育化”。

综上所述，搞清教育评价相关概念的关系，对理清教育评价学科群内各学科的关系，促进该学科群的发展，为丰富和发展教育科学，加快

教育事业的发展有重大的理论和实践意义。

教育测评概念第4篇

关键词教育测验教育测量教育评价

教育评估、教育评价是20世纪30年代在美国兴起，60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年，但理论

一.关于教育评价相关概念简述

教育测验：即为考试，它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统，它由主考、

教育统计（学）：运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理，准确地掌握教育

教育测量（学）：研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

教育评估：是一种有系统地去寻找并搜集资料，对评估对象作预测性、估计性的评判，以便协助教育决策者从若干种可行的策略中择一而

教育评价（学）：以教育为对象，研究各类教育目标与相应的教育现象之间的关系，并给予一定的价值判断的学科．它的研究范围可划分

教育评价（学）：教育评论学是研究教育评论现象和教育评论活动规律的科学．或者说它是研究教育评论的历史、现状，教育评论现象的

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系：教育测验是对人的知识、技能和能力以及其他某些心理特征的检测，是教育评价的一种手段，确切地说它是

教育评价获得评价信息的工具之一．教育评价获取信息的测验法就是来自于教育测验．

教育评价与教育统计的关系：教育统计是运用数理统计的原理和方法研究教育现象中的数量关系，通过数据的分析和处理确切地掌握教育

情况，也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系：教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

教育评价与教育评估的关系：教育评价与教育评估是非常相近的两个概念，在许多场合是通用的。评价是精确的价值判断；而评估是估计

教育评价与教育评论的关系：教育评论是对教育文化的反思和展望，它的对象是以教育文化中的精神文化和制度文化为主的，以真善美作

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为，价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

从前面的分析可以看出，教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析，而且要进行质的分析，

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系，尽管概念、体系有待完善，但已为下一步的研究打下了坚实的基础。与此相应的考

综上所述，搞清教育评价相关概念的关系，对理清教育评价学科群内各学科的关系，促进该学科群的发展，为丰富和发展教育科学，加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

[6] 见刘尧著·《教育评价学》·中国文联出版社·2000年版·第 7--23页

教育测评概念第5篇

关键词教育测验教育测量教育评价

教育评估、教育评价是20世纪30年代在美国兴起，60年代兴盛于西方世界并传入我国。这些学科虽然在我国大力已有20余年，但

的进展不大，学科的成熟度不高，与我国广泛开展的教育评价活动很不适应．我国各省市都有院（中心），也成立了许多评估、评价机构，广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟．尤其值得重视的是教育评价与教育研究和发展，以及对教育评价实践的指导．鉴于此，本文对与教育评价相关概念进行简述和辨析．

一.关于教育评价相关概念简述

教育测验：即为考试，它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统，它由主考、

被考（考生）、试卷（试题的集合及其评分标准）、考分四要素组成。考试的过程就是主考组织编制试题，通过试题作用于被考，将正确答案、评分标准与被考的反应（答案）相比较，然后给出考分的过程。考试从宏观上可分为考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用，可分为常模参照性考试和标准参照性考试。按考试对象分，有学业的成就考试、学术能力倾向测验（其目的在于测量考生的潜在能力、发展倾向，如能力倾向测量）、人格测验（如测量态度、兴趣、情绪、性格等）．按测验人数分，有个别测验、团体测量．接测验方式分，有纸笔测验（用笔时试卷作答）和非纸笔测验（如口试、实验操作、表演等）。其它可分为难度测验、速度测验、性测验、诊断性测验以及大规模测验（其成绩的使用有权威性，要求严格，标准化程度高）、教师自编测验（即教师自编用于课堂教学的测验）等．[1]

教育统计（学）：运用数理统计学的原理和研究教育现象中的数量关系的一门学科。它通过数据的和处理，准确地掌握教育

情况，为制定教育方针、政策提供依据，为开展教育科学研究，探索教育，制定教育方案，检查教育效率提供科学方法，也为教育管理和教育评价提供有效的工具．它分为两大类：一是描述统计学，研究简缩数据和描述这些数据，二是推断统计学，用数据进行统计检验，统计分析和非参数统计法作出决策。前者只是分析某一样本的特点，而后者则是通过抽取母体的一个样本，并以此样本为根据来分析母体的特点．它是在教育的研究中，描述样本，分析样本，分析样本与总体的关系，从而进行教育科学推论的一种原理和方法．其研究方法一般有：大量观察法、统计分组法、综合指标法、统计资料检验法、统计资料图示等。[2]

教育测量（学）：研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具，根据教育目标或教学计划的要求，研究如何测量和评价教育效果，如何编制测量计划，各种类型试题的优缺点，衡量一个学业成绩测验好坏的数量指标，如何进行测验结果的统计分析，测验分数的解释和评价等．其主要包括：测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估：是一种有系统地去寻找并搜集资料，对评估对象作预测性、估计性的评判，以便协助教育决策者从若干种可行的策略中择一而

教育评价（学）：以教育为对象，研究各类教育目标与相应的教育现象之间的关系，并给予一定的价值判断的学科．它的研究范围可划分

教育评价（学）：教育评论学是研究教育评论现象和教育评论活动规律的科学．或者说它是研究教育评论的、现状，教育评论现象的

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系：教育测验是对人的知识、技能和能力以及其他某些心理特征的检测，是教育评价的一种手段，确切地说它是

教育评价获得评价信息的工具之一．教育评价获取信息的测验法就是来自于教育测验．

教育评价与教育统计的关系：教育统计是运用数理统计的原理和方法研究教育现象中的数量关系，通过数据的分析和处理确切地掌握教育

情况，也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系：教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定，为教育评价提供依据，是教育评价信息的主要来源．如果没有教育测量提供的资料，教育评价将成为无源之水，失去了作价值判断的依据，其科学性、准确性便无从谈起。另外，教育测量的结果只有通过教育评价才能获得实际意义，成为改进教育工作有价值的信息．[7]

教育评价与教育评估的关系：教育评价与教育评估是非常相近的两个概念，在许多场合是通用的。评价是精确的价值判断；而评估是估计

教育评价与教育评论的关系：教育评论是对教育文化的反思和展望，它的对象是以教育文化中的精神文化和制度文化为主的，以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差，但它与教育评价分属于教育科学的不同领域，有着重大区别。比如，教育评价是一种管理活动，而教育评论则为观念活动；教育评价由评价机构按严密的程序实施，而教育评论则由教育评论家个人采用灵活多样的方式方法评述；教育评价有明确的指标体系并要求量化，而教育评论无需指标体系更不用量化，教育评价的对象是具体的可控的，而教育评论的对象是抽象的，不可控的；教育评价的结果多用于改进工作，而教育评论的结果则多用于改变观念；等等。这不是说教育评价与教育评论一点关系都没有，它们的关系表现在教育评价的结果可以成为教育评论的论据教育评论，而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与评价相关概念的区别

唯物主义的价值论认为，价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和为对象的，它探讨客体“是怎样的“、”是什么“，探讨事物的现象、本质和规律等实体属性，即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象，它探讨客体的价值属性，即客体的意义------对社会需要意味着什么，它以多种意识形式-----认识（价值与事实判断）、情感（对价值的态度体验）、意志（对价值的自觉保证）等诸种形式的综合来反映客体与主体需要的关系。

从前面的可以看出，教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析，而且要进行质的分析，

把所有考查绩效的材料和分析综合起来，在多大程度上达到了预期的目的作出价值判断。从这里可以看出，教青评价行为是建立在事实判断基础上的价值判断．教育评价中的事实判断在于诊断与鉴别教育的性状，价值判断则是对诊断鉴别而得的结果或结论，按其价值取向进行合乎目的的推断和判断；事实判断是价值判断的基础，价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向，对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程，我们不能说教育测验丝毫没有价值判断，如在测验什么不测验什么的上是有价值判断的；同样，我们也不能说教育评论就无点滴的事实判断，教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群的建议

教育评价学经过几十年的已初步形成了学科体系，尽管概念、体系有待完善，但已为下一步的研究打下了坚实的基础。与此相应的考

试学（研究教育测验的学科）、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展，形成了一个共生的教育评价学科群。21世纪，要使这个学科群得到良好的发展，我认为首先对各个学科的研究范围有个明确的划分，尤其是对教育评价学要有合理的定位，不要再把学、教育统计学、教育测量学的纳入自己的努力范围，要让它们以独立的学科更好地为教育评价学服务。另外，教育评价学还要把属于教育精神文化、制度文化类的抽象的，教育评价无力评价的范围还给教育评论学，让教育评论学更快地发展．同时，要把教育评估与教育评价的关系处理好，可将两者合二为一，形成统一的学科．其次，各学科要明确自己的研究对象，形成概念体系和学科体系，把一些已成熟的概念和约定俗成稳定下来，逐步形成相对稳定的学科知识和概念体系。第三，要处理好理论与实践的关系，加强理论研究，使其适应实践的要求，要积极实践经验并升华为新的理论，丰富和发展教育评价学学科体系．第四，要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论，还是从教育界以外引人教育的评价理论都要结合我国的教育理论和教育实践，进行修正使其“本土化”和“教育化”。

综上所述，搞清教育评价相关概念的关系，对理清教育评价学科群内各学科的关系，促进该学科群的发展，为丰富和发展教育科学，加快

教育事业的发展有重大的理论和实践意义。

[1][5]见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页、第167页

[2]参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3]见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页

[4]参见许茂祖编著·《高等教育评估理论与》·铁道出版社·1997年版·第16--27页

[6]见刘尧著·《教育评价学》·中国文联出版社·2000年版·第7--23页

教育测评概念第6篇

关键词教育测验教育测量教育评价

教育评估、教育评价是20世纪30年代在美国兴起，60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年，但理论

一.关于教育评价相关概念简述

教育测验：即为考试，它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统，它由主考、

教育统计（学）：运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理，准确地掌握教育

教育测量（学）：研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

教育评估：是一种有系统地去寻找并搜集资料，对评估对象作预测性、估计性的评判，以便协助教育决策者从若干种可行的策略中择一而

教育评价（学）：以教育为对象，研究各类教育目标与相应的教育现象之间的关系，并给予一定的价值判断的学科．它的研究范围可划分

教育评价（学）：教育评论学是研究教育评论现象和教育评论活动规律的科学．或者说它是研究教育评论的历史、现状，教育评论现象的

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系：教育测验是对人的知识、技能和能力以及其他某些心理特征的检测，是教育评价的一种手段，确切地说它是

教育评价获得评价信息的工具之一．教育评价获取信息的测验法就是来自于教育测验．

教育评价与教育统计的关系：教育统计是运用数理统计的原理和方法研究教育现象中的数量关系，通过数据的分析和处理确切地掌握教育

情况，也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系：教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

教育评价与教育评估的关系：教育评价与教育评估是非常相近的两个概念，在许多场合是通用的。评价是精确的价值判断；而评估是估计

教育评价与教育评论的关系：教育评论是对教育文化的反思和展望，它的对象是以教育文化中的精神文化和制度文化为主的，以真善美作

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为，价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

从前面的分析可以看出，教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析，而且要进行质的分析，

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系，尽管概念、体系有待完善，但已为下一步的研究打下了坚实的基础。与此相应的考

综上所述，搞清教育评价相关概念的关系，对理清教育评价学科群内各学科的关系，促进该学科群的发展，为丰富和发展教育科学，加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

[6] 见刘尧著·《教育评价学》·中国文联出版社·2000年版·第 7--23页

教育测评概念第7篇

[关键词]教育评价课堂考评教育评价史

[中图分类号]G40-058.1 [文献标识码]A [文章编号]1009-5349（2013）04-0213-03

社会发展，教育先行，教育发展需要教育评价的推动。作为教育学研究重点的教育评价，于上世纪末本世纪初得到迅猛发展，在现代西方教育学史上扮演极为重要的角色。

近现代中国的内忧外患严重阻碍了我国教育评价的发展，自上世纪70年代末80年代初恢复高考之后30年来，随着教育改革进一步深入，教育评价研究发展迅速，但也存在对教育评价基础理论研究不够深入透彻的问题，不利于与国际接轨并形成一套符合中国国情的教育评价体系。在2006年召开的“中国教育学会第19次学术年会暨素质教育评价论坛”上，辽宁师范大学教育学院院长傅维利提出，我国“对评价问题的研究是一个薄弱环节。当我们与外国同行交流时提到评价，人家首先就问你所说的评价是关于哪类评价――是关于学生的还是教师的？如果是关于学生的，则是关于学生哪方面的――是学生发展的评价还是学业成绩评价？”[1]这一事例说明，我国很多教育工作者并不了解作为当今教育领域研究热点的教育评价的基本概念内涵，还停留在知其然而不知其所以然的阶段。

教师的教学活动基于他们对相关教育概念的理解，理清重要概念和命题是开展相关教学实践的思想前提。概念本身就是理论实践的研究对象，是构建教育理论体系，提高教育研究质量的需要。目前，国内教育评价研究在释义、使用、比较等方面存在概念混乱、内涵模糊等问题。若要系统研究理论并使其指导实践成为可能，就必须先对相关概念进行分析释义。我国教育评价若想得到长足稳步发展，必须明晰一些重要术语，而教育评价领域最重要的概念非评价莫属。

一、教育评价的定义

评价一词不仅用于教育领域，也广泛应用于其他社会科学中，但关于评价的定义长久以来还没有达成共识，因为各科学领域的哲学基础和方法论皆有不同，具体到教育领域的评价概念又是随学科发展时刻变化着的，因此也没有形成一致的概念界定。在高等教育的教学过程中，很多时候定义并未作为一种需要认真对待的思考对象，只是作为理解某一概念或理论的切入点。

教育评价术语的提出者泰勒（Ralph W.Tyler）给出的定义是“确定教育目标被实现程度的过程”[2]。这一界定得到了后来大多数欧美相关学者的认同，或直接援引或以此为出发点，当然也有不少学者从不同角度定义教育评价，丰富了教育评价的意义与内涵。下面是几个颇具代表性的定义：

1.收集使用信息以做出教育课程决策。[3]

2.评价的目的是检查课程目标是否正被或已被实现。[4]

3.评价与获取具体教学目标达成证据相关。[5]

4.教育评价是描述、获取并提供对做出决策有用信息的过程。[6]

5.评价是一种阐释说明。[7]

6.评价是对发生在当前课程方案中或其后的事件的系统考察，进行这种考察有助于提高该课程方案或与之类似的其他方案的效果的作用。[8]

7.教育评价是收集学生认知及非认知学习领域进展和成就信息，并以此为基础做出判断及决策的系统过程。[9]

8.评价是收集资料以助决定的过程。[10]

由此可以看出，虽然人们对评价的本质和目的看法各异，但基本都认同描述和判断是评价的两大本质。评价就是在量或质的基础上进行价值判断的过程。教育评价的范围包括政策评价、校务评价、学科评价、教师评价、课程评价等，而位于评价环节底部也是各级评价基础的是针对某一具体课程所展开的教育评价，这也是笔者最关注以及要重点讨论的评价范围。课程评价是指依据一定评价标准，采用各种定性、定量方法系统地收集相关信息，调整课程内容、教学方法手段，对课程的计划、实施、结果等有关问题做出价值判断并寻求改进措施的过程。一个完整的课程教学应包括以下流程：1.确定课程目标；2.前测，摸清学生现有知识技能水平，确定后续教学内容及重点；3.授课过程中不断以各种方式评定学生学习情况，描述教学效果，形成对师生皆有裨益的反馈信息，据此调整教学计划与方法，用以提高教学效果；4.授课结束对学生进行总结性评价；5.学校或相关监管部门综合授课过程中以及结束后的评价信息，再结合已确立的课程目标来判断该课程是否达到既定目标。在此过程中，2、3、4和5都涉及到教学评价，其重要程度可见一斑。

二、教育评价的发展及术语变化

搞清事物历史的前因后果发展脉络，是研究者必知的真谛。作为人类主要交流工具的语言有口头和书面两种形式，相应地，早期评价也分为口试（oral examination）和笔试（written examination）。考试（examination）一词源自法语和拉丁语，意指“对知识的测试”test of knowledge。在教育评价的古典时期，通常以口头提问的方式来检查判定学生对知识的掌握程度，但主观随意性较强，效率低下。中国的科举制度是世界上最早的书面评价形式，18世纪以后，一些欧美国家也开始采用笔试，但早期笔试大多采用论文式（essay），无法测出学生掌握的全部知识情况，并且评测也会受评定人的主观影响，客观可靠性有一定局限。美国的口笔试分别始于1709年和1845年，由欧洲传入，考试的简写形式（exam）出现于1848年。

19世纪末约瑟夫・莱斯（Joseph Rice）第一次进行了针对课程教学方案的评价，利用拼字测验来评定拼字教学实践对学习效果的影响，成为现代教育评价研究的开端。

1904年美国兴起了以桑代克（Edward Lee Thorndike）为首的教育测验运动，针对传统论文式考试的弊端，大力提倡客观标准化测试（standardized test），此后30年运用了大量测量技术，评价多采用测试（testing）或测量（measurement）的形式，因此被称为教育评价史上的测量时代（measurement generation）。

随着教育测验运动深化，人们逐渐认识到测验并不能测得人能力的全部领域，为了弥补测量的缺陷，教育评价发展起来。1929年经济危机爆发，大萧条席卷全球，为了摆脱危机，美国成立了课程改革委员会，展开了教育史上著名的“八年研究”，教育评价是其中的一项重要工作，因而下设了以泰勒为首的评价委员会。1942年，课改委员会公布了研究报告，共分五卷，泰勒及其他评价委员会成员的研究成果集中在第三卷《评价记录学生进展》（Appraising and Recording Student Progress）中，该报告又称为《史密斯-泰勒报告》。报告中，泰勒试图用一套以教育目标为核心的课程编制原则将社会需求、学生需要反映到课程与测验中去，为了与之前的教育测量运动区分开，正式提出了教育评价（educational evaluation）的概念，认为教育评价本质上是确定教育目标在课程与教学方案中实际实现情况的过程，测验只是它的手段。至20世纪50年代，泰勒的行为目标模式（objectives model）一直是占据统治地位的评价思想，由于该模式主要描述教育结果与教育目标的一致程度，因此，这一时期也被称为教育评价的描述时代（description generation）。

1957年苏联第一颗人造卫星升空，促使美国反思本国的教育问题，加快教育改革进程，此后涌现了一批新的评价思想和模式。1963年，克龙巴赫（Lee Joseph Cronbach）发表题为《通过评价改进课程》（Course Improvement through Evaluation）的论文，提出评价的重点应该放在教育过程中而非过程结束后。1966年，斯塔弗尔毕姆（Daniel L.Stufflebeam）提出CIPP模式，即背景评价（context evaluation），输入评价（input evaluation），过程评价（process evaluation）和结果评价（product evaluation）模式，认为“评价最重要的目的不是为了证明（prove），而是为了改进（improve）”，[11]这一看法随后得到了普遍支持。1967年，斯科利芬（Michael Scriven）在《评价方法论》（Methodology of Evaluation）一文中明确提出了形成性评价（formative evaluation）的概念。值得注意的是，斯科利芬认为总结性评价（summative evaluation）比形成性评价（formative evaluation）更重要，这与克龙巴赫和斯塔弗尔毕姆的观点刚好相反。但不管怎样，“形成性”评价一词正式出现，为了改进而评价则成为形成性评价的主要思想。这一时期先后提出了40多种评价观点和方法，但所有1967年后模式都赞同判断是构成评价整体的一部分，并力荐评价者应成为评判者，[12]自此教育评价进入判断时代（judgment generation）。

20世纪60年代末70年代初，人们意识到以往追求的客观科学化评价走到极端会忽略评价的价值特性，不利于全面深入研究，质性评价（quality assessment）自此展开，教育评价进入心理建构时代（mental construction generation）。该时期评价理论阐明了教育评价的核心是价值判断，强调价值多元性，采用质性研究方法，认为评价是对被评事物赋予价值，其本质是评价者和被评价者“协商”进行共同心理建构的过程，这种评价思想正为越来越多的人所接受，并在实践中得到广泛应用。

从教育评价萌芽时期的考试到测试测量，再到评价一词的正式提出，以及目前对质性评价研究的侧重，“教育评价”这一术语的内涵外延也随着教育评价学的历史演变经历了一系列的发展变化。

三、教育评价的内涵

20世纪80年代质性评价取代量化评价成为新的教育评价研究热点，assessment一词开始逐步取代evaluation，同时也赋予了评价新一层含义。简单地讲，之前的评价是强调量化的单一评价，现在新增了质性研究方法，成为具有质、量双层含义的评价。由此看出，之前的评价强调量化，现在的评价讲究量质结合，evaluation与assessment两词与评价研究方法之间的关系见下表：

我们发现，evaluation与assessment存在不加区分互换使用的现象，尤其是在进入21世纪后。英国常用assessment指代对学生学习的判断，用evaluation指代对课程本身或授课过程的判断，以及这种判断的过程。而美国教育界对evaluation与assessment两个术语的区别颇有争议，有些人认为两词同义可以互换，有些人认为evaluation比assessment涵义更广，但有一点确定无疑，evaluation涵盖的范畴肯定不小于assessment。笔者倾向于后者，因为从词源上讲，assessment原指教师坐在学生身旁，通过师生互动来获取、解释、分享信息以促进、提高学习的过程，因此狭义的assessment就是考评。那么两词之间到底有什么样的区别呢？

首先，从评价对象来看，assessment针对的是学生，而evaluation还可以针对教学、课程、政策、计划或机构组织等。因此，两者主要在受评者为学生时容易发生混淆。其次，从测量目的上讲，evaluation主要关注教学结果；assessment更关注学习过程。再次，两者进行改进步骤时参照标准的方式也有不同，evaluation的标准相对而言比较稳定，而assessment的标准可视实际情况适时调整，灵活多变。此外，判断学生学习进展的参照物也有很大不同。Evaluation主要判断学生在整个群体中所处的相对位置，属于群体比较（competition）；assessment则关注学生相对自身的学习进展，属于个体比较（personal improvement）。

以上五点说明evaluation与assessment存在本质区别，可是为什么80年代之后assessment考评研究备受瞩目，进而到今天有发展成广义评价从而取代evaluation一词的趋势呢？美国1965年通过的ESEA法案（《初等及中等教育法》）及其最新解读2002年生效的NCLB（《不让一个孩子掉队》）法案中包含了一系列以考试为基础的问责制条款，广大教育工作者面临沉重的评价压力，不经意地想要回避evaluation评价一词，适逢布莱克和威廉姆（Paul Black & Dylan Wiliam）一项最新研究表明只要在课堂教学中合理利用形成性评价（formative assessment）就可以提高学生在外部学业成就测试中的成绩，一时间形成性评价研究蔚然成风，对当代教育评价研究起到巨大推动作用。虽然assessment有取代evaluation之势与美国教育工作者们的刻意为之不无关系，但我们还要意识到，概念分析的目的是为了帮助我们更好、更清晰地表达、思考、理解教育实践本身。发现教育概念模糊和歧义，看到这种概念问题给教育实践带来的消极影响，要澄清概念，梳理脉络，不让其阻碍教育蓝图与理想的实现。

百年来，教育评价思想处于不断更新之中，经历了萌芽、发展、专业化、扩展与整合等一系列阶段，教育评价从以测验为中心，转向以目标为中心、以决策为中心，进而强调以人为中心。[13]但对核心概念教育评价仍没有一致的定义，用以表示评价意义的两个词evaluation和assessment也是任意互换，这种情况在教育评价理论逐步走向成熟的今天，与其说概念含混不清，基础不牢，不如说是教育评论专家们故意为之，目的是使教育评价成为一个更加开放、广纳百言的理论体系。因此，国内学者教育工作者及对教育评价感兴趣的相关人士，只要掌握了教育评价发展的历史进程和评价一词的衍变历程，就能进行更深层次的研究，以更加开放性的思维创新变革，更好地开拓教育评价研究和实践的新领域。

【参考文献】

[1]杨太清.实施素质教育评价促进学生和谐发展[J].中国教育学刊，2007（1）.

[2]Tyler，R W.Basic principles of curriculum and instruction[M].Chicago：University of Chicago Press，1949.

[3]Cronbach，L J.Educational psychology.2nd ed.[M].New York： Harcourt，Brace & World，1963.

[4]Kerr，J F.Changing the curriculum.London：University of London Press，1968.

[5]Bloom，B S.Toward a theory of testing which includes measurement-evaluation-assessment[A].In M.C.Wittrock & D.E.Wiley ed.The evaluation of instruction[M].New York：Holt，Rinehart & Winston，1970.

[6]Jenkins，D.et al.Curriculum evaluation[M].Milton Keynes：Open University Press，1976.

[7]Parlett，M.& Hamilton，D.Evaluation as illumination：A new approach to the study of innovatory programs[A].In G..Glass（ed.），Evaluation Studies Review Annual.Vol.1[C].Beverley Hills，CA：Sage，1976.

[8]Cronbach，L.J.，et al.Toward reform of program evaluation[M].San Francisco：Jossey-Bass.1980.

[9]Agrawal，M.Concept of educational evaluation [EB/OL].2008. http：//egyankosh.ac.in/bitstream/123456789/26476/1/Unit-23.pdf

[10]McMillan，J M.Educational research：fundamentals for the consumer.3rd ed.[M].New York：Addison，2000.

[11]Stufflebeam，D L.et al.Educational Evaluation and Decision-making[M].Ithaca，Illinois：Peacock，1971.