落实教育评价改革助力高质量人才培养——基于重庆市高考评价改革试点工作实证分析

(整期优先)网络出版时间:2024-07-03
/ 3

落实教育评价改革助力高质量人才培养——基于重庆市高考评价改革试点工作实证分析

邹函1,2 李志刚1

(四川省教育考试院,电子科技大学,四川成都,610000)

摘要:教育评价在人才培养过程中发挥着至关重要的作用,它不仅引导教育方向,还负责评估、诊断、改进和激励教育成果。在高考改革的背景下,对高考数据进行价值判断的教育考试评价,成为了评价命题质量、反馈基础教育、纠正不科学评价导向、实现考试、教学、学习有效衔接的关键手段。本文在新时代教育评价改革的大背景下,深入分析了重庆市高考评价改革的实际情况,探讨了改进和创新的策略。通过引入增值评价技术、利用人工智能进行精准诊断以及构建考试数据平台等措施,本文旨在充分发挥考试的评价功能,促进成渝地区双城经济圈教育考试评价事业的协同发展,并推动两地专业化教育考试机构建设和治理能力的提升。

关键词:教育评价改革;高考命题;考试评价;成渝双城经济圈

评价是牵引教育变革、推动教育创新的指挥棒。在教育、科技、人才“三位一体”格局中,评价贯彻始终,教育评价、科技评价和人才评价改革牵一发而动全身,始终发挥着指挥棒作用。党的二十大报告提出,深化教育领域综合改革,完善学校管理和教育评价体系,为我们做好新时代教育考试工作指明了方向、提供了遵循。202010月,中共中央、国务院印发的《深化新时代教育评价改革总体方案》(以下简称《总体方案》)明确要求改进结果评价,强化过程评价,探索增值评价,健全综合评价。重庆市教育考试院在此背景下的实践与探索,特别是其在考试评价方面的成功经验,对于四川乃至全国的教育评价改革都具有重要的借鉴意义。

为贯彻落实中央工作部署,特别是贯彻习近平总书记在新时代推动西部大开发座谈会重要讲话精神,落实唱响新时代“双城记”战略要求,聚焦发挥专业化考试机构引领作用,聚焦提供内涵丰富、形式多样的考试评价服务,深刻把握全面构建符合我国教育考试实际的新时代教育考试评价体系的内涵和路径,找准症结、理清思路、提出建议、推进工作,形成本调研报告。

一、重庆教育考试评价改革的经验探索

2012年重庆市教育考试院开展考试评价工作以来,该工作已成为与命题、考试、招生录取并列的四大核心业务之一,产生了显著的工作效应和社会效益。其主要成效体现在以下几个方面:助推命题、反拨教学、服务录取、对政府的决策咨询进行服务、促进学生的全面发展。

在具体实施过程中,由科研处牵头,高考处、信息处、命题一处等多部门共同参与,形成了一套高效的工作流程。每年高考结束后,信息处、命题一处提供脱敏数据,高考处审核无误后,科研处导入报告生成系统,按需生成报告并检查校对,无误后付印,确保了评价工作的准确性和及时性。

(一)评价技术与评价内容的双轮驱动

技术能力提升:建立了基于高考的数据分析指标体系,自主开发的数据分析报告导出系统获得了国家软件著作权,体现了技术能力的不断增强。

评价内容体系成熟:构建了全科目、多层次、多维度的评价内容,为命题提供了相关报告,为全市基础教育提供了各类考试评价报告,包括重庆市普通高考考生水平评价报告、重庆市普通高考试题评价报告、考生必读和重庆市普通高考数据统计分析报告;探索进行了教育测量与评价的培训,普及教育测量和评价理念。

(二)公益性与效益性的协调发展

公益支持:为全市基础教育提供了公益性的支持。

效益突破:在效益方面取得了显著进展,获得了社会的广泛认可。连续4年为《考生必读》提供了约占1/4篇幅的普通高考主要学科试题解析和考生典型作答评价,为全市每年20余万考生提供了普通高考备考指导;连续6年为全市高中学校提供高考数据统计分析报告,仅2020年学校数量就达57所,报告数量近8000份,覆盖了大量学校和考生。

(三)服务质量的持续提升

报告体系构建:建立了市、区、校三级报告体系,开发了报告导出系统,通过图形、图表等直观方式呈现报告,提升了用户体验。

服务成果转换:依托重庆市招生考试服务有限公司,为区县和学校提供了40余次普通高考数据分析解读服务,帮助用户更好地利用评价报告。

(四)专业化考试评价队伍建设

队伍建设成效:自2013年起,重庆市教育考试院不断加强教育测量与评价、计算机技术人才的培养,组建了一支多领域、跨学科、高素质、重实践的专家队伍,为考试评价工作提供了坚实的人才支持。

二、重庆教育考试评价改革的特色与不足

重庆市教育考试院在新时代教育评价改革领域取得了显著成就,通过技术创新和方法革新,成功构建了一套符合新高考要求的考试评价指标体系。该体系不仅超越了传统的评价方法,而且通过多维度、多视角、多层次的反馈机制,全面服务于教育行政、教研和教育主体,有效推动了考试评价功能的发挥,有效落实“改进结果评价”。

(一)特色

一是创新的评价指标体系:重庆市教育考试院建立了“一核四层四翼”的新高考语数英三科考试评价指标体系,这一体系以核心素养为中心,通过四个层次和四个方面的评价,全面反映学生的学习成果。

二是数据抽样和遮蔽技术。数据抽样是指所有统计数据基于抽样结果,每个学科均有部分题目的成绩(约10分)未纳入统计分析;通过数据抽样技术,确保了统计数据的代表性,同时避免了将所有成绩纳入统计可能被用于排名的风险。数据抽样与遮蔽技术:遮蔽技术在试题分析中应用,对部分试题结果进行遮蔽,有效防止了通过已公布数据反推原始成绩的风险。通过以上两个手段有效消除了利用原始成绩进行排名的可能性。

三是个性化参照对象的选取。允许学校根据自身需求和特点,自定义选取参照校的数据进行对比,突破了传统的同区学校、同类学校和同水平学校的参照体系,从而更精准地分析学校自身的优势与不足。不仅拓宽了评价维度,也提高了评价的针对性和实用性。

四是数据安全与保密性:在评价过程中,重庆市教育考试院高度重视数据的安全性和保密性。通过限制参照校的选取数量(3-6所),有效避免了个别学校成绩被反推的可能性,确保了数据的安全和隐私。

通过这些创新实践,重庆市教育考试院不仅提升了教育评价的科学性和有效性,而且为教育评价改革提供了宝贵的经验和示范,为新时代教育评价的发展做出了重要贡献。

(二)短板及不足

在重庆市教育考试院的教育评价改革实践中,尽管取得了显著的成就,但也存在一些短板和不足,需要进一步改进和完善。

一是平台开放性不足:目前,重庆市教育考试院的评价平台仅提供纸质报告,尚未实现线上查询和数据对比功能。这限制了用户进行多年横向对比的可能性,影响了评价结果的应用和分析。

二是评价数据完整性有待提高:虽然重庆模式在数据遮蔽和参照校选取方面进行了创新设计,但在数据抽样方法上还存在一些顾虑。高考试卷作为一个精心设计的测量工具,每一道试题都具有重要的测评价值。抽样后的试题是否能代表原卷的信效度,是一个值得深入探讨的问题。

是数据安全与隐私保护的平衡:在保护数据安全和隐私的同时,也需要考虑如何更有效地利用评价数据,为教育决策和教学改进提供更有价值的参考。

三、重庆模式对四川教育评价改革的启示及对策建议

(一)引入增值评价技术

在构建一个全面的教育评价体系时,评价的焦点不应局限于学生在单一考试中的表现,而应扩展至对个体在不同学习阶段的进展和跨年度的纵向发展进行深入分析。这种评价模式的转变不仅有效避免了基于分数和排名的反推问题,而且将评价的核心转向了学生的成长和进步。通过引入增值评价(Value-Added Measurement, VAM)的理念,可以进一步深化教育评价改革,实现评价体系的现代化。在实际操作层面,可以采用学生成长百分等级模型(Growth Percentile Model)来对学生的学习进步进行细致的量化分析。该模型能够详细评估学生的进步情况,包括对特定区域内各区县学生的进步水平进行比较,以及对每个区县中后进生群体(排名后30%的学生)的正增值比例进行统计。通过这种方法,可以识别出在学生增值方面表现突出、一般或不足的区县,并深入分析这些区县对后进生群体的关注和支持情况。 在结果应用层面,通过聚合各层级学生的增值表现,可以以进步的视角评价区域和学校的教育质量;对不同学校类型和考生群体的进步幅度进行对比,丰富教育质量均衡的评价指标;挖掘不同学校的增值特点和类型,帮助学校找准自身的发展特色和定位,通过连续多年的增值评价分析,可以揭示学生进步的趋势和规律,为教育实践提供反馈,指导教育改进措施的实施。这种基于数据驱动的评价方法有助于促进教育公平,提升教学质量,实现教育系统的持续改进和优化。

(二)构建全面的考试数据治理与评价服务平台

构建省级高考成绩报告综合平台,该平台应采用先进的分布式计算架构,并整合人工智能与大数据技术,以实现考试数据的有效治理、深入的数据挖掘分析,以及直观的结果可视化查询。平台设计遵循高考评价改革的理念,旨在全面满足多变量、多级别、多维度和多指标分析的需求,充分挖掘考试数据的内在价值,为教育决策者提供科学的决策支持。此外,平台的设计应显著提升数据分析的效率和精确度,实现对考试数据的高效管理和深入分析。平台应包含以下四个核心服务模块。

1.“经典套餐”——定制化报告生成

平台提供定制化报告生成工具,允许用户根据省级、市级、区级、校级的不同需求,快速定制并导出详尽的教育管理报告和学科分析报告。这些报告模板可个性化定制,以图文结合的形式呈现,支持WordPDF格式,便于打印和分发。

2.“自助餐”——灵活的数据报表查询系统

为适应不同业务部门的数据分析需求,平台设计了灵活的在线预定义报表查询系统。用户能够基于特定的数据维度和条件进行查询,以支持决策制定。系统界面用户友好,操作简单,并采用分权分角色的查询机制,确保数据安全性。同时,系统支持报表的导出功能,便于用户进行进一步的分析和存档。

3.“私人定制”——交互式数据可视化展示

针对高层管理者和重要会议的数据展示需求,平台提供交互式数据可视化展示工具。该工具能够在大屏幕上直观展示关键数据和趋势,全面反映教育系统的状态。支持高度定制化的界面设计和展示内容,以及多种交互功能,以满足特定的展示需求。

4.“自助厨房”——高级自助交互式数据分析

为满足专业业务人员对数据分析的深层次需求,平台提供一套高级的自助交互式数据分析工具。用户可以通过拖拽、筛选等操作进行个性化数据分析,构建定制化的分析报表和仪表板。该工具依托于平台强大的数据引擎,支持大数据量的快速处理和分析,增强了数据分析的灵活性,并促进了数据的深入挖掘和利用。

(三)建立专业化考试评价队伍

科学而有效的考试评价开展,主要依赖于考试评价队伍对教育政策、教育测量与评价技术、数据使用与分析规范的掌握及科学评价理念的树立。考试评价队伍专业化程度如何,直接决定着考试评价的成败。要从人员结构与专业素养上加强考试评价队伍的专业化建设,一方面要通过人才引进,充实了教育测量与评价专业队伍。另一方面要组建一支多领域、跨学科、高素质和重实践的专家队伍。在工作实践中加大学习与培训力度,提升考试评价队伍专业化水准,为考试评价工作开展提供坚实的人才与技术保障。

(四)人工智能赋能精准诊断

在教育评价中,仅依赖于总分的评价方式对于考生个体或群体的评估是不够全面的,这一点已成为教育评价领域的共识。在高考这类高利害性综合性考试中,每道题都旨在考查考生的多方面素养、能力和知识,因此,即使考生在某一题目上得分相同,他们的解题方法、作答步骤、扣分点等差异也能揭示出各自独特的潜在特质。单纯依据最终得分来评价考生的素养水平、能力达成和知识掌握程度,其科学性和准确性是不足的。鉴于此,可采用先进的人工智能(AI)技术,对考生答卷进行深入分析,深入探讨每位考生的作答细节和解题策略,从而更科学地评价考生的综合素质,推动教育评价体系向更加精细化和个性化的方向发展。

(五)加强数据治理

在数据安全和隐私保护的基础上,四川省应加强数据治理,确保数据的合法合规使用,提高数据分析的效率和精度,实现考试数据的高效治理和深度挖掘。

重庆模式在高考评价改革中展现了其创新性和实用性,但也存在一些需要改进的地方。四川的教育评价改革模式可在吸收重庆模式优势的基础上,针对其不足进行改进和创新,通过引入增值评价技术、人工智能赋能的精准诊断,以及建设考试数据平台,形成更为全面和深入的四川模式,为推动教育评价改革交出一份高质量的答卷。这不仅有助于提升四川教育评价的质量和效果,也将为全国教育评价改革提供新的经验和启示。

作者简介:邹函(1982—),女,四川省教育考试院自学考试处副处长、副教授电子科技大学博士研究生。

李志刚(1970—),,四川省教育考试院党委书记、院长。

参考文献

[1] 中共中央 国务院印发《深化新时代教育评价改革总体方案》[EB/OL](2020-10-13)[2023-10-15].http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/ t20201013_494381.html.

[2]范国睿.教育评价改革需要新路向[J].现代教学, 2020(增刊4): 1.

[3]谢维和.结果评价及其改进思路[J].基础教育参考,2022(5): 11-12.

[4]辛涛.挖掘过程性数据中的教育价值[EB/OL].(2020- 12-12)[2023-10-15].http://www.moe.gov.cn/jyb_xwfb/xw_zt/moe_357/jyzt_2020n/2020_zt21/zhuanjiawenzhang/ 202012/t20201214_505246.html.

—1—