破“五唯”是一場事關教育事業(yè)長遠發(fā)展的硬仗。作為一項涉及面廣、復雜度高、綜合性強的系統工程,我們要不斷創(chuàng)新思維方式,積極利用信息技術破解教育評價的“痛點”,扭轉不科學的教育評價導向,推動評價理念、評價方式和評價內容的“升級換代”,為教育高質量發(fā)展保駕護航。
新技術正在成為教育評價改革的內在變量
教育評價經歷了漫長的歷史發(fā)展過程。早在西周時期,我國就已經形成了較為完整的考試制度。《學記》中記載的“比年入學,中年考!,就是每隔一年要對學生的學業(yè)和品行進行考查,并制定相應的考查標準。之后,隋朝創(chuàng)立了“開科舉士”的科舉制度,通過地方預選、全國統考和舉薦相結合的方式遴選人才,極大地暢通了社會階層的流動渠道,使貧寒子弟“朝為田舍郎,暮登天子堂”成為可能,對我國封建社會發(fā)展產生了深遠影響。在西方,古希臘哲學家采用辯論、談話、實際操作等方式對學生進行考核。在這個階段,教育評價主要以質性評價活動為主,依靠教師經驗或主觀判斷來評定學生的綜合發(fā)展水平。
隨著現代教育制度的建立,美國教育家泰勒提出了以目標為導向的教育評價原理,根據教育目標編制試題,對學生進行統一測試,按照一定的標準對學生的學習結果進行評分。這種標準化考試側重評價學生的知識掌握程度和認知發(fā)展水平,有效克服了測試者的主觀偏差,提高了考試的效度。在實踐發(fā)展中,教育評價還引入心理測量技術,用數學統計方法對學習結果進行精確描述,常見的測驗類型有常模參照測驗和標準參照測驗。在這個階段,教育評價主要以紙筆測試為主,通過標準化考試來衡量學生對知識的掌握程度。
近年來,大規(guī)模教育評價技術日趨成熟。以經合組織的國際學生評估項目PISA為代表,它結合了學科測驗和學生背景信息(家庭社會經濟背景、學習動機與策略、學習時間投入、學校教育資源、學校和班級氛圍等),采用矩陣抽樣、多層線性模型、規(guī)則空間模型等測量方法,從多個角度分析學業(yè)成就差異的原因。2015年,PISA全面采用計算機測試方法,并構建了大規(guī)模的教育評價數據庫,在數據挖掘技術的支持下及時發(fā)現問題,為各國教育決策提供參考。從這個階段,教育評價開始引入計算機測試,彌補了紙筆測試難以對學生行為表現(如言語表達能力、動手操作能力、問題解決能力等)進行測量的不足,重點關注學生的能力表現以及學習結果背后的原因分析。
目前,教育評價越來越重視信息技術的重要作用,在實踐探索中形成了計算機自適應測驗、電子檔案袋、學習分析技術、數字畫像、基于大數據的課堂觀察、區(qū)域教育質量監(jiān)測數據平臺等多種評價方式。新技術正在成為教育評價改革的內在變量和活性因子,為破“五唯”帶來了新的可能。
新技術推動教育評價理念與方式的深刻變革
隨著人工智能、大數據、區(qū)塊鏈等新一代信息技術的發(fā)展,新技術正在觸發(fā)一場教育評價方式的深刻變革。今天,我們可以利用技術手段,對評價對象進行多維度、全過程、立體式的考查,在自然情景中采集學生學習的過程性數據,改變過去教育評價的刻意設置特征,實現教育數據的全過程采集和教育結果的適時反饋。評價信息更加多元,既可以是總結性測試的考試分數,也可以是記錄學習過程的文字、圖片、音頻、視頻等學習檔案,還可以是反映學生能力的調查報告、手工作品、活動總結等學習成果,使評價結果更加合理,讀懂學生的真實成長。通過對學生進行精準的數字畫像,提供個性化的教育評價服務,改變傳統評價過于強調甄別與選拔的現狀,使評價、提升、改進融為一體。新技術推動教育評價理念與方式的變革包括:
第一,教育評價將從“容易測量的能力”擴展到“難以測量的素養(yǎng)”。教育領域對分數和成績的過度關注,固然是教育功利化傾向的必然結果,但也和評價方法不夠完善有一定關系。目前,我們還缺乏有效的評價方法和手段,準確衡量學生的高級認知技能和非認知學習成果。2012年,PISA首次引入了計算機測試,在具體的任務情境中評估學生的問題解決能力。2015年,PISA在此基礎上構建了真實的任務情境,利用計算機虛擬成員與參與測評的學生合作解決問題,通過評價任務完成過程來檢驗學生合作解決問題能力。未來,教育評價將從“容易測量的能力”擴展到“難以測量的素養(yǎng)”,通過設置新穎的測試題型、設問方式和任務情境,減少死記硬背的知識性考察,增加能力、素養(yǎng)、思維方式等方面的考察,促使學生主動思考、勇于實踐。
第二,教育評價將從“結果視角”轉向“過程視角”。評價不是為了證明,而是為了改進。每一次的考試、測驗和評估都是階段性總結,把這些節(jié)點數據串聯起來發(fā)現規(guī)律,洞察趨勢,才是教育評價的重點。在大數據技術的支持下,教育評價將從“結果視角”轉向“過程視角”,通過伴隨式的數據采集和自動化的數據分析,評估學生的學習特征與優(yōu)勢潛能,為每一位學生提供學習分析報告,滿足不同潛質學生的發(fā)展需要,幫助他們持續(xù)不斷的提升自我。
第三,教育評價將從單向度的考試測驗轉向多向度的綜合素質評價。如何評價學生的心理、品格和個性,一直是教育評價的難點。過去,我們主要采用心理量表進行測量,但存在解釋力不足的問題。現在,人工智能領域的深度學習算法提供了新思路。美國斯坦福大學科辛斯基教授設計了一種算法,只需要用戶在Facebook(臉書)上的227個點贊行為,就能大致判斷出用戶的性格特征。這表明,通過網絡痕跡可以對學生的人格、興趣、心理健康等進行預估,為全方位地評價學生提供參考。我們要善于利用信息技術的優(yōu)勢,建立科學的教育質量評價體系,不再用同一把尺子衡量所有學生,把品德、身心發(fā)展水平、興趣特長養(yǎng)成等作為教育評價的主要內容,對不同學生實行差別化評價,鼓勵學生發(fā)展特長。
教育評價從散點式的成績記錄轉向全景式的數據采集
過去,教育評價依賴于學生的考試分數或抽樣的截面數據,更多是反映靜態(tài)事實和集體的平均水平。未來,在新技術的支持下,教育評價將從散點式的成績記錄轉向全景式的數據采集,通過學生學習、教師教學、學校發(fā)展的大數據,描述學生成長和教育發(fā)展的動態(tài)過程,發(fā)現共性背后的個性特征以及各要素的內在關聯,促進學生發(fā)展和教育改進。
一是利用學習分析技術建立學習模型,收集學生學習的過程性數據,提供可視化的“學習體檢表”,全面展現學生的知識結構、能力表現、內在潛能等方面的數據,并對可能出現的學習困難進行預警和診斷,幫助老師準確把握學生的學習進展和認知特征,為學生提供最優(yōu)化學習方案。
二是利用區(qū)塊鏈技術開展分布式學習記錄,建立學生的個人學習成長檔案,認證學生的多樣化學習成就,重點考察學生的非認知能力發(fā)展,有效防止數據丟失或被惡意篡改,助力解決學生綜合素質評價中存在的信任問題。
三是利用跨媒體智能技術,探索開展模擬仿真、教育游戲、虛擬任務場景、協作學習環(huán)境等新型評價方式,突破傳統評價對分數的絕對關注,重點考察學生解決實際問題的能力。引導行業(yè)企業(yè)、專業(yè)機構、社會組織等利益相關方共同參與教育評價,推動考試內容與評價方式的整體轉型,使人才培養(yǎng)更加貼合社會需求,提高人才培養(yǎng)的社會契合度。
四是利用大規(guī)模的課堂觀察技術,對非結構化的課堂行為數據進行分析,包括教師提問類型、學生回答方式、師生對話深度等,全方位透視學校的課堂實施水平,提煉優(yōu)秀教師的實踐性經驗,促進教師隱形知識共享,實現信息技術支持下的教師角色轉型和教學能力提升。
五是利用可穿戴運動設備,包括智能手環(huán)、智能手表、智能運動裝備等,采集個人運動及身體健康數據,及時發(fā)現學生在體質健康、運動技能等方面存在的問題,提供個性化的改進方案,從而實現伴隨成長全過程的形成性評價。
六是利用大數據技術提高教育治理現代化水平,通過全樣本、全過程、多模態(tài)的數據采集,匯聚形成區(qū)域教育大數據,包括學生成長數據、學校運行數據、教育資源配置情況、普職學校規(guī)模結構等,幫助管理者獲得超越個體或局部的洞察力,提高教育決策的針對性、靈敏性和科學性,努力滿足人民群眾對多樣化高質量教育的需求。
(作者:曹培杰,系中國教育科學研究院副研究員)
本文系中國教育科學研究院2019年基本科研業(yè)務費專項資金委托項目“‘破五唯’教育評價改革研究”(GYG12019001)成果