《深化新時代教育評價改革總體方案》提出,要改進結果評價,強化過程評價,探索增值評價,健全綜合評價。
在這“四個評價”當中,綜合評價是重點,也是根本。因為如果不指向學生綜合發展,結果評價和增值評價容易變成評價分數,過程性評價也可能走向形式主義,評價便失去了意義和價值。
【資料圖】
但同時,綜合評價又是痛點、難點和卡點。核心素養時代,究竟如何健全綜合評價?想回答這個問題,我們需要明確兩點: 綜合評價不是什么?綜合評價是什么?
綜合評價不是什么
綜合評價不是知識點的拼接
上世紀80年代,我們引進了布魯姆的教育目標分類學及掌握學習法。當時我是一名教研員,用雙向細目表來架構命題框架,改進考試命題。在那個年代能夠這樣做,是很先進的,因為在雙向細目表的引導下,能夠確保命題的覆蓋面比較廣,也確保教學在某些方面不能超綱。
但這就是我們今天追求的綜合評價嗎?顯然不是,因為綜合不是簡單的匯總、相加。今天強調素養導向,素養不限于知識點,也不限于認知范疇,而識記、理解、應用都是認知范疇。
如果用一個公式來說, 素養=(知識+能力)*態度,它強調態度價值維度。態度為正,就是正能量;態度為負,就是負能量。而雙向細目表限于認知維度,跟素養導向的綜合評價是有偏差的。
而且,雙向細目表強調考試,即學生要在規定的時間、規定的場所,回答相同的問題。這樣能考出真正的素養嗎?我說可以,也并非完全可以,因為 最重要的素養是不能通過考試的方式來評價的。
綜合評價不是五育觀測點的相加
目前,中小學流行的綜合評價,是把學生的綜合素質分成了思想品德、學業水平、身心健康、審美素質、勞動與綜合實踐五個方面,每個方面再分解成三級指標。比如,審美素養被分解為美育實踐、美感表達、藝術特長三個指標,每個指標對應4-5個觀測點。整體而言,綜合評價就細分成了五六十個觀測點。
這一套體系對于破除“唯分數論”是有價值的,它關注到分數之外的很多方面;像勞動與綜合實踐,就是過去很少關注的維度。這相對于雙向細目表的評價是有進步的。
但是,這樣的綜合評價仍然是有問題的。
第一個問題,綜合評價表現為各個五育觀測點的簡單相加,在非常細致的分解式考評之下,學生的個性、活力、靈氣就被淹沒了。
第二個問題,綜合評價一般都是通過同學評、老師評、家長評來評出等級或者得出分數。但這些指標缺少一定的可操作性,所以多是憑主觀印象進行評價,不那么客觀;不同學校的把握也不太一樣,缺少一定的可比性。
第三個問題更嚴重,在這樣一套評價指標體系下,課程對接的是學業水平,課程被狹隘地理解為智育;然后在學業水平之外,專門突出了德育、體育、美育等,嚴重窄化了課程的育人功能,評價因而容易走向形式主義。
學校育人以課程為載體,同樣,學生綜合評價也應與課程對接,通過健全課程落地的機制,由課程體系予以保證,不是另外設立一套與課程關系不大的評價體系。 如果評價能夠嵌入課程實施過程,落地在每一門課程,學生的綜合素質一定能夠得到發展。
綜合評價不是全時空的跟蹤、監控
說到綜合評價,現在學校比較時髦的是 “數字畫像”,即依靠穿戴設備和圖像設備,對每個學生的行蹤進行全方位地記錄,并在此基礎上得到學生畫像。
數字畫像有兩個好處,一是便利,可以通過大數據的實時記錄、自動匯集、連接,形成龐大的“數據自我”;二是比較客觀可靠,不再是憑主觀印象進行評價。
但隨之而來的問題也不少:
第一,數據是隨機采集的,缺乏必要的結構;
第二,被記錄的是某些行為及其模式,而不是動機、情感、態度、信仰等。學生的動機、情感、態度、信仰能夠被這些數據體現出來嗎?我表示懷疑。
第三,無所不至的“強制性透明”摧毀了所有的有機表達,剩下的只有機器連接的過程,人變成了完全透明的機器。
我們需要思考的是,全時空的跟蹤、監控這件事究竟對不對?這件事如果發生在我們自己身上,是什么感覺?己所不欲,勿施于人。如果我們自己都不愿意接受這一套,請不要把它用在學生身上,何況是未成年兒童。
伴隨著現代化的進程,人的活動有著私人領域和公共領域之分,而私人領域不應該是透明、公開的。但全時空的追蹤把所有東西都記錄下來,產生龐大的數據,無論是暴露在自己面前還是在別人面前,都會感到非常吃驚。 面對這樣的媒體和數字“暴力”,我想,應該說“不”。
綜合評價是什么?
接下來,我們就來正面回答“綜合素質評價是什么”這一問題。但首先,我們需要明白“綜合是什么”。
綜合是調動多樣化心理社會資源
應對挑戰、完成任務的過程
下面是兩個學習任務的例子。
示例1:6年級數學任務設置
規劃一次出游:教師介紹主題,激活學生以前規劃出游的知識。
引導學生討論:討論內容為以前學校或家庭到哪里出游過或其他外出情況。繪制一個圖表,通過列出學生的首選清單,展示全班的優先選擇,然后對他們最想出游的地方投票,全班討論最優選擇。
每個學生的任務:基于他們對班級投票情況的分析,建議他們班可以去哪里出游;基于圖表顯示的每個地點的距離、門票價格和公交車費,計算每個學生三個不同地點的出游費用;使用成本圖表中呈現的信息,評價學生要去動物園的提議;基于對所有信息的分析,給教師寫一個短信,對班級應該選擇哪個地點出游給出建議和佐證。
示例2:高中語文任務設置
10-11年級學生編輯一個在線電子版文集《人工智能與勞動世界》,具體任務是為文集準備前言,做如下事情:
決定以什么順序選取哪些文本(至少包含6個文本),這些文本至少體現兩種以上的觀點和文本形式;甄別和討論文本所體現出來的關于兩者關系的不同看法;為每個文本寫一個段話,闡明選取的理由及與其他文本的關聯性;提出一系列問題,讓讀者集中思考文本中的觀點。
上面這兩個任務有什么特點? 一是真實性,反映真實的生活或工作需求; 二是開放性,有著充分的自主空間; 三是迭代性,完成這樣的挑戰性任務需要較長的時間,允許學生從錯誤中學習。
在完成挑戰性任務的過程中,學生的知識、技能、價值觀自然而然發生了整合,這個過程叫做綜合。綜合是真實的、自然的,不是預先設定的。 綜合的過程,就是核心素養形成的過程。
所以,素養不是學而即得的知識;按照經合組織的定義,素養不只是知識與技能,還包括在特定情境中,通過利用和調動心理社會資源(包括技能和態度)滿足復雜需要的能力。
綜合素質評價要義的兩個方面
由此,綜合素質評價的要義體現在兩個方面。
一是從挑戰性任務的完成過程中看重要素養的發展情況。
比如上面的示例2,就能看到多方面的素養,包括:學生組織安排及闡釋、推介文本、滿足讀者需求的意識和能力;多渠道閱讀獲取信息、梳理探究與書面表達能力;對技術世界與勞動世界的基本態度。
所以,綜合評價不是評價“今天學會了嗎”“今天作業交了沒有”“今天晚自習上了沒有”。如果綜合評價被理解為這種方式,我們將把學生引向哪里?到最后,學生就會失去自主性。 評價關注學校課程著力培育的重要素養,而非學而即得的知識、技能,以引導教育教學的方向。
二是把學生各方面的情況結合起來,看個性潛能和特長。
具體來說,是對學生的發展可能性作出前瞻性評估,對個人潛質與院校培養目標的匹配度做出判斷,借以引導后續學業、生涯規劃,決定是否報考或錄取。 它要求把“抽象的人”還原為現實生活中的具體個人,并放在一定情境中去理解。
基于學生作品的綜合評價
基于以上對綜合評價的思考,我認為,未來綜合評價的一個出路或者選擇,是基于學生作品的綜合評價。
作品是學生重要素養發展
的關鍵證據
作品是學生完成挑戰性任務過程當中所形成的學習成果,也是學生重要素養發展的關鍵證據。
為什么這么說呢?作品集中展示了學生的理解和行動: 選擇做什么,表明他的價值取向; 怎么做的,反映他的思維過程和行為方式;做到什么程度,表明了他的潛能和個性品質。
同時,作品具有整合性質,可涵蓋所有素養發展過程,而不限于標準化考試所能反映的內容。比如,曹雪芹是個什么樣的人呢?我們可以從《紅樓夢》這個作品中找到答案。
這樣的學生作品,不同于一般的課堂作業,而是屬于一種挑戰性任務。剛才提到,學習任務的特點是真實性、開放式、迭代性。同樣,在任務當中所形成的學習成果即作品,也有3 個特性。
第一,真實性。任務是真實的,作品也應該是真實的,反映了學生的真實想法和行動。
第二,專業性。在完成挑戰性任務時,學生要運用學科和專業領域的重要觀念、方式去分析解決;同時運用一定領域或者學科的表達方式,包括符號、語言,來呈現成果。這使得學生要像專家一樣思考問題、解決問題。
第三,迭代性。完成挑戰性任務一般不是一次性的,需要反復迭代更新,直到最后個人基本滿意為止。
那么,怎樣的學習成果,才算是作品呢?主要有以下四類。
一是閱讀筆記,致力于掌握給定的學科材料,做整理、歸納、比較、闡釋和評論。比如,圍繞某個專題的書籍資料進行整理,就是典型的閱讀筆記。
二是研究成果,即圍繞某個問題進行觀察、調查、實驗等,獲得規律性的認識。通常所說的研究性學習報告,就屬于研究成果。
三是創意表達,即圍繞感興趣的話題,運用多種媒介方法技術,進行個性化地設計、制作、表演、表達等。在高中,學生這方面的創意表達比較豐富多樣。
四是實踐報告,即走向社會、挑戰自我,完成特定目標任務過程的報告,包括改變自我和改變世界兩個方面。比如學生的志愿服務,就是反映學生是否具有一定的責任擔當,能否運用所學去完成任務、接受挑戰的重要證據。
圍繞關鍵證據
——作品的綜合評價
有了作品作為關鍵證據,如何進行綜合評價呢?主要有三個環節。
第一個環節,獲取作品;這是評價的基礎。
在課程實施過程中,設計有關項目任務,或者學生自定義項目,對作品形成、記錄過程做必要指導和規范。比如學生讀書,摘要和筆記可以設計規定的模板,包括什么時候讀什么書、主要內容是什么、作者的觀點是什么、自己是怎么看的,等等。每個學生要在規定學習領域完成并提交作品。
第二個環節,解釋作品。這是評價的關鍵和難點。
解釋作品可以有多方面的參照體系,包括學生個人成長經歷、所處的社會文化環境等,以此來解讀作品的意義,對于重要素養的發展意味著什么,達到了什么目標,進階到了什么水平。
其中,最重要的參照是要有一定領域的通用量規。關于量規,我舉一個例子。中國學生發展核心素養中,有一個素養是健康生活,如何來評價這一素養呢?有人把它分解成以下 6 個水平。
水平1:在指導下,我可以嘗試一些新的東西,看看我自己喜歡的程度。
水平2:在指導下,我可以嘗試一些新的東西,看看我自己喜歡的程度;我可以注意到,如果我吃了什么東西后感覺不舒服(如胃痛、皮疹、頭痛),我可以告訴別人。
水平3:我可以嘗試新的東西(如食物、活動、書籍),找出自己喜歡和不喜歡的東西;如果我周圍的東西或我吃過的東西讓我感覺到不舒服(如胃痛、頭痛),我可以開始注意到問題的規律,并告訴我的照顧者/或另一個我值得信賴的成年人。
水平5:我可以設定一個與鍛煉、營養或睡眠有關的個人目標,并實施一個或多個新的策略或習慣,以幫助我實現我的目標;我可以認識到導致不健康思想或行為的觸發因素和/或消極影響;我可以定期將時間投入到使我感到快樂、自豪或有使命感的關系和活動中;我可以調查哪些特定的身體不相容(如過敏原、糖類),我可以積極嘗試避免它們。
可以發現,這個量規不是在空談健康管理,也不是很具體地談做法,比如要勤洗澡、勤刷牙等,而是介于兩者中間。同時,它的進階非常明晰明了。最后,它是從學生的口吻,通過非常通俗的語言來表達。
學生素養涉及很多方面,關于重要的素養,能不能研制出通用、能理解的量規?這件事挑戰挺大,又相當重要。因為當下的評價,是一個項目設計一個量規,不好用,不科學,看不出進階,彼此之間也不能比較。
第三個環節,分享作品并改進后續學習;這是評價的歸屬。
具體來說,通過在線匯集、家校溝通會議等,促進學生思考“作品為什么是這個樣子”,從中反思改進自己的品質、能力。教師也要從中反思:這個作品符合你的期待嗎?符合教育的期待嗎?符合素養的要求嗎?并在這個過程當中,與學生展開持續的對話。
總之,基于作品的綜合評價,指向重要素養,比如文化理解、健康生活、高階思維等;學生自主把握,不是被動監控;嵌入到課程實施過程當中,不是在課程在另搞一套;連貫一致,貫穿整個小學乃至中學全程。當然,基于作品的評價,也不是唯一的出路。
綜合評價是學生核心素養培育的一個重要支點,希望我們能通過這個支點來撬動教育的未來。
來源 | 整理自作者在2023小學課程周主題峰會的演講
作者 | 柳夕浪
責編 | 張凱
美編 | 姍姍
執行主編 |安迪