導(dǎo)讀:當(dāng)今年秋季的成績單出來的時候,一些家長可能會收到令人不悅的“驚喜”:孩子的成績低于預(yù)期。
前段時間,江蘇一家長大呼“我就退出家長群怎么了”迅速引起公眾關(guān)注。
很多家長在感嘆“壓垮一個成年人只需一個家長群”的同時,繼續(xù)大倒“苦水”;而老師們也頻頻“發(fā)聲”,有人說自己到了深夜11點還在微信群里回復(fù)家長的咨詢信息。
隨著“家長退群”事件持續(xù)發(fā)酵,江西、遼寧等省紛紛出臺文件,明確指出教師必須親自批改作業(yè),嚴禁家長、學(xué)生代勞。
家長和老師各有苦楚,那么批改作業(yè)這個事,交給AI怎么樣?我們可以看看美國已經(jīng)應(yīng)用這項技術(shù)的情況。
自動批改軟件經(jīng)常把正確的答案標注為錯誤
當(dāng)今年秋季的成績單出來的時候,一些家長可能會收到令人不悅的“驚喜”:孩子的成績低于預(yù)期。
但是這可能并不是他們孩子的學(xué)習(xí)情況的準確反饋,而是許多學(xué)校用來檢查作業(yè)的AI系統(tǒng)出現(xiàn)了故障。
除非家長和老師對學(xué)生的考試重新檢查,否則這個問題很容易被忽略。當(dāng)一個五年級學(xué)生在一次科學(xué)考試中考砸了,才有人發(fā)現(xiàn)了這個問題,老師知道他已經(jīng)為考試做好了準備,所以在網(wǎng)上打開測試,想看看這個學(xué)生漏掉了什么,發(fā)現(xiàn)他的一些答案是正確的,但批改錯了。
"錯誤 "是什么呢?只是大小寫字母的問題。
于是老師最好把他參加過的每一次考試都看一遍,看完后,又發(fā)現(xiàn)了幾個例子。
自動評分承諾為教師節(jié)省了時間,但現(xiàn)在老師中的許多人卻要花上幾個小時的時間來研究學(xué)生的每次評估和考試的答案。
在某些情況下,Canvas學(xué)習(xí)平臺將回答的大寫字母的差異標記為不正確。圖片:Julie Jargon《華爾街日報》雜志社
錯誤從何而來?
錯誤的根源在于許多評分機器人的被設(shè)計的過于簡單化。它們試圖將學(xué)生的回答與老師的答案進行匹配。如果兩者不完全一樣,即使人類很容易就能看出答案的正確性,但答案往往會被標記為錯誤。這是突然轉(zhuǎn)向遠程學(xué)習(xí)給老師、家長和學(xué)生帶來的又一個頭疼的問題。
這類教育軟件的制造商承認自動評分存在的問題,并表示許多教師沒有足夠的時間接受如何準確使用在線平臺的相應(yīng)培訓(xùn)。
科羅拉州奧羅拉市的一位單身母親Cristina Perez說,她的三個孩子已經(jīng)對整個遠程學(xué)習(xí)的經(jīng)歷感到失望,包括在Canvas學(xué)習(xí)管理平臺中收到許多錯誤的測試評分。我的孩子們在加利福尼亞使用的虛擬教室也是同一平臺。
"我所有的孩子都是'B'級學(xué)生,現(xiàn)在他們大部分課程都不及格。這就是它的糟糕之處。" Perez女士說,她的孩子們正在讀七年級、八年級和十年級。"這對孩子的心理健康和即便是簡單嘗試造成什么樣的影響?"
孩子上學(xué)期間,Perez女士從事運送汽車零件的工作,她說她發(fā)現(xiàn)很難聯(lián)系到老師。她的每個孩子都有七位老師。她說,她已經(jīng)給他們中的一些人發(fā)了電子郵件,告訴他們這些問題,但考試成績還是沒有得到糾正。
"我沒有時間坐在那里監(jiān)督這一切,"她說。"我已到了告訴我的孩子們只需登錄并做他們能做的地步了。他們的壓力已經(jīng)夠大了。
有些學(xué)生在Canvas中對問題的回答因為與教師的準確措辭不一致而被自動標記為錯誤。在這種情況下,教師已經(jīng)手動調(diào)整了成績。圖片:Julie Jargon《華爾街日報》雜志社
Patrick Lytle在伊利諾伊州高地公園(Highland Park)經(jīng)營一家設(shè)計公司,他五年級的女兒告訴他,她在在線平臺Otus的一次數(shù)學(xué)測驗中答錯了答案。她的老師曾指導(dǎo)學(xué)生在答案中加入單位,而她在一道題上正確地回答了 "3克"。然而,自動評分器卻標錯了,顯示正確答案只是 "3"。Lytle先生就此給老師發(fā)了郵件,老師糾正了該女生的分數(shù)。
位于猶他州的教育軟件公司Instructure Inc.的首席產(chǎn)品官Mitch Benson表示,該公司經(jīng)常聽到有關(guān)其自動評分功能的問題。他說,在虛擬學(xué)習(xí)的熱潮中,許多學(xué)校沒有足夠的時間對教師進行徹底的培訓(xùn),讓他們了解Canvas作為遠程學(xué)習(xí)一站式服務(wù)平臺的各種屬性。
"教師們不得不使用他們并不熟悉的工具,這帶來了一些新的挑戰(zhàn)," Benson先生說。
教師在Canvas中建立自己的虛擬教室,學(xué)生可以登錄視頻會議,訪問教育應(yīng)用程序,接收和提交作業(yè)并進行測試。在舊版本的測驗功能中——Instructure表示,在其6000個地區(qū)和大學(xué)客戶中,約有75%的客戶仍在使用該功能——學(xué)生必須完全按照教師輸入的問題來回答。大約18個月前,Canvas開始推出更新的測驗功能,其算法可以檢測出答案何時足夠接近。
Benson先生說,在業(yè)務(wù)快速增長的過程中,很難跟上所有的問題。Canvas的并發(fā)用戶數(shù)峰值已從4月的200萬上升到9月的650萬??头娫捙c使用量同時上升,上個月達到20多萬個求助電話。
Benson先生說,該公司的目標是讓教師的工作更輕松。"我為我們有些落后的領(lǐng)域感到抱歉,"他說。
總部位于伊利諾伊州的Otus公司首席運營官Keith Westman也表示,自動評分問題不是技術(shù)問題,而是教師培訓(xùn)問題。
當(dāng)教師在Otus中設(shè)計測試時,他們可以包括幾個備用答案。例如,如果一道數(shù)學(xué)題的正確答案是 "3克",教師可以指定幾個被認可為正確的答案,如 "3克",或是 "3"。教師可以選擇是否給學(xué)生一個滿分或半分的答案,可以要求答案完全吻合,或包含部分正確的文字。
Westman先生說,如果教師不喜歡自動評分,他們可以完全禁用它。他還說:"自動評分在起作用的時候是很好的,但當(dāng)它不起作用時,對學(xué)生來說是毀滅性的。"
在170個K12學(xué)區(qū)使用的平臺Otus,讓教師包括幾個備用答案。該公司表示,自動評分問題不是技術(shù)問題,而是教師培訓(xùn)問題。圖片:Otus
Kristin Beamish-Brown是明尼蘇達大學(xué)雙城分校的高級教學(xué)專家,她每天都要處理來自她第三學(xué)期西班牙語課上遠程學(xué)生的惱人問題。盡管她警告他們,他們在Canvas中看到的自動成績可能是錯誤的,但她經(jīng)常在她二次檢查自動批改成績之前聽到他們的消息。
"我有71個學(xué)生。我需要花上幾個小時的時間來評定本應(yīng)是自動評分的測驗,"她說。"我不僅要回去檢查他們的成績,還要回復(fù)50個給我發(fā)郵件擔(dān)心成績的學(xué)生。"
Beamish-Brown女士說,她已經(jīng)開始向?qū)W生隱瞞成績,直到她可以審查所有的答案。當(dāng)自動評分器標出一些錯誤時,她發(fā)現(xiàn)自己要讀三四遍答案才能確定。
她說:"我開始懷疑自己,因為機器說那是錯的。""這就是科技讓我們的生活變得更輕松。"