【明報專訊】從每天下田耕種,拉着馬匹到處奔波,到搭火車趕到工廠上班,在三次工業革命以前,人們或未想像過用機械取代人力生產。以如今人工智能(AI)的發展趨勢,未來似乎大部分工作能以AI代勞。本地兩間大學分別研發AI中文作文評改系統和智能問題庫,盼提高學生的學習效率,以及減少教師批閱習作的壓力。在不久的將來,我們是否會迎來用AI來評改公開考試和評估的一天?
港大研發 3中小學試用
香港大學教育學院團隊研發了「mAI Mind 中文寫作評改系統」(簡稱 mAI Mind),並邀請了本地3間中小學試用。港大教育學院助理院長(知識交流)、助理教授羅嘉怡表示學生害怕寫作,有研究發現學生一作文,就會莫名感到恐懼,「不知道要寫什麼、如何組織詞句,時間又不夠用,字數要求多」;對教師而言,批改作文則不如閱讀理解般有明確的分析對象,「寫作是學生將閱讀所得的知識靈活運用,即需大量(知識)輸入」,惟市面的教材未必能幫助老師教導學生將閱讀內容化為寫作創意。
減人手批改時間
她解釋,將AI應用在中文作文上,是為了讓學生透過輸入關鍵詞,獲得作文建議,執筆前獲得更多構思,另外老師利用AI批改,縮短學生獲得老師評語的時間,「我們希望一些低層次批改,可借助AI初步處理,老師再審視學生整體寫作表現,給予具深度和針對性的回饋,並增加評講時間」。她說回顧與修訂,是學生學習最有效和進步得最快的過程,但現時靠人手批改,這個過程則拖很久,「再勤力的老師,起碼都要兩至三星期才改好,其實隔了這麼久,學生什麼都忘了」。
俗語有云「practice makes perfect(熟能生巧)」,學生多練習寫作,不就會進步嗎?羅嘉怡笑言:「學生寫得愈多,教師改得愈慘,要是有一個自動批改的平台,就能立即針對學生的文章提出建議。」學生可按建議修改,再交改良版作文給老師,而非寫完第一次就算。
生成範文功能 只限部分學生
羅嘉怡向記者示範中文作文評改系統的運作,她首先設定「小六中文記敘文」,並輸入「題目:上學的一天,運用倒敘手法及明喻句」的提詞,約1分鐘後,系統自動生成範文。範文首段寫道:「今天是星期一,我一早就被鬧鐘吵醒了。回想起今天的上學經歷,真是像一場精彩的電影。」「回想」揭示接下來的內容將是倒敘,「像」則是喻詞,羅說鍵入的指令愈清晰,系統生成的文章愈具體。不過生成範文這功能並未開放給年幼的學生使用,「因為這種科技是新開發的,所以我們採取一個比較穩健的步伐,因此會對年幼使用者施加限制」。
羅嘉怡保留先前的作文指令,再加入範文內容讓系統評改,系統就文章的內容、結構、文句、錯別字和詞語運用等評價,並給予改善建議:「可以增加一些細節描寫,使文章更加生動具體。例如,可以描述一下數學課上解題的過程……可以在結尾部分增加一些反思或感想,使文章更加深刻。」記者好奇AI是沒有情感的機器,能如何評改需要想像力、表達較主觀的作文?
評改系統參考本地課程、TSA要求
保良局黃永樹小學師生是mAI Mind的用家,校長陳瑞良是資深語文老師,曾任教育局語文教學支援主任,他稱使用系統將高年級中文作文的評改時間,由平均每篇文10至15分鐘縮短到兩分鐘。他續說,每個文體都有一些學生寫作時需要貼近的關鍵語文元素,而語文老師引導學生如何構思寫作意念時,正體現其教學習慣,故老師在系統鍵入的提詞具主觀意識,系統亦按此標準評改,「當然我們都預計系統或有限制, 譬如開發初期 ,學生作文樣本數量有限,(系統運行)未必達預期效果,所以老師可以編輯系統初步評改的建議」。
羅嘉怡說他們的評改系統評參考了本地中國語文課程對寫作的要求、系統功能語言學裏的文類教學法,還有全港性系統評估(TSA)的標準,「因為這是教育界一個共通語言,是一個專業的理解」。陳瑞良補充,網上的資料質素參差,或有沙石,故系統結合了語文教師自定評改要求、教育局課程文件和考評局評分標準,好讓它貼近教師批改文章的角度。
AI寫AI改 「沒有意思」
自從ChatGPT面世,利用生成式人工智能(generative AI)代筆寫論文做功課,不再是新鮮事。AI生成的內容是否原創或牽涉抄襲,能否以文字表達人類細膩的情感等,是坊間一直存在的疑問。考評局去年新增校本評核的AI使用指引,要求學生完成校本評核課業時使用AI工具須註明出處。羅嘉怡說大學一直討論應否讓學生利用生成式AI做功課,而她們的結論是:「AI不會取代人,因為AI需要人類指示才會執行指令,但是不懂運用AI的人會被取代。教育界不應逃避科技,反而應學會如何利用科技讓學與教能發揮得更好」。
假如利用生成式AI寫作目的是完成功課,陳瑞良直言:「由AI生成一篇文,再用AI批改,其實這個遊戲很沒意思。」因為當中缺少了真正的教育功能,以作文為例,寫作是將真情實感和生活連繫,再轉化成自己的文字表達,「人文精神或人文素養的表達,是我們一個很重要的個性化學習,如果缺少情感表達個人感受的成分,我覺得這個教育走向出現偏差」。
擅長蒐集硬知識 欠情感表達
關於AI生成的創作缺乏情感表達,陳校長免費補習天地創辦人及總幹事陳葒說:「它(生成式AI)可以給你答案,卻無法給你快樂。」他解釋創作的意義在於享受其過程,譬如說看見心儀女子想寫一首情詩給她,其創作價值是AI無法創造的,AI本身亦無法取代老師引導學生的成長。但他認為AI生成的「硬知識」準確度較老師高,始終AI能在短時間蒐集不同權威來源的資訊。
陳校長免費補習天地於2021年推出「補天網上學習平台」,讓學生在網上自學和完成小測驗,溫習及檢視學習進度,平台現新增由香港教育大學團隊研發的「AceiTeach學習系統」,由AI生成問題讓學生選答,並分析學生答錯的題目,針對其弱點出題。陳葒說補習社至今招募的義務導師和成功配對的學生分別逾21,000人,但仍有約4000名學生等候配對,人手不足,而且義師是「抽時間來,一星期基本上只有一天有空可以義補,但學生一星期只補習一次顯然不夠」。利用AI學習平台,學生便不用等義師解答,可先行自學,或經AI分析學生的題型弱點後,義師可針對特定題型教學。系統設「錯題庫」和「題目溫習」,讓學生重溫過去答錯的題目,並就相關題目操練。
多項選擇題 答案具爭議
記者打開AceiTeach學習系統界面,試答中文連接詞題目,題型都是多項選擇題。其中一題為「妹妹是一位活潑(_)好動的小孩子」,有「或、或是、而,和」的選項,記者選答了「而」,被判斷答案錯誤,「和」才是正確,然而兩者用在句子中均合理。陳葒說他試用也留意到多項選擇題的答案具爭議,例如關於結構助詞的題目「高興(_)跳起來」,他從「的、地,得」三者選答「得」,系統的正確答案是「地」,惟兩者文意皆通。陳葒說,「AI對所有人一視同仁,你這般答,它就這樣評分」,學習系統暫時未設開放式題目,陳葒認為主觀和創意內容仍須老師評改。
今年4月,美國得克薩斯州(得州)教育部宣布使用AI智能聊天工具人如GPT-4的組成的科技,推出「自動評分引擎」來批改當地學術評估STAAR的閱讀、寫作、科學和社會研究部分的開放式題目,所有答案會先經電腦評改,其中四分之一會再經人手重新評核。有得州此例,記者好奇本地是否也有用生成式AI批閱試卷的可能?
陳瑞良作為小學校長兼中文老師,他認為日後有AI評改試卷的可能,但要視乎該技術的成熟程度,並小心使用。特別就中文科而言,他說不同地區的語言習慣有分別,「如果在大數據時代下,(AI)系統可以兼容語法差異,那我覺得(AI改卷)那個發展是好的,但不是要去到在DSE或者公開評估使用,這個過程仍有一段距離」,同時要兼顧教師學習使用科技的步調。羅嘉怡反問長遠而言,在高效率的考試中,是否需要系統自動評改?她始終覺得人的元素很重要,因為凡事也有例外,電腦也會出錯,「電腦可以幫我們審核一次,但結果仍須交由專業教師審視,這是負責任和保險的做法」。
考評局:AI未能取代閱卷工作
考評局回覆記者查詢,表示目前沒有計劃於轄下公開考試及評核使用AI工具進行閱卷工作,當局為轄下公開考試的閱卷工作程序,建立一套嚴格的質素保證機制,所有閱卷員須接受適當培訓,以符合閱卷資格,有關工作尚未能由AI工具取代。