{事實查核達人}李鈺鵬 教AI做好人 擋流言覓真相

文章日期:2024年09月29日

【明報專訊】在這資訊科技時代,任何人都可透過網絡發布對社會議題的正反觀點,或用人工智能生成頭頭是道的「論文」,真假難辨,不想受騙便要fact-check(事實查核)。事實要查核,「觀點不需要判斷真假」,以人工智能(AI)為研究對象的李鈺鵬如是說。他的最新研究方向是利用AI檢測包括由AI生成的虛假資訊。有說實踐是檢驗真理的唯一標準,查核事實又該持什麼標準?若然創造AI的人類也未必能從資訊汪洋中辨出真假,利用AI做fact-check能否分清觀點與事實?

AI核實能力未成熟

Fact-checking有時很簡單,只費多問一句的工夫,正如記者訪問李鈺鵬前備課,從香港浸會大學的「學者專家名錄」搜尋他的資料,網頁內容顯示他是傳理學院互動媒體系助理教授,專頁範疇是經濟學、大數據、大眾傳播、人工智能、社會福利及政策等,是跨專業學者。記者當面向他列舉這一大串名詞,好奇他其實最初修讀哪科,他尷尬而不失禮貌地笑:「經濟就……應該沒有學……你可能看錯了。」

要知道全世界有很多事同時發生,不會有時間逐一查證。李鈺鵬說人類雖然聰明,但受制於效率,難在這個資訊每分每秒以光速傳播的時代,查證生成式人工智能 (Generative AI)和人類大量生產的不實信息。「人是(fact-check)不可或缺的部分,但自動化(fact-check)無可避免,便有必要利用AI去做。」這正是他在埋首努力實現的方向,不過他說AI查核事實的能力未算成熟。

用AI做fact-check的原理其實跟人一樣,就是搜尋多個資料來源後,整合內容判斷資訊真假。李鈺鵬特別提到要AI提取與fact-check內容相關的信息,其準繩度仍有待改善,當中涉及人工智能的推理能力(reasoning)。「AI可以判斷到那件事是否事實,假如有100份資料都在說同一件事,儘管每份資料述說的意見或立場不同,但事實擺在那裏,AI較高機會認為那件事屬實,但當然不是說100%(正確)。」而他在研究檢測錯誤信息、謠言和假新聞時,意識到「不是所有資訊都可以用來判斷真假」,例如人的意見和想法。他稱現時直接用AI做fact-check不太可靠,因為AI可能誤當意見為可靠的「事實」作fact-check證據。

「AI如孩子 學習後自有思考能力」

在人工智能急速發展前,新冠疫情爆發時早已假資訊滿天飛,譬如有網民說接種復必泰疫苗會導致體內淋巴細胞數量下降、連登帖文稱南韓宣布由2022年3月起「停止接種新冠疫苗」。李鈺鵬記得疫情伊始,「我感到害怕,我可以做的就是保護好自己,戴好口罩勤洗手,物理上隔絕(病毒)」。到研發了治療新冠的藥物,或許職業使然,他還是十分謹慎,「它有無效用,你還未能完全相信,我始終覺得這藥物是新的」。他那時從加拿大回港到浸大教書,在隔離酒店檢疫21日。「我入職的經歷也頗……哈哈,我要在隔離酒店授課,同事很nice(友善),送了一個電腦螢幕給我上課用。」比起對着電腦鏡頭,他還是喜歡面對面交流,用電腦看不到觀眾的真實反應。雖說AI可捕捉人類的表情和動作,「但人對AI,跟對真實的人,我猜每個人(的反應)都有分別」。人類不相信AI的話,便不會對AI展露真我,AI便發揮不到作用,他說他仍要努力研發人類可信任的AI。

「現在的AI技術或很脆弱。」李鈺鵬說訓練AI的數據未必百分百真實,可能潛藏惡意信息。他在加拿大多倫多大學任博士後研究員時,專門研發能抵禦這些威脅的可靠AI,即robust machine learning(堅固的機器學習)。每有討論AI會否取締人類,總說這是冰冷的工具,沒人類擁有的情感,但原來它並非完全理智。「AI其實都有bias(偏見)。」李鈺鵬說AI從數據中學習,而數據由人產生,「人本身就有bias(偏見)」。要解決AI因偏見而「歧視」部分信息,就要用人類方法處理。AI alignment(人工智能對齊)是其中一個方案,即引導AI符合人類價值觀和社會期望地運作,就像我們接受社教化一樣。李鈺鵬解釋,發現AI有資料偏差問題時,可新增立場相反的數據作調整,「類似小朋友學壞,我要向他示範何謂好和壞,並告訴他不可以學習壞的例子」。他身為AI設計者,須探究AI與社會行為的相互作用,「只靠技術不會知道道德標準和價值觀是什麼,要從社會行為中找到feedback(回饋),幫AI進化為一個所謂的好人」。

在李鈺鵬看來,AI是個孩子,靠人類的知識餵養,正如人類要學習知識,才練就一項專業技能,「像小朋友般多讀書,教過他數學後,自成邏輯思考能力」。但他說AI尚未如人類般可作主觀判斷,舉例它暫只可為學術論文做表面的總結,卻不能像人類般理解和消化內容,難以鑒定論文的價值。這也好比寫新聞,李鈺鵬說要AI按記者所思所想生成文章,「知你想向哪個方向寫,有哪些標準,我覺得有點難」,意即開發人員或未能定義寫新聞的準則,難度身訂做AI。李說:「我覺得這或需要受過專業新聞訓練的人,去設計可生成新聞的AI。」這也解釋了李鈺鵬要跨學科發展的原因,他沒讀過傳理,卻要研究如何用AI查核事實,便需要大眾傳播的知識,及熟習人手fact-check的流程。

研AI譯手語 助聾人融入社會

李鈺鵬在學時,其老師常言做研究要有學術品味,不能隨便,「要做具影響力的東西」,他銘記至今。自他獲浸大邀請,研究社交媒體數據與公眾接種新冠疫苗的態度之關係,他正式思考如何利用AI輔助人類解決社會問題,鑽研社會計算學(social computing)。「我想做一些對社會有用的東西,以前做研究靠假設,偏向技術內容,現在我則想看到我的研究在現實產生價值。」李續說,新冠疫情爆發期間,公眾存「疫苗猶豫(vaccine hesitancy)」。他與研究團隊透過社交媒體數據,分析大眾不想接種疫苗的原因,希望供政府參考。他們發現,部分用戶即使沒發布任何關於疫苗的內容,甚至「未必講嘢」,但基於與朋友或媒體追蹤者的互動,機器可深度學習這些公開數據,推斷用戶對打疫苗的態度,「你在社交網絡的位置與你的意見和立場其實有關」。李鈺鵬2022年獲中國人工智能學會主辦的第七屆全國大數據與社會計算學術會議選為「2022年度社會計算青年學者新星」之一。他說:「我某程度上可能算是做了些有影響力的東西吧,但社會還有很多問題未解決,要讓AI跟社會聯繫,在社會產生作用,仍有一段距離。」

他口中還未解決的社會問題,例如即時自動翻譯手語。他說不同地區的手語有別,聾人未必能跨國交流,他仍在研究如何用AI將手語實時轉換成多個語言。他想像聾人用文字或「做口型」與健聽人士溝通,或是聽不到港鐵站內的緊急廣播,靠觀察旁人的行為和乘客資訊顯示屏,事故當下無法立即反應也是一種不公平,「這不算真正融入這個社會」。

如此看來,AI不止是一項技術,而是跨專業應用,尤其生成式AI的出現,無疑降低了人類使用AI的專業門檻。李鈺鵬說現在對所有人都比較公平,沒有高深的數理能力也懂得使用AI,像是近兩年被廣泛使用的ChatGPT,人們用以翻譯句子和總結文章,李鈺鵬認為使用AI做跨學科研究已成趨勢。

文˙ 姚超雯

{ 圖 } 姚超雯、受訪者提供、網上圖片

{ 美術 } 朱勁培

{ 編輯 } 周淑樺

fb﹕http://www.facebook.com/SundayMingpao

相關字詞﹕