無名周記:超級預測 超級難測

文章日期:2024年01月07日

【明報專訊】2024年元旦坐在電腦前玩《經濟學人》在Good Judgement Open平台上的全年預測挑戰賽,就着諸如南非國會選舉、阿根廷通脹率、烏克蘭可收復多少失地等各項可能填上或然率。大部分題目都是國際政經大事,但有些題目超出認知範圍,如ICC男子T20板球世界盃。玩着玩着,便傳來日本能登半島大地震的消息,翌日更發生羽田機場飛機相撞事件,兩者都是罕見事故。2024年,真是可以預測?

「預測」是人類生存必要技能,一般人作決定都或多或少關乎自身對未來的判斷。每逢新年在傳媒總可讀到國際局勢預測、經濟預測、樓市預測,下月農曆新年更一定有班風水術士為大家「指點迷津」,似乎總要有一些預測才可能令人安心——雖然明知未來無法預測。

《經濟學人》每年推出The World Ahead系列,除了編輯部預測來年趨勢外,近年都有請Good Judgement旗下的「超級預測師」(Superforecasters)對一些事件的可能性作預測。超級預測師2022年成績,為8中5,但暫時未見公布2023年預測成績。《金融時報》去年12月26日有一篇關於「超級預測師」的報道,將「超級預測師」跟讀者在2023年初的預測比對。10個預測題目包括GDP增長、俄羅斯總統普京會否下台、女足世界盃觀眾人數等。8500名讀者在一星期內回應,之後不可更改預測;至於95名經過訓練的「超級預測師」則可在一年內調整預測。以一個從 0.5(pure guess純粹猜測)到 1(perfect choice完美選擇)的系統來評分,FT讀者的得分是0.73,而超級預測師的得分是0.91。

「超級預測師」源自普林斯頓大學心理學教授兼Good Judgement的共同創辦人泰特洛克(Philip Tetlock)。他1984年開始研究專家如何預測地緣政治及經濟,在19年內找來超過250名來自學界、政府和傳媒的專家作預測。他在2005年發表研究,顯示專家的預測僅比隨機好一點點,但有些人的確預測得準確,於是他開始研究準確預測的竅門,物色擁有「超級預測」特質的人,組成預測小組作預測,該小組在美國情報機構辦的預測比賽擊敗一眾情報人員勝出。在這基礎上,泰特洛克成立Good Judgement預測公司,並在2015年出版Superforecasting: The Art and Science of Prediction一書。

不少心理學家早指出,人類心理機制加上基於個人信念或自身經歷,會產生認知偏見,未能對事物作恰當反應及判斷。關於這點,心理學家兼諾貝爾經濟學獎得主康納曼(Daniel Kahneman)在《快思慢想》(Thinking, fast and slow)言之甚詳。人類大腦運作有「系統1」和「系統2」兩部分,前者是無意識的「快思」,反應迅速且喜歡捨難取易,將複雜的問題轉換成簡單問題;後者則是「慢想」,是自覺的判斷,糾正「系統1」的錯誤。不過,很多時人類只是純粹依「系統1」而行,沒有「系統2」參與。康納曼在書中引用不少有趣實驗,展示人類是差勁的統計學家,判斷時很常有令人驚訝的認知錯誤,例如拋錨效應(anchoring effect,即過度依賴最初接觸的資訊作判斷)、範圍不敏感(scope insensitivity,即未能因應範圍的大小相應調節信念及判斷)等。

身為心理學家的泰特洛克當然對這些認知偏見有深入理解。他早年研究便發現,專家在其專長領域不一定代表可以較準確預測,因為專家身分往往令他們固守自身觀點,難以綜合其他額外資訊。但他相信,認知偏見可以通過訓練克服。他在Superforecasting一書中便指出,「超級預測師」會花精力來利用「系統2」校正「系統1」的錯,例如後退一步採取外部觀點來評估,學會如何對事物作恰當反應。

不讓主觀感受干擾預測

《金融時報》2023年預測遊戲有一條問題是問2023年會有多少歐洲城市打破高溫紀錄。《金融時報》讀者跟超級預測師的估計相差極大,有超過五成讀者估計5個以上,相反超級預測師的估計則保守得多,有37%正確預測1至2個。其中一名超級預測師解釋,自己5月在西班牙經歷了一場熱浪,但他沒有讓主觀感受干擾其預測,而是查看8年的溫度紀錄,發現有4年打破1至2個紀錄,其他年份則沒有打破紀錄或打破2個以上紀錄,於是他預測打破1至2個紀錄。

「超級預測師」另一個優勢便是團隊成員可互相參考觀點、互補不足。泰特洛克亦強調,問題設計的重要,一定要有具體時間線,而「超級預測師」亦要交代自己對答案的自信程度。據《金融時報》,超級預測師往往很難預測地緣政治談判。任何依賴於少數行動者的決定,或者依賴於不可預測的領導人一時興起的事情,都令他們束手無策,例如,朝鮮領袖金正恩的決策便屬難以預測之列。

泰特洛克在Superforecasting一書中討論了不少緩減認知偏見的方法,並透過分析問題來辨析可知與不可知的範圍,從而達至較準確的預測,讀來相當有趣,亦令讀者受用。他對「超級預測術」顯得信心爆棚,甚至認為旗下一些「超級預測師」的「系統2」校正實踐得很好,幾乎已成習慣,甚至已成為「系統1」的一部分,不費吹灰之力糾錯。不過,他也強調,「超級預測」大部分時間仍是要花很大力氣。

姑勿論泰特洛克是否只是為旗下公司爭生意,「超級預測」真是如此有用?如果人類的認知偏見根深柢固需要用盡力氣糾正,我們又為何相信「超級預測師」可以不受此限?人工智能既能分析大量數據,又沒有人類認知系統的限制,不是會給出更可靠的預測嗎?更大問題是,未來有多少是可以預測的?《經濟學人》今次的World Ahead便提到編輯部2023年預測最大過失便是沒有預視到2022年11月推出的ChatGPT引發的AI熱潮。《黑天鵝》(Black Swan)作者Nassim Taleb便向來對預測嗤之以鼻,除了因為預測十之八九不準外,他認為無人能預測的「黑天鵝」才是影響巨大的事件,諸如2001年「九一一恐襲」、2020年的Covid-19疫情都是沒人預測得到但卻影響深遠的「黑天鵝」。至於去年10月7日哈馬斯突襲以色列亦恐怕算是一隻「黑天鵝」,衝擊還未完。與其預測,不如着力保持韌性,使自己能承受「黑天鵝」衝擊。

檢視「可知」與「不可知」

未來不可測,那麼「超級預測」有什麼好玩?「超級預測」的價值恐怕並非預測,而是檢視現有的「可知」與「不可知」。例如我真的不懂板球,那條板球世界盃題目屬於我的「無知」範圍;南非政局我也沒有多留意,填上南非國會選舉預測前需特意重溫南非近年政局;至於那條烏克蘭可以收復多少土地的題目,作答前也要檢視一下目前對情勢的認識。這樣檢查一次自己對世界的認識,或者更有助準備不可知的未來。

文˙林康琪

編輯•王翠麗

fb﹕http://www.facebook.com/SundayMingpao

相關字詞﹕每日明報-封面