無名周記：超級預測超級難測

文章日期：2024年01月07日

Share

prev next

【明報專訊】2024年元旦坐在電腦前玩《經濟學人》在Good Judgement Open平台上的全年預測挑戰賽，就着諸如南非國會選舉、阿根廷通脹率、烏克蘭可收復多少失地等各項可能填上或然率。大部分題目都是國際政經大事，但有些題目超出認知範圍，如ICC男子T20板球世界盃。玩着玩着，便傳來日本能登半島大地震的消息，翌日更發生羽田機場飛機相撞事件，兩者都是罕見事故。2024年，真是可以預測？

「預測」是人類生存必要技能，一般人作決定都或多或少關乎自身對未來的判斷。每逢新年在傳媒總可讀到國際局勢預測、經濟預測、樓市預測，下月農曆新年更一定有班風水術士為大家「指點迷津」，似乎總要有一些預測才可能令人安心——雖然明知未來無法預測。

《經濟學人》每年推出The World Ahead系列，除了編輯部預測來年趨勢外，近年都有請Good Judgement旗下的「超級預測師」（Superforecasters）對一些事件的可能性作預測。超級預測師2022年成績，為8中5，但暫時未見公布2023年預測成績。《金融時報》去年12月26日有一篇關於「超級預測師」的報道，將「超級預測師」跟讀者在2023年初的預測比對。10個預測題目包括GDP增長、俄羅斯總統普京會否下台、女足世界盃觀眾人數等。8500名讀者在一星期內回應，之後不可更改預測；至於95名經過訓練的「超級預測師」則可在一年內調整預測。以一個從 0.5（pure guess純粹猜測）到 1（perfect choice完美選擇）的系統來評分，FT讀者的得分是0.73，而超級預測師的得分是0.91。

「超級預測師」源自普林斯頓大學心理學教授兼Good Judgement的共同創辦人泰特洛克（Philip Tetlock）。他1984年開始研究專家如何預測地緣政治及經濟，在19年內找來超過250名來自學界、政府和傳媒的專家作預測。他在2005年發表研究，顯示專家的預測僅比隨機好一點點，但有些人的確預測得準確，於是他開始研究準確預測的竅門，物色擁有「超級預測」特質的人，組成預測小組作預測，該小組在美國情報機構辦的預測比賽擊敗一眾情報人員勝出。在這基礎上，泰特洛克成立Good Judgement預測公司，並在2015年出版Superforecasting: The Art and Science of Prediction一書。

不少心理學家早指出，人類心理機制加上基於個人信念或自身經歷，會產生認知偏見，未能對事物作恰當反應及判斷。關於這點，心理學家兼諾貝爾經濟學獎得主康納曼（Daniel Kahneman）在《快思慢想》（Thinking, fast and slow）言之甚詳。人類大腦運作有「系統1」和「系統2」兩部分，前者是無意識的「快思」，反應迅速且喜歡捨難取易，將複雜的問題轉換成簡單問題；後者則是「慢想」，是自覺的判斷，糾正「系統1」的錯誤。不過，很多時人類只是純粹依「系統1」而行，沒有「系統2」參與。康納曼在書中引用不少有趣實驗，展示人類是差勁的統計學家，判斷時很常有令人驚訝的認知錯誤，例如拋錨效應（anchoring effect，即過度依賴最初接觸的資訊作判斷）、範圍不敏感（scope insensitivity，即未能因應範圍的大小相應調節信念及判斷）等。

身為心理學家的泰特洛克當然對這些認知偏見有深入理解。他早年研究便發現，專家在其專長領域不一定代表可以較準確預測，因為專家身分往往令他們固守自身觀點，難以綜合其他額外資訊。但他相信，認知偏見可以通過訓練克服。他在Superforecasting一書中便指出，「超級預測師」會花精力來利用「系統2」校正「系統1」的錯，例如後退一步採取外部觀點來評估，學會如何對事物作恰當反應。

不讓主觀感受干擾預測

《金融時報》2023年預測遊戲有一條問題是問2023年會有多少歐洲城市打破高溫紀錄。《金融時報》讀者跟超級預測師的估計相差極大，有超過五成讀者估計5個以上，相反超級預測師的估計則保守得多，有37％正確預測1至2個。其中一名超級預測師解釋，自己5月在西班牙經歷了一場熱浪，但他沒有讓主觀感受干擾其預測，而是查看8年的溫度紀錄，發現有4年打破1至2個紀錄，其他年份則沒有打破紀錄或打破2個以上紀錄，於是他預測打破1至2個紀錄。

「超級預測師」另一個優勢便是團隊成員可互相參考觀點、互補不足。泰特洛克亦強調，問題設計的重要，一定要有具體時間線，而「超級預測師」亦要交代自己對答案的自信程度。據《金融時報》，超級預測師往往很難預測地緣政治談判。任何依賴於少數行動者的決定，或者依賴於不可預測的領導人一時興起的事情，都令他們束手無策，例如，朝鮮領袖金正恩的決策便屬難以預測之列。

泰特洛克在Superforecasting一書中討論了不少緩減認知偏見的方法，並透過分析問題來辨析可知與不可知的範圍，從而達至較準確的預測，讀來相當有趣，亦令讀者受用。他對「超級預測術」顯得信心爆棚，甚至認為旗下一些「超級預測師」的「系統2」校正實踐得很好，幾乎已成習慣，甚至已成為「系統1」的一部分，不費吹灰之力糾錯。不過，他也強調，「超級預測」大部分時間仍是要花很大力氣。

姑勿論泰特洛克是否只是為旗下公司爭生意，「超級預測」真是如此有用？如果人類的認知偏見根深柢固需要用盡力氣糾正，我們又為何相信「超級預測師」可以不受此限？人工智能既能分析大量數據，又沒有人類認知系統的限制，不是會給出更可靠的預測嗎？更大問題是，未來有多少是可以預測的？《經濟學人》今次的World Ahead便提到編輯部2023年預測最大過失便是沒有預視到2022年11月推出的ChatGPT引發的AI熱潮。《黑天鵝》（Black Swan）作者Nassim Taleb便向來對預測嗤之以鼻，除了因為預測十之八九不準外，他認為無人能預測的「黑天鵝」才是影響巨大的事件，諸如2001年「九一一恐襲」、2020年的Covid-19疫情都是沒人預測得到但卻影響深遠的「黑天鵝」。至於去年10月7日哈馬斯突襲以色列亦恐怕算是一隻「黑天鵝」，衝擊還未完。與其預測，不如着力保持韌性，使自己能承受「黑天鵝」衝擊。

檢視「可知」與「不可知」

未來不可測，那麼「超級預測」有什麼好玩？「超級預測」的價值恐怕並非預測，而是檢視現有的「可知」與「不可知」。例如我真的不懂板球，那條板球世界盃題目屬於我的「無知」範圍；南非政局我也沒有多留意，填上南非國會選舉預測前需特意重溫南非近年政局；至於那條烏克蘭可以收復多少土地的題目，作答前也要檢視一下目前對情勢的認識。這樣檢查一次自己對世界的認識，或者更有助準備不可知的未來。