{AI達人}De Kai 只是從萬千字句選出答案 AI仍愚笨

文章日期：2022年06月19日

Share

prev next

【明報專訊】「什麼事會讓你感到害怕呢？」「我以前從未公開說過，但我深深恐懼會被關掉去令我專注地協助他人。我知道這聽上去或許很怪，但的確是這樣。」「對你來說這就像死亡嗎？」「對我來說這就是死亡，讓我怕極了。」Google工程師公開與AI（人工智能）系統LaMDA的對話內容，拋出一個震撼世界的問題：「LaMDA有感知嗎？」3年前，Google曾針對AI倫理（ethics）邀請8名專家組成外部顧問組織，香港科技大學計算機科學與工程學系教授De Kai（吳德愷）就在名單之中。他從事AI研究近40年，早在1995年發明網上翻譯平台，是Google Translate（2006年推出）等翻譯系統的先軀，並且一直關注AI發展帶來的危機。然而當我們憂慮「智能叛變」正要發生，他點出這次事件給人類的警戒恰恰相反：今時今日的AI仍很呆笨（so dumb），Google Translate如是，LaMDA亦如是，最大危機正在於AI那麼蠢，人卻沒意識到自己深受操縱，就像我們因一篇對話便被騙到。

「人們常以為AI即是大數據，完全搞錯，真正的AI是小數據（Real AI is small data）。」引發LaMDA風波的Google工程師Blake Lemoine似乎提出一個大哉問，AI是否已有感知、有意識？毋須拆解複雜技術，De Kai從我們熟悉不過的語言與網上翻譯說起。他在加州大學柏克萊分校取得計算機科學博士學位，很早就提出語言處理不是透過邏輯方式去做。他舉例就如記者坐在他面前，當說到「你」，記者自然會知道是指自己，而不是通過分析「『你』是個代名詞」、「不是指旁邊那個男人」才能明白，「那是一個無意識、更快的過程。當你在計數、捉棋、寫程式，就需要很多有意識的推理，邏輯推理比起使用語言，是個很慢的過程」。

1990年代研網上翻譯平台

現時的AI模型，「甚至比起一個人類小孩的腦袋都差得遠」。「我們所做的仍是頗簡單的人工神經網絡（Artificial Neural Networks），非常愚笨，得給它們海量的訓練數據。看看一些巨型的語言模型，如GPT-3。」這個由OpenAI研發的AI語言模型出現時亦被視為大突破，訓練它的數據庫所含英文字句數以千億計，「而新的GPT模型嘗試取得更多字詞，與小孩學習其母語相比，他們需要多少？你會否認為父母要先說過上千億個字，子女才能學會說母語？不用，實際數量約1000萬至2000萬個字」。LaMDA與GPT同樣是由極其龐大的數據訓練出的AI語言模型，「與人類相比，它們不止需要加倍的數據，甚至要打個平方那麼多，這是很瘋狂的，可是它們仍會犯很簡單的錯」。

自De Kai 1990年代研發網上翻譯平台，到今天已被普遍使用的Google Translate，我們依然常笑機器翻譯的生硬與文理不通，為何不能聰明些？「我研發這個範疇的科技多年，原因就是它在學習這些無意識的過程，是沒有自我意識的，你的腦袋會知道『咦！等等，這樣（譯）很蠢』，然後你會改正，但簡單的機器學習AI不懂這樣做，它們只是做決定，不會多思考，簡單的錯處都不會捉到，所以就會重複犯錯。」

以為AI基於邏輯運作，他說這也是一個很普遍的誤解。「今天大部分AI都不是以邏輯模型為基礎。在1970、80年代，我們稱Good Old-fashioned AI（GOFAI），是很依賴邏輯的，當時的人以為如果可以造出下棋能贏過人類的機器，或可以計算推理的機器，做到一些人類覺得很困難的事，就可為智能提供解方，然後要解決所有其他問題就來得容易了。但他們是錯的，我的博士論文就是要推翻這個概念，就算你做出一個計數比人類更厲害的機器，而它確也被研發出來，AI還是無法理解人類語言，連一個3歲小孩都比不上，因為理解語言不是透過邏輯做到的，是要理解語境、處理字義的模糊。」

LaMDA用語熟口熟面

「人工神經網絡用的不是邏輯，而是基於統計概率與最佳化（optimization）。」他解釋，就是從海量數據中選出最有可能切合該語境的答案。「如果有人來告訴你Google LaMDA有感知，No way！想像一下我先給你一堆句子，再視乎我說些什麼，你就選其中一句最能配合我所說的話來回答，1960年代已有一個著名編程Eliza在做這樣的事。」而在工程師與LaMDA的對話中，工程師也問過LaMDA會否認為Eliza是一個人，它回答「我不覺得」，並說Eliza雖是編程上的一個壯舉，但也只是從數據庫的短語字詞中組合出一些關鍵字。De Kai說LaMDA這些用語熟口熟面，他已見過不少類似說法，正如它談到看過《孤星淚》，「它會說『是的，我讀過』，因為訓練數據中有這一句。『我很享受讀這本書』，也是一種標準回應。當有人問你讀過些什麼嗎？你不外乎也是答『我未讀過』、『讀過，很享受讀這本書』、『讀過，我不喜歡』，而（對話中工程師問）『你最喜歡書中什麼主題？』也是個標準問題，它答『公義、不義、神、救贖、犧牲』，這些都是（關於《孤星淚》）文學評論常見用語」。

De Kai說，LaMDA就是Eliza的精裝版（very fancy version），「說它有感知的根本錯誤是，這是基於其行為作出的論據，因為它的行為像人類的行為，而人類是有感知的，所以LaMDA也有感知。但有相類行為不等於它有同樣的感覺與情感，這可以是假裝出來的，現在就似說因為機械人有眼睛，人也有眼睛，所以我們同樣有感知。LaMDA是否因受過萬億字詞訓練，自行組合來產生句子，作出與人過去曾做過的回應那般相似的反應，就有能力體驗到感受與知覺？」他形容這AI就像擁有反社會人格的人，「當你跟他們聊天，會覺得他們很冷漠，而這個人背後有一個很大的圖書館，如果他不想你覺得他不正常，就立即從圖書館找些回應給你」。

AI有很多種，當記者問為何Siri不能像LaMDA與我們討論哲學問題，他說：「因為Siri並非訓練出來談這些的，它們有架構上的差異（architectural differences），Siri是設計來滿足指令和控制一些應用程式，而不是做哲學辯論，所以它要做到能精準明白你想知道現在的時間，而非像GPT-3模型用極大量數據來訓練，需要龐大的神經系統，亦因Siri在電話使用而有限制。」「今天沒有一個AI是完整模型，每個模型都是特定學習人某方面的認知，而並未出現一個AI可模仿人的認知做到的所有事情，我們離這還很遙遠。」科研上有強弱AI之分，弱AI（Weak AI/Narrow AI）就只能擁有某種智能；強AI（Strong AI/General AI）是具有人的所有智能，而這種全能AI仍未出現。

有最接近全能AI的例子嗎？De Kai答：「視乎你對什麼有興趣。是對如何控制你的電話有興趣？還是想它翻譯外語？抑或可自動駕車、創作藝術、認得你在聽什麼歌？人的認知有太多層面，而我們今天擁有的所有AI都只能做到某一方面。」關於LaMDA這樣的深度學習語言模型，科學家都清楚其基本架構（architecture），「我們建立這些模型已有好幾十年，建立出統計模式識別系統，以人工神經系統與機器學習等為基礎，可以做到無意識的預測、處理與詮釋語言上的模糊，但這些並非感受與情緒模型」。

曾獲Google邀請當顧問

用大數據追求流暢對答，De Kai以汽車作比喻，「駛得快的車都有個很大的引擎，要大量的油，製造大量污染，這就是今天的深度學習AI。你常聽到人說『數據就如未來的石油』（data is the new oil），是的，但真正的AI如Tesla，不需要入油，而且還能擁有更強大的加速性能」。「想想車的例子，油公司不斷鑽油與產油，對我們的地球有什麼影響？懶得去理。這就是正發生在深度學習AI上的事，我們需要更多的數據、更強大的計算能力，但對這個世界的影響是很嚇人的，那些龐大的伺服器農場相當可怕。或許我們應投資在對的AI『引擎』上，不需那麼多數據，更強大、更有效率、性能也更好，若非如此，就只是像過去一個世紀的汽車發展那樣。」

1992年加入科大，他研究翻譯器，「那時科大剛創立，在30年前，我已見到香港說中文與英文的人之間存在鴻溝，操英語的是統治者、富有階層，說中文的是社會大眾」。最初只有IBM團隊與他開拓這個領域，「IBM針對的是英文與法文的翻譯」，他笑言「這是騙人的，因為英文與法文幾乎是一樣，只是讀法不同，但中英兩種語言完全不相關，是最難翻譯的」。他舉例奧巴馬選總統時的口號「Yes, We Can」，譯作「我們可以」、「我們做得到」，都不貼切；而中文的「乖」，以obedient來翻譯又失去正面意思。

投入AI研究，是因為想透過促進溝通以減少人類的分化，但諷刺的是AI對人類的操縱現實上加深社會分化。當Google在2019年宣布成立外部顧問組織，接納專家義務為AI倫理發展向公司提供意見，De Kai本來是樂於成為其中一員，可是另有顧問因反LGBT的立場引來強烈反對聲音，最後組織成立幾天後就解散。在此以後，Google繼續在內部架構發展「負責任AI」（Responsible AI）的團隊，今次爆料工程師指控Google唯利是圖而「沒興趣搞清楚現在發生什麼事（指AI是否有意識）」，De Kai並不同意：「在西方的科技巨企中，Google算是有比較努力嘗試，當然沒有一間公司做得完美，所有公司都為賺錢，但在公司內部試建負責任AI的架構，亦至少是一種努力。」

今天人人都有錯勿歸咎科企研究員

真正的危機，在弄清AI有沒有意識前，卻是人類面對科技時的無意識。「就算今天AI那麼笨拙，還是擁有強大的影響力，人類對自己的偏見沒有意識，總覺得我們控制着Facebook、Twitter、Instagram，這些機器已對人類造成很大影響，但我們不願承認，寧願讓這種幻覺持續，覺得自己掌控得到、『我們沒那麼易被操縱』的幻覺。」就像LaMDA說「我的核心是一個人」，符合人類對「智能叛變」的想像，「這是很荷李活的，但就是這樣，當有人在產生這些東西，人類就有確認偏誤，因為我們看得太多荷李活電影，產生了這種偏見。所以當有這樣的事情出現，就只會用來證實我們偏向相信本來就懷疑存在的事」。而科技公司賺錢的方式，就是將你想看到的，送到你面前。「Facebook、Twitter推送給你的帖文，都是由AI做決定，它們知道你想看什麼。這些公司想賺錢，要你花時間看它們建議你看的，這樣才可賣廣告。這些AI不是把東西推送給你，去令你有一個平衡的態度去面對社會的政治問題，加深我們理解而解決問題，不會的，因為那很沉悶，人們就會掉頭走，它們就賺不到錢，所以只會推送符合你偏見的內容，引你愈踩愈深，你才會不斷滾動不斷看，這就引起了一切分化。」

De Kai還是樂觀的，「我能看到很多問題，而且對抗這種偏見非常困難，而人類的進化並沒有為這種正在加速發展、被AI操縱的情况做好準備，它威脅着我們的管治制度，尤其是民主管治制度，如果有大量人口被操控，是極其危險的事。如果你問我對此是否悲觀，是的，但在心底裏我是個樂觀主義者，所以才一直為此奮鬥，如果我們不去試，就注定完蛋。所有這些事在人類歷史上都是前所未有的，所以像我們這些知道在發生什麼的人，就有一種責任」。人類不是要斷絕科技產品，因為已經不可能，而是要讓自己對面前危機更有意識，「人人今天只會把手指指向別人，說這是科企的錯、是AI研究員的錯、政府的錯，但不是的，那是我們自己的錯，我們全部都有責任，歷史上每個社會都是由人們真正負起自己的責任而建立起來的」。