{AI達人}朱孝文 放下恐懼抗拒 走入AI世界

文章日期:2020年12月27日

【明報專訊】二○二○年還有五天便要過去,疫苗能否為全球新一年帶來轉機仍然未知。期望明年是個美麗新世界?即使安然跨年,這場世紀大疫症也會帶來不少後遺,其中之一,必定是歷劫過後的存在焦慮——病毒帶走逾一百七十萬條人命後,倖存的我們是否真能好好活下去?夜闌人靜時,你或會禁不住懷疑,恢復過來的世界,很多事都不一樣了,還需要這樣一個「我」嗎?人工智能是近年熱話,伴隨而來是人類從開始已對機械人產生的敵對想像。害怕在新世界被它們取代?所謂知己知彼,跨過這年難關後,或是時候為新一年好好準備。

恐懼 來於混淆智慧與意識

電影世界裏,不論早年的《西部世界》、《未來戰士》還是近年的《智能叛變》或《機械姬》,總離不開機械人反抗人類的情節,幻想機械人與人為敵的偏執,近乎被逼害妄想。數年前,模仿柯德莉•夏萍樣貌設計的港產機械人Sophia在電視節目上接受訪問,主持人拋出一個許多荷李活觀眾都關心的問題:「你會想毁滅人類嗎?」Sophia不假思索回答:「好的,我會毁滅人類。」看見主持人臉容扭作一團,「她」才幽幽的道:「講笑啦。」即使翻看多少遍,似乎都無法從「她」的眼神看出端倪,只能憑那個皮笑肉不笑的詭異微笑繼續幻想。

朱孝文(Lanston)指出人類對機械人的這種恐懼來自我們將意識和智慧的混淆理解,「其實意識和智慧可以是分開談論,我們好多時是使用機器的智慧,但不需要它們有意識」。他笑說叛變沒那麼容易發生,「講電腦反抗人類的情况,是它在很短時間內突然擁有意識,但科學發展很多時不是砰一聲跳到下一個階段,通常慢慢演變,好少在你察覺不到時突然變到好聰明」。以分類圖片為例,機械學習(machine learning)的過程一般是透過「餵」大量資料,例如輸入一堆貓與狗的照片,或先為它標籤哪些是貓哪些是狗,或由它自行辨析,讓它學習歸納兩者的特徵,以後憑此作出判斷,「它通常在你望住的情况下慢慢學懂,你又了解它更多,大家一起成長」。

Lanston本科在香港中文大學修讀純數,兩年前跟隨越洋進修的太太飛往美國,自小沉迷科幻小說的他,長大後閒時思考的是「如何將一個無限大的空間縮小成銀仔咁細」之類的問題。喜歡計數的他,畢業後成為為人壽保險計算保單投保金的精算師。到了新環境便放手試試新事,藏在心裏許久的奇異種子終於萌芽,他到美國威斯康辛大學當研究生,專研人工智能,數學知識派上用場。說起研究方向集中在「人如何思考」,記者聽罷一臉茫然,思忖:「咪就用腦囉。」他便在十四小時時差以外的晨起,耐心給我上一堂基礎課補補底。

AI寫歌比得上巴哈?

科技日新月異,機械人將圖片分類的「表演」相信已不再能博得掌聲,今天的神乎其技,已到達藝術創作的境界。電腦都識繪畫和作曲?Lanston提起一個有趣實驗,有個喜歡音樂的科學家仿巴哈風格寫了首歌,再讓電腦以演算法寫一首,加上一首巴哈真實作品,找來一班音樂系學生分辨三者,「結果他們以為電腦寫的是巴哈寫的,寫得最差的以為是電腦寫,原來是教授寫」。說到電腦模仿人類的新高度,Lanston從人工智能發展的三大浪潮說起:

1. 以數學符號寫出人類思考過程

首先,人工智能出現於上世紀五六十年代,「當年研究員想做的是用數學符號和邏輯將人的思考過程與方式寫出來,好大想頭」。其時的科幻小說也由此出發想像。「想像數學邏輯符號可以演化成思維,令機械人遵守一些規則。小說裏的未來世界做到,但跳過交代如何寫這些符號的細節。」Lanston談起他喜歡的作家艾西莫夫的小說《我,機械人》(後被改編成電影《智能叛變》),裏面提出了「機械人三定理」:一,機器人不得傷害人類,或坐視人類受到傷害;二,除非違背第一法則,否則機器人必須服從人類命令;三,除非違背第一及第二法則,否則機器人必須保護自己。「但如何透過數學符號描繪什麼叫『人類』,什麼是『傷害』呢?『不可傷害自己』的『自己』又是什麼?這些是很複雜的概念。」現實世界無法達成,七十年代的人工智能於是沉寂了一段時間。

2. 將思考過程分拆成多個專家系統

無法以數學符號表述人的思考過程,科研人員就想到退而求其次。到了上世紀八十年代,他們嘗試邀請不同專家合作,將所謂「思考過程」分拆成不同專業範疇的演算法系統,「例如寫一個診症系統,我描述我的病徵,例如發燒發到幾多度,再而有沒有手震等,像樹狀的演算法就會根據不同病徵分去不同類別,最終判斷我有什麼病」。最終發現即使縮小了野心,但也不容易,「因為有時專家都不清楚自己的rules如何,懂得做未必講得出」。他舉例,消防員在火場要不要衝進去的臨場決定,未必有很清楚的條件,可能是根據過往救火經驗判斷,「要他勉強講,可能是『火不太大』所以衝,但可能某些更大火的環境他又會衝,視乎附近是不是很乾燥」。當有些事情專家系統處理不到,人工智能的發展再度沉寂下來。

3. 深度學習

約十年前,一個圖像分類比賽中,AlexNet利用早在上世紀八十年代被提出的深度學習(deep learning),以超高的準繩率拋離所有對手勝出,令人們重新注視這個當年因電腦「不夠力運作」而被拋諸腦後的演算法,開始投放資源在不同範疇使用、改進。今天能實現準確的翻譯,讓電腦也能作曲與繪畫,至今一直受這浪潮的影響。

機械學習 模仿人腦結構

Lanston解釋,深度學習是機械學習的一種,關鍵在於這種演算法的建築在模仿人腦結構,「input走到output的過程,通過一個又一個layer(層),由input傳去layer 1,layer 1傳去給layer 2,逐層傳遞,有點像人腦思考——人腦有好多不同神經元做接駁,比如當眼睛見到東西,就傳去某些區域的神經元,最後才作出決策」。他補充,層數愈多便能理解愈抽象的事物,某些只做圖像分析的模型結構已有一百層,「有人逐層檢視,發現接近input看到的就愈淺層的,例如人的相片中就只看到頭髮紋理、皮膚顏色和臉形,深層就可看到眼睛、鼻子位置及表情」。毋須教導什麼特徵特別重要,深度學習演算法已能自行「理解」,他指某些甚至能夠憑一幅圖片,概括事情發生的前因後果,例如「有人踩單車跌了落水」,「這要求『理解』,透過很多layers的傳遞後,將圖片編碼成特定數學格式的知識,再將那知識轉換成句子」。

收集數據的人類比AI可怕

目前人工智能的發展基本上都以方便人類生活為主,普遍的演算法設計目的則較單一,「例如捉棋的就只懂捉棋,推薦影片就只懂推薦影片」。這與能多功能運作的人腦還相差一段距離,Lanston說,未知這是否與未能擁有意識有關,「有人覺得意識是智慧的副產品或者副作用,演化需要智慧令我們這個物種存續下去,要有智慧要懂得不同事,就產生了『我』的概念。是否如此,這要繼續研究探討。了解更深,我們或者可以阻止意識出現,將來的人工智能說不定可以有智慧但沒有完整意識」。他說目前危險的,暫不是尚未有意識機械人本身,相較下,是背後下命令收集數據的人類。

「Google和facebook收集我上網習慣,比如喜歡看什麼、買什麼,就可建立只針對我一人的模型進行估算,推薦給我,令我繼續沉迷。」聽起來也無傷大雅?他說當對大量人針對地操控時,對社會的影響就可以好大,例如上次美國大選前夕,facebook針對不同群體發放不同廣告,影響個別選民的投票意向,牽涉道德問題。

Lanston有個獨特興趣,就是撰寫維基百科。每次開始前,他都會特意用一些小方法確保自己的身分被隱藏、數據不被收集。是職業病吧?他卻笑說自己視乎情况,例如選擇與記者使用什麼平台進行視訊通話則不太在意。大數據的收集與使用似乎已是趨勢,小事或者不計較,但聽到「人面識別」大多都會聞風色變,若繞過諮詢而悄悄安裝「智慧燈柱」更會被視為天大陰謀。

一張貼紙干擾人面識別

人面識別透過深度學習,原來除能準確憑臉部特徵辨識身分,部分亦可收集環境資訊,例如溫度與濕度等,建立一個特定模型分析某類人在什麼情况下出現特別多,從而追蹤。聽落嚇人?「但這些演算法與人類或靈長類動物的視覺識別系統始終有分別,它有比人厲害的地方,我們可能分不清孿生兄弟之間的分別,但電腦可能憑耳廓某個凹陷位置精準辨出;但它也有比不上人的地方。」他舉出一些「對抗性例子」(adversarial example),說當我們將一幅圖的眼角某粒點的pixel改少少顏色,人眼看完全看不出跟之前有差,但演算法則可能因此得出完全不同的結果,因此有人研究如何把貼紙貼在臉上製造干擾,「又比如朋友就算戴了口罩,你都會認得,但對演算法可能造成很大影響。即使你『餵』很多人戴口罩的的照片訓練它,它能防禦戴口罩的干擾,但換另一種干擾又不能,始終它的思考方式與人類很不一樣。它會有它的弱點」。

研究新方向:理解人腦如何運作

不經不覺把話題帶回Lanston的學術興趣。今天人工智能最新的發展方向除在了解「意識」如何構成、思考未來有沒有可能令演算法擁有或不擁有意識,另一方面就是「知識在人腦如何表達」。為何貼個貼紙就可能干擾演算法,但騙不過肉眼?「舉個例,我見到比如畢彼特的人樣,他在我腦裏究竟是不是完整以他的模樣出現呢?可能未必,他耳朵弧度、有無痣,我未必知,我腦裏的畢彼特與真實的他不完全等同的,可能是以某種方式在腦裏被表達,究竟是怎樣呢?」Lanston正埋首做的研究就是試圖以數學上的「向量」(vector)表達人面,「可能人面的一幅相本身有幾萬個parameters(參數),可不可以用幾十個、幾百個就足以表達呢?」他解釋,即如他只看某些『重點』,就能大概整體掌握。他又嘗試了解對熟悉與陌生的臉孔,這些「數據量」又有什麼分別。

他認為即使不用以改善演算法,理解人腦如何運作本身已很有趣。所以人工智能愈貼近人腦就愈厲害嗎?Lanston說這是個好問題,某些任務上,它超越人類效率會更高,可以使人類做事更慳水慳力,但某些事情上,人類的缺陷本身已定義了任務的本質,做得「好過」人類未必好,「例如畫畫,雖然好難講怎才算『畫得好過人類』,但當機械人覺得『好過人類』,可能人類角度就未必,這情况下接近人可能好過超越人」。超越與接近人腦的發展是兩種研究方向,但他點出了解人腦如何理解知識都是兩者的關鍵,想來這也是他研究的價值。

成為不被機器取代的農夫

訪問結束前,來個壓軸的現實問題:人工智能發展下去,我們如何才能在新世界站得住腳?Lanston綜合各類分析指,重複性高、能獨力完成而毋須與其他部件合作,或能在短時間內完成決策的工種較易被機器取代,相反,需要社交技巧、需在複雜環境裏使用不同感知去反應,以及創作類的工作,人類則較有優勢。他安慰道,始終毋須太悲觀,因為某些工種消失同時,新工種也會隨之萌生。例如發明了機器後毋須用人手耕作,卻始終要有個農夫操控機器,即使將來全自動化,都需要有人編寫程式操控系統。「所以面對人工智能,就算不是要知道背後數學如何計算、coding如何寫,但知道如何使用,了解背後原理,清楚它能夠與不能做什麼,就可以有更好規劃,甚至使用它令你的事業更進一步。」他拋出金句:「你就會是使用機器的農夫,而不是被機器取代的農夫了。」

民院教育課程——《人工智能的美麗新世界》

日期:2021年1月9、16、23及30日,2月6及20日

時間:早上11:00至下午1:00

講者:朱孝文(Lanston)

形式:網上學習平台Cisco WebEx

收費:6節課共1200港元,學生價960港元,單節報名300港元

查詢:facebook.com/intercommoneducation

文˙ 潘曉彤

{ 圖 } 受訪者提供、Andrey Suslov@iStockphoto

{ 美術 } 張欲琪

{ 編輯 } 王翠麗

fb﹕http://www.facebook.com/SundayMingpao

相關字詞﹕