高智能AI也會變「蠢」

文章日期：2023年06月27日

Share

【明報專訊】人工智能的表現不一定「高智能」，甚至部分被批評為「蠢」。許彬指出，AI的智能受眾多因素影響。

數據講求質素

數據是訓練AI必備材料，許彬說以往收集數據有難度，但隨智能手機、社交平台、網購平台、電子支付服務及物聯網（IoT）等普及，數據收集變得容易。不少科技公司更將數據庫及訓練模型放上開源（open source）平台分享，其他開發人員在研究新服務時毋須由頭做起，助AI近年取得飛躍發展。

不過，數據並非愈多愈好，還講求質素，以語音識別工具為例，如訓練數據包含過多男性聲音樣本，在辨識女性聲音時便可能不夠準確；又或是想預測特定年齡層男性購物能力，但數據混入女性或小童資訊，這些雜訊都會影響準確度。

演算法太精準不懂變通

很多人以為訓練AI的演算法愈複雜，結果愈準確，實際上卻可能出現過度擬合（overfitting），許彬解釋，即AI分析訓練資料有極高準確度，但分析新輸入資料表現不佳。

他以AI辨識貓圖片為例，演算法愈複雜，AI用愈多特徵如顏色、輪廓、眼耳口鼻、毛髮、體型，去確認圖中物件是否一隻貓；由於特徵非常細緻，因此AI在辨識訓練數據內的貓圖片時，準確度非常高。但當輸入另一張貓圖片，其顏色與數據庫的不同時，AI有可能因辨識條件「過硬」，缺乏彈性，誤判圖片並非貓，這種訓練效果便不夠理想。因此訓練AI時，研究員必須選擇合適演算法及調節複雜程度。

運算速度要求高

AI需要高效運算能力，如果設備性能不足或運算速度太慢，就會影響準確度。以OpenAI的GPT-4為例，由於它具備1萬億個參數（parameter），需要極高運算能力，不能輕易轉移至家庭電腦上離線運行。不過，近日有人成功將facebook母公司Meta開發的人工智能語言模式LLaMA，轉移至智能手機上離線運作，雖然LLaMA參數只得7億個，但已反映出隨着新技術發展，應用AI的條件將會愈來愈簡單。