【明報專訊】人工智能的表現不一定「高智能」,甚至部分被批評為「蠢」。許彬指出,AI的智能受眾多因素影響。
數據講求質素
數據是訓練AI必備材料,許彬說以往收集數據有難度,但隨智能手機、社交平台、網購平台、電子支付服務及物聯網(IoT)等普及,數據收集變得容易。不少科技公司更將數據庫及訓練模型放上開源(open source)平台分享,其他開發人員在研究新服務時毋須由頭做起,助AI近年取得飛躍發展。
不過,數據並非愈多愈好,還講求質素,以語音識別工具為例,如訓練數據包含過多男性聲音樣本,在辨識女性聲音時便可能不夠準確;又或是想預測特定年齡層男性購物能力,但數據混入女性或小童資訊,這些雜訊都會影響準確度。
演算法太精準 不懂變通
很多人以為訓練AI的演算法愈複雜,結果愈準確,實際上卻可能出現過度擬合(overfitting),許彬解釋,即AI分析訓練資料有極高準確度,但分析新輸入資料表現不佳。
他以AI辨識貓圖片為例,演算法愈複雜,AI用愈多特徵如顏色、輪廓、眼耳口鼻、毛髮、體型,去確認圖中物件是否一隻貓;由於特徵非常細緻,因此AI在辨識訓練數據內的貓圖片時,準確度非常高。但當輸入另一張貓圖片,其顏色與數據庫的不同時,AI有可能因辨識條件「過硬」,缺乏彈性,誤判圖片並非貓,這種訓練效果便不夠理想。因此訓練AI時,研究員必須選擇合適演算法及調節複雜程度。
運算速度要求高
AI需要高效運算能力,如果設備性能不足或運算速度太慢,就會影響準確度。以OpenAI的GPT-4為例,由於它具備1萬億個參數(parameter),需要極高運算能力,不能輕易轉移至家庭電腦上離線運行。不過,近日有人成功將facebook母公司Meta開發的人工智能語言模式LLaMA,轉移至智能手機上離線運作,雖然LLaMA參數只得7億個,但已反映出隨着新技術發展,應用AI的條件將會愈來愈簡單。