刊於《信報》,20241118

AI模型投資熾熱 訓練成本暴升

許佳龍

科大商學院署理院長;資訊、商業統計及營運學系講座教授;艾禮文家族商學教授

筆者上兩周闡述和分析了ChatGPT面世,生成式聊天機械人雖則本身未接受過任何專業訓練,缺乏專業知識,唯一通曉的,是由深度學習神經網絡和轉換器技術,擷取出前人所闡述、經過溝通交流的相關專業知識和經驗,並用語言呈現出來;按照前人所用的文法詞句,照辦煮碗 ,加之以模仿各種專業,去生成所需要回答的問題內容。

明白了這個原理後,我們就可以理解,目前大家對生成式人工智能,有不少「盲點」,如生成的作答內容,往往遭人詬病為「作內容」,答案不一定準確,原因是其作答的內容,並非來自什麼精準的科學理論、科學性的預估模型,與傳統人工智能所回答的內容是建基於過去的事例,透過歸納過去的數據推理出來有所不同,而是找出相關問題經常這樣講的語言字詞,用來作出回答,因此,所作答的內容,既有機會答錯,甚至答案是「無中生有」。

答辯書虛假案例教訓

有一個經典例子,於2023年6月,美國一名律師在一宗訴訟案中,應用生成式人工智能的ChatGPT,去準備其答辯書,結果被法官發現,其答辯書所列的案例,全部是虛假的。筆者相信,這名律師未有留意ChatGPT的應答內容,並非來自真實事例或數據的特性,而是通過字和句之間的相連關係,找出相關內容答案,據此回答,以致墮入生成式人工智能「無意的陷阱」–幻覺–之中。

雖然ChatGPT彷彿像一個「百曉生」,什麼問題都可以回答,所持的「技術」,就像武俠小說家所形容的「獨孤九劍」,可以招駕任何招式,天下無敵,而生成式人工智能通過「語言處理」這門獨孤九劍絕技,用語言模仿出各種專業知識,據此回答任何提問挑戰。不過,必須謹記,其模仿絕非準確無訛,百份百正確。

予生成式AI無限應用憧憬

生成式人工智能的「百曉」廣泛技能,予人無限發展憧憬。不少機構冀用生成式AI的技能,去取代一些傳統工作,譬如取代醫生,基於醫生的診斷,也是通過語言來表達。記得當2022年ChatGPT面世後,於 2023年初,美國一份頂尖醫學期刊——《美國醫學會雜誌》(The Journal of the American Medical Association ‧JAMA)發表了一篇論文,該篇論文比較了由ChatGPT和真正醫生對病人的診斷結果內容,據此去比較兩者在診斷質素水平和同理心上的高下,比較的方法,是向兩者提出相同問題,兩者分別作答,再經一個獨立醫學專家小組作判斷,結果發現,ChatGPT在質素上和同理心上均更勝一籌。

於是,生成式人工智能可以取代醫生這個「結果」,給不少機構和市場無限憧憬,認為不少專業工作,也可以由生成式AI 來完成,不必聘用專業人才;也有不少機構,擬利用生成式 AI來取代員工的工作,節約生產成本。

在某個程度上,人工智能的確可以取代人手操作,譬如,員工所撰寫的英文文書,無論在文法和行文上,如果水準不足,甚至有明顯的文法錯誤,利用生成式AI撰寫紏正,起碼文法上和行文結構沒有錯誤,但值得再次強調,內容不一定百份百正確。換言之,一些基礎性工作,生成式 AI 可以替代人手,甚至做得可能更好,但答案有可能隱含「錯誤陷阱」。

投資熱潮隱含泡沫嗎?

如今不少不同行業的機構,正如火如荼計劃應用生成式AI來協助機構發展,冀藉此更上一層樓,甚至包括大中小學,都熱衷於發展生成式人工智能,去提升教與學的質量,當大家一窩蜂投入巨大資源,去引入生成式人工智能,但生成式AI的能力,是否無遠弗屆到能夠取代各行各業專業人手的工作,或者任何機構都必須應用生成式AI,遂不惜投入巨大資源,去訓練大語言模型?

值得注意的是一個基礎的成本效益問題,訓練大語言模型如ChatGPT,究竟成本有多大?事實上,投入開發大語言模型,成本甚高。

據美國史丹福大學「人本人工智能研究中心」(HAI)發表的《人工智能指數報告2024》(AI Index Report 2024)估計, AI 模型的訓練成本已達到前所未有的水平。例如,OpenAI 的 GPT-4 投入價值約 7800 萬美元的資源進行訓練,而谷歌的 Gemini Ultra 的資源成本高達 1.91 億美元,訓練成本暴升(參見附表)。

闡述至此,面對這股生成式 AI投資火熱浪潮,我們應該如何去分析其價值及走向,以避免再遭逢互聯網泡沫爆破的慘痛經歷,重蹈覆轍?囿於篇幅,下回討論這個問題。

附表:主要AI模型訓練成本

年份

模型

開發者

訓練成本 (美元)

2017

Transformer

Google

$930

2018

BERT-Large

Google

$3288

2019

RoBERTa Large

Meta

$160,018

2020

GPT-3175B (davinci)

OpenAI

$4,324,883

2021

Megatron-Turing NLG 530B

微軟/NVIDIA

$6,405,653

2022

LaMDA

Google

$1,319,586

2022

PaLM (540B)

Google

$12,389,056

2023

GPT-4

OpenAI

$78,352,034

2023

Llama 2 70B

Meta

$3,931,897

2023

Gemini Ultra

Google

$191,400,000

資料來源:HAI:《人工智能指數報告2024》(AI Index Report 2024),頁 64 65

資料來源:HAI:《人工智能指數報告2024》(AI Index Report 2024),頁 64及 65

生成式AI投資火熱透視‧之三

Read Article