刊於《信報》,2025年210

DeepSeek引領技術換代 芯片需求不虞萎縮

許佳龍

科大商學院署理院長;資訊、商業統計及營運學系講座教授;艾禮文家族商學教授

由杭州深度求索(DeepSeek)人工智能基礎技術研究有限公司開發的大語言模型DeepSeek-R1,憑藉低成本高效能的AI訓練技術改進, 迅速崛起,給美國人工智能科技行業造成巨大競爭壓力。DeepSeek的突破,不僅挑戰了硅谷的技術領導地位;也引發美國政界、商界和學界高度關注,並紛紛警告,美國在AI領域的領先地位正面臨嚴峻挑戰。

執筆之時,包括美國在內多個國家政府或私隱監管機構,對使用DeepSeek的安全性、私隱保障提出質疑,並先後以威脅國家安全為由,禁止在政府設備上使用DeepSeek-R1。

芯片企業股價斷崖式暴跌

很顯然,DeepSeek在AI領域的突破性發展,隨即引起各種各樣的「條件反射」式行為,這並不令人太訝異。誠然,隨着人工智能普及化,由此引起個人資料保護和私隱保障問題,確實值得討論。有機會,筆者冀從確切的性質、嚴謹的學術研究角度,和大家一起深入探討。

本文,筆者聚焦討論DeepSeek推出後,引起芯片市場其中另一個「條件反射」式的反應——生產芯片企業的公司股價,應聲暴跌,造成華爾街市場巨大震盪,典型的例子,是當DeepSeek-R1模型一推出,芯片生產龍頭公司英偉達(Nvidia)的股價,在美國當地時間(1月27日)單日暴瀉近17%,一夜之間,市值蒸發了破紀錄的5,890億美元,損失慘重。

芯片需求下跌猜想

從市場反應去推斷股價暴跌的原因,很大程度是由於DeepSeek-R1大模型在多項國際基准測試中,表現絕不比ChatGPT-4o 遜色,甚至在部分測試項目有過之而無不及,但據媒體引述DeepSeek的報告,DeepSeek-R1僅使用了 2048塊英偉達H800 GPU進行訓練,既不是高端性能芯片,也毋須通過使用大量芯片來積累算力,其訓練成本僅花了557.6萬美元。另一方面,根據美國史丹福大學「人本人工智能研究中心」(HAI)之前發表的《人工智能指數報告2024》(AI Index Report 2024)估計, OpenAI 的 GPT-4 投入價值約 7800 萬美元的資源進行訓練(讀者可參考筆者在本欄〈AI模型投資熾熱 訓練成本暴升〉一文,刊2024年11月18日),成本差距懸殊。

DeepSeek的建模成本遠遠低於ChatGPT-4o,卻得到與OpenAI 的ChatGPT-4o水平不遑多讓的效果,這不僅意味美國芯片企業過去的股價,大有可能是嚴重高估,而且對未來的芯片需求,市場擔心也會有暴跌壓力,甚至有人憂慮,AI芯片這個大泡沫會因此而遭刺破!

另闢蹊徑彎道超車

為什麼AI的發展與芯片緊扣在一起?筆者之前討論生成式AI與通用技術的多篇文章中,已闡釋了生成式AI的底層技術結構邏輯和原理,因為這類生成式 AI需要使用大量的算力去訓練大模型。事實上,建構大模型需要海量的資訊文本,來訓練一個「會寫」、「會理解」、「會生成文章」的大型人工智能機器,箇中必須運用大量算力,給機器進行學習、分析和理解文本資料中,字與字之間、句與句之間的意義關係,這樣一來,也就需要用到大量芯片來積累足夠算力,在DeepSeek-R1未推出前,一般理解皆如此,因而英偉達的股價水漲船高,不斷攀升,且一度成為全球市值最大的企業。

目前,DeepSeek-R1對金融市場和AI業界造成如此巨大衝擊,因為其面世証實了同樣的生成式人工智能、依然使用同一底層基礎技術——亦即深度神經網絡的學習方法,但DeepSeek通過創新思維,另闢蹊徑,能夠在大模型之下,減少使用一些「涵數」,但功能表現依然不減,最終得出絕不遜色於ChatGPT-4o的效果。

對於DeepSeek的輝煌成績,有人懷疑,DeepSeek的大模型並非「首創」,甚至有指控DeepSeek是利用模型蒸餾技術,基於OpenAI的技術來訓練自己的模型。但細閱DeepSeek的報告文件,發現其模型比較複雜,並非「蒸餾」那麼簡單。有關AI技術問題於本文不談,而集中分析究竟DeepSeek大模型的突破,會否給芯片的未來需求造成顛覆性影響?甚至是否會引爆AI泡沫這種極端後果?

芯片需求料無大變

探究答案,可從經濟學供需關係進行分析。芯片企業股價之所以下跌,理由是市場推斷大模型的建構,今後不再需要那麼多芯片,由是芯片價格自然會下降。但這個推斷,無疑是基於對目前人工智能的應用需求不變,長期下去也不會大變,大家滿足於AI在當前發展階段的用途。若然如此,芯片公司股價受壓,價值下跌的推斷可說基本正確。但這個假設相信讀者都會馬上加以否定,指出這不是合理假設,因為像DeepSeek這類大模型的創新性,恰恰代表了人工智能可以有很大的發展空間、有很多不同途徑更有效地運用算力,去生產和建構更複雜、能力更高的模型,從這個角度看,長期而言,對芯片的需求不見得一定會縮減。囿於篇幅,對DeepSeek面世會否帶來或剌破芯片市場泡沫,另文討論。

Read Article