刊于《信报》,2025年210

DeepSeek引领技术换代 芯片需求不虞萎缩

许佳龙

科大商学院署理院长;信息、商业统计及营运学系讲座教授;艾礼文家族商学教授

由杭州深度求索(DeepSeek)人工智能基础技术研究有限公司开发的大语言模型DeepSeek-R1,凭借低成本高效能的AI训练技术改进, 迅速崛起,给美国人工智能科技行业造成巨大竞争压力。DeepSeek的突破,不仅挑战了硅谷的技术领导地位;也引发美国政界、商界和学界高度关注,并纷纷警告,美国在AI领域的领先地位正面临严峻挑战。

执笔之时,包括美国在内多个国家政府或私隐监管机构,对使用DeepSeek的安全性、私隐保障提出质疑,并先后以威胁国家安全为由,禁止在政府设备上使用DeepSeek-R1。

芯片企业股价断崖式暴跌

很显然,DeepSeek在AI领域的突破性发展,随即引起各种各样的「条件反射」式行为,这并不令人太讶异。诚然,随着人工智能普及化,由此引起个人资料保护和私隐保障问题,确实值得讨论。有机会,笔者冀从确切的性质、严谨的学术研究角度,和大家一起深入探讨。

本文,笔者聚焦讨论DeepSeek推出后,引起芯片市场其中另一个「条件反射」式的反应——生产芯片企业的公司股价,应声暴跌,造成华尔街市场巨大震荡,典型的例子,是当DeepSeek-R1模型一推出,芯片生产龙头公司英伟达(Nvidia)的股价,在美国当地时间(1月27日)单日暴泻近17%,一夜之间,市值蒸发了破纪录的5,890亿美元,损失惨重。

芯片需求下跌猜想

从市场反应去推断股价暴跌的原因,很大程度是由于DeepSeek-R1大模型在多项国际基准测试中,表现绝不比ChatGPT-4o 逊色,甚至在部分测试项目有过之而无不及,但据媒体引述DeepSeek的报告,DeepSeek-R1仅使用了 2048块英伟达H800 GPU进行训练,既不是高端性能芯片,也毋须通过使用大量芯片来积累算力,其训练成本仅花了557.6万美元。另一方面,根据美国史丹福大学「人本人工智能研究中心」(HAI)之前发表的《人工智能指数报告2024》(AI Index Report 2024)估计, OpenAI 的 GPT-4 投入价值约 7800 万美元的资源进行训练(读者可参考笔者在本栏〈AI模型投资炽热 训练成本暴升〉一文,刊2024年11月18日),成本差距悬殊。

DeepSeek的建模成本远远低于ChatGPT-4o,却得到与OpenAI 的ChatGPT-4o水平不遑多让的效果,这不仅意味美国芯片企业过去的股价,大有可能是严重高估,而且对未来的芯片需求,市场担心也会有暴跌压力,甚至有人忧虑,AI芯片这个大泡沫会因此而遭刺破!

另辟蹊径弯道超车

为什么AI的发展与芯片紧扣在一起?笔者之前讨论生成式AI与通用技术的多篇文章中,已阐释了生成式AI的底层技术结构逻辑和原理,因为这类生成式 AI需要使用大量的算力去训练大模型。事实上,建构大模型需要海量的信息文本,来训练一个「会写」、「会理解」、「会生成文章」的大型人工智能机器,个中必须运用大量算力,给机器进行学习、分析和理解文本数据中,字与字之间、句与句之间的意义关系,这样一来,也就需要用到大量芯片来积累足够算力,在DeepSeek-R1未推出前,一般理解皆如此,因而英伟达的股价水涨船高,不断攀升,且一度成为全球市值最大的企业。

目前,DeepSeek-R1对金融市场和AI业界造成如此巨大冲击,因为其面世证实了同样的生成式人工智能、依然使用同一底层基础技术——亦即深度神经网络的学习方法,但DeepSeek通过创新思维,另辟蹊径,能够在大模型之下,减少使用一些「涵数」,但菜单现依然不减,最终得出绝不逊色于ChatGPT-4o的效果。

对于DeepSeek的辉煌成绩,有人怀疑,DeepSeek的大模型并非「首创」,甚至有指控DeepSeek是利用模型蒸馏技术,基于OpenAI的技术来训练自己的模型。但细阅DeepSeek的报告文件,发现其模型比较复杂,并非「蒸馏」那么简单。有关AI技术问题于本文不谈,而集中分析究竟DeepSeek大模型的突破,会否给芯片的未来需求造成颠覆性影响?甚至是否会引爆AI泡沫这种极端后果?

芯片需求料无大变

探究答案,可从经济学供需关系进行分析。芯片企业股价之所以下跌,理由是市场推断大模型的建构,今后不再需要那么多芯片,由是芯片价格自然会下降。但这个推断,无疑是基于对目前人工智能的应用需求不变,长期下去也不会大变,大家满足于AI在当前发展阶段的用途。若然如此,芯片公司股价受压,价值下跌的推断可说基本正确。但这个假设相信读者都会马上加以否定,指出这不是合理假设,因为像DeepSeek这类大模型的创新性,恰恰代表了人工智能可以有很大的发展空间、有很多不同途径更有效地运用算力,去生产和建构更复杂、能力更高的模型,从这个角度看,长期而言,对芯片的需求不见得一定会缩减。囿于篇幅,对DeepSeek面世会否带来或剌破芯片市场泡沫,另文讨论。

Read Article