刊于《信报》,2024年11月18日
AI模型投资炽热 训练成本暴升
许佳龙
科大商学院署理院长;信息、商业统计及营运学系讲座教授;艾礼文家族商学教授
笔者上两周阐述和分析了ChatGPT面世,生成式聊天机械人虽则本身未接受过任何专业训练,缺乏专业知识,唯一通晓的,是由深度学习神经网络和转换器技术,撷取出前人所阐述、经过沟通交流的相关专业知识和经验,并用语言呈现出来;按照前人所用的文法词句,照办煮碗 ,加之以模仿各种专业,去生成所需要回答的问题内容。
明白了这个原理后,我们就可以理解,目前大家对生成式人工智能,有不少「盲点」,如生成的作答内容,往往遭人诟病为「作内容」,答案不一定准确,原因是其作答的内容,并非来自什么精准的科学理论、科学性的预估模型,与传统人工智能所回答的内容是建基于过去的事例,透过归纳过去的数据推理出来有所不同,而是找出相关问题经常这样讲的语言字词,用来作出回答,因此,所作答的内容,既有机会答错,甚至答案是「无中生有」。
答辩书虚假案例教训
有一个经典例子,于2023年6月,美国一名律师在一宗诉讼案中,应用生成式人工智能的ChatGPT,去准备其答辩书,结果被法官发现,其答辩书所列的案例,全部是虚假的。笔者相信,这名律师未有留意ChatGPT的应答内容,并非来自真实事例或数据的特性,而是通过字和句之间的相连关系,找出相关内容答案,据此回答,以致堕入生成式人工智能「无意的陷阱」–幻觉–之中。
虽然ChatGPT彷佛像一个「百晓生」,什么问题都可以回答,所持的「技术」,就像武侠小说家所形容的「独孤九剑」,可以招驾任何招式,天下无敌,而生成式人工智能通过「语言处理」这门独孤九剑绝技,用语言模仿出各种专业知识,据此回答任何提问挑战。不过,必须谨记,其模仿绝非准确无讹,百份百正确。
予生成式AI无限应用憧憬
生成式人工智能的「百晓」广泛技能,予人无限发展憧憬。不少机构冀用生成式AI的技能,去取代一些传统工作,譬如取代医生,基于医生的诊断,也是通过语言来表达。记得当2022年ChatGPT面世后,于 2023年初,美国一份顶尖医学期刊——《美国医学会杂志》(The Journal of the American Medical Association ‧JAMA)发表了一篇论文,该篇论文比较了由ChatGPT和真正医生对病人的诊断结果内容,据此去比较两者在诊断质素水平和同理心上的高下,比较的方法,是向两者提出相同问题,两者分别作答,再经一个独立医学专家小组作判断,结果发现,ChatGPT在质素上和同理心上均更胜一筹。
于是,生成式人工智能可以取代医生这个「结果」,给不少机构和市场无限憧憬,认为不少专业工作,也可以由生成式AI 来完成,不必聘用专业人才;也有不少机构,拟利用生成式 AI来取代员工的工作,节约生产成本。
在某个程度上,人工智能的确可以取代人手操作,譬如,员工所撰写的英文文书,无论在文法和行文上,如果水平不足,甚至有明显的文法错误,利用生成式AI撰写紏正,起码文法上和行文结构没有错误,但值得再次强调,内容不一定百份百正确。换言之,一些基础性工作,生成式 AI 可以替代人手,甚至做得可能更好,但答案有可能隐含「错误陷阱」。
投资热潮隐含泡沫吗?
如今不少不同行业的机构,正如火如荼计划应用生成式AI来协助机构发展,冀藉此更上一层楼,甚至包括大中小学,都热衷于发展生成式人工智能,去提升教与学的质量,当大家一窝蜂投入巨大资源,去引入生成式人工智能,但生成式AI的能力,是否无远弗届到能够取代各行各业专业人手的工作,或者任何机构都必须应用生成式AI,遂不惜投入巨大资源,去训练大语言模型?
值得注意的是一个基础的成本效益问题,训练大语言模型如ChatGPT,究竟成本有多大?事实上,投入开发大语言模型,成本甚高。
据美国史丹福大学「人本人工智能研究中心」(HAI)发表的《人工智能指数报告2024》(AI Index Report 2024)估计, AI 模型的训练成本已达到前所未有的水平。例如,OpenAI 的 GPT-4 投入价值约 7800 万美元的资源进行训练,而谷歌的 Gemini Ultra 的资源成本高达 1.91 亿美元,训练成本暴升(参见附表)。
阐述至此,面对这股生成式 AI投资火热浪潮,我们应该如何去分析其价值及走向,以避免再遭逢互联网泡沫爆破的惨痛经历,重蹈覆辙?囿于篇幅,下回讨论这个问题。
附表:主要AI模型训练成本
| |||
年份 | 模型 | 开发者 | 训练成本 (美元) |
2017 | Transformer | Google | $930 |
2018 | BERT-Large | Google | $3288 |
2019 | RoBERTa Large | Meta | $160,018 |
2020 | GPT-3175B (davinci) | OpenAI | $4,324,883 |
2021 | Megatron-Turing NLG 530B | 微软/NVIDIA | $6,405,653 |
2022 | LaMDA | Google | $1,319,586 |
2022 | PaLM (540B) | Google | $12,389,056 |
2023 | GPT-4 | OpenAI | $78,352,034 |
2023 | Llama 2 70B | Meta | $3,931,897 |
2023 | Gemini Ultra | Google | $191,400,000 |
数据源:HAI:《人工智能指数报告2024》(AI Index Report 2024),页 64及 65
|
数据源:HAI:《人工智能指数报告2024》(AI Index Report 2024),页 64及 65
【生成式AI投资火热透视‧之三】