刊于《信报》,2025年11月3日

ChatGPT工作使用 偏重字处理

许佳龙

科大商学院署理院长;信息、商业统计及营运学系讲座教授;艾礼文家族商学教授

本文续谈OpenAI 研究团队与哈佛大学经济学家David Deming联合进行的一项研究(How People Use ChatGPT),考察202211ChatGPT面世后,到2025 7月底,期间用户使用行为的变化。研究发现,用户与ChatGPT的三大主题对话——「实用指导」(Practical Guidance)、「搜寻信息」(Seeking Information)和「写作」(Writing)中,「搜寻信息」占所有对话的比例,有明显增长,从14%升至24%,但值得注意的是,在非工作上的增长,较工作上的增长更快。

对生成内容不可盲目接受

对于大语言模型生成的信息内容,笔者过去在本栏及其他媒体都提及,其提供的信息答案未必准确无误,甚至有时可能是「无中生有」。

目前,我们看到,不少人包括笔者身边的朋友,都把大语言模型生成的讯息答案,一律视之为正确无讹,这令笔者感到不安,因为一旦对答案讯息深信不疑,不加考证,便有可能导致用户在认知上做出错误判断,后果可大可小。

如今调研发现,在「搜寻信息」主题对话,无论在工作上或非工作上都有所增加,反映用户相当依赖大语言模型生成的内容,作为指导生活行为以至决策的咨询「工具导师」,「言听而计从」,这种发展状况并不理想。

值得强调,用户使用AI大语言模型时,最好能够反刍思考一下AI所生成的内容答案,不宜盲目地全盘接受,尤其对那些会产生影响性后果的答案讯息,更需要检视,养成核实内容是否正确的良好习惯。

男女数码鸿沟收窄

在数码鸿沟方面,我们看到,女姓用户的数目持续上升,从37%增至52%,男女使用比例几近不相伯仲。笔者估计,这个现象与工作及非工作上的应用双双增加有一定关系。事实上,在职场,无论就业率或信息科技工具的应用,男女的使用比例并不一致,如今ChatGPT通过在日常生活应用的渗透,把男女的数码鸿沟有效收窄,反映AI具潜力扩展在生活上的应用边界。

再细致地检视这次调研,研究团队使用了「通用工作活动」(Generalized Work ActivitiesGWA)作分析框架,对人们使用ChatGPT从事的「工作」进行归类、量化和分析。所谓GWA是指完成主要工作职能所需的核心、基本行动与技能,代表工作的基本要素,而非具体的任务细节。这些活动可以分为一些通用类别,例如「信息输入」、「与他人互动」等等。换言之,研究人员并非看用户是「工程师」抑或「作家」,而是去分析他们与ChatGPT的对话内容,本质上是在进行哪一种通用工作活动。

ChatGPT整体使用模式

研究团队首先按序列示了属于七类通用工作活动(GWA)的讯息比例,通过收集「所有」与ChatGPT 的对话通讯,着眼用户与ChatGPT的整体性应用情况。研究发现,近一半的信息(45.2%),属于与获取信息和阐释信息含义相关的三类活动,即(1)获取信息(Getting information19.3%);(2)为他人解读讯息含义(Interpreting the meaning of information for others13.1%);(3)文件记录/信息整理(Documenting/Recording information12.8%);其余的通用工作活动包括(4)提供咨询和建议(Providing consultation and advice to others9.2%);(5)创意思考(Thinking creativity9.1%);(6)决策及解决问题(Making decision and solving problems8.5%);(7)计算机操作(Working with computers4.9%)。这七项「通用工作行动」合计占所有对话信息的76.9%

很显然,第3项的「文件记录/信息整理」,属于客观性的操作,基本没有生成信息内容的讹错风险。事实上,目前愈来愈多人使用大语言模型去协助抽取会议上的重点信息,或将之综合成报告。但除此之外,其他活动,包括信息的获取、解读信息的含义、提供决策意见等,都牵涉内容是否正确的问题,一旦讯息内容有讹错,相信会对用者产生误导性错判的潜在风险。

这项发现给出什么启迪?,当我们进一步优化大语言模型的研究工作和应用功能,实在有必要确保生成式信息内容的正确性。因为若准确性无法提升,难免对用者构成负面性影响,甚至此举会窒碍了大语言模型的应用和发展。

ChatGPT在职场上的使用模式

另一方面,研究团队亦透过「通用工作活动」分析框架,把所有讯息归类为「与工作相关」那一部份讯息,亦即聚焦「工作相关」的对话,以揭示ChatGPT在工作职场上的应用模式。研究发现,依次为(1)文件记录/信息整理(18.4%);(2)决策与问题解决(14.9%);(3)创意思考(13.0%);(4)计算机操作(Working with computers10.8%);(5)为他人解读信息含义(10.1%);(6)获取信息(9.3%);(7)提供咨询与建议(4.4%[参见附图]。这七类GWA合计占工作相关讯息近81%

附图:七类主要「通用工作活动」的对话讯息比例

一张含有 文字, 字型, 行, 数字 的图片

AI 产生的内容可能不正确。

数据源:How People Use ChatGPT〉调研论文

我们看到,在工作上使用ChatGPT,文件记录/信息整理占比最大,显示公司或机构,目前乐于使用ChatGPT进行字处理,这绝对是一个良好趋势。至于计算机操作在工作上也得到较多应用,用户通过使用ChatGPT来提升运用计算机的能力,也属好事。这两方面的应用无疑都是安全的,用户可以获取那些不虞有讹错风险的信息,而且也是可以提升生产力的应用。

总的来说,大语言模型的发展目前方兴未艾,因此,了解用户的应用模式,有助把这个AI工具的应用功能进一步优化,提升其增加生产力的作用。不过,对大于语言模型生成的内容,用户绝不宜视之为必然准确无讹,不假思索地全盘接受,而必须加以思考。若所生成的信息,牵涉用户继后采取决策行动,更需要三思而后行,避免因过度依赖生成式信息,在工作或学习过程中,于认知上出现错判。

Read Article