刊於《信報》,2025年11月3日

ChatGPT工作使用 偏重文書處理

許佳龍

科大商學院署理院長;資訊、商業統計及營運學系講座教授;艾禮文家族商學教授

本文續談OpenAI 研究團隊與哈佛大學經濟學家David Deming聯合進行的一項研究(How People Use ChatGPT),考察202211ChatGPT面世後,到2025 7月底,期間用戶使用行為的變化。研究發現,用戶與ChatGPT的三大主題對話——「實用指導」(Practical Guidance)、「搜尋資訊」(Seeking Information)和「寫作」(Writing)中,「搜尋資訊」佔所有對話的比例,有明顯增長,從14%升至24%,但值得注意的是,在非工作上的增長,較工作上的增長更快。

對生成內容不可盲目接受

對於大語言模型生成的資訊內容,筆者過去在本欄及其他媒體都提及,其提供的資訊答案未必準確無誤,甚至有時可能是「無中生有」。

目前,我們看到,不少人包括筆者身邊的朋友,都把大語言模型生成的訊息答案,一律視之為正確無訛,這令筆者感到不安,因為一旦對答案訊息深信不疑,不加考証,便有可能導致用戶在認知上做出錯誤判斷,後果可大可小。

如今調研發現,在「搜尋資訊」主題對話,無論在工作上或非工作上都有所增加,反映用戶相當依賴大語言模型生成的內容,作為指導生活行為以至決策的諮詢「工具導師」,「言聽而計從」,這種發展狀況並不理想。

值得強調,用戶使用AI大語言模型時,最好能夠反芻思考一下AI所生成的內容答案,不宜盲目地全盤接受,尤其對那些會產生影響性後果的答案訊息,更需要檢視,養成核實內容是否正確的良好習慣。

男女數碼鴻溝收窄

在數碼鴻溝方面,我們看到,女姓用戶的數目持續上升,從37%增至52%,男女使用比例幾近不相伯仲。筆者估計,這個現象與工作及非工作上的應用雙雙增加有一定關係。事實上,在職場,無論就業率或資訊科技工具的應用,男女的使用比例並不一致,如今ChatGPT通過在日常生活應用的滲透,把男女的數碼鴻溝有效收窄,反映AI具潛力擴展在生活上的應用邊界。

再細緻地檢視這次調研,研究團隊使用了「通用工作活動」(Generalized Work ActivitiesGWA)作分析框架,對人們使用ChatGPT從事的「工作」進行歸類、量化和分析。所謂GWA是指完成主要工作職能所需的核心、基本行動與技能,代表工作的基本要素,而非具體的任務細節。這些活動可以分為一些通用類別,例如「資訊輸入」、「與他人互動」等等。換言之,研究人員並非看用戶是「工程師」抑或「作家」,而是去分析他們與ChatGPT的對話內容,本質上是在進行哪一種通用工作活動。

ChatGPT整體使用模式

研究團隊首先按序列示了屬於七類通用工作活動(GWA)的訊息比例,通過收集「所有」與ChatGPT 的對話通訊,着眼用戶與ChatGPT的整體性應用情況。研究發現,近一半的資訊(45.2%),屬於與獲取資訊和闡釋資訊含義相關的三類活動,即(1)獲取資訊(Getting information19.3%);(2)為他人解讀訊息含義(Interpreting the meaning of information for others13.1%);(3)文件記錄/資訊整理(Documenting/Recording information12.8%);其餘的通用工作活動包括(4)提供諮詢和建議(Providing consultation and advice to others9.2%);(5)創意思考(Thinking creativity9.1%);(6)決策及解決問題(Making decision and solving problems8.5%);(7)電腦操作(Working with computers4.9%)。這七項「通用工作行動」合計佔所有對話資訊的76.9%

很顯然,第3項的「文件記錄/資訊整理」,屬於客觀性的操作,基本沒有生成資訊內容的訛錯風險。事實上,目前愈來愈多人使用大語言模型去協助抽取會議上的重點資訊,或將之綜合成報告。但除此之外,其他活動,包括資訊的獲取、解讀資訊的含義、提供決策意見等,都牽涉內容是否正確的問題,一旦訊息內容有訛錯,相信會對用者產生誤導性錯判的潛在風險。

這項發現給出什麼啟迪?,當我們進一步優化大語言模型的研究工作和應用功能,實在有必要確保生成式資訊內容的正確性。因為若準確性無法提升,難免對用者構成負面性影響,甚至此舉會窒碍了大語言模型的應用和發展。

ChatGPT在職場上的使用模式

另一方面,研究團隊亦透過「通用工作活動」分析框架,把所有訊息歸類為「與工作相關」那一部份訊息,亦即聚焦「工作相關」的對話,以揭示ChatGPT在工作職場上的應用模式。研究發現,依次為(1)文件記錄/資訊整理(18.4%);(2)決策與問題解決(14.9%);(3)創意思考(13.0%);(4)電腦操作(Working with computers10.8%);(5)為他人解讀資訊含義(10.1%);(6)獲取資訊(9.3%);(7)提供諮詢與建議(4.4%[參見附圖]。這七類GWA合計佔工作相關訊息近81%

附圖:七類主要「通用工作活動」的對話訊息比例

一張含有 文字, 字型, 行, 數字 的圖片

AI 產生的內容可能不正確。

資料來源:How People Use ChatGPT〉調研論文

我們看到,在工作上使用ChatGPT,文件記錄/資訊整理佔比最大,顯示公司或機構,目前樂於使用ChatGPT進行文書處理,這絕對是一個良好趨勢。至於電腦操作在工作上也得到較多應用,用戶通過使用ChatGPT來提升運用電腦的能力,也屬好事。這兩方面的應用無疑都是安全的,用戶可以獲取那些不虞有訛錯風險的資訊,而且也是可以提升生產力的應用。

總的來說,大語言模型的發展目前方興未艾,因此,了解用戶的應用模式,有助把這個AI工具的應用功能進一步優化,提升其增加生產力的作用。不過,對大於語言模型生成的內容,用戶絕不宜視之為必然準確無訛,不假思索地全盤接受,而必須加以思考。若所生成的資訊,牽涉用戶繼後採取決策行動,更需要三思而後行,避免因過度依賴生成式資訊,在工作或學習過程中,於認知上出現錯判。

Read Article