School in Media Faculty Insights in Media

Predicting Stock Returns with AI (Chinese Version Only)

28 Feb 2026

Author

刊於《經濟日報》，2026年2月28日

機器學習有效預測國際股票收益

蔡達銘

科大商學院金融學系副教授

人工智能（AI）技術發展和應用方興未艾，「AI 投資」——使用人工智能技術，如機器學習、深度學習、自然語言處理來分析大量的市場數據、預測市場趨勢和股票表現，發掘投資機會等，目前愈來愈受到重視和實踐。筆者聯同香港中文大學金融學系江文熙教授，以及香港科技大學（廣州）張超教授，攜手探討機器學習模型在國際股票市場預測中的應用效果；運用機器學習技術，根據公司的特徵預測國際股票收益，供讀者參考。

金融學者，如法瑪（Eugene Fama）及弗倫奇（Kenneth French）指出，與公司特徵相關的變量，例如規模、價值和動量，可以預測國際股票收益。此外，金融文獻也發現，全球股票市場部分整合，但並非完全整合，意味各國股市雖然會受到共同因素或同類公司特徵的影響，股價出現一定程度的同步性，但同時也保有個別市場獨特的本地因素所帶來的差異。換言之，不同公司特徵的預測能力因市場而異。

運用兩個模型作預測比較

大多數利用機器學習研究股票收益與公司層級變數之間關係的研究，都集中在美國。我們將美國數據與國際其他市場的股票數據混合（以美國數據為主），運用這個龐大且混合的數據庫，去訓練單一的一個神經網絡模型。

另一方面，基於不同公司特徵的預測力因市場而異，我們也為每個單一的國家市場，並利用這些專屬於該市場的數據，來訓練一個獨一性的神經網絡模型，這個特定模型針對每個單一的國家市場進行訓練。

相較傳統的線性分析模型，神經網絡作為一種高度非線性模型，具有強大的擬合能力，可以有效捕捉到複雜模型和互動效應。事實上，在股票預測的情境中，公司特徵對收益的影響很少是獨立且為線性的。由於能更貼近現實的複雜數據生成過程，並且可據原始或稍經處理的公司特徵中直接學習，因而非線性模型一般在預測精準度上，大大優於線性模型。不過，值得強調一點，非線性模型需要大量數據才能訓練出穩定與可靠的模型。

機器學習模型優於線性模型

我們建構了包含 32 個國際市場，除美國外，還包括中國，日本、韓國、英國、法國、瑞士、新加坡以及香港市場的資料集，並選用36個公司特徵的變量，這些變量包括最容易取得的股票特徵，例如歷史回報、市值、交易量、現金流對負債比率、行業歷史回報和會計資訊等，據此運用機器學習模型預測股票的橫斷面收益。在美國市場，雖然只用了 36 個特徵，但這個機器學習模型的預測能力和獲利能力，與先前使用數百個變量的研究結果相當。

更重要的是，使用美國數據訓練我們的模型，並將其應用於國際股票，此舉旨在解決潛在的過度擬合（Overfitting）問題。所謂過度擬合是機器學習中一個常見問題，是指模型在訓練資料上表現得非常好，但在面對新的、未見過的資料時，預測效果卻很差的現象。我們得出的結論是，機器學習模型的表現優於線性模型，尤其是在構建盈利投資組合和預測回報排名方面，基於神經網絡系統能更好地學習到各個市場中公司特徵與未來收益之間真實的、複雜的映射關係。

個別市場訓練模型表現更佳

另一方面，我們針對每個市場分別訓練神經網路模型，使模型能夠提取特定市場回報特徵關係，我們得到了更優異的結果。當特定市場模型與美國訓練模型的相似度較低，以及神經網路模型的「隱藏層」（Hidden Layer）較多時，這些良好結果更為顯著。所謂隱藏層是人工神經網絡中的中間層，位於輸入層和輸出層之間。其作用是對輸入數據進行特徵提取和變換，為最終的輸出層提供高層次特徵。很顯然，個別市場獨特的本地因素所帶來的差異，這種差異導致驅動股票收益的「特徵與回報之間的關係」，在不同市場中並不相同，是以一個統一性的全局模型，難以捕捉這些細微但至關重要的差異。

值得強調的是，有跡象表明，在觀測值較少的市場中，迴歸樹會過度擬合樣本內數據，以致表現遜於線性模型。換句話說，我們透過迴歸樹模型的對比實驗，發現數據觀察量起顯著的作用，在小樣本環境下，簡單的線性模型，反而較複雜模型更具穩定性。

雖然不同市場的回報生成過程似乎有所不同，但國際市場並非完全分割，除差異外，市場各部分之間仍能相互影響，有所互通。當我們將美國特徵的差異，以及股票特徵與其各自的美國特徵差異之間的相互作用，作為補充的自變量，我們發現，特定市場的神經網路模型（尤其是在與世界融合程度更高的國家）表現將更加強大。

市場特定訓練至關重要

總的來說，我們運用機器學習技術，基於企業特徵預測全球股票收益。研究結果反映，市場特定訓練至關重要——相較於使用美國數據訓練的全局模型，在各市場單獨訓練的神經網絡模型，能夠獲得更優異的結果。神經網絡在預測股票收益排名和構建盈利投資組合方面，均優於線性模型。相反，當觀測樣本數量較少時，回歸樹模型表現不及線性模型。研究還清楚顯示，引入基於美國企業特徵構建的變量（可能包含國際股票特徵之外的信息），能夠進一步提升特定市場神經網絡的收益預測能力，為投資者取得超額收益的機會。讀者若有興趣詳細了解，可參考筆者的論文”Alpha Go Everywhere: Machine Learning and International Stock Returns”。

Read Article