刊于《经济日报》,2026年2月28日

机器学习有效预测国际股票收益

蔡达铭

科大商学院金融学系副教授

人工智能(AI)技术发展和应用方兴未艾,「AI 投资」——使用人工智能技术,如机器学习、深度学习、自然语言处理来分析大量的市场数据、预测市场趋势和股票表现,发掘投资机会等,目前愈来愈受到重视和实践。笔者联同香港中文大学金融学系江文熙教授,以及香港科技大学(广州)张超教授,携手探讨机器学习模型在国际股票市场预测中的应用效果;运用机器学习技术,根据公司的特征预测国际股票收益,供读者参考。

金融学者,如法玛(Eugene Fama)及弗伦奇(Kenneth French)指出,与公司特征相关的变量,例如规模、价值和动量,可以预测国际股票收益。此外,金融文献也发现,全球股票市场部分整合,但并非完全整合,意味各国股市虽然会受到共同因素或同类公司特征的影响,股价出现一定程度的同步性,但同时也保有个别市场独特的本地因素所带来的差异。换言之,不同公司特征的预测能力因市场而异。

运用两个模型作预测比较

大多数利用机器学习研究股票收益与公司层级变量之间关系的研究,都集中在美国。我们将美国数据与国际其他市场的股票数据混合(以美国数据为主),运用这个庞大且混合的数据库,去训练单一的一个神经网络模型。

另一方面,基于不同公司特征的预测力因市场而异,我们也为每个单一的国家市场,并利用这些专属于该市场的数据,来训练一个独一性的神经网络模型,这个特定模型针对每个单一的国家市场进行训练。

相较传统的线性分析模型,神经网络作为一种高度非线性模型,具有强大的拟合能力,可以有效捕捉到复杂模型和互动效应。事实上,在股票预测的情境中,公司特征对收益的影响很少是独立且为线性的。由于能更贴近现实的复杂数据生成过程,并且可据原始或稍经处理的公司特征中直接学习,因而非线性模型一般在预测精准度上,大大优于线性模型。不过,值得强调一点,非线性模型需要大量数据才能训练出稳定与可靠的模型。

机器学习模型优于线性模型

我们建构了包含 32 个国际市场,除美国外,还包括中国,日本、韩国、英国、法国、瑞士、新加坡以及香港市场的数据集,并选用36个公司特征的变量,这些变量包括最容易取得的股票特征,例如历史回报、市值、交易量、现金流对负债比率、行业历史回报和会计信息等,据此运用机器学习模型预测股票的横断面收益。在美国市场,虽然只用了 36 个特征,但这个机器学习模型的预测能力和获利能力,与先前使用数百个变量的研究结果相当。

更重要的是,使用美国数据训练我们的模型,并将其应用于国际股票,此举旨在解决潜在的过度拟合(Overfitting)问题。所谓过度拟合是机器学习中一个常见问题,是指模型在训练数据上表现得非常好,但在面对新的、未见过的数据时,预测效果却很差的现象。我们得出的结论是,机器学习模型的表现优于线性模型,尤其是在构建盈利投资组合和预测回报排名方面,基于神经网络系统能更好地学习到各个市场中公司特征与未来收益之间真实的、复杂的映射关系。

个别市场训练模型表现更佳

另一方面,我们针对每个市场分别训练神经网络模型,使模型能够提取特定市场回报特征关系,我们得到了更优异的结果。当特定市场模型与美国训练模型的相似度较低,以及神经网络模型的「隐藏层」Hidden Layer较多时,这些良好结果更为显著。所谓隐藏层是人工神经网络中的中间层,位于输入层和输出层之间。其作用是对输入数据进行特征提取和变换,为最终的输出层提供高层次特征。很显然,个别市场独特的本地因素所带来的差异,这种差异导致驱动股票收益的「特征与回报之间的关系」,在不同市场中并不相同,是以一个统一性的全局模型,难以捕捉这些细微但至关重要的差异。


值得强调的是,有迹象表明,在观测值较少的市场中,回归树会过度拟合样本内数据,以致表现逊于线性模型。换句话说,我们透过回归树模型的对比实验,发现数据观察量起显著的作用,在小样本环境下,简单的线性模型,反而较复杂模型更具稳定性。

虽然不同市场的回报生成过程似乎有所不同,但国际市场并非完全分割,除差异外,市场各部分之间仍能相互影响,有所互通。 当我们将美国特征的差异,以及股票特征与其各自的美国特征差异之间的相互作用,作为补充的自变量,我们发现,特定市场的神经网络模型(尤其是在与世界融合程度更高的国家)表现将更加强大。

市场特定训练至关重要

总的来说,我们运用机器学习技术,基于企业特征预测全球股票收益。研究结果反映,市场特定训练至关重要——相较于使用美国数据训练的全局模型,在各市场单独训练的神经网络模型,能够获得更优异的结果。神经网络在预测股票收益排名和构建盈利投资组合方面,均优于线性模型。相反,当观测样本数量较少时,回归树模型表现不及线性模型。研究还清楚显示,引入基于美国企业特征构建的变量(可能包含国际股票特征之外的信息),能够进一步提升特定市场神经网络的收益预测能力,为投资者取得超额收益的机会。读者若有兴趣详细了解,可参考笔者的论文”Alpha Go Everywhere: Machine Learning and International Stock Returns”

Read Article