购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 机器学习崛起

说起当今全球知名的几家使用机器学习算法进行交易的基金公司,不得不提到诸如文艺复兴科技公司、德邵基金公司、堡垒投资集团和Two Sigma公司等。其中,文艺复兴科技公司是由数学家詹姆斯·西蒙斯在1982年创建的,现在已经成为全球较大的量化投资公司。它的奖章基金自成立以来,年均收益率较稳定。另外三家基金公司也因为使用基于算法的交易策略之后,业绩表现亮眼,从而跻身全球前列。

与此同时,越来越多的基金公司转向机器学习技术。人工智能系统可以从大量数据中学习,并且持续进化。从对冲基金到共同基金,越来越多的机构使用算法制定交易策略。这也催生出了一个新的物种——量化基金(Quant funds)。

1.2.1 量化投资风生水起

随着新技术的普及,以往靠基本面分析进行投资的公司也在引入机器学习技术,并开展量化交易。例如,管理资产规模较大的Point72公司就已经有相当比例的投资组合是使用人与算法结合的方法来进行管理的。据摩根士丹利公司所进行的调查来看,截至2020年,在他们从事投资的客户中,有意愿或者已经在使用机器学习技术进行量化投资的客户数量,在短短两年间提高了20%。

黑石集团为了能够立于不败之地,大举投资量化交易企业SAE,希望借这场豪赌击败竞争对手。无独有偶,富兰克林·邓普顿基金集团也收购了一家名为“随机森林资本”的公司(一家以算法和数据为导向的技术型企业)。

在中国,很多金融机构也已经觉醒。相信在未来几年,我们也能看到优秀的本土量化投资公司。

1.2.2 没有数据是不行的

所谓机器学习,其实就是通过若干算法,使用数据训练模型并做出预测的过程。那么数据的重要性就不言而喻了。假如模型是马路上跑的汽车,那么数据就是让汽车正常运转的燃料。常规的数据包括经济统计数据、市场交易数据和上市公司财报。如今,人们使用的数据范围更广,甚至包括卫星图像、信用卡销售、股民情绪分析、手机地理位置定位和爬虫抓取等来源。理论上来讲,我们这里说的数据包括任何可以使用机器学习提取交易信号的信息。

举一个例子,如果在某家上市公司公布财报数据之前,我们可以获取该公司在招聘网站上发布的招聘岗位数量,就可以先于财报数据发布了解到该公司的运营状况。假如该公司的招聘人数在上升,则可能说明该公司业绩良好,自然其股票的价格也可能上涨;反之,假如该公司的招聘人数锐减,则说明该公司的经营可能有困难,则可能会导致该公司股价下跌。

当然,最直接有效的数据还是那些能够直接体现用户消费的数据,如支付数据。在后面的章节,我们会具体来讨论如何使用外部数据,并将其添加到模型的训练当中。

1.2.3 交易策略和阿尔法因子

说完了算法和数据,下面我们就要讲讲如何将二者结合起来并应用到投资中。我们先通过各种数据源提取出有效信息,并且通过特征工程(feature engineering)将数据转换为阿尔法因子(alpha factor),再将这些因子拿来训练模型,使模型可以对交易品未来的趋势或价格变动做出预测,并触发买单或者卖单。例如,模型预测次日股价大涨,则下单买入,反之则卖出。

在这个过程中,阿尔法因子(以下统称为alpha因子)的确定是一个复杂的工程。在这一步中,我们需要探索输入的数据与目标收益之间的关系,并进行复杂的特征工程,还要不断测试及对模型进行调优,以此来优化模型的预测能力。

当然,经过数十年的学术研究,金融学家已经帮我们总结好alpha因子。如果要给小瓦完全解释明白这背后的理论,我们就要花很大的篇幅去讲解市场金融理论和投资者行为学等。不过这些不是主线“剧情”,因此本书不展开介绍了。 GU44CbfqN3bYxywQkhIOsfd9Stsidfhd1vj09T/Ninm0JNCqIptj5J4iAgG86cAi

点击中间区域
呼出菜单
上一章
目录
下一章
×