媒体信息通过传播专家意见或者个人观点,引起投资者情绪的波动,从而使其产生非理性投资行为,最终左右证券市场的波动。本章基于媒体信息对证券市场的作用机理,从理论和技术两个层面完整地梳理和回顾了相关研究文献。
(1)理论层面
第一,证券市场媒体效应存在性的相关理论。传统金融学理论认为,证券市场的波动由“新信息”驱动,投资者依据“新信息”调整投资行为,从而推动证券波动。近代行为金融学者指出,证券市场的波动来源于投资者的非理性行为,而信息又是投资者情绪波动的根源。虽然二者就信息如何影响证券市场波动有着不同的见解,但是都认同证券市场的波动与媒体关于资本信息的发布、传播和吸收紧密相关(De Long et al.,1990;Fama,1965;Rechenthin et al.,2013)。
第二,财经新闻在证券市场风险波动中的作用机理。新闻对证券市场的影响研究起源于学者观察到重大新闻事件的影响力,通过研究突发重大新闻个案或标题来探索新闻的作用机理( Mitchell et al.,1994;Niederhoffer,1971;陶萍等,2015)。随着信息技术的发展,学者尝试利用计算机技术打破案例研究以偏概全的局面,研究新闻中传达的宏观经济、企业基本面、投资者情感等信息与证券市场的内在联系,并取得了里程碑式成果(Calomiris et al.,2019;Tetlock,2007;Tetlock et al.,2008)。
第三,投资者情绪及其对证券市场的影响研究。行为金融学表明,投资者情绪会对证券市场的波动产生影响。本书通过对投资者情绪与证券市场关系的相关文献的梳理,发现信息中蕴藏的情感性倾向通过媒体的传播被投资者接受、消化,诱导其产生非理性投资行为,进而影响证券市场波动。作者在撰写媒体信息的过程中,因自身利益的影响,难免加入主观看法,造成其与客观事实的偏差,导致非理性投资者形成有偏见的主观情绪,做出不理智的决策,最终影响证券市场的波动。
(2)技术层面
第一,媒体信息的分类方法。早期的研究由于技术的局限性,只能依靠人工阅读信息内容的方法,研究不同主题的媒体信息对证券市场影响的差异性(Niederhoffer,1971;刘海飞等,2017)。随着人工智能技术的发展,一些学者尝试利用传统的机器学习方法对文本内容进行分类(Joachims,1998;Lewis et al.,1994)。但是随着大数据时代的到来,传统机器学习方法面对大数据依然显得捉襟见肘,深度学习便依靠其能够精准捕捉海量数据高维度、非线性关系的特点,得到了飞速发展与广泛应用(Kowsari et al.,2017;Mikolov et al.,2013a)。
第二,媒体信息的量化方法。早期的研究往往通过对个别媒体报道展开案例研究,或者将媒体报道的数量作为衡量媒体信息对证券市场影响力的指标。考虑到媒体信息对证券市场的影响主要来源于其文本内容,学者们开始采用词向量法来提取文本中的所有词汇信息。但是将所有的词汇都视为重要信息,不但加大了计算机的运算负担,而且产生的噪音信息会严重干扰对文本中心思想的理解。行为金融学发现一篇文章中的情感因素可以有效代表文章的影响力,因此,情感分析量化法成为目前主流的媒体信息量化方法。
第三,洞悉媒体与证券市场关系的分析模型。经济学者和计算机学者分别从不同的角度来探寻证券市场媒体效应。经济学者通常利用经济学模型,例如运用Kruskal-Wallis秩和检验、斯皮尔曼相关性系数等统计模型来验证影响因素与市场波动指标的相关性,运用资本资产定价模型、 Fama-French三因子模型等计量经济学模型来挖掘二者之间的内在因果关联。计算机学者则从捕捉二者之间复杂的非线性关联出发,利用传统的机器学习模型或者最近广受欢迎的深度学习模型来捕捉媒体对证券市场影响的深度
和广度。
通过对现有文献的梳理,本书发现,第一,已有文献多是研究传统媒体上的新闻报道对证券市场的影响。事实上,互联网时代下的海量财经新闻信息,为帮助我们更接近证券市场波动的本质创造了极大的可能。特别是利用大数据分析手段对海量财经新闻数据进行直接分析,能够实现深层次地揭示互联网财经新闻与证券市场风险波动的关系,这也是本书寻求的突破之处。第二,现有的研究多是笼统地概括媒体新闻与证券市场的关系。事实上,可以从三个不同的层面来探讨其影响力。首先,在媒体层面,不同主题内容的新闻对投资者关注度的吸引力不同,是否会引起投资者在证券市场中的差异化投资行为,导致证券市场受冲击的不同;其次,在公司层面,不同公司具有不同的属性,特别是处于不同的行业,是否会受到投资者不同程度的关注,证券受冲击程度也不尽相同;最后,在管理者层面,有的公司管理者倾向于同外界媒体产生更多的互动,有的管理者则更关注公司自身的经营,那么不同风格的管理者媒体行为是否会引起其公司在证券市场的不同表现。本书将从这三个层面进行进一步的深思和探索。第三,现有研究的分类技术多是基于通用领域的,鲜有研究对财经新闻进行主题分类。同时,多数文献采用的情感分析法通常是基于通用领域的情感词库,缺乏对金融领域的专用情感词库的应用。因此,本书希望寻求更适用于财经新闻信息的文本分类方法和情感量化手段。第四,现有的经济学和计算机学模型缺乏对证券市场数据结构的有效适配。经济学者往往受限于信息技术手段的缺失,多是基于小样本,难以从大数据的角度来探索证券市场波动的本质。虽然计算机学者能够用大数据技术和机器学习模型研究证券市场新闻媒体效应的影响,但是脱离了金融学背景往往使得模型实际应用能力不强。因此,本书希望利用深度学习机制,提出一个智能计算框架,用整体、连续,而非单一的数据关系,研究复杂市场因素对证券市场新闻媒体效应的综合影响,为金融学经典问题的研究提供一个新的视角和技术手段。