近代行为金融学理论指出,投资者是“不完全理性”的,他们的认知偏差(cognitive bias)和不完全理性会引起情绪化的投资行为和决策,从而导致股票的价格产生偏差,致使证券市场中产生各种“金融异象”(Banz,1981;Gultekin et al.,1983;Hirshleifer et al.,2003;Rozeff et al.,1976)。如糟糕的天气可能会导致投资者心绪不佳,拖累股指下跌(Hirshleifer et al.,2003)。特别是在信息技术飞速发展的今天,互联网媒体不仅是投资者获取信息的重要渠道,也是影响投资者情绪波动的重要因素,更是影响证券市场稳定的重要“风险源”。事实上,投资者情绪驱动证券市场风险波动的理论逐渐得到大量金融学者的广泛证实( Bollen et al.,2011;Calomiris et al.,2019;Schumaker et al.,2009a,2009b)。本节通过梳理媒体信息与投资者情绪的相关文献,以及解析投资者情绪与证券市场风险波动的相关文献,从理论层面深入探索二者之间的内在关联,为本书后续关于互联网新闻中的投资者情绪研究提供关键的理论基础和研究支撑。
(1)投资者情绪的定义
传统金融理论以理性决策为重要前提,其本原可以追溯到新古典主义经济学,他们认为经济决策的主体都是充满理智的、精于判断和计算的,其行为是完全理性的,既不会感情用事,也不会盲从。在经济活动中,主体所追求的唯一目标是自身经济利益的最大化。也就是说,在证券市场中,传统金融学理论认为投资者能够根据资产的未来价值预期做出理性投资决策,不受个人情绪因素的影响。事实上,在现实情况中,投资者在证券市场上的经济决策难免会受到外界信息的强烈干扰,投资者难以持续保持理性行为。一个典型的现象便是“羊群效应”,是指投资者高度依赖于其他投资者或者舆论导向,产生“整体压力,厌恶,恐惧”等情绪下的群体性非理性行为,也被称为“从众效应”。羊群效应在短时间内可以将股价提升至一个不合理水平,也可以引发大众的群体恐慌情绪使市场重挫。经济学家通过对此类事件的观察,开始从心理学和行为学的角度探寻证券市场羊群效应、规模效应、天气效应等“金融异象”的内在机理,行为金融学便应运而生。
近年来,对投资者情绪的研究逐渐成为行为金融学领域的研究热点。关于投资者情绪的研究可以追溯到两篇行为金融学经典文献“ The Noise Trader Approach to Finance”(Shleifer et al.,1990)和“Noise Trader Risk in Financial Markets”(De Long et al.,1990),它们首先给出了投资者情绪的定义即“投资者偏离了公司基本面的那些信念”,认为情绪是那些与基本面无关的“信念”,只有噪音投资者才会有情绪,套利者或者理性投资者是不会受到情绪的影响的。随后,Stein (1996)将投资者情绪定义为投资者对未来预期的系统性偏差,它反映了市场参与者的投资意愿或者预期,Stein肯定了传统金融学主张的股价是上市公司的“预期”利润的贴现,但是Stein也更新了人们对股价的认知,指出“预期”的形成依赖于投资者的情绪心理。之后,Baker和Wurgler (2006)提出投资者情绪是投资者对资产未来现金流和投资风险的预期形成的一种信念,并且可能含有对持有股票的乐观与悲观倾向。紧接着,Baker和Wurgler (2007)继续深化了对投资者情绪的理解,在 2006 年研究的基础上补充“投资者情绪不取决于当前基本面的信念,并且在噪音交易者和理性套利者群体中同样存在”。
综上所述,投资者情绪的定义纷繁多样,每一种解释均有自己的道理。不可否认的是,在经济活动中,投资者情绪是个非常不确定的因素。投资者情绪会影响到其投资理念的形成过程,还会影响到其对未来的主观判断,并最终影响到其投资决策行为,形成合力后,对证券市场会形成很大的冲击。尤其是在如今互联网媒体信息的复杂环境中,投资者心理更容易受到多方面海量信息的影响,投资者情绪波动频率和幅度也会随着信息量激增和传播速度加剧变得愈发强烈。因此,对投资者情绪的充分理解有助于捕捉互联网信息中投资者情绪的变化,有利于揭示投资者情绪在证券市场运行中的作用,有助于投资者尽可能规避非理性行为,有利于监管者维护市场情绪。
(2)投资者情绪的度量
行为金融学领域的诸多研究已经证实,投资者情绪在社交网络中相互传播、互相影响,并在互动机制 的作用下趋于一致、形成合力,从而推动证券市场的波动(Chan,2003;De Long et al.,1990;Li et al.,2017;Li et al.,2020a;Tetlock,2007;Tetlock et al.,2008)。因此,如何准确地度量投资者情绪的变化,成为揭示投资者情绪与证券市场关联关系的前提与关键(Baker et al.,2006),对了解市场发展动向具有至关重要的作用。早期,关于投资者情绪的研究可以按照度量方法划分为显性情绪指数法和隐形情绪指数法。
显性情绪指数,也称为直接投资者情绪指数,是指直接对投资者进行调查(如调查问卷),来获得投资者对市场走势的看法和判断的数据,并将调查的结果编制成投资者情绪指标来表示投资者的主观情绪态度。显性情绪指数在发达国家金融市场较为成熟,目前获得广泛认可的主要包括:瑞银集团(UBS)和盖洛普咨询公司(Gallup)联合发布的投资者乐观指数,美国个人投资者协会发布的美国个人投资者情绪指数,摩根富林明投资者信心指数,投资者智能指数,道富投资者信心指数,好友指数等。国内市场中比较权威的显性情绪指数主要有两个,一是由央视财经频道在每日收盘后经过对各家券商观点的统计编制的“央视看盘”投资者情绪指数,王美今和孙建军(2004)利用该指数研究发现投资者情绪是影响证券市场收益的一个系统性因子;二是耶鲁—CCER中国股市投资者信心指数,该指数的基础数据通过对基金经理、证券分析师、保险公司和专业财经媒体的观点调研而获得,王博(2014)将该指数作为一个因子引入资产定价模型中,发现模型效率有显著提升。国内其他显性情绪指数还包括好淡指数、华鼎多空民意调查指数、巨潮投资者信心指数等。
隐性情绪指数,也称为间接投资者情绪指数,是指利用间接影响投资者对市场预期和估计的变量(通常是利用金融市场交易数据)来衡量投资者情绪。Zweig (1973)、 Lee等(1991)、 Pontiff (1995)、张丹和廖士光(2009)等多项研究发现,封闭式基金折价可以用来代表投资者情绪的变化。Baker和Wurgler (2006)采用封闭式基金折价、换手率、 IPO公司数量、 IPO首日收益率、股利溢价和股权融资比例这六个市场客观指标,通过主成分分析法复合构建出投资者情绪指数(以下简称“BW指数”)。易志高和茅宁(2009)对BW指数的构建过程加以优化,构建出与中国市场发展状况相匹配的中国股市月度投资者情绪综合指数(CICSI),并证实了其有效性。蔡志刚和赖明明(2016)选取了城镇居民投资意愿、 IPO首日收益率、对数开户比和流通市值加权换手率等指标,用三种不同的手段建立了三种中国股票市场投资者情绪的月度复合指数。国内其他隐性情绪指数还包括中金公司海外投资者情绪指数(OISI)、国泰君安情绪指数(GMX)、国信证券情绪指数(GSISI)等。
目前,由于互联网媒体信息发布量大、传播速度快、受众面广和影响力度强等特点,再加之自然语言处理技术瓶颈的突破与发展的迅速,越来越多的学者对于投资者情绪的深入挖掘逐步扩展到对互联网媒体文本信息,以及文本情感分析相关技术难题的攻克。Tetlock (2007)利用哈佛大学通用情感词库Harvard-IV-4,通过计算《华尔街日报》新闻中的正面词语和负面词语的比例来度量投资者的情感波动。Das和Chen (2007)利用雅虎财经论坛中发帖者的看涨、看跌或看平观点建立投资者情绪指数。Bollen等(2011)利用OpinionFinder情感分析工具将推特信息量化成为消极和积极两个方面,同时利用Google-Profile of Mood States工具将推特信息量化成冷静( calm)、警觉( alert)、确信( sure)、活力( vital)、平和(kind)、快乐(happy) 6 个维度的语义来刻画投资者情绪曲线。段江娇等(2017)选取了东方财富网股吧上证A股论坛帖子,使用贝叶斯分类器将帖子分为看涨或看跌,并用二者之间的关系衡量投资者情绪。唐晓波和叶晨孟(2017)借助自主构建的高频情感词典、领域情感词典和已有的心理学情感词典,创新性地融合热点新闻和读者态度设计了 3 种情感计算方式进行情感分析。
综上所述,目前有多种衡量方法可以对投资者情绪进行度量,从不同的数据源视角解析投资者情绪的变化,并以此为基础探寻投资者情绪与证券市场风险波动之间的关系。相比于显性情绪指数利用的调研数据和隐性情绪指数所用的市场交易数据,在媒体信息量爆炸式增长和传播迅速的今天,媒体信息成为影响投资者情绪波动的最大风险源,其中的倾向性观点引起的投资者情绪波动该如何度量?采用合理有效的量化方法获得新闻信息对投资者情绪倾向影响性的表达,是后续探寻互联网新闻与证券市场波动关系的坚实保障。
随着互联网媒体的兴起和信息技术的发展,海量信息及其极速传播增强了媒体对投资者理性决策的干扰,导致证券市场的异常波动更为频繁与剧烈。具体而言,情绪信息通过媒体的传播被投资者接受、消化,最终转变成投资行为影响证券市场。媒体传播一方面降低了信息的获取成本,缩小了投资者之间拥有信息的数量及质量上的差距;但另一方面,作者在撰写媒体信息的过程中,难免因自身利益对信息加入主观看法,造成其与客观事实存在信息偏差,导致非理性投资者形成有偏见的主观情绪,从而做出不理智的投资决策,最终影响资产价格。事实上,证券市场风险波动受到非理性投资者情绪的影响已经得到了众多研究的证实,基于投资者情绪驱动的证券市场波动分析逐渐成为学术界讨论的热点(Bollen et al.,2011;Ding et al.,2015;Li et al.,2020a;Schumaker et al.,2009b;Tetlock,2007;Zheludev et al.,2014)。为了更好地厘清受媒体信息影响的投资者情绪与证券市场波动之间的内在联系,本节以媒体形式的转变作为逻辑主线,由早期的权威机构发布的新闻报道,到公众可以参与讨论的财经论坛,再到新兴的交互式社交媒体,重点阐明媒体信息引起的投资者情绪与证券市场波动的关系。
早期的研究起源于对权威机构发布的传统新闻报道的探索,学者们通过观察重大新闻中蕴藏的专家倾向性意见和情感,获取投资者情绪和投资行为的改变,来探索投资者情绪与证券市场之间的内在联系。Tetlock教授先后在 Journal of Finance 上发表的两篇研究使其成为该领域的开拓者(Tetlock,2007;Tetlock et al.,2008)。Tetlock通过对 16 年的《华尔街日报》( Wall Street Journal )新闻的情感分析,首次论证了运用新闻信息来捕捉投资者情绪与非理性行为对相关证券波动影响的有效性,发现新闻报道中悲观情绪愈甚,则证券市场面临着愈大的下行压力,同时发现不论悲观程度过高还是过低,都会提升市场交易量。Engelberg (2008)使用道琼斯新闻社(Dow Jones News Service)报道中的负面词汇来衡量新闻的情感,发现相比于数据信息,公司的新闻信息包含了更多的与公司未来收益相关的重要信息。例如,负面情绪的公司报道可以预判该公司未来在证券市场上的表现会变得更糟糕。Kothari等(2009)研究发现媒体报道会影响公司的证券走势波动风险,消极新闻的披露会增加公司的证券走势波动风险,积极的媒体报道会减少公司证券走势的波动风险。Dougal等(2012)以及Gurun和Butler (2012)对《华尔街日报》的“与市场同步”专栏的新闻进行分析,发现该专栏的报道与证券市场表现在短期内存在因果关系,且进一步发现这些报道的正面倾向与公司市场价值显著正相关,也就是说,新闻报道越正面,企业在证券市场的表现会越好。国内的相关研究起步较晚,直到 2012 年,游家兴和吴静(2012)首次以包括《中国证券报》《证券日报》在内的 8 家全国性财经报纸为研究对象,从投资者情绪的视角研究了新闻对证券市场的影响,发现当新闻报道所传递出的情绪较高涨或较低落时,股票价格更有可能偏离基本价值水平,并且媒体所传递的不同情绪对资产的影响存在不对称性,乐观的媒体情绪更容易推动证券价格向上偏离基本价值,导致股价泡沫产生。黄辉(2013)通过对刊登在《证券日报》上的 915 篇负面报道的研究,发现媒体负面报道有一定的负向市场反应,并且深度的、严重侵害倾向的负面报道引致的市场反应更为强烈。张磊(2017)将《上海证券报》《中国证券报》《证券时报》上刊登的新闻作为研究对象,通过统计新闻报道中正面、负面和中性的情感词汇,确定新闻报道的情绪,并发现其对股价行为有显著影响,同时具有不对称性,当出现对市场持有悲观态度的报道时,股价会受到强烈冲击;反之,股价的变动则相对温和。
随着互联网的发展,出现了投资者可以自由表达心声和分享经验的财经论坛,投资者可以在财经论坛上发表关于某只股票、证券市场、宏微观经济等方面的看法,其他人也可以通过评论回复表达对其支持或者反对的观点,这使得财经论坛逐渐成为汇集和反映投资者集体智慧的完美平台,学者们开始将获取投资者情绪的渠道转移至财经论坛,如雅虎财经、新浪财经、东方财富等。Das和Chen (2007)最早探索财经论坛与证券市场之间的关联,他们利用文本挖掘技术提取雅虎财经论坛上的投资者情感,来揭示论坛信息发布与证券市场波动的关联。紧接着,Sehgal和Song(2007)同样证明了雅虎财经论坛上的公众情绪与证券市场的关联。Jiang等(2014)进一步指出,金融危机左右着雅虎财经论坛的讨论主题,并且在危机的不同阶段,投资者情绪与证券市场的关系不同。Li等(2014b)从东方财富和新浪财经的论坛上获取到了每家上市公司对应的公众情绪,发现公众情绪与财经新闻的结合可以很好地反映证券市场未来的走势。Sabherwal等(2011)通过研究The Lion.com论坛上的帖子发现,异常高或者异常低的投资者情感指数都会导致较高的市场交易量和波动率。Nguyen等(2015)的研究发现,相比仅使用历史价格数据的模型,加入了雅虎财经论坛中的投资者情绪影响因素的模型表现更优。石勇等(2017)通过对股吧论坛数据、社交媒体数据和财经新闻数据与证券市场波动的比较性研究,发现不同来源的投资者关注和投资者情绪对中国证券市场的影响是不同的。黄创霞等(2020)基于上证指数股吧论坛信息,研究了投资者情绪与市场收益率的关系,发现积极情绪是收益率的格兰杰原因,而消极情绪与收益率的关系不显著。
随着社交媒体对投资者传统沟通方式的改变,投资者不仅成为信息的消费者,更是生产者和传播者,海量信息的产生与快速传播对投资者情绪产生了巨大的冲击,使得社交媒体成为学者们的重点关注对象。Bollen等(2011)是最受关注的文章之一,他们成功地从 1 000 万条推特信息中提取到投资者情绪,并将其划分为 6 个维度,发现将其中的“冷静”情绪指数推后 3 至 4 天,与道琼斯工业指数的走势有着惊人的重合率,高达 86. 7%。Karabulut (2013)发现从脸书信息中提取的国民幸福指数每增加 1 个单位,平均来说,证券市场第二天的收益率会增加 11. 23 个单位,但这只是短暂的,将会在未来几个交易日内出现反转效应。Sprenger等(2014)运用自然语言处理技术分析了微博的 25 万余条推文,发现推文情感与证券市场呈正相关关系。Yang等(2015)构建了一种从推特信息中提取投资者情绪的方法,发现与一般的社交情绪相比,该方法的表现更加稳定,对证券市场的预见性更高。张书煜等(2015)将微博中获取的投资者情绪划分成六个等级,探讨社交媒体中不同程度的投资者情绪倾向与证券市场收益之间的预测能力和双向反馈关系。张信东和原东良(2017)根据微博信息中提取的投资者情绪构建了“微指数”情绪指标,并揭示了“微指数”与证券市场的相关性。陈玉和李述山(2019)提出了一种基于情感倾向点互信息的微博情感计量方法,证实了微博表达的投资者情感与证券市场间的显著关系。值得一提的是,目前业界已经初步成立了多只基于社交媒体的对冲基金,例如DCM Capital、 Twitter - based Hedge Fund、 Cayman Atlantic,这些基金通过分析大量的媒体文本信息来感知投资者情绪和行为以及指导投资,取得了不错的成绩。
综上所述,无论是财经新闻、论坛股吧还是社交媒体,以往的研究都已经有效地证明了不同媒体信息中的投资者情绪与证券市场之间的关联性。但是其中的大部分研究都是基于通用情感词语库来量化情感倾向的,Harvard-IV-4 和SenticNet 是现有研究中使用最为广泛的两种通用领域情感词库。然而,由于语言的多样性,通用领域的情感词在金融领域中很有可能只是一个普通词语,反之亦然。例如,在通用领域中,“熊”是指一种哺乳动物,而在金融领域通常暗示金融市场行情前景悲观,比如“熊市”,类似的词语还有“过山车”“跳水”“空军”等等。事实上,Loughran和McDonald (2011)指出Harvard-IV-4 通用情感词库中,73.8%的负面情感词语在金融领域都不再表达负面的情感含义,并提出了金融文本情感分析词典(Loughran and McDonald Sentiment Word Lists )。特别是在互联网媒体飞速发展的今天,新词新语不断涌现并得以广泛使用,在不同环境下,即使是相同的词语也可能会表达不同的情感。由于缺乏金融领域的专用情感词库,针对国内证券市场的研究不得不采用人工阅读、判别的方法来提高情感分析的准确率,因此极大受制于样本数量和主观差异性(李培功等,2010;游家兴等,2012)。如何利用先进的文本量化分析技术,提高从媒体信息中获取投资者情绪的准确性,也是一道亟待学者突破的阻碍。
在大数据时代下,互联网媒体通过对市场信息的收集、分享、传播与扩散,引起投资者情绪的波动,进一步影响到投资者的决策行为。基于投资者情绪与证券市场之间的关系,本节上述内容从投资者情绪的定义与度量和媒体信息中的投资者情绪对证券市场的影响研究两个方面,对相关文献进行了系统性的梳理与总结,为后续的研究奠定了坚实的理论基础。
在投资者情绪的定义与度量方面,传统金融学理论认为投资者应该是完全理性且没有情感的,都是精于判断和计算的,他们所追求的唯一目标是自身经济利益的最大化。行为金融学指出投资者情绪是影响投资决策的重要原因,它认为投资者情绪既是那些与上市公司基本面无关的“信念”,也是对未来预期的系统性偏差。投资者情绪通常被划分为积极情绪和消极情绪,可以通过直接对投资者问卷调研或利用间接数据估计两种方法对其进行衡量。
在媒体信息中的投资者情绪对证券市场的影响研究方面,已有的研究揭示了不同媒体信息来源所获取的投资者情绪与证券市场之间的关联性。媒体信息是对市场信息的有效补充,引起的投资者情绪是驱动证券市场波动、阻碍股票价格回归合理估值区间的重要因素。对媒体信息的合理分析与投资者情绪的精准表达是探寻证券市场新闻媒体效应的关键。
但是,通过对国内外相关文献的梳理,本书发现以往文献中的投资者情绪获取一般来源于传统的新闻媒体,很少有研究从大数据的视角,更全面地挖掘互联网新闻中的投资者情绪与证券市场波动的关系。此外,合适的文本信息量化技术方法是准确获取投资者情绪的重要途径,选择怎样的投资者情绪度量方法,能够有效保留投资者情绪的影响力,是进一步探索互联网新闻信息对证券市场影响的关键。