近十多年来,在计算机文本分析法逐渐成熟的基础上,利用计算机手段提取文本特征进行研究成为实证会计领域中不可忽视的一种新范式。年报中的文本信息包含了财务信息所不能体现的丰富内涵,具有很高的研究价值,例如,可读性、情感和相似度等特征不仅可以反映管理者的行为和动机,还可以影响投资者对信息的理解进而影响其投资决策。在信息披露的主体研究框架下,现有相关实证研究主要分为两类:一是讨论影响年报文本信息披露的因素;二是考察文本信息披露后的影响效应。
本节将“textual analysis或text analysis或text mining”与“annual report或financial report或accounting或finance”作为检索关键词,在web of science数据库核心合集中进行检索,将发表时间限定为2000年至2020年7月。通过人工阅读检索到的文章摘要,筛选出与公司年报文本信息研究相关的SSCI期刊论文161篇。对这些论文的发表时间进行统计发现(见表2-3),具有以下两个特点:
表2-3 国外金融、会计学领域年报文本研究的总趋势(2000—2020年)
数据来源:web of science数据库。
(1)2000年至今,国外会计金融领域对公司年报文本的研究呈上升趋势,尤其近五年以来,相关研究发文数量持续迅速增长。截至2020年7月,近五年发文量已达年均27篇,较五年前增长了约七倍。可见,年报文本研究近年来成为一个新兴研究热点,会计金融研究领域也出现了语言转向。
(2)对公司年报文本研究的期刊分布情况统计发现,公司年报文本研究在会计金融领域受到广泛关注,且具有跨学科属性。大多数论文发表在会计类期刊上(占71.2%),如 Journal ofAccounting and Economics , Accounting Auditing and Accountability Journal , Accounting and Business Research , Accounting Review , Corporate Governance , Management Science 等,反映出公司年报文本在会计领域受到了广泛关注。此外,有相当一部分研究发表在金融学期刊上,如 Journal of Behavioral Finance , Journal of Financial Economics , Financial Management , International Review of Financial Analysis 等金融类期刊发文量占总发文量的20.3%,反映出公司年报文本研究在金融领域受到一定关注。公司年报文本研究还发表在计算机科学,经济学,商务沟通学等不同领域期刊上,如 Decision Support Systems , Applied Economics Letters , International Journal of Business Communication 等,反映出公司年报文本研究具有跨学科的属性。
在会计和金融领域的年报文本研究主要是实证研究。这些研究以计算机为基础,将定性的年报文本信息压缩为简单的文本特征,不仅降低人工成本,而且极大地提高了研究效率。总结现有实证文献可以发现,已被量化的文本特征按照是否与内容相关可分为两类。其中,语调、可读性与文本内容无关,而相似性则属运用到文本内容的一部分。根据肖浩等(2016),表2-4概括了最主要的三种年报文本特征的代表性国外文献。需要说明的是,在这三类基本的文本特征分类基础上,利用相关文本特征提取方法,还有许多文献进行了更广泛的文本特征衍生研究。例如,基于文本内容,采用字典法识别和度量包含在MD&A中的前瞻性信息、研发信息和风险信息等(Loughran和Mcdonald,2011)。
表2-4 主要年报文本特征的代表性文献
数据来源:web of science数据库和肖浩等(2016)《国外会计文本信息实证研究述评与展望》。
相对而言,国内研究涉及的文本特征主要集中于语调、可读性、业绩归因自利性。在具体文本特征的衡量上,这些研究不仅借鉴了国外的已有研究,同时针对中文语言进行了本土化的改良。例如,孙蔓莉和姚岳(2005)通过理论分析得出,由于上市公司内外信息不对称,管理者作为“内部人”,能通过调整报告语言特征等,对信息使用者进行印象管理。国内企业采取的印象管理手段主要包括选择信息披露内容与格式、自利性归因、操纵信息阅读难度、控制文本语调等(谢德仁和林乐,2015)。管理者在向信息使用者传递公司价值信号时,常常不是孤立使用某一维度的语言特征,而是整合多种特征方法,根据公司面临的不同情况灵活进行策略性地组合表述(蒋艳辉和冯楚建,2014;李胜男,2018)。整体上,我国早期的上市公司年报文本信息的可读性较低。阎达五和孙蔓莉(2002)对B股59家公司的英文进行分析,发现我国上市公司年报非财务信息是难读的或非常难读的。孙蔓莉(2004)也通过学生实验发现我国上市公司年报接近于半专业投资者的理解能力,但对于非专业投资者则是不可理解的。葛伟琪(2005)研究表明,2005年的中英文年报虽然在信息含量上有明显的增加,但可读性仍然较低。从近些年文本信息可读性的变化趋势来看,国内学者并没有得出一致结论。陈林俊(2009)的研究结果表明,不论是MD&A整体部分、经营情况回顾部分还是未来发展展望部分,可读性都是连续三年下降的。与之相反的是,李萍(2018)对房地产行业的报告信息进行了比较,发现该行业报告可读性不断提升,语言更加精炼且易懂,虽然可读性总体上还是偏难,但呈现出一个不错的改善趋势。
尽管统计结果表明,影响公司信息披露的因素很多,但大致可以归为三大类:外部宏观环境、行业层面因素和公司层面因素。
1.外部制度环境因素
已有关于信息披露的实证研究揭示了法律、文化、政治经济等宏观环境对信息披露的影响。这是因为公司的生存与发展离不开外部的制度环境。无论是证券交易委员会规定、法律条款还是证券市场的内在需求,都会影响年报信息的披露。这些因素同样会影响到年报中的文本信息质量。一是证券交易委员会的要求。美国证券监管委员会在1980年强制要求上市公司在年报中增加MD&A部分,用于评估企业的流动性、资本以及经营状况。至今,MD&A已经成为上市公司年报中最受关注的文本内容。Loughran和McDonald(2014)研究发现,SEC在1998年明确要求上市公司在招股说明书中必须使用简明英语,这之后不仅是招股说明书连未被强制性要求的年报的可读性也得到显著的提高。又如,Li et al.(2013)发现,在SEC建议公司在年报文本中包含对竞争形势的描述后,公司描述竞争形势的文本就显著包含了与盈余质量相关的信息。二是法律制度。Li(2010)的研究发现,安然公司丑闻案之后的萨班斯-奥克斯利法案要求公司在MD&A中增加更多的前瞻性信息披露,这使得MD&A中前瞻性描述的语调与公司未来盈利以及流动性正相关,对未来的业绩具有增量解释。三是市场环境。如果公司的信息环境较差,股价并不能充分反映公司未来盈利信息,公司很可能调整信息披露策略来引导投资者决策。例如,Muslu et al.(2014)发现,当公司股价不能充分反映未来盈利信息时,公司会选择在年报MD&A文本中进行更多的前瞻性信息披露,这种策略能有效缓解股价信息效率低的问题。我国学者李萍(2018)发现每股收益越差的公司,其报告的可读性反而更好,这可能是因为盈利能力较弱的企业会面临更严厉的社会监督和市场监督。
2.行业层面因素
年报文本具有灵活自由的内容体现,很大程度上反映的是自愿性信息披露。由于行业之间的差异性,年报自愿性信息披露的内容有很大的不同。例如,FASB(Financial Accounting Standards Board,2001)发表了一份题为《改进企业报告增加自愿性信息披露》的研究报告,选取了汽车、化工、计算机、食品、石油、制药、区域性银行及纺织各行业的多家上市公司作为样本,指出不同行业自愿性信息披露内容的不同。高科技、高成长公司自愿披露人力资本信息,已经成为业界通行的惯例,而传统公司较少自愿披露能为公司带来价值的人力资本信息。Nerissa(2005)通过实证研究发现,同一行业或同一类型的公司之间的自愿性信息披露行为会相互影响,导致出现自愿性信息披露的“行业羊群行为”。这使得公司的自愿性信息披露决策与其他同业公司的自愿性信息披露行为呈现正相关关系。有的行业性因素会促进上市公司自愿披露更多的信息,例如,处于垄断性行业的公司由于缺乏竞争对手,扩散成本低而会增加自愿性信息披露。如果经营情况正在好转,在诉讼风险不同的行业中,公司发布的未来盈余预测的乐观程度存在差异(Bushman et al.,2004)。
3.公司层面因素
首先,公司特征在一定程度上决定了文本特征。Loughran和McDonald(2014)指出,业务越复杂的公司,文本更难以阅读,甚至有时很难将公司复杂性与年报可读性加以区分。此外,文本所包含的信息可能是公司业绩、诉讼风险等变量的函数。Li(2010)发现,公司未来的盈利状况和流动性越好,文本的语调也就越乐观。Brown和Tucker(2011)对不同时期MD&A的内容进行比较后发现,公司经济状况的变化越大,MD&A内容的改变也就越大。Merkley(2014)的研究表明,业绩的下滑会导致公司增加对研发信息的披露。在国外的公司诉讼案中,投资者经常会将公司披露的定性文本作为诉讼证据,因此,Nelson和Pritchard(2007)研究发现,当公司面临更大的诉讼风险时,年报将采用更多的警告性语句和更易读的语言,以减少诉讼成本。其次,管理者特征和公司治理对年报文本特征存在重要影响。上市公司年报的执笔在很多情形下,实际上是由管理者、审计师、律师和公关部职员等多方协同完成,但在撰写和完成时都需要征询公司治理和管理者的意见,需要通过其审阅。管理者不仅直接影响文本信息的披露,而且这种影响存在个体差异。例如,管理者的工作经历、心理特征等因素会影响文本信息量以及语调特征。Hanley和Hoberg(2010)发现,勤勉工作的管理者能够提高招股说明书的信息含量。当管理者任期更长或是信息来源更可靠时,年报文本信息具有更高的信息含量。再次,管理者存在自利归因动机。Li(2011)发现,具有自我服务偏差的经理人在公司业绩较好的时候,更倾向于在年报MD&A中使用第一人称。而且,大量研究证明了年报文本信息中存在业绩自利性归因倾向,花贵如等(2014)提出,管理者自我服务归因偏差产生的动因来自信息加工处理过程中无意识的认识偏差。他们有意将成功更多地归因于内部原因,而将失败更多地归因于外部原因,主要是为了“维持脸面”,从而在认知过程中无意识地偏离了正常的路线。蒋艳辉和冯楚建(2014)发现,管理者对公司未来绩效的预期,会影响MD&A语言文本特征。当对未来业绩保持乐观时,管理者有更强的动机采取恰当的表达方式传递公司价值信号,相应MD&A语言信息的可读性更高,业绩归因解释更加客观可靠,前瞻性信息也更加准确积极。相反,当对未来业绩预期不理想时,管理者会弱化这些表述方式。
从信息经济学的角度来看,上市公司年报在资本市场中起着至关重要的作用,大量研究发现与收益相关的信息影响了股价波动和股票交易量。最初的观点认为,年报文本的影响效应很弱,这些文本信息只是基于通用模板所做的披露,仅仅包含样板式的文字、免责的声明、标准化的语句以及其他无关紧要的细节,并不具有信息价值(Li,2010)。但随着计算机语言学的应用,越来越多的研究结果已经证明,年报文本信息对资本市场有显著的影响(肖浩等,2016)。
1.对投资者的影响
年报文本影响投资者对年报信息的理解。首先,从文本信息内容的角度看,Kravet和Muslu(2013)和Hope等(2014)发现,公司增加风险信息披露能够增强投资者对风险的认识和理解,对特质性风险的信息披露有益于投资者对财务报表数据的理解。Li(2014)的研究则表明,文本的重复性披露不仅能为投资者提供有用的信息,而且能够增强投资者对非重复性文本信息的理解。从文本的基本特征来看,由于复杂的文本信息会增加投资者尤其是中小投资者的信息处理成本,因此,年报可读性越差,相应的股票交易量也越少(Miller,2010)。其次,从心理学角度看,Rennekamp(2012)和Tan et al.(2014)基于实验研究的方法证明,文本信息的可读性越强,投资者处理信息的过程就会越流畅,投资者由此产生一种心理暗示:此类信息披露更可靠、更值得信赖。Loughran和McDonald(2014)认为可读性影响年报中关于价值信息的有效沟通,而投资者更可能投资于年报可读性更强的公司。再次,从信息操纵角度看,Li(2008)、Lo et al.(2014)、Bushee et al.(2015)的研究证明,管理者通过降低年报文本的信息含量、进行语调的策略性管理、增加文本复杂性等诸多手段操纵文本信息,可以误导投资者对公司价值的判断。
2.对资本市场的影响
由于年报文本信息会引起投资者行为的变化,进而影响资本市场反应。考察文本信息的市场反应,不仅可以判断年报文本信息的信息含量,还可以用于检验资本市场的效率。首先,文本的语调会引起市场的显著反应。Davis et al.(2012)认为,管理者通过乐观或悲观的语言来暗示公司未来的业绩,因此,盈余公告的语调越乐观,市场的短期反应就越强烈。林乐和谢德仁(2016)发现,年报文本信息语调能够显著影响资本市场反应。我国投资者能够理解业绩说明会上的管理者语调,对于负面语调会即时做出显著的负向反应,而对于正面语调,需要经过一段时间的观察分析,才可能做出正向反应。周波等(2019)不仅考虑了语调的积极程度,还考虑了语调的真实性。结果表明,不考虑语调真实性时,年报的积极程度和股价崩盘风险无关。但是考虑语调真实性后发现,在语调真实程度较低的情况下,年报语调越积极,其公布后发生崩盘风险的可能性越大。除此之外,语调还会引起股票交易量的变化(Loughran和McDonald,2011;Price et al.,2012)。其次,文本可读性也会影响市场对信息的反应。Bushee et al.(2015)发现,由管理者驱动的文本复杂性扩大了投资者的信息不对称程度,降低了股价信息效率。此外,Brown和Tucker(2011)发现,由于经济状况的较大变化会引起各年MD&A文本的显著变化,进而在年报公告时导致市场更大的反应。再次,文本信息可能影响盈余数据与股价之间的关系。年报中的文本信息不只是盈余数字的替代,也是其有益的补充。Li(2010)证明,当公司在对应计的解释文本中发出警告时,市场减少了对应计的定价偏误。孟庆斌等(2017)在探究MD&A信息含量和股价崩盘风险的关系时,发现文本的可读性特征具有显著的调节作用。随着可读性的提高,MD&A展望部分所提供的信息能够更好地为信息使用者所理解,从而信息含量与股价崩盘风险的负向关系更加显著。
3.对分析师和审计师的影响
分析师和审计师作为资本市场中的重要参与者,也成为文本信息影响效应的研究对象。Lehavy et al.(2011)研究发现,公司年报的可读性越差,关注该公司的分析师就越多;由于分析师需要耗费更多的努力来工作,因此,其研究报告的信息含量也更高。公司披露更多的R&D信息,不仅能够吸引更多的分析师关注,而且能够提高分析师预测的精度、减少分析师预测分歧。裴蓓(2017)的研究发现,分析师能比较理性地看待年报文本中的语调信息,管理者异常积极语调的上扬会显著增加证券分析师对公司的关注度,同时提高证券分析师的盈余预测质量。绩优公司的管理者异常积极语调越高,证券分析师对公司未来一年的业绩表现预期越乐观。相反,绩劣公司的管理者异常积极语调越高,证券分析师不仅会对公司未来一年的业绩表现预期越悲观,而且会投入更多的关注,以期降低预测误差。李晓慧和孙蔓莉(2012)以“莲花味精”为例,对风险导向审计、审计风险识别以及业绩归因等理论做了总结,试图构建通过年报文本信息业绩归因分析评价审计风险的应用框架。虽然该研究还只是停留在理论分析的层面,但有很高的实证分析指导意义,为文本信息对审计师的影响指明了新的研究方向。