购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 研究背景与意义

1.1.1 研究背景

现代经济学已经证明,信息是市场经济有效运行的关键因素之一,信息不对称是制约经济运行方式和经济效率的基本问题。上市公司公开披露年度报告(以下简称“年报”)是有效降低资本市场信息不对称程度的重要方式。长期以来,年报中的财务信息被认为是年报的核心内容,是市场参与者进行经济决策的主要依据,但随着上市公司经营状况的复杂性上升,利益相关者及其关注的信息范围不断扩大,财务信息传递的内容已经不能充分满足市场中的信息需求。人们对非财务信息的关注开始不断加强。非财务信息一般是以自然语言的形式呈现出来,采用文本叙述性方式表达。当前,这类文本信息在上市公司年报中所占比重不断增加,具有很高的研究价值。尤其在我国这一高语境传播的环境中,文本可以从内容、语调和可读性等方面向外部投资者传递更多和公司价值相关的信息。然而,国内外对文本信息的考察整体上还处于起步阶段,文本信息的特征提取技术、生成机制、经济后果以及对财务信息的影响等问题,都亟待得到进一步的探讨。这就为本书专题讨论上市公司年报文本信息提出了研究动机、目标和要求。

1.财务信息价值相关性下降的困惑

上市公司年报中的财务信息从会计视角揭示了公司的财务状况、经营业绩和现金流量等经济情况,目的是反映公司管理层受托责任履行状况,帮助财务报告使用者做出经济决策。在有效市场的理论框架下,Ball和Brown(1968)以及Beaver(1968)拉开了关于财务信息价值相关性的实证研究序幕。大量研究基于事件研究法,发现在年报披露的短窗口期内,资本市场中股票价格或股票交易量变化与财务信息关系显著。这些研究一方面有助于人们判断和识别财务信息是否受到资本市场投资者的重视,另一方面可以从市场反应的角度评价财务信息的质量。

然而,美国会计学者Lev(1989)在综述1970年至1989年期间发表在美国三大会计期刊上有关盈余信息含量的研究时指出,很多证据显示财务盈余对于股票价格的解释力非常低。在窄窗口期(2—3天),财务盈余对股价变动的解释力只有2%至5%;即使在较宽(一个季度)和很宽(最长为两年)的窗口期,财务盈余对股价变动的解释力也只有 4%至7%。此后,Lev和Zarowin(1999)持续跟踪相关研究发现,股票价格与关键财务变量(如报告盈余、权益净值和现金流量)之间的统计关联性不断恶化:在二十年期间,反映股票回报与报告盈余相关关系的拟合优度从0.115降至0.037,反映股价变动与报告盈余变动相互关系的盈余反应系数(Earnings Response Coefficient,ERC)也从0.907降至0.61;反映股票回报与经营性现金流量相关关系的系数从0.074降至0.036;反映股价变动与现金流量变动相互关系的现金流量反应系数(Cash Flow Response Coefficient,CFRC)也从0.75降至0.416;按照Ohlson模型计量的反映股票回报与“报告盈余+权益净值”的相关关系系数由0.923降至0.618。2016年,Lev和Gu在《会计的没落与复兴》一书中,将考察期间拓展至1950—2013年,发现财务信息相关性的下降趋势仍然没有改观,多重财务指标(包括销售收入、销售成本、销管费用、净利润、总资产和总负债等六个指标)对股票市值的解释能力从1950年的90%降至2013年的50%—60%之间。

如果资产负债表、利润表和现金流量表三大报表提供的财务信息,只能在很低程度上解释不同上市公司的股价差异,则财务信息的决策相关性堪忧,财务信息的提供是否符合成本效益原则,令人质疑。这引发了人们对财务信息解释力低的原因的探讨,诸多学者考察了包括盈余的性质、会计准则和公司或行业特征等因素的影响。其中,财务信息自身的局限性被认为是价值相关性较低的本质原因。这些局限性包括:

一是财务信息受到会计确认和计量基本原则的制约。这导致财务信息相关性和可靠性之间的矛盾普遍存在,很多重要的经营活动无法通过传统的财务信息予以货币计量。并且,财务信息反映的主要是公司过去的经营业绩,无法满足利益相关者分析公司未来发展情况的需求。因此,财务信息越来越难以满足市场信息需求(黄世忠,2020)。Govindarajan et al.(2018)的调查访谈表明,很多首席财务官(CFO)甚至认为,按照公认会计准则编制财务报告特别是资产负债表和利润表,只是法规遵从(Regulatory Compliance)要求的一种摆设,尤其是新经济环境下,相当多耗费在财务报告编制和审计上的资源属于浪费。

二是建立在权责发生制基础上的财务信息貌似精确,却充斥着主观的估计和判断。由于面临诸多不确定性,企业的业务日趋复杂,财务报表在编制过程中需要企业管理当局和会计人员运用大量的判断和估计。管理当局正是利用会计这一缺陷玩起了“数字魔术”,通过操纵财务信息披露,引导市场做出对其自身能力和公司价值有利的判断(Bloomfield,2002)。已有研究发现,管理者操纵财务数字信息披露的机会主义行为普遍存在(Healy和Wahlen,1999;Healy和Palepu,2001)。

三是财务信息具有高度的综合性和专业性。“三十年前,会计准则的文献资料仅仅有两卷,并且很容易就能装进公文包携带。从那以后,会计准则文献资料数量呈指数速度迅速增长,现在需要用带有很多隔层的书柜才能容得下”(Steve Liesman,2002)。要真正理解准则已成为一件令人气馁的事情,即使是专业的财务主管们也不得不雇佣高专业水平的会计师。试想,又有几个投资者能真正读懂如此复杂准则下生成的财务报表?安达信的CEO Berardino在《我对安然审计的反思》一文中写道“安然就是很典型的一个案例,它如此正宗地用了会计标准却使得投资者更难于理解业务的真相”。大多数投资者由于缺乏专业基础,阅读和理解财务信息比较困难,可能只流于表面,无法真正理解数据的内涵(Lev,2001;Grandi et al.,2009)。

2.非财务信息的价值认同

随着经济结构转型调整、新兴产业的崛起以及投资者对信息需求的不断增长,财务信息的局限性凸显,且所传达的内容已不能够充分满足市场的信息需求。在此期间,非财务信息的披露日益受到人们的关注。非财务信息主要是指那些“无法进入财务报表,但与企业的生产经营密切相关”的信息。

目前,全球范围内有至少45个国家的政府及交易所明确要求或鼓励企业披露其非财务信息。 在我国,上市公司在年报中披露非财务信息的重要性也与日俱增。近年来,不断修订的《公开发行证券的公司信息披露内容与格式准则第2号——年度报告的内容与格式》多次强调了非财务信息披露的重要性。比如,根据2007年修订版,我国证监会首次要求所有公司在管理层讨论和分析中都应更加详细地披露有关公司未来发展方面的非财务信息;2011年,证监会鼓励上市公司披露对投资者决策有重大影响的报告期主要产品的生产量、销售量、库存量和市场占有率等非财务信息;2014年的修订版明确指出,要增强非财务信息披露的针对性,披露内容要做到简明易懂;2016年、2017年,证监会又再次对上市公司非财务信息披露内容和披露方式提出要求。

国内外监管层采取加强非财务信息披露举措的根本动因和理论基础,是由于非财务信息作为财务信息的重要补充,能有效缓解信息不对称的程度,提高信息透明度,向外部投资者传达与价值相关的内部信息和公司未来的发展前景(Grossman,1981)。首先,从实证研究上看,非财务信息可以增强财务危机预警和提高财务欺诈识别的概率(Wu,2004);提高企业收入预测,从而减少投资者风险(Brazel et al.,2009);平均而言,公共机构一项投资决策的35%都是由非财务信息决定的(Khan et al.,2016)。而且,非财务指标对企业内部管理也有重要作用。Ittner et al.(1997)的一项研究表明,317家样本公司中有36%的公司使用诸如产品质量、顾客满意和市场份额这样的非财务指标来评估CEO的业绩。其次,投资者一般认为,非财务信息的可靠性远强于财务信息,因而更愿意投资于非财务信息质量比较好的上市公司(Riley et al.,2003)。消费者也倾向于购买披露非财务信息较多的公司生产的产品(张川和潘飞,2007)。再次,从实践经验上看,过去财务信息是企业价值评估的重要信息来源,而近年来考虑非财务信息的投资行为越来越普遍。例如,2015年9月曝光的大众集团排放作弊的丑闻直接导致一周内公司市值减小了约1/3,但其实在该事件发生四个月之前的2015年5月,全球领先的指数供应商MSCI因为大众公司在董事会独立性、高管薪酬以及会计准则等公司治理方面出现的问题而将其除名。这充分表明非财务信息评价的领先性。在2016年,全球最大资产管理公司BlackRock的首席执行官Larry Fink在发给标准普尔500强公司高管的一份备忘录中表示,“请更多地关注企业的长期价值创造能力而不是短期股利发放,并请多关注环境、社会以及公司治理因素,因为它们具有真实和可量化的财务影响”。由此可以看出,非财务信息涵盖内容丰富且具有重要的潜在价值,反映公司治理、创新、竞争、风险等的非财务信息可以传递公司更多的状态。将非财务信息指标纳入投资决策,对于公司本身而言,是加强风险控制能力和长期可持续发展能力的一种手段;对于投资者和利益相关者而言,是提高投资稳定性和可预测性的一种方法。

然而,非财务信息在具体应用中还存在两方面的局限性。一是缺乏规范性。许多机构和学者认为,制定最优的非财务信息强制披露准则是一件非常困难的事情(Skinner,2008;Simpson,2010;Beyer et al.,2010)。虽然近年来国际综合报告委员会(The International Integrated Reporting Council,IIRC)、全球报告倡议组织(Global Reporting Initiative,GRI)和美国可持续发展会计准则委员会(Sustainability Accounting Standards Board,SASB)等组织都在致力于推进非财务信息报告的标准化,但目前各国非财务信息披露格式和内容仍旧以自愿披露为主,这导致非财务信息的可比性和可阅读性较差。二是人工处理成本高。非财务信息一般是大量分散的,并由多个渠道来源收集的信息。因此,非财务信息的收集和加工不仅需要投入较多的时间阅读,而且需要投入精力进行信息整理。最近Amel-Zadeh和Serafeim(2017)的调查研究显示,尽管全球413名投资高管中的82%受访者表示非财务信息非常重要,但在应用于投资过程中面临种种障碍,其中缺乏跨公司可比性(44.8%)以及缺乏非财务信息报告标准(43.2%)是最大的问题;其次是收集和分析非财务信息的成本高(40.5%),信息缺乏细节(39.4%)和缺乏可量化(37.8%)等。

综上所述,尽管上市公司年报中的非财务信息具有结构化财务数据难以体现的丰富内涵,但从理论上来说,很难有像约束财务信息的会计准则那样对非财务信息进行标准化规范。而且,非财务信息一般不以货币形式出现,大多是一种定性的非结构化的文本信息描述,如何克服上述两方面局限性,是在挖掘非财务信息价值的过程中需要解决的重要议题。

3.年报文本分析的现状和前景

导致年报文本信息可比性差和处理成本高的本质原因是非财务信息难以计量。因此,如何量化非财务信息是突破其应用中两方面局限性的切入点(Li,2010)。由于绝大部分的非财务信息是以文本形式表达的,那么通过识别文本特征并构建指标来解决非财务信息的量化问题,被认为是挖掘年报中非财务信息价值的重要手段。

早期对非财务信息的文本分析主要基于两个视角:一是采用主观打分法。这种方法虽然可以根据文本内容选择相应的指标,具有较强的针对性,但无论是在指标选取还是对权重赋值时都存在较强的主观性,从而损害了研究的解释力和可鉴证性。并且,这种方法需要人工阅读大量的年报和临时公告,工作量较大,使得研究样本普遍偏小。这就提高了抽样误差,进而降低了估计结果的可靠性。二是直接采用一些非财务指标,如顾客满意度、市场占有率等。采用这种方法可以有效避免打分法只注重披露信息的数量而忽略了信息的差异。比如,即使公司披露了顾客满意度,但不同公司的顾客满意度并不完全相同,而是存在着较大差别,如果忽视这种差异,仅仅考虑是否披露,就可能得出错误的实证结论(胡元木和谭有超,2013)。然而,由于非财务信息以文本方式披露,仅有一小部分非财务信息可能存在直接量化的指标。更多的文本信息由于缺乏量化指标而被迫产生信息丢失。因此,早期人工判断法进行的文本分析存在人工成本高、解读效率低下、费时费力、易受解读者主观因素和个人利益影响的问题。这些问题长期困扰着非财务信息研究者,导致相关研究进展缓慢。

近十年来,随着机器学习(Machine Learning)和自然语言处理(Natural Language Processing)技术的长足发展,使用机器取代人进行年报文本分析成为可能。计算机文本分析的学习算法与Google公司的人工智能程序AlphaGo深度学习的基本原理是一致的。这种文本分析方法通过类人工智能程序阅读海量财务报告文本并进行专家式的信息解读,不仅解决了文本的样本量偏少问题,降低了人工成本,而且减少了人工阅读中主观性过大的问题,极大地提高了非财务信息的分析效率。近年来,一些创新性公司已经陆续开发了年报文本分析工具,成功地利用年报中非财务信息进行了投资决策。例如,建立在美国硅谷的创业公司TruValue Labs基于自然语言处理办法开发了Insight360文本分析工具,根据美国可持续发展会计准则委员会标准,对全球8 000多家上市公司的非财务信息进行评级。从2013年到2017 年,TruValue Labs评级分数高的公司股票收益率超过准普尔500指数,额外回报年率达到3%至5%。总部位于阿姆斯特丹的Sustainalytics公司,通过机器学习算法来整合2013年到2016年的1 600多家公司的非财务信息,根据非财务信息信号纳入的投资组合,年化利率超过基准指数的1.1%至4.3%(金希恩,2018)。

在计算机文本分析方法不断发展的背景下,财务会计领域的信息披露研究开始有了实质性突破。据Li(2010)统计,截至2010年,发表在国际顶级期刊上的以计算机为基础的会计文本实证研究已超过数十篇,而近十年来文本分析文献逐年增长的趋势不减。这些学者尝试从可读性、文本相似性、披露语调等计算机文本分析法得出的关键文本特征,来研究年报中的非财务信息。随着非财务信息越来越受到重视,基于计算机文本分析法的研究逐渐成为当前财务会计领域的研究热点。

计算机文本分析法与早期的人工分析法相比优势明显,并能提供更多的文本特征和变量。但由于这种方法要求研究人员既懂得财会知识,又懂得计算机知识,门槛较高,让很多研究者望而却步。同时,已有关于中文年报文本的研究不仅数量较少,且主要是通过手工收集数据与人工阅读的方法,存在研究样本量较小、变量取值较为主观等问题(孙蔓莉等,2013;王克敏等,2018)。这使得目前文本分析研究在我国财务会计领域尚属于新兴话题,现有文献量远远低于研究财务数据信息的文献。

4.本书写作主旨

随着当前新经济时代的到来,财务信息披露的作用有限。各国监管机构要求并鼓励公司在年报中披露非财务信息。文本自由而丰富的表达方式,为多样化的非财务信息披露提供了天然的载体。这些文本信息具有较高的信息含义,能够对财务报表数据起到解释、补充以及验证的作用。但是,非财务信息具有规则性和一致性较差的特征,即使采用选取具体项目并进行人工评分的度量方法,依然具有主观性和人工量大的缺点。同时,文本的信息价值又隐藏在字里行间,不容易直接观察和测度,因而需要运用专门的技术手段进行提炼,进而量化为数值型的变量。凭借以计算机为基础的文本分析方法,公司背景、生产运作、公司治理等方面的非财务信息都可以得到文本特征度量,会计学者可以对年报文本进行深入的研究,以进一步论证、补充和扩展现有财务信息披露理论框架。

目前,国内外将文本挖掘技术应用于社会科学的各个领域,取得了许多成果,如科技教育,社会舆论、商业金融领域等,但会计领域对文本分析的研究尚待展开。在对近十年来相关研究成果进行系统的梳理和述评基础上,我们发现,现有文献中国外文献占比较高,这些文献主要是以英文文本为分析对象。但文本分析是以语言的基本结构和语义构造为基础的,由于不同的语言之间存在显著的差异,现有的国外相关研究并不能直接应用于我国年报的中文文本。特别是相比英语文本的线性思维,汉语更强调圆式思维,反映在语言上更加委婉含蓄(孟庆涛,2009),这导致中文语义更为曲折隐晦,增加了上市公司年报文本信息汉语语言特征提取的难度(王克敏等,2018)。因此,对于我国的研究而言,构建中文文本分析方法是开展会计文本研究的基本前提。而且,考虑到国家间文化和制度的差异性,不同的文化与制度可能影响公司年报文本信息的生成机制及其经济后果,这导致基于国外欧美制度的研究结论并不能直接照搬到我国。因此,我国上市公司年报文本信息研究一方面需要借鉴国外已有的研究框架和理论成果,但另一方面更需要积极探索我国特色情境下的年报文本研究。整体而言,国内外会计领域对文本分析技术的应用都尚在初级阶段,年报文本分析技术、年报文本信息披露特征、年报文本研究理论框架及其与原有财务信息研究的结合和扩展等,许多问题亟待得到系统的解答。

本书将在文献梳理、技术讲解和实证分析的基础上,对文本分析技术的构成、文本分析的实际应用、年报文本信息含量及其影响因素进行细致讨论,为实现年报文本信息价值的挖掘和文本分析技术在会计领域中的推广应用提供理论基础和应用借鉴。

1.1.2 研究意义

随着近年来计算机自然语言处理技术和大数据技术的长足发展,理论界和实践界都意识到年报文本分析的必要性。但是,具体哪些计算机技术在财会领域更有普遍的应用前景;如何在财会领域使用自然语言处理技术;如何衔接新型自然语言处理技术和传统财会分析范式;文本信息可以从哪些角度展开分析;执业者、监管者和研究者如何理解文本分析的结果等问题都尚未得出明确的结论。本书将清晰地展现如何将计算机文本分析技术引入到财会领域的年报文本信息研究中,通过构建相关理论基础,并实证分析年报文本的影响因素、经济后果和扩展应用来尝试解答上述问题。具体来讲,本书的理论意义和实践意义分别如下:

1.理论意义

第一,拓展已有的财务信息披露理论,构建新的理论来解释和预测日益复杂的年报信息披露问题。在信息使用者越来越多元化的情况下,管理者会基于何种动机披露非财务信息,以及其会导致何种经济后果?已有的代理理论和信号理论难以提供完全合理的解释,因而迫切需要引入或创建新的理论模型用以指导研究和解决实践问题。通过引入组织话语理论、印象管理理论、专有成本和市场竞争理论等,本书为充实年报信息披露理论进行了探索,为今后的研究提供了借鉴思路。

第二,通过中文年报文本信息大样本分析,为已有信息披露的理论包括有效市场理论、信号传递理论、委托代理理论等,提供新的实证证据。计算机自然语言处理技术的革命性发展,推动了文本分析技术的应用。本书在当前英文文本研究成果的基础上,结合汉语语言学研究进展,从文本可读性、相似性、聚类等层面构建中文年报文本信息指标变量。这扩大了传统年报财务数据分析的范畴,有助于充分挖掘年报中非财务信息的价值。与此同时,通过将计算机领域的新技术应用到会计领域,本书研究中的文本信息提取与变量生成全部由计算机程序自动完成,与传统手工搜集和人工阅读打分方法相比,研究样本大幅增加,评价指标多元化,研究结果更加客观。

第三,融合财务信息和非财务信息的研究,为应用计算机文本分析法来对接和扩展原有财务信息研究体系提供参考。已有关于年报信息披露的研究一般将财务信息和非财务信息作为两类相对独立的信息披露(Schrand和Walther,2000;Li,2008;Huang et al.,2014)。但随着非财务信息披露的增加以及相关文本分析法的改进,从信息的内涵、影响机制和经济后果来看,财务数字信息和非财务文本信息之间的互补或替代关系将有望得到探讨。本书通过提出年报文本分析的研究框架,推动财务会计信息披露研究迈入到一个新的发展阶段。

2.实践意义

第一,对市场投资者而言,先前主要关注的年报信息是财务信息。但随着经济增长方式和公司经营模式的转变,财务信息的局限性突出,为了增强年报的决策有用性,非财务信息大幅度增长。当根据年报信息进行公司比较和选择投资决策时,非财务信息将逐渐产生重要影响。由于非财务信息涵盖范围广,难以被统一规范,这在某种程度上增加了市场投资者的信息处理成本。本书提供的文本分析法,将有助于投资者从文本信息的可读性、相似性、前瞻性等方面解读非财务信息,也可帮助市场参与者了解公司文本信息披露策略,提高决策的有效性。

第二,对公司管理者而言,年度报告是与外部利益相关者进行沟通的重要载体。财务信息由于受会计准则的约束而发挥空间有限。但在非财务信息方面,文本如何组织,管理者有相对的自由和灵活度。如果投资者对年报信息的解读会影响其对公司价值的判断,那么,公司就有必要在文本上下功夫,及时优化文本披露策略。本书的研究有助于管理者理解如何通过文字,使得阅读者进一步了解公司的产品、产业、行业、市场、人员、经营、战略,从而加深对公司的印象,增加对公司的兴趣,提高对公司的认同。

第三,对监管层而言,我国财务报告披露相关法规重点关注财务信息披露的全面性和透明度,对文本信息的关注较少。尽管《公开发行证券的公司信息披露内容与格式准则第2号——年度报告的内容与格式》多次提到鼓励非财务信息的披露,但这些非财务信息披露多以文本方式进行,管理者在披露时存在多种技巧。本书的研究提示监管者应加强对年报文本信息的关注,指导上市公司发布更加简明易懂的年度报告。 2MkqXEGCs7f0a/5w7jgJm6p06SL5eGcKC5vZR/goKp78j2PrcuacQofx9dv9VIzk



1.2 基本概念的界定

1.2.1 财务信息和非财务信息

一般而言,财务信息是指那些完全符合可定义性、可计量性、可靠性、相关性的,能够通过确认、计量、记录、报告程序进入财务报表的信息,以及报表附注中的解释说明和由财务报表扩展而来的信息。非财务信息是指与财务信息相对应的,不以货币为主要计量单位,与企业生产经营活动相关的,与利益相关人决策相关的信息。这种财务信息和非财务信息的界定与美国财务会计准则委员会(FASB)在《企业财务报表项目的确认和计量》中的观点,以及澳大利亚特许会计师协会(1997)在《报告非财务信息》中的定义相一致。

上市公司年报信息披露是以“受托责任”和“决策有用”为基础的。长期以来,上市公司在年报中应当充分披露高质量的财务信息已经成为共识。但财务信息由于受到会计确认、计量等因素制约,其主要面向过去,是对企业历史经营情况的反映,很多重要信息无法通过传统的财务报表予以披露,越来越难以满足投资者准确了解公司经营现状以及预测未来业绩的需求。同时,随着利益相关者理论的影响日益扩大,信息需求者的范围也不断增加,如员工更加关注福利待遇、职业培训、工作环境,政府更加关注环境保护、社会责任履行等信息。为增强年报的“决策有用”目标,增加非财务信息披露,已经得到了理论界和实务界的广泛认同。

从非财务信息的内容看,美国证监会发布的S-K规程最早详细规定了年报中必须提供的非财务信息,主要包括:①经营说明;②普通股的市场价格与红利;③管理部门的讨论与分析;④会计师的变更与分歧;⑤管理人员的薪金;⑥与有关方面的交易与关系;⑦收益的使用;⑧管理人员与董事们的报酬。但随着经济环境的发展和市场对重要信息的需求变化,上市公司对非财务信息的自愿披露内容也在发展变化中。Robb et al.(2001)在对美国、加拿大和澳大利亚的公司年报进行综合分析的基础上,将非财务信息划分为前瞻性的非财务信息和历史性的非财务信息,前者主要包括公司周围环境、战略和管理、公司发展趋势信息;后者主要包括公司环境信息、产品信息、顾客信息。2013年,为了解决实务中非财务信息披露标准缺失的问题,国际综合报告委员会(IIRC)发布《国际综合报告框架》提出了八大类非财务信息 。近年来,全球报告倡议组织(GRI)提出将非财务信息分为环境、社会与治理(Environment,Society and Government,ESG)三类。由此看出,因为上市公司披露的非财务信息是对信息需求者的回应,而企业的生产经营与社会经济发展是密切相关的,随着经济发展方式、企业经营模式或经营内容的转变,信息需求者的信息需求也在变化。时至今日,我国上市公司年报中披露的非财务信息主要包括:①背景信息。企业经营总体规划和战略目标,企业经营活动和资产的范围与内容,所处行业的特点,产品生命周期及产品结构。②经营业绩说明。经营活动指标、成本指标、关键经营业务指标、关键资源数量与质量指标。③管理部门的分析与讨论。企业财务状况、经营业绩变化的原因和未来的发展趋势。④前瞻性信息。企业面临的机会与风险,管理者的计划,影响的关键因素,将实际经营业绩与以前披露的机会与风险进行比较。⑤社会责任。环境责任指标,包括处理废水、废渣、废气的情况,对社会环境治理提供的服务,减少耗用稀有及不可再生资源的措施与效果;人力资源信息,如企业员工构成情况信息、员工安全和健康信息以及员工培训、员工福利和社会保障信息;企业经营对当地的影响,包括对带动地区经济发展的积极作用,为当地提供就业机会情况,对居民居住环境和社会稳定的影响。⑥核心竞争力及持续发展能力。研究与开发创新能力,员工能力,资源利用情况。

上市公司年报中这些多维度的非财务信息具有结构化财务数据难以体现的丰富内涵,为扩展财务会计研究提供了充足的资源。例如,反映公司治理、创新、竞争、风险、前瞻性等的非财务信息可以传递公司更多的状态。探究非财务信息披露的内在机制和经济后果,可以自然地融入和发展已有的财务会计研究。

但是目前非财务信息的披露大多还是处于自愿的状态,因此,实践中各公司披露的差异较大。为此,一系列关于非财务信息披露规则标准制定的工作正在进行中。正如Baker和Eccles(2018)在《FASB和IASB应该为非财务信息制定标准吗?》提出,如果没有监管机构提供的标准和报告要求,非财务信息将永远不会具有财务信息的质量、效用和合法性。近年来,美国可持续发展会计准则委员会(SASB)和国际综合报告委员会(IIRC)、全球报告倡议组织(GRI)一致努力在实现公司非财务信息报告的标准,并且要推动非财务信息在上市公司年报中实现与财务信息统一进行披露。在这一背景下,我国为维护资本市场的健康发展,优化市场资源配置效率,保护投资者及其他利益相关者的权益,对非财务信息的研究亟待加强。这包括非财务信息的披露方式、影响因素、经济后果,以及非财务信息与财务信息的关系等问题,相关研究将为我国监管层推动非财务信息披露规范提供重要参考。

1.2.2 年报文本信息内容

我国上市公司年报需要依据证监会《公开发行证券的公司信息披露内容与格式准则第2号——年度报告的内容与格式》中的规定进行披露。该准则的总则中指出“准则的规定是对公司年度报告信息披露的最低要求;对投资者投资决策有重大影响的信息,不论本准则是否有明确规定,公司均应当披露。鼓励公司结合自身特点,以简明易懂的方式披露对投资者特别是中小投资者决策有用的信息。”年报正文包含的内容分为十二节:重要提示、目录和释义;公司简介和主要财务指标;公司业务概要;经营情况讨论与分析;重要事项;股份变动及股东情况;优先股相关情况;董事、监事、高级管理人员和员工情况;公司治理;公司债券相关情况;财务报告;备查文件目录。许多公司实际披露的年报篇幅经常长达上百页,这其中不同的利益相关者的关注点存在差异。

按照信息的表达形式,上市公司年报的内容可分为数据信息和文本信息两部分。数据信息是指上市公司在年报中通过数字形式列示的各项主要经济指标。资产负债表、利润表、现金流量表中的所有项目都属于数据信息。财务报表是上市公司提供数据信息的主要载体。文本信息是指公司报告中除数据信息以外,其他所有以文字叙述为主要表达方式的信息(孙蔓莉和姚岳,2005)。文本信息以非财务信息为主,包括股东情况、治理结构、董事会报告、监事会报告、重要事项等,是公司对外报告的重要组成部分。如果按篇幅计算,非财务信息在公司报告中占主体地位。2009年的一项调查发现,2005年至2009年期间,非财务信息内容增加导致伦敦交易所上市公司的年报页数增加了41%。在一份典型的上市公司年报中,以文本表达的非财务信息的篇幅在80%左右(赵立新和黄燕铭,2013)。

就财务会计研究而言,经营情况讨论与分析,重要事项,董事、监事、高级管理人员和员工情况,公司治理构成年报非财务信息文本分析的重要对象。

首先,经营情况讨论与分析。这对应着美国上市公司年报10-K文件中的“管理层讨论与分析”(Management Discussion and Analysis,MD&A)。MD&A不但包括公司管理层对当前公司经营状况的阐述,还包括对公司未来的展望,因此,信息含量较高。我国上市公司年报在2002年首次引入管理层讨论与分析概念,在2016年将年报中的董事会报告正式更名为经营情况讨论与分析。这部分信息披露的内容从业务层面充分解释导致财务数据变动的根本原因及其反映的可能趋势;提供了许多关于公司经营情况的细节信息,例如研发投入、投资状况、生产经营环境变化;还包括了公司未来发展战略、下一年度的经营计划以及公司可能面临的风险。对这一部分信息进行解读,能够帮助阅读者理解上市公司运营状况,判断公司核心竞争力、预测上市公司未来的发展。

其次,重要事项。重要事项中所包括的内容应该是投资者特别予以关注的方面,这段文字可能埋藏着公司正常持续经营的“炸弹”。其中包括的重大诉讼、仲裁事项关乎公司业务和财务状况,是公司风险的重要来源;公司、公司董事及高级管理人员受监管部门处罚的情况,可以传递公司是否规范经营的重大信息;公司收购及出售资产、吸收合并事项的情况,可以让投资者理解上述事项对公司财务状况和经营成果的影响,更为清晰地认识公司的本来面目;重大关联交易事项可以提供公司社交网络的信息来源。在重大事项中,公司资产或项目存在盈利预测,且报告期仍处在盈利预测期间内,公司董事会、相关股东和负责持续督导的中介机构应当就资产或项目是否达到原盈利预测及其原因作出说明。这为前瞻性信息的文本分析提供了资源。同时,披露准则鼓励公司主动披露积极履行社会责任的工作情况,这成为分析社会责任的重要来源。

再次,董事、监事、高级管理人员和员工情况。董事、监事和高级管理人员的背景信息和报酬决策程序、报酬确定依据以及实际支付情况、母公司和主要子公司的员工情况,包括在职员工的数量、专业构成(如生产人员、销售人员、技术人员、财务人员、行政人员)、教育程度、员工薪酬政策、培训计划以及需公司承担费用的离退休职工人数,是年报阅读者了解公司人力资源信息的重要来源。特别是高管人员信息为分析高管激励、高管特征、团队能力等指标和公司绩效的关系提供了信息来源。

最后,公司治理。近二十年来,我国学术界对公司治理的研究日益深入,公司治理从一个研究问题演化成一个研究领域,并最终成为一个学科。公司治理结构是否规范;治理职能是否齐全;议事规则是否合理;人员是否胜任等指标的度量,充分应用了年报中的公司治理信息。随着内部控制基本规范的出台,公司治理信息披露要求公司内部控制存在重大缺陷的,应当披露具体情况,包括缺陷发生的时间、对缺陷的具体描述、缺陷对财务报告的潜在影响,已实施或拟实施的整改措施、整改时间、整改责任人及整改效果。这为内部控制领域的研究提供了详细信息。

1.2.3 文本分析和自然语言处理技术

围绕着各种非财务信息披露内容,大量密密麻麻的文字提高了阅读者的处理成本。为了挖掘年报中非财务信息的价值,年报披露准则多次提出要求“语言表述平实,清晰易懂,力戒空洞、模板化。”然而,具体文本表达难以进行统一规范,由此产生了文本偏差。这是指不同社会范畴个体运用语言及文字向他人传递信息时,语言与文字的特征表现出一定的差异。文本分析通过文本特征识别与变量构建来解决非财务信息的量化问题,一直被认为是挖掘年报中非财务信息价值的重要手段。

文本分析又可以称为文本知识发现,它是一个运用自然语言处理、数据挖掘和计算机技术,从半结构化或非结构化的文本中,提取文本信息,进而发现知识的过程(Ronen et al.,1995)。从基本技术上来讲,文本分析是个多学科交叉的研究领域,可将其视为数据挖掘的一个分支。数据挖掘中的统计知识、机器学习技术及可视化技术都可以被运用到文本分析中来。一般文本分析的过程首先是文本信息的预处理,主要是指量化方法的选择,信息的清洗,分类,特征标识等;然后建立索引与存储结构,形成中间表示层(聚类、趋势分析、关联规则发现等);最后是信息的分析,即知识发现和表示的过程(谌志群等,2005)。但文本分析与传统的数据挖掘相比较,最大的不同之处在于,数据挖掘处理的是结构化数据,如存储在数据库中的数据,而文本分析所处理的对象主要是不规则的,无法直接量化表达的文本。因此,相关研究面临着许多自然语言处理上的困难和挑战。

现有经济管理研究领域在运用计算机技术提取以下五种文本特征上取得较为一致的意见,这五种特征分别为:

(1)可读性。在最广泛的意义上,可读性是影响读者理解文本信息的所有元素的总和(Dale和Chall,1948)。根据Tekfi(1987)的经典定义,可读性是“确保给定的一段写作按照作者的意图来传达并影响其受众”。在计算机处理的文本分析中,可读性具体是指文本的复杂性或模糊性特征。SEC将文本复杂性定义为非简明语言的使用。可读性较差的文本会增加投资者处理信息的成本。

(2)相似性。这是指文本之间的相似度。与之相对应的概念是文本距离,指的是两个文本之间的距离。文本距离和文本相似性是负相关——距离小,“离得近”,相似度高;距离大,“离得远”,相似度低。在商业领域,通过文本相似度可以找到与主题信息相似度较高的信息。通过测量文本的重复或者距离,还可以衡量公司之间经营的同质性,进而测度竞争程度(Brown和Tucker,2011;Hoberg和Phillips,2016)。Li(2010)则认为文本的重复性披露可以增强投资者对其他非重复性文本信息的理解。

(3)前瞻性。这是指文本中包含与公司未来发展和业绩相关的信息。这些信息一般包含在管理层讨论和分析(MD&A)的段落中,比如,行业发展趋势、公司未来的发展战略、新年度的经营计划、未来资金来源及使用、未来可能的风险因素以及应对策略等。MD&A前瞻性信息对投资者有重要的战略指导意义,准确的前瞻性信息能直接帮助预测公司的未来发展趋势,为投资决策提供有效的指引。

(4)语调。文本语调分析又被称为文本情感分析、意见挖掘,是指对带有情感色彩的主观性文本进行采集、处理、分析、归纳和推理的过程。语调或情感是由乐观或悲观、正面或负面、积极或消极两种对立的感觉构成。中性语调或可视为第三种语调,因为大部分词句既不乐观也不悲观(Li,2010)。

(5)管理者特征。文本不仅可以对受众、环境和话题做出有效回应,还可以微妙地展现文本披露人的角色个性等特征(Rampton,1995)。这种特征体现主要基于自我服务偏差或归因心理,例如,在MD&A中存在管理者对年报业绩的自我服务归因偏差。文本中第一人称的使用频率,或者管理者在电话会议中的发言特征都经常被用来度量管理者特征(Li et al.,2009)。

相对中文而言,英文语句中单词之间存在空格,词与词之间有自然区分,采用词作为索引在英语语言处理技术上要比中文简单得多。中文文本挖掘受自身特点的限制,比英文处理难度更高。中国学者对中文文本挖掘也做了许多的研究,其中,中文分词技术的研究尤为重要。自20世纪80年代中文信息处理提出自动分词以来,中文文本分析取得了一些重要的研究成果(刘迁等,2006)。中文分词技术总结起来大致分为三类:

一是基于词典的分词方法。这也被称为“词袋法”,基本思想就是字符串匹配技术:确定一个匹配策略,将待处理文本段落中的词与“词袋”中的词条进行匹配,若在词典中找到某个词或短语,则匹配成功,即该词语被识别。该方法的优点是过程实现非常容易,但缺点是匹配速度慢,词典的创建和质量影响分词效果,也存在歧义切分等问题。

二是基于统计模型的分词方法。这种方法的基本思想是鉴于词是稳定的字的组合,因此,某文本集中一些字同时出现的次数越多,就越可能构成一个词(曹倩等,2004)。基于统计的分词方法依赖于一些统计模型的应用,主要的统计模型有互信息、神经网络模型、隐马尔科夫模型和“熵”模型等。这些统计模型主要是利用字与字的同时出现概率作为分词的依据。基于统计的分词优点明显,不受待处理文本的领域限制,无须建立适合该领域的专属字典。其缺点则是需要大量的文本进行训练学习,完善模型参数估计,分词精度受到训练文本数量和质量影响。

三是基于规则和理解的分词方法。这主要依赖人工智能技术的应用,进行中文的分词处理。该领域算法的分词过程是希望将人的思维方式模拟移植到机器之中,使机器像人一样思考,理解人的言语表达方式,从而自动识别文本中词的构成。该方法是理论上最理想的方法,也是最难实现的方法,由于该分词方法的研究处于起步阶段,并且由于汉语自然语言复杂灵活,因此,基于人工智能的分词技术仍然面临着巨大的挑战。 oj/7aHMwrO7sQIUuLYxpqs4We0RFFSgWBySOzVmXyOe2kPJ4wZmArvg7NLgMwgA6

点击中间区域
呼出菜单
上一章
目录
下一章
×