“用数据说话”是商务人士经常挂在嘴边的一句话。大千世界,每天都在产生巨量数据,每个人都在使用各种各样的数据,数据已经构成了一项重要的资源。
万物皆可被记录。数据是人们用来描述客观事物的可鉴别的符号,可以是数字、文字、声音和图像。
描述对象的过程就是将对象抽象为一个个属性,如描述某人,通常用身高、体重、性别等属性。属性是可以被度量的,如身高“180”、性别“男”。描述属性的过程就是量化的过程,也是建模的基础。
经过加工对客观世界产生影响的数据称为信息。信息是一种经过选摘、分析、综合的数据。例如,企业日常发生的购销存业务数据、生产数据等经过加工整理形成会计账簿和财务报表后就成为能够影响管理层、投资人和债权人的会计信息。
知识是人类在实践中认识客观世界包括人类自身的成果,是人类从各种途径中获得的经过总结与凝练的系统认识。知识包括事实、信息的描述,以及在教育和实践中获得的经验和技能。
智慧是生命所具有的高级创造思维能力,包含对自然与人文的感知、记忆、理解、分析、判断、升华等所有能力。在我们的日常生活中,智慧体现为更好地解决问题的能力。
以上四者之间,数据是对客观事实的忠实记录,信息为人们提供了认识问题本质的观测角度,知识助力我们寻求解决问题的不同途径,智慧让我们具有解决问题的综合能力。四者的关系总结如图1-1所示。
图1-1 数据、信息、知识与智慧
希望通过这门课程的学习,大家拥有数据获取和处理的基本能力,积累数据可视化分析的实战经验,提升发现问题—确定方法—解决问题的综合能力。
大数据(Big Data)也称巨量数据,是指其数据规模巨大到无法通过人工或常规工具在合理时间内完成捕获、管理和处理的数据集合。
国务院2015年印发的《促进大数据发展行动纲要》中指出:大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合。
大数据的四个基本特征可以用4V来表述:数据体量大(Volume)、数据种类多(Variety)、处理速度快(Velocity)、商业价值高(Value)。
财务数据是对在企业生产经营过程中涉及价值变动的部分进行记录、计算、汇总而产生的数据,主要包括财务账簿、财务报表,以及企业的各项指标分析数据。
企业经营受到国际形势、国家宏观政策和经济环境的影响,要严格遵守相关政策、法律法规,还要考虑同业竞争以及供应链企业、自身资源的限制。传统的分析方法和分析工具不足以支撑对海量数据的获取,更不能按照决策者的信息需求对数据进行深入挖掘和深度分析,导致传统的财务数据仅是对企业经营状况的反映。
财务大数据是利用大数据技术,不仅从企业内部管理信息系统中获取企业经营数据,还从各种数据库、政府网站、上下游合作伙伴、Web上获取外部数据而形成的海量数据集。
常见财务数据来源如表1-1所示。
表1-1 常见财务数据来源
另外,还有以网页新闻、论坛发言、发帖、评论等形式存在的碎片化信息。