工业企业数据的分类维度有很多种,目前业内还没有特别通用的标准,通常可以按照数据对象划分,也可以按照数据结构来划分,还可以按照数据库类型来划分,等等。下面介绍的是常见的4种分类方式。
1. 按照数据对象划分
按照数据对象,工业企业数据可以被分成如下5类。
(1)参考数据。
参考数据是指对其他数据进行分类和规范的数据,如国家、地区、货币、计量单位等产业通用的数据及各产业特色基础配置数据。为了简化,有的企业称这类数据为配置型主数据,也有的企业称这类数据为通用基础类数据。它是相对稳定、静态的数据,基本上不会变化,往往通过系统配置文件给予规范并固化在信息管理系统中。
(2)主数据。
主数据是指满足跨部门业务协同需要的、反映核心业务实体状态属性的基础信息。
主数据是用来描述企业核心业务实体的数据,是企业核心业务对象、交易业务的执行主体,是在整个价值链上被重复或共享应用于多个业务流程、跨越多个业务部门和系统、高价值的基础数据,也是各业务应用和各系统之间进行数据交互的基础。从业务角度看,主数据是相对固定、变化缓慢的,但它是企业信息系统的神经中枢,是业务运行和决策分析的基础,如供应商、客户、企业组织机构和员工、产品、客户、供应商、物料等主数据(见《数据资产管理实践白皮书(4.0版)》)。
(3)业务活动数据。
业务活动数据(又称交易数据)是指在业务活动过程中产生的数据,是企业日常经营活动的直接体现,也是围绕主数据实体产生的业务行为和结果型数据,如采购订单、销售订单、发票、会计凭证等数据。业务活动数据存在于联机事务处理系统中(OLTP系统),具有瞬间生成和动态的特点。
(4)分析数据。
分析数据(又称统计数据、报表数据或指标数据等)是组织在经营分析过程中衡量某一个目标或事物的数据,一般由指标名称、时间和数值等组成。
(5)时序数据。
时序数据是指时间序列数据。它是按时间顺序记录的数据列,在同一个数据列中的各个数据必须是同口径的,要求具有可比性。在工业企业中,实时数据是时序数据的一种,如设备运行监测类数据、安全类监测数据、环境监测类数据。
2. 按照数据的存储形式划分
按照数据的存储形式,工业企业数据可以被分为结构化数据、非结构化数据、半结构化数据(下面的名词解释来自《管理科学技术名词》)。
(1)结构化数据。
结构化数据是指数据元素之间具有统一且确定关系的数据。它由明确定义的数据类型组成。结构化数据的一般特点是数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。结构化数据的分析更为便利,且存在成熟的分析工具。
(2)非结构化数据。
非结构化数据是指数据元素之间没有统一和确定关系的数据。它是具有内部结构,但不通过预定义的数据模型或模式进行结构化的数据,如各种格式的图片、视频等。非结构化数据占企业全部数据的80%以上,但直接分析非结构化数据得有很强的专业性。
(3)半结构化数据。
半结构化数据是指数据元素之间的关系介于结构化数据和非结构数据之间的数据。它是非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、E-mail等。
3. 按照数据库的类型划分
按照数据库的类型,工业企业数据可以被分为关系型数据库、非关系型数据库、图数据库、时序数据库。
(1)关系型数据库。
关系型数据库是采用关系数据模型的数据库系统。关系数据模型实际上是表示各类实体及其之间联系的由行和列构成的二维表结构。一个关系数据数据库由多个二维表组成。表中的每一行为一个元组(或称一个记录),每一列为一个属性。属性的取值范围被称为域。对关系型数据库进行操作通常采用结构化查询语言(SQL)(见《管理学大辞典》)。
(2)非关系型数据库。
非关系型数据库是对不同于传统的关系数据库的数据库管理系统的统称。和关系型数据库相比,两者存在许多显著的不同点,其中最重要的是非关系型数据库使用NoSQL而不使用SQL作为查询语言。其数据存储可以不需要固定的表格模式,也经常会避免使用SQL的JOIN操作,一般有水平可扩展性的特征(来自维基百科)。
(3)图数据库。
图数据库是以图结构来表示和存储信息的数据库(见《计算机科学技术名词》)。
(4)时序数据库。
时序数据库是指时间序列数据。它是按时间顺序记录的数据列,在同一个数据列中的各个数据必须是同口径的,要求具有可比性。时序数据可以是时期数,也可以是时点数。
4. 按照权属类型划分
按照权属类型,工业企业数据可分为私有数据和公有数据。
(1)私有数据。
私有数据是指有明确归属的数据,归属方为可决定数据使用目的的自然人、法人或其他组织。如私人数据、企业数据等。
(2)公有数据。
公有数据指具有公共财产属性且可被公众访问的数据,如天气数据、人口数据等。