从多价值链的角度来看,一个典型制造企业的经营活动,除了研发设计、生产制造、供应链管理外,还包括营销、安装、维修、回收等服务性质的活动,这些活动构成了产业增值链条。制造业多价值链数据是指在制造业领域中,围绕典型智能制造模式,生产链、供应链、服务链、营销链中产生的各类数据及相关技术和应用的总称,包括CAD数据、BOM数据、电子邮件等结构化和非结构化数据。以产品数据为核心,拓展了传统制造业数据的范围,同时还包括制造业数据相关技术和应用。
当前数据管理面临的挑战如下:
1)数据量大且类型多样,全生命周期产生大量多源异构数据,企业无法有效管理数据导致管理成本上升,大部分数据价值流失。
2)数据关联关系复杂,制造业数据的关联关系具有应用价值,也是制造业数据管理的特别之处。包含关系(每个实体中都有一个或多个文件),组合关系(每个实体组合起来形成一个完整的结构),顺序关系(生命周期中产生的不同文件之间的时序关系)。
3)系统复杂,实时性要求高。制造业数据规模巨大,结构复杂多样,类型多源异构,价值稀疏,对其的处理面临计算复杂、实时性要求高、持续性强等特点,对大数据处理系统的运行效率以及系统性能提出了严苛的要求,给实时数据采集和快速数据分析提出了巨大挑战。
4)疏于安全管理,导致商业机密泄露。大数据给信息安全带来的挑战主要体现在:大量数据的集中存储增加了其泄露的安全;复杂的数据存储在一起,可能造成企业数据安全管理不合规;大数据被应用到攻击手段中。
5)多源信息共享困难。由于数据来源多样,结构不易,具有不同的格式与标准,有生产链数据,也有营销链数据等非结构化或者半结构化的数据。各企业之间信息系统相互独立,同时,由于信息源、设备生产商不同等众多因素导致数据格式千差万别,致使信息集成贯通难以实现。
数据空间是指与主体相关的数据及其关系的集合。主体的相关性和可控性是数据空间中数据项的基本属性。主体的相关性是指数据空间所管理的是与特定主体相关的信息,而这些信息可以出现在不同的时间,存放在不同的位置,也可以采用不同的格式表示;主体的可控性是指主体的通过各种操作或服务来控制和管理数据空间中数据项。
与传统数据库相比,数据空间的数据管理技术能较快地处理多源异构数据,具有数据空间动态变化、数据模型数据优先、模式在后、多源数据分布式存储、数据集成不改变数据原有格式、数据空间自我演化等特点,主要对比见表2-1。
表2-1 数据空间与传统数据库的对比