近年来,全球工业大数据的发展规模不断增加。据统计,至2017年全球工业大数据的市场规模达到了201亿美元,占全球大数据总规模的50%以上。2018年我国工业大数据市场规模约为292亿元,较上年同比增长41.3%,增速较快。近年来,我国工业大数据的发展步伐明显加快,在全球市场中呈不断增长趋势。
由于行业特点和“两化”基础参差不齐,企业的大数据应用存在较大差异。特别是“两化”基础较好的大型企业具备实施工业大数据的良好基础,成为大数据应用的领军者,大数据应用比例明显高于其他中小微企业,其应用层次更加注重企业新模态、新业态的创新发展,聚焦企业整体核心竞争力的持续培育和升级。而中小微企业由于受到自身条件的约束,大数据应用仍停留在关键工艺环节的性能优化和生产力提升上。
据统计,工业大数据的当前应用主要集中于设备管理服务、生产过程管控与企业运营管理三大应用场景,占比分别达到38%、28%和18%。工业大数据在智能化设计和制造资源优化配置领域得到初步应用,占比分别为13%和2%,仍需加大发展力度。国外工业大数据应用更加侧重于设备管理服务,占比接近50%,其中设备健康管理应用占比39%,产品后服务占比10%,生产过程管控的大数据应用也是发展重点,占比24%。
经过多年发展,我国工业大数据已经初步形成一个较为完整的产业链。在数据采集、整理、传输、存储、分析、呈现和应用方面,出现了一批专精特新的工业大数据产业型企业,包括:①传统企业在向数字化、软件化、平台化发展过程中,形成一批具有较强数据集聚能力从而具有数据资产的衍生型企业;②软件企业向工业领域渗透,形成一批在大数据处理与分析领域具有自主核心技术的技术型企业;③互联网企业针对工业企业应用需求,形成一批提供工业大数据平台产品及服务的平台型企业。
不可否认,工业大数据已经成为增强我国工业制造转型发展的新动能,并且在智能化设计、智能化生产、网络化协同制造、智能化服务和个性化定制等领域成为新技术、新业态和新模式的核心要素。然而,随着全球化制造业格局的重新布局和企业内外部制造环境复杂性的日益加剧,工业大数据的应用面临诸多挑战。
随着新一代信息技术与制造业相互融合的深度与广度的不断加剧,以智能制造为代表的各种新型制造模式相继出现,从而推动生产要素在人(人力资源)、机(虚拟信息系统)、物(生产物理系统)三元世界形成更加密切的合作与协同关系。在此背景下,工业大数据的来源更加复杂多样,多样性、多模态、高通量和强关联等特性进一步增强,对工业大数据的一体化管理提出了挑战。
总体上,我国工业企业的数据资源存量普遍不大,66%的企业数据总量都在20TB以下,还不到一个省级电信运营商日增数据量的1/10。此外,数据的价值密度普遍较低,有价值的数据非常稀缺,工业系统对数据有精准控制和高可靠性要求,大部分数据是在系统正常工作条件下采集到的,而具有利用价值的包含系统故障情形下的“坏”样本数据较难获得,还有一些工业场景要求捕获故障/异常瞬间的细微状况,才能还原和分析故障发生原因,这对数据采集、监测、存储提出了较高的要求。
工业大数据跨域跨界的流通性是保证数据资源价值体现的重要基础。而目前,工业大数据的多源异构性使企业所收集到的数据资源较为独立和分散,尤其在企业横向的不同信息系统之间以及纵向的信息系统与操作系统之间普遍存在明显的数据壁垒,形成了众多的数据孤岛,严重影响了大数据资源在整个产业链的流通性,进而限制了工业大数据应用的深度和广度。
工业领域追求确定性的分析结果,对数据分析的可靠性要求高,因而对数据质量的要求也就更高,低质量的数据会给企业带来10%~20%的损失。从信息化程度较高的金融、电信、互联网等行业的经验来看,开展数据资产管理是确保数据质量的必要手段。而调查结果显示,我国只有不到1/3的工业企业开展了数据治理,51%的企业仍在使用文档或更原始的方式进行数据管理。
工业大数据在给企业带来巨大经济利益的同时,其本身所存在的安全问题也让企业面临着巨大的风险。近年来,工业数据平台被曝出的漏洞日益增多,尤其是工业控制系统内的安全漏洞层出不穷,且大量集中在装备制造、交通、能源等重要领域,严重威胁国家信息基础设施安全。从全球发展趋势来看,工业互联网和工业数据日益成为黑客攻击的重点目标,包括克莱斯勒、福特、特斯拉等全球100家汽车企业的超过4 7000个机密文件遭遇外泄。
工业大数据分析应用还普遍处于浅层阶段。40%的应用集中在产品或设备数据的检测、诊断与预测性分析领域,而在涉及数据范围更广、分析复杂度更高的经营管理优化和资源匹配协同等场景中,现有数据分析能力还无法满足应用要求,需要进一步提高数据分析技术创新能力提升工业大数据对企业整体生态系统的价值创造水平。
随着智能制造发展战略下各类新型制造模式的不断涌现,人机物协同优化成为现代制造创新发展的重要特征。围绕人机物三元世界的互融互通,工业大数据资源中的各类数据相互交织、复杂关联,多源、多维、多模态的特征凸显,需要从语义层面进行融合和统一,保证各类数据资源在产品全生命周期中各个环节的互融互通,该环节是深化大数据应用,获得数据最大化价值体现的重要基础。
德国工业4.0计划已经把数据流通作为重点议题,在构建工业数据空间(industrial data space)方面进行模式上的探索。区块链技术为工业大数据跨域流通、开放共享、分布式存储、安全访问提供了解决方案。区块链具有可信任性、安全性和不可篡改性,可打破数据孤岛,促进工业数据在不同地理空间的跨域流通;区块链点对点(P2P)的链接结构以及基于全网共识的相互验证实现了数据可信的分布式存储;基于区块链的数据脱敏技术能保证数据私密性,实现隐私保护下的数据开放共享;区块链技术可以通过多签名私钥、加密、安全多方计算确保数据的安全性。
工业是一个强机理、高知识密度的技术领域。除了大数据资源隐含的有待深度挖掘的行业知识,通常还包括大量的机理模型和专家经验的深厚积累,有效融合这些来源不同、类型各异的知识资源,提升工业大数据能级水平,需要借助工业知识图谱技术的赋能作用。工业知识图谱可以高质量地屏蔽行业数据模型在语义层面的异质性,构建特定领域的行业级、企业级知识图谱,可以为大数据分析应用提供更加灵活的基于图搜索技术的语义查询模型,极大降低大数据开发应用成本。
工业大数据平台是工业大数据技术的有效载体,直接关系到企业大数据的实施成效。当前,工业领域特别是信息化基础较为薄弱的中小微企业,普遍缺乏可用、好用、可信的工业大数据平台,难以充分利用全产业链上下游的数据,以实现人、机、物等各类工业要素、业务流程以及产业链上下游企业间更大范围的网络链接与智能交互。为应对人工智能技术的快速发展,工业大数据平台应朝着知识化、灵活化、持续优化的方向迭代升级,有机融入现有的知识、经验与分析资产,模块化系统资源,灵活配置系统应用,消除技术门槛对工业大数据应用发展造成的障碍。
工业大数据安全是跨工业领域与多学科的综合性问题,需要结合法律法规、行业特点、工业技术等多维度进行研究。在工业大数据接入安全、平台安全、应用安全等不同层次,加强工业大数据安全保障体系建设,推进大数据安全技术与产品研发、完善相关法律法规和制度体系成为当务之急。