数字化浪潮席卷全球,很多工业企业也在尝试通过数字化技术的深度应用,推动研发、生产、服务、运营、决策等关键环节的数字化转型。但工业行业大多机理复杂,其进程仍不及数字化亲和度更高的服务业。在工业数字化推进中,大家也一直在思考,工业数字化的本质是什么?工业大数据带来了什么新的能力?工业大数据如何推进更有效率?
从社会生产力要素这一宏观层面看,“数据分析”是一种生产工具的本质一直没有变。只不过,不同时期,生产力水平不同,核心生产力要素不同,对数据分析的业务需求不同,再加上数据的供给成本和水平不同,使得数据分析的落地途径与价值也不同。在工业1.0时代,生产活动与能源/动力供给是紧密绑定的。随着电气化革命(工业2.0),电力能源供应与动力装置可以相对解耦,但工业技术仍是生产力的关键要素,这时候数据采集成本也高,少量的数据分析集中在关键工业技术的研发与验证上。工业3.0阶段实现了社会的充分分工,跨组织协作变得更加重要,管理信息化是提高生产效率的重要手段之一,另外,很多人工操作环节也成了效率或质量的瓶颈,自动化手段是解决这些问题的重要手段之一。这个时期的数据分析大多集中在协作效率提升上。在工业4.0阶段,生产制造能力很多时候不再是瓶颈。复杂产品的定制化能力与创新速度成为核心竞争能力,生态链协同和响应速度变得很重要,但生态链涉及的因素更加复杂动态,基于人工的传统决策模式不再有效,从而决策效率与质量也变成了数据分析支撑的重点,将隐性知识显性化(可检验、可继承、可发展),通过人工智能等适应能力更好的技术,不断扩展认知的边缘,提高决策能力。
从思维范式的中观层面,从工业2.0到工业4.0,数据分析技术还是发生了根本性的变化。从领域知识驱动的假设检验的逻辑思维(第一性原理范式)和基于数据统计的实证思维,发展到基于统计归纳的数据思维,以及与机理/仿真模型结合的构造思维(或称为计算思维)。工业系统是精心设计的、能够长期稳定运行的系统,工业大数据分析中的样本不均衡问题更加严重。在工业领域,先验知识不再局限于概率关系(联合、条件概率),还有大量体系化的因果关系(设计机理、运行机制、运营逻辑等)和很多非系统化的经验知识(以领域专家为载体)。这些特点决定了工业领域的数据平台与分析技术和服务业领域不同。
无论在服务领域还是工业领域,数据都是对自然现象和社会现象的不完备刻画,这也从根本上决定了数据技术的适用范围。但在具体项目实施中,决策要素和决策逻辑对应的数据对象很难描述完备,数据中蕴含的规律也没有先验知识,工业大数据的不确定性比信息化项目要高得多。工业大数据的维度通常很高,且跨越多个领域,这也进一步增加了工业大数据项目的复杂度。工业大数据的处理链条通常比较长,再加上大数据量、高采集速度、多样性等特点,分析模型从技术原型变成日常生产力常常需要业务应用的开发,这些因素造成了工业数字化项目落地周期很长。一个分析应用投入生产后,也要面临复杂运维的需求,这对工业企业和服务商的协作模式提出了新的要求。在多年的数据分析实践中,笔者一直在思考一个问题:是否存在一些工业大数据工程化方法与技术,让工业数字化过程更加顺畅有效?
本书的写作目的是为工业大数据工程实施提供一些参考。全书共10章,第1章讨论了工业大数据的内涵与特点,并给出了工业大数据工程的三个要素,即数据资源、数据分析和数据应用;第2~4章提出了领域模型驱动的数据资源的建模技术,并给出了工业大数据系统技术与建设方法;第5、6章讨论了敏捷工业大数据分析与运维方法,并阐述了背后的分析软件技术;第7章讨论了用户驱动数据应用的低代码开发技术;第8~10章用风电、水电、煤矿综采三个行业,展示了工业大数据工程方法的应用过程。
本书的第1、5、6章由田春华编写;第2、3章由张硕主笔,2.4节由李令莱编写,2.1.2节、2.1.4节由田春华编写,3.1.2节、3.1.4节由徐地编写;第4章由徐地编写;第7章由胡志勇、张浩编写,7.1.1节、7.1.2节由胡志勇和张浩编写,7.4节、7.5节由张浩编写,其余部分均由胡志勇编写;第8章由蒋伟、孙忠诚编写;第9章由刘少波、张弋扬、肖剑等编写;第10章由孙忠诚、张幸福、李国威等编写,10.3节引用了曾聿赟的工作成果。全书由牛莉、陆薇、田春华等审校。
本书是对工业大数据工程的一些初步探讨。鉴于精力与篇幅限制,很多行业实践内容没有详细展开;再加上笔者才疏学浅,行业实践有限,有些提法和表达尚欠推敲;书中难免有疏漏、错误之处。望广大读者不吝赐教,日后有机会加以勘正。
为了方便读者阅读,部分图片可扫二维码查阅。
田春华
2023年10月于北京