传统意义上的工业大数据主要来源于制造过程中的产品、物料、设备的工况参数和环境参数,随着物联网技术实现了万物互联,工业大数据的范畴扩展至产品全生命周期的各个阶段。按照我国发布的《工业大数据白皮书(2019)》中的定义,“工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所产生的各类数据及相关技术和应用的总称,工业大数据以产品数据为核心,极大延展了传统工业数据范围,同时还包括工业大数据相关技术和应用。”
工业大数据具有价值属性和产权属性。一方面,价值属性是指通过大数据分析技术,可以实现企业特定领域典型应用场景的知识挖掘,从而提升企业生产运营的智慧化水平,达到企业提质增效的目的,为企业创造可量化的价值;另一方面,工业大数据作为企业重要的核心资产,具有明确的权属关系和资产价值,企业可以自主支配数据的使用目的和使用方式,并采取有效机制对大数据进行组织管理。
一般来说,工业大数据的来源包括三类:一是来自企业资源计划(Enterprise Resource Planning,ERP)、产品生命周期管理(Product Lifecycle Management,PLM)、供应链管理(Supple Chain Management,SCM)、客户关系管理(Customer Relationship Management,CRM)等各类信息系统的与企业运营管理相关的业务数据;二是制造过程数据,来自生产系统中产品、物料和设备的工况参数和环境参数,这部分数据随着传感器采集速度的提升,体量增长极快;三是企业外部数据,来自供应商、销售商、产品用户等。
工业大数据虽然来自工业领域,但是仍具备一般大数据的五大特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实)。
(1)“数据规模大”。工业大数据的主体是来自生产系统的设备数据,这些数据以高频率、全天候地采集,其体量庞大。以风力发电机为例,正常状态下每秒产生500个左右的监测点数据。相比于其他行业领域,大部分工业设备全天候持续运行,时序数据需要长时间或永久留存,数据量可以达到PB或TB级别。
(2)“处理速度快”。工业大数据的处理对象往往是高精尖的大型复杂装备,从数据采集到数据处理,直至完成数据分析往往需要毫秒级的处理速度。特别是针对设备故障检测,需要瞬时预判故障症状,及时采取防范措施,因此需要更快速的数据处理速度。
(3)“数据多样化”。工业大数据的来源包括企业内部涉及多学科多专业的生产数据和业务数据,以及企业外部供应商和用户的互联网数据,数据来源丰富,类型多样,半结构化和非结构化数据占比逐渐增大,形成了丰富的数据资源。
(4)“价值密度低”。大部分工业大数据描述的是生产系统正常运行条件下的行为特征,这些数据只能用于一般统计过程和数据关联分析。企业往往需要运用大数据诊断生产瓶颈,预测机器故障及发现异常情况,这些则要求采集非正常生产条件下的数据资源,而这类数据较难获得,在大数据资源中的占比较少。因此总体上,大数据的价值密度低。
(5)“数据真实”。数据真实是工业大数据最基本的特征。工业大数据是通过传感器等采集手段从物理对象中获取的信息,表征了物理对象的真实特征和行为。在这个基础上,利用数据模拟物理对象并对其进行优化,是工业大数据的根本目的。数据的真实性是数据分析结果的可信性和可靠性的保障基础。
相比其他行业的大数据资源,工业大数据具有多模态、强关联、高通量的自生特点。
(1)“ 多模态 ”:相比于数据量的大小,工业大数据更加注重样本的全面性,即大数据应能反映工业系统在各种条件下的运行特征,尽可能地囊括各个生产要素并全方位地描述要素信息,缺失的信息会导致分析模型的不完整,进而造成分析结果的碎片化。全面的信息涉及工业系统的“光、机、电、液、气”多学科、多专业的领域数据,具有多维度、多类型、多结构的复杂性。在实际应用中,工业大数据的采集需要结合应用场景和分析目的,力求保证建模的完整性和分析的全面性。
(2)“ 强关联 ”:工业数据之间不是简单的字段关联,而是在多个学科支撑下的对物理实体及其所处环境在机理层面的关联,具有很强的因果性,即分析结果是可靠的并能够进行因果揭示。不同于互联网数据关注的是数据特征,工业大数据更加注重挖掘隐藏在数据背后的物理意义和机理逻辑。
(3)“ 高通量 ”:嵌入了传感器的智能互联产品使数据采集能力得到了质的飞跃,特别是物联网技术快速发展使生产设备的时序数据全天候持续不断产生,采集频率高,数据吞吐量大,数据体量极大。例如,单台风机的采样频率为50 Hz,按照2万台来计算,数据写入速度为4.5GB/s。
按照《工业大数据白皮书(2019)》的定义,工业大数据由三部分组成:生产经营相关业务数据、设备物联数据、外部数据。随着企业内部纵向之间、企业与企业之间、企业与用户之间的集成度的进一步加强,工业大数据的获取范畴逐步从企业内部延伸至人机物三元世界,数据类型也从以物联网数据为主体扩展到包含社会网数据、互联网数据、物联网数据的三大数据资源的并存。据此,重新对工业大数据进行梳理归纳,工业大数据由人(社会网)、机(互联网)、物(物联网)三种类型组成。
“人”的数据即社会网数据,社会网把人类真实社会活动映射到网络,形成了以微博、微信、QQ为手段的丰富的社交媒体网络信息,相对工业领域,这些信息包含产品使用者的评价信息、潜在用户的个性化需求、领域专家的相关经验知识等。
“机”的数据即互联网数据,这类数据包含互联网上与产品研发、制造、销售、售后服务相关的各类信息,具体有:供应商与销售商信息、企业用户信息、竞争企业信息、市场需求信息、多学科多专业技术知识、各级标准、相关政策、法律法规等。
“物”的数据即物联网数据,包含企业生产系统的物联网监测数据和来自企业各类信息系统的业务数据。相比其他数据组成,物联网监测数据的体量最为庞大,占据大数据总体规模的最大比重,担负着实现大数据价值的重担。由于是利用传感器采集数据,这部分数据的价值密度较低,隐藏的数据特征较难挖掘。
工业大数据对企业的持续优化和提升作用已经得到企业界的共识。如前所述,工业大数据的应用离不开工业领域的典型应用场景,其价值实现必须依托企业的实际需求和转型发展中的瓶颈问题。尽管不同行业特征和生产方式的应用存在差异,工业大数据的应用场景仍然可以归结为以下几方面。
随着产品制造全生命周期各个环节的大数据资源的实时获取成为可能,大数据分析技术的运用实现了这些数据在产品设计环节中的技术创新和模式创新。
提供了数字化设计手段。打破传统的离散化设计壁垒,将CAD、CAM、CAPP、PDM等传统的设计分析工具集成到一个统一的仿真分析环境中,通过数据的快速传播、共享和可追溯性,实现全流程的系统化设计。特别是通过数字孪生技术,建立了针对领域的CPS系统,在虚拟的三维空间里设计产品,利用仿真方法修改完善产品的设计参数和几何结构,同时可以完成产品可制造性的验证工作,大幅度缩短物理样机的制造时间,降低制造成本。例如,波音公司利用大数据优化设计模型,将机翼的风洞实验次数从2005年的11次缩减至2014年的1次。
实现了协同设计。当前,供应链全球化的生产组织方式愈发明显,传统的企业设计系统难以满足协同设计的时空要求。依托云平台,工业大数据可以实现大数据跨地域的流通和共享,构建面向全球网络化的快速协同的产品研制环境,数据在企业多站点可以共享,生成的新数据也可以瞬间传播到各个站点,实现协同设计的设计模式。例如,IBM运用大数据技术,使某全球航空制造商中的技师、工程师能够及时通过单一访问点查看位于不同应用系统中的信息,使访问时间缩短了三分之二。
在生产制造环节,工业大数据汇集设备、产品、物料、工艺、管理等生产现场数据,利用大数据的分析和挖掘功能,实现数据到知识的价值转化,支撑对生产系统的优化,提升企业的生产制造能力。
在生产工艺方面,采集生产工艺数据和设备运行工况,分析设备的性能参数,确定提升工艺性能的参数优化区间。阿里云整合ERP和MES数据、设备运行数据、手工运维数据,通过大数据分析,找出最为影响合格率和生产效率的关键因素以及相应的工艺参数推荐方案,从而帮助客户提升生产效率和合格率。在生产流程管理方面,采集生产过程数据、物料数据、生产计划、设备数据等信息,建立生产过程模拟仿真环境,通过建模分析,优化生产排程,衔接上下游生产工艺流程,减少了因生产工艺的不连贯和割裂造成的生产效率低下、资源浪费等现象。例如,在钢铁行业,通过大数据分析,可以实现冶炼、铸造、轧制的一体化排程,降低板坯热装和热送的能源消耗。
在产品质量管理方面,基于对产品质量数据和生产过程数据的关联性分析,识别影响产品质量的关键因素,通过对这些因素的在线监测和预测分析,实现产品质量的实时跟踪以及产品异常的捕捉和追溯。例如,生物制药生产过程极其复杂,药品产量会在50%~100%之间变动,某厂商对超过200种的变量进行监测,从中识别出9种影响产量的关键因素并进行跟踪,从而将产量提高了50%。
在能源管理方面,监测生产系统中的固液气等能源计量数据,发现能源消耗的异常情况,提出预警并给予及时处理;挖掘能源计量数据与生产工艺和设备工况参数的关联,通过优化工艺流程和设备运行参数降低能源消耗。例如,在氯碱生产中,烧碱浓度是电化厂烧碱产品的关键质量指标,为了保障产品的生产质量,电化厂生产出的烧碱浓度往往比产品规定高出0.2%~0.3%的冗余,而烧碱浓度的提升会造成电力、蒸汽等能源消耗的增加。为了减少该环节的能源消耗,运用大数据技术,获得电解槽设备的压力、温度、流量等关键工艺参数的最佳运行值,依据这些最佳值对电解槽运行进行优化调节和控制,使烧碱浓度控制在高出0.1%的水平,显著节约了电力和蒸汽资源,减少了电解废水量。
大数据时代打破了“信息孤岛”的信息不对称壁垒,实现了信息资源的全球化扩散与传播,对产品制造全生命周期数据的访问变得更加透明,加速了制造资源在全球不同地域的广泛互联及跨越产业边界的优化融合。在此环境下,企业的制造资源和制造能力不再具有独占性,可以作为共享资源被其他企业主体租赁使用,全球化制造资源基于互利共赢的目的聚合在一起,以智能协同与优化配置的组织方式最大化制造资源的价值体现。工业大数据作为连接桥梁,为企业构建了一个跨域集成、信息共享、业务整合的协同制造网络,提升了整个产业链各方制造资源的汇聚能力。网络化制造主要体现在制造资源共享和供应链优化方面。
制造资源共享方面,企业软硬件制造资源作为共享资源发布到大数据平台中。平台根据制造主体的订单需求和约束条件,完成生产能力评估与资源优化配置,实现制造资源在多站点的统一调度和协同运行。例如,上海海立作为空调压缩机生产企业,实施国际化产业布局,跨地域建立了5个世界级绿色工厂和7个技术服务中心,企业自主研制了面向全价值链的产供销协同平台,实现了跨区域的实时网络协同制造。
供应链优化方面,通过工业大数据的信息整合和知识挖掘,优化物流时空配送云资源,快速响应用户需求,降低供应链仓储、配送、销售成本。例如,某物流企业综合集成车辆高速通行动态数据、车辆定位跟踪数据、运输管理数据,运用大数据挖掘和分析,为物流企业提供车辆管理服务,降低了物流成本。
大数据技术与工业领域的融合催生了工业制造的新模态、新业态,企业不再仅仅是产品的提供者,制造业与服务业的跨界融合推动企业从“生产型制造”向“服务型制造”转变,制造业服务化进程加速,市场营销和售后服务赋予企业新的经济增长点。
市场营销的大数据应用加快了新产品销售模式的形成,推动了以工业品交易的即时性、交互性、无界性为特征的电商平台的大范围推广。例如,我国研制的“钢银钢铁现货交易平台”以专业的B2B操作流程,为钢厂、贸易商和终端客户提供网上交易、交易数据分析平台,通过交易平台实现大宗商品的挂牌、订单、撮合、竞卖、竞买、在线融资等多种交易处理方式。
在售后服务方面,大数据在设备远程运维领域发挥了重要作用。通过大数据技术,可以建立复杂设备的远程监测、在线诊断、及时维护的智能化服务,有效降低了传统的现场巡检和人工维护的管理成本,提高了售后服务水平。例如,宝钢公司研制的“EMC项目远程智能监控中心”,实现了跨地域节能设备的远程集中智能化监控,解决了目前EMC(合同能源管理)节能设备异地管理的工作量大、实时性差等问题,提升了EMC节能设备监控的可靠性、准确性和实时性水平。
工业大数据缩短了企业与用户之间的距离,实现了用户需求与产品制造全生命周期的无缝集成。通过对销售商、互联网上用户评价信息的收集和分析,可以及时捕捉用户深层次的个性化需求,并将需求及时反馈到产品设计环节。工业大数据优化重组了产业系统中人与人、人与组织、人与资源的交互模式和行为方式,能够快速准确发现客户需求,以低成本实现大规模定制化生产。例如,上汽集团零部件采购中心打造了“好途邦”汽车后市场互联网平台,通过整合零配件供应商,服务中心和客户通过网站可以查询配件并进行下单,打造了O2O的汽车专业维修服务体系。