购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3 工业大数据分析的关键技术

2.3.1 模型和算法

工业大数据分析中常用的算法有以下5类。

(1)通用的统计与机器学习算法:通过丰富的通用分析算法库,支持更多“公民数据分析师”参与统计分析建模。

(2)针对特定数据类型的机器学习算法:针对传感器数据的时序分析算法、针对日志等文本数据的工业知识图谱算法。

(3)针对特定领域的算法:设备故障诊断算法(包括旋转设备、往复式设备、静设备、电气设备等)、压力容器的缺陷识别算法等。将经验模型、机理模型与统计学习模型融合,以支持严重不均衡数据样本的建模。

(4)运筹优化算法:在底层机制清晰的前提下,优化系统的整体性能。

(5)专家规则:提供常用的时序模式算子,提高专家知识形式化效率。

2.3.2 分析项目管理方法与工程化

经典的CRISP-DM(Cross-Industry Standard Process for Data Mining)方法论对明确的数据分析问题的实施流程进行了规范。但是,在实际项目中,很多时候数据分析问题的需求并不明确,需要用方法论来支撑分析问题的识别与选择。另外,还需要考虑如何融合分析模型与当前业务流程,形成业务闭环。

在工业大数据分析中,通常需要融入大量专家经验和业务规则。专家规则的抽取和专家经验的沉淀与复用都需要业务规则建模方法论的指导。

2.3.3 数据分析软件与平台

工业大数据分析平台提供面向分析优化的数据存储组件、可视化分析建模组件、分析模型执行引擎组件、分析算法库与知识库组件、数据可视化组件、分析模型服务化组件、安全组件、工业互联网平台集成接口等一系列工业大数据分析专业工具产业化和推广所需的技术组件。

平台应该支持敏捷的迭代开发过程,包括本地分析程序(Python、R、Matlab等)的低代码重用与并行化。受时效性和数据传输带宽的限制,很多训练好的模型需要运行在端侧,因此,平台应该支持模型的发布与部署。 Ryk9hpLFWjCru2lxPVPejtm14bvr7JCP361SclO2Z8j7Y+TRss6pnUv2X6v7Qc8z

点击中间区域
呼出菜单
上一章
目录
下一章
×