产品寿命预测在很多年前就受到了科研人员和工程人员的关注,尤其是近年来,随着技术的进步,越来越多的长寿命产品广泛出现在各行各业中,更加激发了人们在寿命预测方法领域的研究热情。科学合理的维修策略对保证长寿命产品安全可靠地工作具有重要意义。传统的维修策略是基于定期维修原则制订的,规定产品使用到预先规定的时间,或在这个时间之前,必须将产品退出使用并对其进行检修 [2] 。定期维修策略因没有考虑产品真实的健康状态,而经常出现“该修的没有修,不该修的却要修”的问题 [3] 。对于一些健康状态较差的产品,其故障发生时刻很可能早于预先设定的维修时间,因此导致设备意外停机,造成重大经济损失;与之相反,对于一些性能较好的产品,到了维修时间还非常健康,造成浪费。为弥补上述缺点,美国科学家率先提出视情维修的概念,并取得了广泛应用 [4-6] 。与被动的定期维修不同,视情维修是一种主动的预防性维修策略,它立足于故障机理分析,借助传感器等监控装置时刻掌握产品的健康状态,预测产品故障发生的时刻,并基于此制订相应的维修计划。基于性能退化数据的可靠性评估与剩余寿命预测属于视情维修的研究范畴,近年来国内外学者对其展开了深入且广泛的研究 [7,8] 。
性能退化理论兴起于20世纪70年代,但发展初期并没有得到可靠性工程人员的过多关注。直到20世纪90年代,长寿命产品越来越多地出现在工程中,性能退化理论才逐渐受到重视并被大量应用到产品寿命预测中 [9] 。进入21世纪以来,工程人员对产品在线健康管理与视情维修越来越重视,性能退化理论也随之发展为剩余寿命预测与视情维修的理论基础。传统寿命评估方法是基于失效数据的,即通过寿命试验获得足够多的失效数据(也称寿命数据),然后通过一些常见分布(如指数分布、Weibull分布、对数正态分布等)模型或非参数分布模型拟合这些失效数据,从而实现可靠性评估和剩余寿命预测 [10-12] 。对于长寿命产品,在有限时间内通过寿命试验或者加速寿命试验往往难以获取到足够支撑寿命分布拟合的失效样本。相比而言,性能退化建模分析的对象是性能退化数据,可靠性试验无须做到产品失效也能获得足够多的退化数据,因此可以在一定程度上解决长寿命产品寿命预测时“少失效、零失效”的难题 [13] 。性能退化建模的对象是退化失效型产品。按照一定设计要求和工艺方案生产出来的产品,在规定条件下应该具备完成规定功能的能力。根据性能退化理论,产品能否完成上述规定功能可以通过其关键性能参数是否在规定范围内变动来判断。随着产品工作或存储时间的增加,其性能参数会逐渐发生趋势性变化(退化现象),产品失效等价于性能参数达到或超过规定阈值。性能参数在不同时刻的测量值称为退化数据,描述退化数据与时间之间函数关系的模型称为(性能)退化模型。即使在没有任何失效数据的情况下,借助退化模型同样可以推断出产品寿命分布。
根据产品关键性能参数数量的不同,性能退化模型可以分为一元退化模型和多元退化模型。目前,相关文献研究的多是一元退化模型,常见的包括失效物理模型、退化量分布模型、退化轨道模型及随机过程模型等 [14,15] 。
失效物理模型是指通过分析导致产品失效的内在物理、化学、电化学机理,以及产品失效与使用条件、环境应力等外部因素之间的内在联系,进而建立起来的退化模型。常见的失效物理模型有Paris累积损伤模型、反映论模型、随机斜率-截距模型等。1993年,Meeker等 [11] 最早采用Paris累积损伤模型对某种金属的一组裂缝增长数据进行退化建模,并基于该模型推导出该金属的寿命分布;Carey和Koenig [16] 利用反映论模型对海底电缆组件加速退化数据进行了退化建模;Gertsbackh和Kordonskiy [17] 对随机斜率-截距模型进行了研究,假设线性退化模型的斜率和截距均服从正态分布且相互独立,并基于上述假设推导出了一种新的寿命分布——Bernstein分布;Gebraeel等 [18] 将随机斜率模型用于刹车片厚度的退化建模中。
退化量分布模型考虑了退化过程本身的随机性。该模型假设在不同时刻,产品退化量自身或某些特征值服从同一分布族,且该分布族的参数为关于时间变量的函数,工程上最常采用的分布族有Weibull分布、正态分布等。邓爱民等 [19] 分别假设不同时刻退化量均值和样本标准差分别服从正态分布和Weibull分布,并基于此对某长寿命GaAs激光器进行了可靠性评估;Sun等 [20] 假设某电容器不同时刻的退化量均服从正态分布,且分布的期望和标准差均是时间的函数,并利用此模型对样本缩减的T型退化试验数据进行退化建模和可靠性评估;Huang等 [21] 假设不同时刻退化量服从截断Weibull分布,且Weibull分布的形状参数是关于时间的函数,并利用金属裂纹数据对该模型的有效性进行了验证;Sun等 [22] 在对某型号高功率自愈式金属脉冲电容器失效机理分析的基础上,提出了一种用于描述退化量分布的Gauss-Poisson联合分布模型,并将该模型用于电容器可靠性评估中。与传统的基于Weibull分布的退化量分布模型相比,Sun等 [22] 提出的Gauss-Poisson模型可靠性评估精度更高。退化量分布模型的优点是适用于不同样本退化轨道差异较大的场景 [23] ,缺点是对试验样本量有一定要求,不适用于小样本情形。
上述退化量分布模型属于典型的参数模型,在建模时需要知道退化量分布的具体形式。但是,在实际工程中,并非每个测量点都有足够多的退化数据,因此有时很难确定退化量分布的具体形式。针对上述参数模型的不足,一些学者尝试利用比例风险退化模型进行退化量分布非参数建模。传统比例风险模型的建模对象是寿命数据,通过该模型描述多元协变量对失效风险函数的累积效应。Eghbali [24] 在传统比例风险模型的基础上提出一种比例风险退化模型(Proportional Hazard Degradation Model,PHDM),该模型将研究对象从寿命数据的失效风险函数转化为退化量的失效风险函数,并将时间作为协变量,进而对多种类型应力组合下的加速退化数据进行退化量分布建模;Mohammed等 [25] 也对上述基于加速退化数据的比例风险退化模型进行了研究,与传统退化量分布模型相比,该方法适用于退化量分布规律未知的预测场景;钟强晖等 [26] 和Su等 [27] 在其研究中将上述基于加速退化数据的比例风险退化模型推广到非加速退化数据情形,只考虑时间这一单一协变量,建立其与退化量之间的比例风险模型,进而实现非加速应力下的退化建模与可靠性评估。
退化轨道模型直接从性能参数变化规律出发,假设不同样本的退化数据均服从某种形式的函数族,并利用不同样本退化模型参数的不同来刻画不同样本之间的差异性。常见的退化轨道函数有线性函数、指数函数、幂函数等。Lu和Meeker [28] 认为退化轨道模型的参数可以分为随机效应参数和固定效应参数两类,随机效应参数是服从某种分布的多维随机变量,用来描述个体之间的差异,固定效应参数对所有样本是相同的,用来描述产品总体退化特征;在Lu和Meeker工作的基础上,Oliveira等 [29] 以线性退化轨道为例,提出了三种寿命分布估计方法,即解析法、数值法和蒙特卡罗仿真方法;Freitas等 [30] 将退化轨道模型应用到火车轮的性能退化建模中,分别运用解析法和数值法得到了火车轮的寿命分布;Weaver等 [31] 利用线性退化轨道模型对产品寿命预测方法和费用-精度约束下的试验设计方法进行了详细阐述。
随机过程模型认为,产品在工作过程中面临包括自然环境变化、工况波动及内部材料异质等在内的多种随机因素,因此性能参数随时间的演变可以看作一种随机过程。利用随机过程进行退化建模时,通常假设性能参数在两时刻之间的变化量(也称退化增量)服从某种随机分布,常见的如正态分布、Gamma分布、逆高斯分布等,对应的随机过程分别为Wiener过程、Gamma过程和逆高斯过程。
Wiener过程是一种非单调连续随机过程,起源于描述花粉随机游走的布朗运动。基于Wiener过程推导出的寿命(随机过程首次达到失效阈值的时间,简称首达时)分布具有封闭的解析表达式。凭借上述良好的数学性质,Wiener过程被广泛应用于性能退化建模、可靠性评估和剩余寿命预测中。根据随机过程随时间的变化趋势不同,Wiener过程又可以分为线性Wiener过程和非线性Wiener过程。Peng和Tseng [32] 对线性漂移Wiener过程进行了研究,将其应用到线性退化型产品的退化建模中,并利用该退化模型推导出产品的寿命分布——逆高斯分布(Inverse Gaussian);赵建印等 [33] 利用线性漂移Wiener过程对金属化膜脉冲电容器在线退化数据进行建模,实现了电容器的在线可靠性评估;Wang [34] 对含随机效应的线性漂移Wiener过程进行了研究,假设漂移系数和扩散系数分别服从高斯分布和逆Gamma分布,利用EM算法得到模型参数极大似然估计值,并研究了基于bootstrap方法的寿命特征量区间估计方法;Li等 [35] 将含随机效应的线性漂移Wiener过程用于卫星动量轮退化建模与可靠性评估,其在模型参数估计时同样采用了EM算法;针对非线性退化过程,Whitmore [36] 通过对时间尺度进行变换,将变换后的模型转换为线性漂移Wiener过程,从而实现非线性退化型产品退化建模与可靠性评估;Pak等 [37] 则提出了另外一种思路,首先对原始退化数据进行适当变换(如对数变换),经过变换的退化数据呈现出线性退化趋势,然后使用线性漂移Wiener过程对变换后的退化数据进行建模;Wang等 [38] 在Whitmore模型的基础上,提出了一种广义Wiener过程退化模型,该模型可以对具有线性规律和多种类型非线性规律的退化数据进行建模,扩展了传统Wiener过程的使用范围。上述研究都只适用于具有单一规律的退化过程,Feng等 [39] 则针对工程中经常出现的多阶段退化现象,提出了一种基于Wiener过程的多阶段退化建模方法,假设产品性能参数在不同退化阶段可以用参数不同的Wiener过程描述,最后将其模型应用到高能电容器可靠性评估中。
Wiener过程是一种典型的非单调退化过程。工程中,一些产品性能参数退化是严格单调的(如金属裂纹的增长),此时用Gamma过程对其进行建模更为合适 [40] 。Gamma过程是一种严格单调非减随机过程,广泛应用于退化建模、可靠性评估和维修决策中。Yuan [41] 利用Gamma过程对核电站中某些元器件进行了退化建模和可靠性评估;Noortwijk [42] 和Tan等 [43] 分别对Gamma过程在产品维修决策中的应用进行了研究和总结;Tsai等 [44] 对随机过程退化建模中的模型误用问题进行了研究,利用Wiener过程对一组实际服从Gamma过程的退化数据进行建模,并分析了Gamma过程参数变化时模型误用对平均寿命估计精度的影响;Wang等 [45] 针对产品退化过程中存在明显拐点的情形,提出了一种多阶段退化建模方法,在拐点前后分别用Gamma过程和Wiener过程对退化数据进行建模,最后利用所建模型实现了产品在线可靠性评估;Ye等 [46] 还在上述研究的基础上对含随机效应的Gamma过程参数估计方法进行了研究。
逆高斯分布本来是一种基于线性漂移Wiener过程推导出的寿命分布类型,但因其具有非负增量、可叠加性等良好的数据性质,近年来有学者利用其对退化数据增量进行建模,并在其基础上提出一种新的随机过程——逆高斯过程 [47] 。Wang等 [48] 对基于逆高斯过程的性能退化建模方法进行了研究,利用EM算法和bootstrap方法分别得到模型参数的点估计和区间估计,最后通过激光器退化数据对模型的有效性进行了验证;Peng等 [49] 考虑产品个体间的不一致性,建立了三种具有不同随机效应参数的逆高斯随机过程模型,给出了模型参数的贝叶斯估计方法和产品在线可靠性评估方法,并通过仿真案例分析了可靠性评估结果对先验信息和样本数量的敏感性;Ye等 [50] 对基于逆高斯过程退化模型的常应力加速退化试验设计方法进行了研究,将最小化分位点寿命渐进方差作为优化目标,给出优化后的应力水平选择方案和各应力水平下的样本分配方案。更多关于逆高斯过程退化建模、可靠性评估与剩余寿命预测的系统性研究成果可参考文献[51]。
上述传统退化建模方法研究的多是恒定应力下的退化过程,或者虽然产品工作应力非恒定,但建模时可以忽略应力变化给退化过程带来的影响。事实上,大多数产品的性能退化过程会受到温度、湿度、电压、负载、使用频次等诸多应力变量中一种或几种的影响。因此,当外界应力非恒定时,有必要在退化建模时考虑应力变化给退化过程带来的影响。工程上认为,应力变化给退化过程造成的最主要影响是会改变性能参数退化速率。例如,为了缩短试验时间,提高经济效益,人们在开展可靠性试验时常会提高应力水平以加速产品退化 [52,53] ,也称加速退化试验。加速退化试验中常见的应力剖面有恒定应力、步进应力、序进应力、周期应力等。目前,针对恒定应力 [37,54] 和步进应力 [55,57] 的加速退化建模方法较多,而针对序进应力 [58] 和周期应力的加速退化建模方法研究较少。
除在实验室条件下开展可靠性试验获取性能退化数据外,产品在现场工作条件下的性能参数监测数据(若有监测条件)同样是性能退化建模的重要信息来源。在现场条件下,受自然环境、工作负载等外界因素影响,产品实际经历的应力条件通常是复杂且随时间变化的,这与实验室条件下的确定性应力施加方式(如恒定应力、步进应力、序进应力等)又存在一定区别 [59] 。目前,针对复杂时变应力剖面的退化建模与可靠性评估方法相对少见。
对于多元退化型产品,其任何一个性能参数超出失效阈值都会导致产品失效。与一元退化建模相比,多元退化建模往往更为困难。Huang等 [60] 假设各性能参数之间相互独立,对每个性能参数分别进行退化建模,最后通过串联模型得到产品整体的可靠性模型;Sari等 [61] 考虑多个性能参数之间的相关性,首先用线性回归模型对每个性能参数进行退化建模,然后通过Copula函数将各性能参数的边际分布联系起来,得到产品的联合退化模型;Pan等 [62] 对二元非线性退化过程进行了研究,首先用带时间变换的线性Wiener过程分别对两个性能参数进行退化建模,然后通过Copula函数将各性能参数退化增量边际分布联系起来,最终实现产品的可靠性评估;Hao等 [63] 在Pan等工作的基础上,进一步考虑了模型参数中存在随机效应的情形,利用随机效应描述个体之间的不一致性;Pan等 [64] 针对单调性变化二元退化过程,提出了一种二元Gamma过程退化模型,经过近似处理,推导出二维Birnbaum-Saunders分布及其边际分布,并利用该分布逼近产品真实寿命分布;Pan等 [65] 还对两个部件组成的串联和并联系统可靠性评估方法进行了研究,假设每个部件的退化过程都可以用一元Gamma过程进行描述,且认为两个Gamma过程之间具有相关性,并利用马尔可夫链蒙特卡罗方法(Markov Chain Monte Carlo,MCMC)解决参数估计问题;在上述模型的基础上,Pan和Sun [66] 还研究了二元退化过程下步进应力加速退化试验设计优化问题;潘正强 [67] 将其关于多元退化建模的多年研究成果总结在博士论文中,主要内容涉及二元退化过程可靠性评估方法及试验设计方法,并将相应方法扩展到了多元退化情形;Whitmore等 [68] 从隐变量的角度研究二元退化问题,认为导致产品失效的关键性能参数是无法直接观测到的,但其与可观测的某些显变量之间存在一定的相关性,并通过二元Wiener过程对隐变量和显变量分别进行建模,最后推导出了产品的寿命分布。
剩余寿命预测一直以来是PHM领域研究的热点方向,其研究对象是现场条件下处于工作状态的个体产品。过去受限于落后的数据采集、传输技术,剩余寿命预测研究多以实验室获取的数据为基础建立预测模型,然后直接将该模型应用到外场工作产品上。与稳定可控的实验室环境相比,很多产品实际工作过程中面临的自然环境、工况负载是不断变化的,这些因素可能通过多种方式改变产品性能退化规律,影响其剩余寿命。例如,锂离子电池容量衰减过程由环境温度、负载电流等因素共同决定;风力发电机涡轮故障间隔时间受到风速、转速等的影响。上述因素不仅在不同产品个体间存在差异,即使是同一个体,在其全寿命周期中也不是一成不变的。近年来,随着传感器、物联网、云存储等技术的发展,很多产品工作期间具备实时采集、监测现场数据的条件。“万物互联”为获取产品现场大数据提供了可能,同时也对剩余寿命预测方法提出了新的要求。此外,一些产品全寿命周期中多个反映其健康状态的性能参数均随着工作或存储时间延长而不断退化,共同决定产品的失效时间和给定时刻的剩余寿命,相比单参数退化过程,其剩余寿命预测会更加复杂。
Si等 [69] 对产品剩余寿命预测方法进行了综述,将其分为失效物理方法、人工智能方法和统计数据驱动方法三类。其中,失效物理方法需要对产品潜在失效机理有深入的理解,并在其基础上建立动力学模型,对大部分产品而言,上述过程需要大量的时间和经济投入,实施起来较为困难。人工智能方法是一种利用机器学习预测剩余寿命的方法,通过训练建立输入(观测量)和输出(剩余寿命)之间的“黑箱”映射模型,常见的有神经网络、高斯过程、支持向量机等模型,以及上述模型的混合优化方法等。这类方法的预测精度依赖大量有标记的训练样本,对长寿命、高可靠这类缺少足够失效数据的产品并不友好。相比而言,统计数据驱动的剩余寿命预测方法实施起来相对容易,工程上应用得也最为广泛。统计数据又分为失效数据和退化数据,目前统计数据驱动的剩余寿命预测方法主要是基于退化数据开展的。早期,人们只关注产品的失效数据,并试图直接通过产品总体寿命分布推导出任意给定时刻的剩余寿命分布。例如,文献[70]在对激光发射器和陀螺仪进行剩余寿命预测时就用到了上述方法。但是,该方法得到的结果描述的是这一类产品总体的剩余寿命分布规律,而没有考虑个体产品之间可能存在的差异。近年来,统计数据驱动的剩余寿命预测方法更倾向于通过融合总体历史信息与个体现场退化数据来实施在线剩余寿命预测 [71] 。该方法在实施过程中首先需要对产品性能参数进行退化建模,然后结合现场退化数据对模型参数进行实时更新,最后利用更新后的退化模型预测产品剩余寿命。国内外文献中几种常见的统计数据驱动的剩余寿命预测方法包括基于回归模型的剩余寿命预测方法、基于随机过程的剩余寿命预测方法、基于马尔可夫模型的剩余寿命预测方法、基于比例风险模型的剩余寿命预测方法等。
常见回归模型形式有线性模型、指数模型、幂函数模型、多项式模型等。基于回归模型的剩余寿命预测方法在工程上应用非常广泛。利用该方法进行剩余寿命预测时,通常需要假设回归模型的一些参数为随机效应参数,即这些参数是服从某种分布的随机变量,产品在工作过程中,通过实时采集性能参数数据可以不断更新这些参数的分布,进而实现精确追踪性能参数变化趋势和准确预测剩余寿命的目的。Gebraeel等 [72] 利用线性回归模型对产品剩余寿命预测方法进行了研究,通过贝叶斯公式实时模型随机效应参数分布更新,从而将产品历史信息与现场采集的退化数据联系起来,并由此分别推导出高斯噪声误差和布朗运动误差下的剩余寿命分布;Gebraeel等在之前工作的基础上,又分别对性能参数服从指数退化规律 [73] 及缺少先验信息 [18] 时的产品剩余寿命预测方法进行了探讨;此外,Chakraborty等 [74] 和Elwany等 [75] 也分别对基于回归模型的产品剩余寿命预测问题进行了系统性研究。
近年来,基于随机过程的剩余寿命预测方法得到国内外学者广泛关注,预测时最常用的随机过程是Wiener过程和Gamma过程。1.2.1.1节提到,线性漂移Wiener过程因首达时分布具有解析表达式这一良好数学性质,被广泛应用于退化建模和可靠性评估中。与基于回归模型的剩余寿命预测思路类似,利用Wiener过程进行剩余寿命预测时也需要将模型参数分为随机效应参数和固定效应参数。Si等 [76] 使用线性漂移Wiener过程描述产品性能参数退化规律,当获取到现场退化数据后,通过贝叶斯公式和EM算法实时更新随机效应参数分布,最后推导得到剩余寿命分布解析表达式;Si等 [77] 还对基于非线性漂移Wiener过程的剩余寿命预测方法进行了研究,结果表明考虑退化过程中的非线性可以显著提高剩余寿命预测精度;Wang等 [78] 提出了一种基于广义Wiener过程的剩余寿命预测方法,通过强追踪滤波算法更新模型参数,并推导出剩余寿命分布解析表达式,该方法适用性较强,针对线性、非线性退化过程都具有较高的预测精度;Tang等 [79] 利用考虑测量误差的线性漂移Wiener过程对锂离子电池开展剩余寿命预测,将容量作为关键性能参数进行退化建模,对比了三种模型初始参数估计方法——极大似然估计、贝叶斯估计和EM算法,最后利用贝叶斯公式实时更新模型参数。上述提到的剩余寿命预测方法存在一个共同点,即在离线阶段对退化模型初始参数进行估计时,用到的历史信息都是同类型产品退化数据。工程上,历史信息除了退化数据,还可能包括很多同类型产品的寿命数据。彭宝华等 [80] 针对以历史信息为寿命数据的情形,利用线性漂移Wiener过程对产品进行退化建模和剩余寿命预测,并利用EM算法开展退化模型初始参数估计。相比Wiener过程,Gamma过程因其模型形式较为复杂,在剩余寿命预测中应用相对偏少,典型的应用有:张英波等 [81] 研究了基于Gamma过程的直升机主减速器行星架剩余寿命预测方法;Lawless等 [40] 将退化协变量引入Gamma过程退化模型,并基于该模型对产品剩余寿命预测问题进行了研究。
无论是回归模型还是随机过程模型,利用其对产品进行剩余寿命预测时都存在一个共同的关键步骤,即结合历史先验信息和现场退化数据推导模型随机效应参数后验分布。当退化模型形式简单(如线性回归模型、线性漂移Wiener过程模型)且随机效应参数先验分布取特定形式(如共轭先验分布)时,可以通过贝叶斯公式推导出具有解析形式的后验分布。但是,对于一些退化模型复杂、随机效应参数较多、参数先验分布形式复杂(或未知)的情形,利用贝叶斯公式很难推导出随机效应参数后验分布解析表达式。当然,利用MCMC方法可以给出上述情形下随机效应参数后验分布的数值解,但工程上更普遍的做法是使用粒子滤波方法序贯更新随机效应参数分布。粒子滤波方法的基本思想是用一定数量的随机样本(粒子)来描述概率分布,然后在现场数据的基础上,通过调节各粒子权重的大小来近似估算后验概率分布。原则上,粒子滤波方法可用于任意非线性、非高斯随机系统的状态估计(模型参数也可以看作系统状态之一,因此可以认为参数更新是一种特殊的状态估计) [82,83] 。在运用粒子滤波方法进行剩余寿命预测时,模型参数、性能参数都可以看作系统状态,通过建立合理的状态转移模型,可以序贯地得到退化模型参数和关键性能参数后验分布,进而结合失效阈值实现剩余寿命预测。例如,Xing等 [84] 提出了用一种复杂组合模型对锂离子电池进行容量退化建模和剩余寿命预测,并利用粒子滤波方法实现模型参数更新;Marine等 [85] 在粒子滤波框架下,提出了一种用于PEM燃料电池剩余寿命在线预测的方法;Li等 [86] 针对粒子滤波算法中粒子多样性随更新次数增加逐渐贫化的问题,提出了一种突变粒子滤波方法,并将其应用到电池状态评估与剩余寿命预测中;Enrico等 [87] 利用粒子滤波方法对非线性退化型产品的剩余寿命预测方法进行了研究,并将其成功应用到金属裂纹增长预测中;Jin等 [88] 使用带测量误差的线性漂移Wiener过程对卫星锂离子电池容量数据进行退化建模,首先利用剖面极大似然估计方法离线估计模型初始参数,然后利用粒子滤波方法在线更新模型参数,最后实现电池剩余寿命预测;Dawn等 [89] 给出粒子滤波框架下基于回归模型估计产品剩余寿命分布的Matlab算法代码,并分别以锂离子电池容量退化和金属裂纹扩展为例验证了其算法的有效性。
马尔可夫模型属于一种无记忆模型,在利用其进行剩余寿命预测时,通常将退化过程离散成有限的状态空间 ϕ ={0,1,2,…, N },并假设表征产品健康水平的状态变量在状态空间中不断转移,其中0对应初始状态, N 对应失效状态,产品未来的状态只与当前状态有关(无记忆性)。文献[90,91]对利用马尔可夫模型进行退化建模时的首达时分布进行了研究,并基于首达时分布研究了产品在线更换与维修策略制订问题。Kharoufeh等 [92,93] 在马尔可夫模型假设的基础上,对产品可靠性评估和剩余寿命预测等问题进行了一系列研究;Giorgio等 [94] 在利用马尔可夫模型进行退化建模时,认为两种状态之间的转移概率不但与当前状态有关,还与系统的老化程度有关。
比例风险模型是统计学中一种常见的生存模型,其通过线性回归方程将协变量与产品失效率联系起来,因此可以较容易地描述不同协变量对产品寿命的影响 [95] 。目前,一些研究人员将比例风险模型应用到产品剩余寿命预测中,并取得了较好的效果。Vlok等 [96] 利用比例风险模型对轴承的剩余寿命进行了预测,并在此基础上对轴承预防性维修策略进行了研究;Sun等 [97] 在比例风险模型的基础上提出了一种比例协变量模型,利用加速寿命试验数据和现场监测数据进行寿命建模,并基于现场监测数据实现模型的在线更新,最后将该方法用于某机械系统的剩余寿命预测中;李小波等 [98] 对基于比例风险模型的装备剩余寿命预测问题进行了研究,并以发动机上的某类轴承为例,将剩余寿命预测结果应用到了产品维修决策中。
除上述经典方法外,一些学者还针对较复杂情形下的剩余寿命预测问题进行了研究。Wang [99] 对两阶段退化过程中的剩余寿命预测方法进行了研究,并利用第二阶段的退化数据更新模型参数,进而实现了产品剩余寿命预测;Son等 [100] 提出了一种含拐点退化过程的联合预测模型,他们认为拐点出现会增加产品的失效概率,并基于此对产品剩余寿命预测方法进行了研究;Chen等 [101] 和Lin [102] 也分别对含拐点退化过程的剩余寿命预测问题进行了研究;Wang等 [103] 对考虑维修影响时的剩余寿命预测问题进行了研究,其利用Wiener过程描述产品性能退化,并假设每次维修会造成性能参数一定程度的恢复,且恢复值是服从某种分布的随机变量;Wang等 [104] 对退化与冲击竞争失效情形下的产品剩余寿命预测问题进行了研究;Cheng等 [105] 提出了一种较新的锂离子电池剩余寿命预测方法,利用函数性主成分分析方法建立容量退化模型,基于贝叶斯公式实现模型在线更新,并通过仿真方法实现剩余寿命预测,该模型跟踪能力较强,能在监测到性能参数退化轨道发生突变后很快地调整模型参数。
上述剩余寿命预测方法大多是基于部件级产品的,一些学者还研究了系统级产品的剩余寿命预测方法。系统级产品剩余寿命预测主要分为两部分:一是构成系统的各部件的剩余寿命预测;二是构成系统的各部件之间的关系建模。例如,Van等 [106] 就系统级产品剩余寿命预测方法及维修策略制订等问题进行了研究,并取得了一定成果。
退化模型在线更新是剩余寿命预测区别于可靠性评估的主要地方。由于工艺、材质、环境等因素的随机性,同批次产品不同个体工作期间退化规律会有所差异。为描述这种差异,Lu和Meeker [28] 将退化模型参数分为固定效应参数和随机效应参数,前者为常量,刻画同类产品的共性特征;后者为随机变量,描述不同个体间的差异性。剩余寿命预测的关键步骤是在贝叶斯理论框架下更新随机效应参数后验分布,使退化模型逼近个体真实退化规律。常用的更新方法有解析法、MCMC法、贝叶斯滤波法等。解析法需根据退化数据似然函数选择合适的共轭先验分布,在该假设下随机效应参数先验、后验分布均存在解析形式,故可直接推导后验分布解析表达式,计算效率很高,如Gebraeel [73] 、Si等 [76] 在其研究中常采用该思路。但是,常见的共轭分布族较少,并不总能找到,故解析法有一定局限性。当退化模型复杂或随机效应参数维数较高导致后验分布不存在解析表达式时,可借助MCMC(马尔可夫链蒙特卡罗)法近似计算后验分布 [107,108] 。但是,MCMC法作为一种数值算法,计算效率低、耗时长,不适用于对时效性要求高的在线预测场景。滤波法最初用于运动状态追踪,近年来很多学者用其解决剩余寿命预测中的退化模型更新问题。在实施时,一般将模型参数看作状态量,将退化数据看作观测量,通过建立状态方程和观测方程实现状态量递推更新。例如,Wang等 [109] 、Duong等 [110] 利用卡尔曼滤波(Kalman Filtering,KF)及其扩展方法,Wang等 [78] 、Si等 [111] 利用强跟踪滤波(Strong Tracking Filtering,STF),Jin等 [88] 、Wei等 [112] 利用粒子滤波(Particle Filtering,PF)开展剩余寿命预测研究。其中,粒子滤波方法对先验分布、噪声类型均无特别要求,应用范围较广,是近年来剩余寿命预测研究的热点方向,但其在应用中也存在粒子退化、贫化等瓶颈问题。
剩余寿命预测的最终目的是结合失效阈值推断失效时间分布,得到剩余寿命概率密度函数,进而计算其期望值、分位点值及置信区间等指标。上述指标可为产品在线健康管理、视情维修等管理活动提供优化模型的条件输入。估计剩余寿命分布,首选计算效率最高的解析推导法。例如,Wiener过程首达时定义的剩余寿命服从逆高斯分布或其扩展形式 [113] 。但由于涉及随机效应参数积分,很多复杂退化模型对应的剩余寿命分布无法得到解析表达式,此时一般借助蒙特卡罗仿真技术进行数值求解 [114,115] 。
剩余寿命预测的主要对象是在线工作产品。产品在实际工作过程中,所经历的应力往往是随时间不断变化的,这与理想的实验室环境有很大差别。目前大部分关于剩余寿命预测的研究均假设产品在理想环境下工作,而没有考虑应力变化可能对性能退化规律造成的影响,这往往导致剩余寿命预测结果与真实值存在一定偏差。因此,时变环境或应力下的剩余寿命预测是工程上一个亟待解决的难题。例如,Khelif等 [116] 在研究锂离子电池剩余寿命预测时提出,传统剩余寿命预测方法无法描述工作条件变化对产品性能的影响,因此在很多情况下都难以直接将其应用到工程实践中;Zhang等 [117] 在其关于剩余寿命预测的综述性文章中提出,个体退化规律出现不一致性的因素主要有个体差异、自然环境变化和工作负载变化三点,其中后两者都可以归结为时变应力问题。
研究发现,剩余寿命预测相关文献在介绍产品工作环境时经常提到“恶劣”“动态”“复杂”“随机”等修饰词,但真正建模预测时往往较少考虑上述情况。原因在于,开展动态环境下剩余寿命预测,需要在退化建模和在线更新阶段考虑环境变动影响,并在预测阶段考虑未来环境状态变化规律,难度大大增加。传统解决思路是将环境因素看作协变量,利用比例风险模型(也称Cox回归模型)建立协变量与寿命分布之间的关系 [118] 。但该方法需要大量不同环境状态下的失效样本,且无法有效利用性能退化信息。在性能退化框架下,Gebraeel等 [119] 利用随机效应回归模型对时变环境下工作的产品进行剩余寿命预测,并假设多个环境因素对随机效应参数的影响是可以线性叠加的。Bian等 [120] 研究了动态环境下的剩余寿命预测问题,在线性加速方程假设下给出退化模型参数在线更新公式。Mosallam等 [121] 考虑了不同温度和电流对锂离子电池剩余寿命的影响,利用K近邻算法和高斯过程回归实现电池剩余寿命预测,该方法与传统方法相比预测精度大大提高;You等 [122] 提出了两种时变应力下的退化模型参数更新方法,对环境状态做了离散化处理,以进一步降低参数更新的难度,并分别基于线性回归模型和指数回归模型实现产品剩余寿命预测,但剩余寿命预测阶段仍假设未来环境应力为某个恒定值。Liu等[114]利用解析推导和蒙特卡罗仿真分别给出未来恒定应力和时变应力两种剖面下的剩余寿命分布估计方法,并结合锂离子电池实例对方法有效性进行了验证。此外,一些学者还对现场环境变化规律进行了建模,并在此基础上开展剩余寿命预测研究。例如,Kharoufeh等 [123] 在对产品进行寿命预测和剩余寿命预测时,将环境变化看作一种有限空间里的马尔可夫过程,并假设性能参数退化率是与该过程状态相关的随机变量;Flory等 [124] 、Tang等 [125] 用马尔可夫过程描述环境状态随时间变化的规律,对环境状态进行离散化处理得到状态转移矩阵,并开展剩余寿命预测研究。Si等 [126] 研究了工作状态切换下的剩余存储寿命预测问题,假设设备在存储状态下性能退化缓慢,切换至服役状态后性能退化明显加快,并利用连续时间马尔可夫链对切换时间进行建模。需要指出的是,上述研究大多只考虑了环境变化对产品性能参数退化速率的影响,但实际情况可能更加复杂。例如,Bian等 [127] 、Li等 [128] 还分别研究了环境状态变动会同时引起退化速率变化和性能参数突变时的剩余寿命预测问题。
上述剩余寿命预测方法适用于只有单个性能参数的产品。当产品存在多个性能参数时,尤其是当多个性能参数间存在相关性时,会给剩余寿命预测增加很多困难。有些学者在进行多参数退化型产品剩余寿命预测时,首先分别对每个性能参数进行剩余寿命预测,然后利用串联模型得到产品整体的剩余寿命分布,但这种方法要求各性能参数之间相互独立。目前,针对多个性能参数相关情形下的剩余寿命预测方法研究还比较少。Wang等 [129] 对双参数退化型产品剩余寿命预测方法进行了研究,首先用带时间变换的Wiener过程分别对每个性能参数进行退化建模,然后用Copula函数将两个性能参数退化增量边际分布联合起来以描述其相关性,在获取到现场数据后,通过强追踪滤波方法更新模型参数,并最终推导出产品剩余寿命分布;在上述工作的基础上,Wang等 [130] 又对存在测量误差情形下的双参数退化型产品剩余寿命预测方法进行了探讨;张建勋等 [131] 研究了基于Copula函数的多元退化型产品剩余寿命预测问题,提出了一种方差时变的正态随机过程,用于对每个性能参数单独退化建模,利用现场数据分别更新每个退化模型的参数,并推导出相应的剩余寿命分布,最后利用Copula函数将各剩余寿命分布联合起来实现产品整体剩余寿命预测。