购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.2 基于故障机理的可靠性方法

基于数据统计和分析的传统元器件可靠性方法主要通过元器件“降额”的机理来提高可靠性,通过元器件的基本失效率和应力因子估计系统可靠性。但随着元器件技术的快速进步,越来越多的元器件失效机理被发现,元器件失效并不是随机的,都有原因可找,因此现代元器件可靠性的工程方法已经产生巨大的改变,该方法称为基于故障机理(PoF,Physics of Failure)的可靠性方法,它是基于大量的元器件可靠性工程实践得出的。

PoF是自然世界因果关系的一种具体体现,任何一个元器件的失效必然存在一个导致失效的关键因素,如果排除这个导致失效的关键因素,则此因素导致失效的结果就不会发生。在不断地排除导致元器件失效的因素的过程中,元器件的可靠性会不断提升,最终确保单板可靠性达到预期。

PoF是一种逆向工程方法,即从问题中改进产品可靠性。工程师需要从失败积累的经验中形成设计规则,在设计前端去约束产品设计。这些设计经验从何而来,学习借鉴是主要来源,当无可借鉴时,就需要通过高加速寿命试验(HALT,Highly Accelerated Life Testing)先制造出问题,再分析问题产生的原因,进而积累和优化设计规则。

PoF改变了元器件可靠性的一些传统工作方法,加强了对元器件失效机理的研究,通过对元器件失效机理的研究,可以识别影响元器件可靠性的关键要素。对元器件可靠性的要求可以转换为具体的可量化规格和可管理的要求。

在单板的设计中,单板的设计需求(包括可靠性)需要分解到元器件中,但在设计实践中,很多时候是:有什么元器件设计什么电路,对元器件的关键规格没有明确定义;一旦设计定型,产品量产,再进行元器件替代将变得异常困难。作者曾经在实际工作中遇到这样一个问题:一颗90nm工艺的Flash元器件在升级到45nm工艺后不能稳定地工作,在极端情况下出现数据读写错误;经过分析发现,原因为90nm工艺的元器件对地址线的上升沿和下降沿“过冲”不敏感,但升级到45nm后,元器件接口处理速度变快,“过冲”破坏了Flash的数据寻址。类似这样的高级元器件不能替代低级元器件的问题是对元器件应用需求不明确导致的。

PoF解决元器件问题的过程,类似于图2.3所示的PDCA循环,其目的是通过相关措施的落地防止元器件可靠性问题的再次发生。但在实际工作过程中,问题的原因非常复杂,元器件失效或烧毁后,在大多数情况下不能确定元器件失效的根本原因,依据对失效元器件的物理解剖分析,也许能发现是过电应力失效,至于是元器件缺陷在正常应力下失效,还是因为外部存在应力超过元器件承受极限导致失效,物理分析很难给出真实的结论。需要多个PDCA循环,才能确定问题的根因。一般情况下,一个受控型号的元器件多次失效的根因只有一个,一个PDCA循环可以依据原因分析确定几个根因,并确定后续验证措施和相应的工作计划,通过试验验证,检查失效根因的唯一性,依据根因将改进措施落实到相关环节。

图2.3 元器件失效分析的PDCA循环

元器件供应商依据PDCA循环原理制定了8D报告模式,但8D报告模式和PDCA主要用于管理的规范,失效根因分析机理阐述往往不是很全面,技术深度也相对不足,对失效分析和可靠性提升往往帮助不大。

从提高单板可靠性角度,首先需要选择可靠的元器件,其次是依据元器件的可靠性特点应用好元器件,因此本章中关于元器件可靠性保障的内容主要围绕选择可靠的元器件和可靠地使用元器件来开展,包括为掌握这些技能必须掌握的元器件失效模式和失效机理。 SHVf3gHht45fvC20Fxi0j8bJhiq88oZHGJtVyd5Ghc6hb6RwzKbhcs5nIu4lJZQm

点击中间区域
呼出菜单
上一章
目录
下一章
×