尽早找出故障原因,对可靠性增长并达到规定的可靠性要求有重要的作用,故障原因发现得越早就越容易采取有效的纠正措施。因此,要求尽早建立FRACAS是非常重要的。FRACAS的运行应尽可能利用现有的信息系统。
FRACAS的效果取决于准确的输入信息(即记录的故障以及故障的原因分析),因此,要求进行故障核实,必要时,要故障复现。输入信息应包括与故障有关的所有信息,以便正确地确定故障的原因,故障原因分析可采用试验、分解、实验室失效分析等方法进行。 FRACAS确定的故障原因还可证明FMECA的正确性。
做好有关故障报告、故障分析及纠正措施的记录,并按产品的类别加以归纳,经归纳的信息可为类似产品的故障原因分析和纠正措施提供借鉴的信息。
从最低层次的元件以及以上各层次,直至最终产品(含硬件和软件),在试验、测试、检验、调试及使用过程中出现的硬件故障、异常和软件失效、缺陷等均应纳入FRACAS闭环管理。采取的纠正措施应能证明其有效并防止类似故障重复出现。对所有的故障件应作明显标记以便于识别和控制,确保按要求进行处置。
订购方在合同中规定对承制方FRACAS的要求,同时还应明确承制方提供信息的内容、格式及时机等。
建立故障报告、分析和纠正措施系统的目的、实施要点及注意事项如表2-7。
表2-7建立故障报告、分析和纠正措施系统
(续表)
术语如下:
故障报告、分析、纠正措施系统(FRACAS):通过及时报告产品发生的故障,分析故障原因,并采取有效的纠正措施,以防止故障再现,实现可靠性增长的一种管理系统。
纠正:为消除已发现的不合格所采取的措施。
纠正措施:为消除已发现的不合格或其他不期望情况的原因所采取的措施。
FRACAS运行分为故障发现及报告、故障分析及定位、确定纠正及纠正措施、实施纠正及纠正措施、纠正措施有效性验证、故障闭环等工作阶段。 FRACAS工作流程如图2-2所示。
图2-2 FRACAS工作流程
1)故障报告
产品在调试、联试、试验和使用过程中出现故障(含失效)时,由故障发现者于24小时内发起FRACAS。
2)故障核实
根据报告的故障情况,产品质量师进行故障核实,外场发生的故障由专人核实后报告质量师,必要时将故障信息通报用户,用户或其代表在用户栏中确认。
3)故障审理
故障审理组织主要由产品设计师系统或不合格产品审理组织成员组成。在上述人员无法得出审理结论时,由产品质量师负责报首席专家参加审理。
故障审理要求如下:
1)故障审理组织成员根据故障识别、定位情况,对故障进行必要的分析,确定故障原因,提出纠正、纠正措施建议,关键件、重要件发生故障及影响最终产品质量的故障,产品总(副总)设计师参加审理,分析确定故障原因,提出纠正措施建议。
2)对在FRACAS运行过程中发现的非偶发的重复故障,应实施质量问题归零。
3)采取纠正和纠正措施
采取纠正和纠正措施要求如下:
a)根据故障原因,确定是否存在或可能发生类似的故障,评价是否需要采取纠正措施,避免其再次发生或者在其他场合发生。需要采取纠正措施时,故障审理组织成员提出纠正和纠正措施建议及要求;
b)责任单位根据纠正和纠正措施建议和要求,制订具体纠正方法或纠正措施并实施;
c)对于批次性的采购、外包产品问题,审理人员要明确批次处理意见。
4)审理会签
纠正或纠正措施实施后,审理人员填写审理组织最终审理意见,签署完成后交有关设计、调试、制造、工艺和质量等有关人员对纠正和纠正措施的有效性进行会签评审;涉及软件故障时,需要交软件总体和产品SQA人员进行会签评审。
5)纠正和纠正措施有效性验证
要求如下:
a)在纠正、纠正措施实施过程中,产品质量师或指定人员跟踪监督;
b)偶然发生的、轻微的故障实施纠正后,责任单位通知产品质量师或检验员进行验证;验证满足要求后,质量师或检验员在FRACAS表检验验证环节进行确认;
c)其他故障纠正措施实施后,责任单位通知产品质量师,产品质量师根据纠正措施实施情况,确定故障审理组织中的有关验证人员;责任单位根据确定的验证人员,将FRACAS表提交相应验证人员;验证人员负责验证,明确验证效果及遗留问题结论并在FRACAS表验证环节进行确认;
d)故障纠正、纠正措施经验证有效的,纠正措施予以闭环。验证无效或存有遗留问题的,责任单位负责继续组织实施纠正措施,验证环节确认后FRACAS流程提交产品质量师进行确认。
6)通报用户
FRACAS表应向用户通报后闭环。
7)故障信息收集存档
要求如下:
a)纠正措施实施过程中,各责任部门须形成纠正措施结果记录,并负责收集存档;
b)纠正措施实施验证结束后,产品质量师按产品收集归档FRACAS表。
FRACAS运行示例如表2-8所示。
表2-8 FRACAS表运行示例
(续表)
FRACAS审理中元器件失效如判为偶然失效一般只需采取纠正即可,如判为非偶然失效则必须采取预防性纠正措施,以避免故障的重复发生。因此,偶然失效的判别在FRACAS运行和审理中就很重要。
进行偶然失效判断时,一般有两种思路:(1)直接分析:分析出由某种偶然因素引起失效;(2)间接分析:遍历所有失效机理(可借助FMEA),可排除由非偶然因素引起,只可能由偶然因素引起失效。
不同阶段执行不同的判据。考虑到元器件数量、失效率、使用时间、使用环境等变化,针对过程产品、分机或整机和交付后保证期内、保证期外这三个阶段,执行不同的判断方法。
周期性回头看时,应重新审核偶然失效的判断是否准确。
1)元器件偶然失效判别方法如下:
a)过程产品
过程产品装配、调试过程中如果发生元器件失效,初步判断失效是否可能由偶然因素引起,统计该批次过程产品的同种元器件失效数,如失效数不超过3个,一般判断该元器件为偶然失效,运行元器件失效单,应在“产生原因”一栏给出判断为偶然失效的理由。
b)分机或整机和交付后保证期内
整机或分机如果发生元器件失效,根据失效模式和失效机理的分析(必要时送第三方机构进行元器件失效分析),初步判断失效是否可能由偶然因素引起。统计产品所用该种元器件失效数,用偶然失效计算方法计算判别该元器件是否为偶然失效。
c)保证期外
如果产品交付已经过了保证期,可根据元器件故障分布概率与实际工作情况适当进行偶然失效的判断。
d)周期性回头看
每单位时间(如每月)统计FRACAS中每个型号产品的偶然失效情况。关注同一领域中不同型号同种元器件的偶然失效情况。对于短期内较大量失效的元器件要重新判断是否为偶然失效。
2)偶然失效计算方法如下:
通过GJB 299、外购厂家提供或其他方法得到的故障件失效率λ,可以计算故障件的理论失效个数。故障件累计故障分布函数为:
如产品总数为 N ,故障件理论失效数 r 理论 为:
式中,当服从指数分布时(即 R ( t )=e- λt , F ( t )=1-e- λt ),理论失效数为:
如果实际失效数 r 实际 ≤ r 理论 ,则可判别失效数在偶然失效范围内。
[例2-1]某元器件有2000只,失效率为1.0×10 -6 /h,实际失效了4只。其服从指数分布,可以计算1000h工作时间内的理论失效数为: r 理论 = N ·(1-e- λt )=2000×(1-e -1.0× 10 -6 ×1 000 )=1.999≈2, r 实际 r > 理论 ,因此,该元器件不能判别为偶然失效。