0、引言
電子產(chǎn)品的可靠性預(yù)計(jì)一直是困擾各個(gè)無(wú)線通信公司的難題之一,目前比較通用的可靠性預(yù)計(jì)方法是由貝爾實(shí)驗(yàn)室在2001年推出的Bellcore-SR332方法。該方法的不足之處在于它僅根據(jù)產(chǎn)品的設(shè)計(jì)和使用環(huán)境進(jìn)行可靠性預(yù)計(jì),未考慮影響產(chǎn)品可靠性的其他關(guān)鍵因素,例如工藝、制造、篩選、管理等,預(yù)計(jì)的結(jié)果表達(dá)的是設(shè)計(jì)的可靠性,而非現(xiàn)場(chǎng)可靠性。在充分認(rèn)識(shí)到Bell-core-SR332方法的缺陷后,依據(jù)可靠性相關(guān)理論對(duì)現(xiàn)場(chǎng)返還數(shù)據(jù)進(jìn)行分解與建模分析,獲得一個(gè)融合了產(chǎn)品設(shè)計(jì)能力、使用環(huán)境、工藝水平、制造能力、檢測(cè)能力以及質(zhì)量管理水平的產(chǎn)品失效率模型,并建立了一套符合無(wú)線通信產(chǎn)品研發(fā)生產(chǎn)過(guò)程各項(xiàng)可靠性活動(dòng)返還率預(yù)計(jì)系統(tǒng),為無(wú)線通信產(chǎn)品可靠性設(shè)計(jì)與提升奠定基礎(chǔ)。
本文通過(guò)應(yīng)用可靠性理論及其相關(guān)的數(shù)學(xué)模型,對(duì)大量無(wú)線通信產(chǎn)品的現(xiàn)場(chǎng)返還數(shù)據(jù)進(jìn)行分解和建模分析,建立了一個(gè)不僅涵蓋產(chǎn)品設(shè)計(jì)能力、使用環(huán)境等因素,而且還包含產(chǎn)品工藝水平、制造能力、檢測(cè)能力以及質(zhì)量管理水平等諸多因素在內(nèi)的失效率模型,從而避免了現(xiàn)有可靠性預(yù)計(jì)方法上的漏洞。另外,結(jié)合無(wú)線通信行業(yè)可靠性設(shè)計(jì)活動(dòng),設(shè)計(jì)出一套現(xiàn)場(chǎng)返還率預(yù)測(cè)方法,能夠滿足產(chǎn)品設(shè)計(jì)、研發(fā)、試產(chǎn)、上市等各個(gè)階段對(duì)可靠性預(yù)計(jì)的需求,為無(wú)線通信產(chǎn)品的返還率降低提供支持。
1、可靠性理論
1.1 傳統(tǒng)可靠性理論知識(shí)
與大多數(shù)產(chǎn)品類似,無(wú)線通信產(chǎn)品的可靠性亦符合失效率“浴盆曲線”規(guī)律(見圖1)。其失效率的現(xiàn)場(chǎng)表現(xiàn)可以劃分為三個(gè)時(shí)期:早期失效期、偶然失效期和耗損失效期。
第一階段是早期失效期:表明產(chǎn)品在開始使用時(shí),失效率很高,但隨著產(chǎn)品工作時(shí)間的增加,失效率迅速降低。這一階段失效的原因大多是由于設(shè)計(jì)、原材料和制造過(guò)程中的缺陷造成的。第二階段是偶然失效期,也稱隨機(jī)失效期:這一階段的特點(diǎn)是失效率較低,且較穩(wěn)定,往往可近似看作常數(shù)。產(chǎn)品可靠性指標(biāo)所描述的就是這個(gè)時(shí)期,這一時(shí)期是產(chǎn)品的良好使用階段,偶然失效主要原因是質(zhì)量缺陷、材料弱點(diǎn)、環(huán)境和使用不當(dāng)?shù)纫蛩匾稹5谌A段是耗損失效期:該階段的失效率隨時(shí)間的延長(zhǎng)而急速增加,主要由磨損、疲勞、老化和耗損等原因造成。
1.2 可靠性理論深入分析
為進(jìn)一步分析失效率曲線,需要對(duì)故障發(fā)生時(shí)的數(shù)學(xué)模型做一些說(shuō)明。故障的發(fā)生通常是產(chǎn)品所設(shè)計(jì)和制造出來(lái)的強(qiáng)度不滿足環(huán)境應(yīng)力,例如一個(gè)電路的極限功率為5 W,若向其提供超出5 W的功率,電路燒毀,則故障發(fā)生。如圖2所示,一批產(chǎn)品的強(qiáng)度是符合正態(tài)分布的,命名為設(shè)計(jì)強(qiáng)度曲線;而這批產(chǎn)品的使用環(huán)境同樣也符合正態(tài)分布,命名為環(huán)境應(yīng)力曲線。
圖2 中的故障區(qū),當(dāng)兩只曲線交叉時(shí),表明有部分產(chǎn)品的強(qiáng)度低于其環(huán)境應(yīng)力,從而發(fā)生故障。這個(gè)交叉的區(qū)域面積代表失效率率,隨著使用時(shí)間的不同,這個(gè)區(qū)域是會(huì)發(fā)生變化的,如圖中虛線為老化后的產(chǎn)品強(qiáng)度曲線,交叉面積在不斷增加。
由此可知,兩曲線交叉面積所得到的失效率是由四個(gè)因素決定的,分別是該產(chǎn)品的設(shè)計(jì)強(qiáng)度(即中值)、制造能力(即一致性)、老化速度和環(huán)境應(yīng)力。由于環(huán)境應(yīng)力的度量還沒有比較有效的手段,雖然其規(guī)律符合正態(tài)分布,但中值和方差的獲得在技術(shù)上還是難題。因此在預(yù)測(cè)方法上采取以相同環(huán)境處理,避免了環(huán)境應(yīng)力的影響。
結(jié)合以上分析,對(duì)產(chǎn)品的失效率模型可以分解為三個(gè)子模型,分別是制造因素模型、設(shè)計(jì)因素模型和老化因素模型。圖3是對(duì)失效率“浴盆曲線”的分解。
2、通信產(chǎn)品的預(yù)測(cè)方法
上面提到,由于環(huán)境應(yīng)力度量上的困難,從預(yù)測(cè)方法上將以相同使用環(huán)境作為失效率建模和返還率預(yù)測(cè)的前提。從另一個(gè)角度看,不同市場(chǎng)的售后服務(wù)政策不同,也必須按市場(chǎng)的不同進(jìn)行返還率預(yù)測(cè)。如圖4所示。
圖4是按相同市場(chǎng)進(jìn)行的返還率預(yù)測(cè)過(guò)程,以及過(guò)程中的變量說(shuō)明。預(yù)測(cè)包括四個(gè)過(guò)程,數(shù)據(jù)采集、失效率建模、返還率計(jì)算和模型校準(zhǔn)等。數(shù)據(jù)采集既包括對(duì)已有產(chǎn)品返還數(shù)據(jù)的采集,又包括產(chǎn)品研發(fā)過(guò)程中相關(guān)的可靠性活動(dòng)和質(zhì)量檢驗(yàn)等數(shù)據(jù),還包括預(yù)測(cè)后產(chǎn)品上市后現(xiàn)場(chǎng)數(shù)據(jù)的采集。失效率建模則是通過(guò)采集到可靠性測(cè)試和質(zhì)量檢驗(yàn)結(jié)果,換算出各項(xiàng)因素參數(shù),用于失效率模型因子計(jì)算,從而得新產(chǎn)品失效率模型。返還率計(jì)算則是通過(guò)新產(chǎn)品的失效率模型,結(jié)合該產(chǎn)品銷售模型,按返還率定義計(jì)算出預(yù)測(cè)的返還率。最后,待新產(chǎn)品上市后采集返還率數(shù)據(jù),校準(zhǔn)該產(chǎn)品預(yù)測(cè)的失效率模型,為下一個(gè)新產(chǎn)品的返還率預(yù)測(cè)提供經(jīng)驗(yàn)。
3、現(xiàn)場(chǎng)返還數(shù)據(jù)分析與建模預(yù)計(jì)
無(wú)線通信產(chǎn)品的現(xiàn)場(chǎng)返還故障多種多樣,以智能手機(jī)為例,有硬件的、軟件的、部件的等,故障種類多達(dá)上百種。對(duì)于如此復(fù)雜的現(xiàn)場(chǎng)返還數(shù)據(jù),為保證返還率預(yù)測(cè)的準(zhǔn)確性,必須選擇重點(diǎn)故障進(jìn)行失效率建模。如何選擇重點(diǎn)故障,可以通過(guò)圖5的某智能機(jī)現(xiàn)場(chǎng)返還故障占比案例進(jìn)行說(shuō)明。
通過(guò)計(jì)算可知,該產(chǎn)品前10 名故障數(shù)量占總故障數(shù)量的62.5%.如果只對(duì)這10個(gè)故障的現(xiàn)場(chǎng)數(shù)據(jù)分析和建模,則預(yù)測(cè)方法的系統(tǒng)誤差有37.5%,這與要求的系統(tǒng)誤差不高于10%相差甚遠(yuǎn)。為降低預(yù)測(cè)的系統(tǒng)誤差,應(yīng)擴(kuò)大更多的故障進(jìn)行建模,使得這些故障總占比超出90%.按前面案例中的智能機(jī)產(chǎn)品,至少有33 種故障加起來(lái)的故障數(shù)占總故障數(shù)比值超出90%,在失效率建模中要分別對(duì)這33種故障進(jìn)行建模。
確定了哪些故障要建模后,便開始進(jìn)行失效率建模。以不識(shí)卡故障為例,其現(xiàn)場(chǎng)返還數(shù)據(jù)的規(guī)律如圖6所示。可以看出該故障早期失效期大約到第40周,最初的2周時(shí)間內(nèi)主要由于開箱損和相關(guān)法律法規(guī)影響,返還率較高,而第3周后到第40周的返還成先波峰狀,經(jīng)數(shù)學(xué)工具擬合分析后證明該分布符合威布爾分布。
40周后,該故障成線性分布,視作偶然失效期。
由于此類型消費(fèi)類無(wú)線通信產(chǎn)品的產(chǎn)品生命周期較短,一般不超過(guò)2年,因此很難觀測(cè)到故障的耗損失效期,為此僅對(duì)故障的早期失效期和偶然失效期的失效率進(jìn)行建模。
圖7是對(duì)不識(shí)卡故障的現(xiàn)場(chǎng)返還數(shù)據(jù)進(jìn)行的建模,符合威布爾分布,其形狀參數(shù)為2.8,尺度參數(shù)24.7.在第40周附件的模型與實(shí)際數(shù)據(jù)略有差異,表明有故障發(fā)生但用戶因該產(chǎn)品已經(jīng)使用了較長(zhǎng)的時(shí)間,不愿意去維修,故返回規(guī)律在此處與模型有所差異。
可得不識(shí)卡故障的失效率模型如式(1)所示:

式中:N為總返還量。
按照以上數(shù)學(xué)工具擬合方式對(duì)其余32個(gè)故障進(jìn)行建模,便可完成產(chǎn)品的失效率模型,如式(2)所示:

開始新產(chǎn)品的預(yù)測(cè)時(shí),根據(jù)新產(chǎn)品可靠性測(cè)試和生產(chǎn)質(zhì)量檢驗(yàn)等輸出物進(jìn)行失效率模型的因子計(jì)算,便可獲得新產(chǎn)品的失效率模型,如式(3)所示:

式中:N為總返還量;Mi為某故障在生產(chǎn)質(zhì)量檢驗(yàn)中的發(fā)生概率與已有產(chǎn)品在生產(chǎn)質(zhì)量檢驗(yàn)中發(fā)生概率的比值,作為該產(chǎn)品的制造因素參數(shù);Di為某故障在研發(fā)階段可靠性測(cè)試中的失效率與已有產(chǎn)品的失效率比值,作為該產(chǎn)品的設(shè)計(jì)因素參數(shù)。最后,通過(guò)返還率的定義,按月份計(jì)算產(chǎn)品上市后各個(gè)月度的返還率。
4、結(jié)語(yǔ)
通過(guò)以相同市場(chǎng)的已有產(chǎn)品返還數(shù)據(jù)進(jìn)行產(chǎn)品失效率建模和返還率預(yù)測(cè),規(guī)避了Bellcore-SR332可靠性預(yù)計(jì)方法上的缺陷,使得返還率的預(yù)測(cè)更加符合產(chǎn)品實(shí)際情況。并且結(jié)合無(wú)線通信產(chǎn)品的研發(fā)過(guò)程,相應(yīng)的采用過(guò)程數(shù)據(jù)進(jìn)行預(yù)測(cè),使得可靠性預(yù)計(jì)工作與產(chǎn)品可靠性設(shè)計(jì)結(jié)合得更加緊密,為提高無(wú)線通信產(chǎn)品的可靠性,提高預(yù)測(cè)的準(zhǔn)確性等方面都得以實(shí)現(xiàn)。