一文讀懂“容錯”與“冗餘”技術
發布時間:2020-06-05 責任編輯:wenwei
【導讀】容rong錯cuo控kong製zhi的de研yan究jiu雖sui然ran麵mian臨lin著zhe空kong前qian的de挑tiao戰zhan,但dan近jin些xie年nian來lai,相xiang關guan研yan究jiu領ling域yu,如ru魯lu棒bang控kong製zhi理li論lun,模mo糊hu控kong製zhi,神shen經jing網wang絡luo控kong製zhi研yan究jiu的de不bu斷duan深shen入ru和he發fa展zhan,也ye給gei容rong錯cuo控kong製zhi的de研yan究jiu帶dai來lai了le良liang好hao的de機ji遇yu,提ti供gong了le充chong分fen的de條tiao件jian。
而計算機控製技術、人工智能等技術的飛速發展,使得容錯控製技術在實際工程中應用的可能性變得越來越大。
一、容錯
提高係統的可靠性一般有兩種辦法:
1、采用縝密的設計和質量控製方法來盡量減少故障出現的概率。
2、以冗餘資源為代價來換取可靠性。
利用前一種方法來提高係統的可靠性是有限的,要想進一步的提高必須采用容錯技術。
容錯控製技術在國外發展的比較早,是由馮·諾nuo依yi曼man提ti出chu的de。隨sui著zhe八ba十shi年nian代dai微wei型xing計ji算suan機ji的de迅xun速su發fa展zhan和he廣guang泛fan應ying用yong,容rong錯cuo技ji術shu也ye得de到dao了le飛fei速su的de發fa展zhan,容rong錯cuo技ji術shu被bei應ying用yong到dao各ge個ge環huan境jing中zhong。我wo國guo的de容rong錯cuo技ji術shu現xian在zai發fa展zhan的de也ye很hen迅xun速su,一yi些xie重zhong要yao的de工gong作zuo場chang合he如ru航hang天tian、電廠等現在都采用了容錯技術。
所謂容錯:jiushirongxucuowu,shizhishebeideyigehuoduogeguanjianbufenfashengguzhangshi,nenggouzidongdijinxingjianceyuzhenduan,bingcaiquxiangyingcuoshi,baozhengshebeiweichiqiguidinggongneng,huoxishengxingnenglaibaozhengshebeizaikejieshoufanweineijixugongzuo。
錯誤一般分為兩類:
第一類是先天性的固有錯,如元器件生產過程中造成的錯、線路與程序在設計過程中產生的錯。這一類的錯誤需對其拆除、更換或修正,是不能容忍的。
第二類的錯後天性的錯,它是由於設備在運行中產生了缺陷所導致的故障。這種故障有瞬時性、間歇性和永久性的區別。
容錯技術是提高係統可靠性的重要途徑。常采用的容錯方法有硬件容錯、軟件容錯、信息容錯和時間容錯。
1、什麼叫“智能容錯”
智能容錯IFT(Intelligent Fault-Tolerance):jiushishebeizaiyunxingguochengzhongyigehuoduogeguanjianbujianfashengguzhanghuojijiangfashengguzhangzhiqian,liyongrengongzhinenglilunhefangfa,tongguocaiquyouxiaocuoshi,duiguzhangzidongjinxingbuchang、抑製、消除、修複,以保證設備繼續安全、高效、可靠運行,或以犧牲性能損失為代價,保證設備在規定的時間內完成其預定功能。
智能容錯技術的構成方法可以采用以下三步來實現:
(1)建立係統的設計目標;
(2)設計智能容錯處理機構;
(3)根據設計目標對所作的設計進行評價,如果滿足目標則設計成功,否則將返回第二步進行重新設計,直到滿足設計目標要求。
硬件智能容錯 HIFT (Hardware Intelligent Fault Tolerant) 主(zhu)要(yao)采(cai)用(yong)硬(ying)件(jian)冗(rong)餘(yu)技(ji)術(shu)。其(qi)基(ji)本(ben)思(si)想(xiang)是(shi)對(dui)設(she)備(bei)的(de)關(guan)鍵(jian)部(bu)件(jian)配(pei)備(bei)多(duo)重(zhong)相(xiang)似(si)或(huo)相(xiang)同(tong)部(bu)件(jian),一(yi)旦(dan)檢(jian)測(ce)和(he)診(zhen)斷(duan)出(chu)設(she)備(bei)發(fa)生(sheng)故(gu)障(zhang)就(jiu)可(ke)以(yi)立(li)刻(ke)切(qie)換(huan)到(dao)備(bei)份(fen)部(bu)件(jian),以(yi)達(da)到(dao)故(gu)障(zhang)容(rong)錯(cuo)的(de)目(mu)的(de)。圖(tu) 1 所示為二冗餘結構原理圖:

圖 1 二冗餘結構原理圖
2、硬件智能容錯方式的分類
硬件智能容錯按其工作方式可以分為:靜態冗餘、動態冗餘和混合冗餘。
靜態冗餘容錯是通過表決和比較屏蔽係統中出現的故障,如圖2所示:

圖 2 三模冗餘(靜態冗餘)TMR係統結構圖
靜態冗餘容錯的主要特點是:
(1)由於故障被屏蔽,所以不需要識別故障;
(2)容易與無冗餘係統進行轉換;
(3)所有模件都消耗能量。
動dong態tai冗rong餘yu的de主zhu要yao方fang式shi是shi多duo重zhong模mo塊kuai相xiang繼ji運yun行xing來lai維wei持chi設she備bei正zheng常chang工gong作zuo。當dang檢jian測ce到dao工gong作zuo模mo塊kuai出chu現xian故gu障zhang時shi,一yi個ge備bei用yong模mo塊kuai立li即ji接jie替ti故gu障zhang模mo塊kuai並bing投tou入ru工gong作zuo。
動態冗餘容錯控製的主要特點是:
(1)僅有一個模件消耗能量;
(2)模件數目可隨任務而改變,不會影響係統工作;
(3)轉換裝置和檢測裝置中任一故障都會導致係統失效。

圖 3 動態冗餘容錯控製結構圖
混合冗餘兼動態冗餘和靜態冗餘之所長,通常用H(n,k)來表示,如圖4所示。圖中的V為表決器,n表示模塊的總數,k代表以表決方式實現靜態冗餘的模塊數,而其餘N-K個模塊則作為表決係統中模塊的備份。當參與表決的k個模塊中(通常k>=3)有(you)一(yi)個(ge)模(mo)塊(kuai)出(chu)現(xian)故(gu)障(zhang)時(shi),備(bei)份(fen)就(jiu)替(ti)代(dai)該(gai)模(mo)塊(kuai)參(can)與(yu)表(biao)決(jue),維(wei)持(chi)靜(jing)態(tai)冗(rong)餘(yu)係(xi)統(tong)的(de)完(wan)整(zheng)。當(dang)所(suo)有(you)備(bei)份(fen)都(dou)被(bei)替(ti)換(huan)完(wan)後(hou),係(xi)統(tong)就(jiu)成(cheng)為(wei)一(yi)般(ban)的(de)表(biao)決(jue)係(xi)統(tong)。
如在硬件構成的邏輯係統中表決器是由開關電路實現的,而軟件中表決需要通過軟件斷言SA(Software Assertions)來實現。軟件斷言就是當軟件在宿主係統中運行時,對其進程或功能的正確與否做出判斷的條件。

圖 4 H(n,k)係統結構
3、智能容錯的故障處理方式
智能容錯技術是一種外延廣博的綜合性技術。為了消除故障的影響,可以采用以下處理方式來實現:
(1)故障檢測
通過故障檢測可以迅速準確地對故障進行定位。故障檢測是容錯的基礎。故障檢測方式可分兩種:脫機檢測,即進行檢測時係統不能做有用的工作,聯機檢測,即檢測與係統工作同步進行,它具有實時檢測的能力。
(2)故障定位
zaigeidingdeguzhangtiaojianxia,zhaochuguzhangyuanyin,quedingfashengguzhangyuanjiandejutiweizhi。dingweidexiangxichengdushijutiwentierding,yibandingweidaojinxingxitongzhonggousuoxudezuixiaodanyuan。
(3)故障屏蔽
故(gu)障(zhang)屏(ping)蔽(bi)能(neng)夠(gou)把(ba)故(gu)障(zhang)效(xiao)應(ying)掩(yan)蓋(gai)起(qi)來(lai),以(yi)防(fang)止(zhi)故(gu)障(zhang)對(dui)輸(shu)出(chu)產(chan)生(sheng)影(ying)響(xiang)。故(gu)障(zhang)屏(ping)蔽(bi)隻(zhi)能(neng)容(rong)忍(ren)故(gu)障(zhang),而(er)不(bu)能(neng)給(gei)出(chu)故(gu)障(zhang)警(jing)告(gao),當(dang)冗(rong)餘(yu)資(zi)源(yuan)耗(hao)盡(jin)時(shi),將(jiang)使(shi)設(she)備(bei)產(chan)生(sheng)錯(cuo)誤(wu)輸(shu)出(chu)。
常chang用yong的de故gu障zhang屏ping蔽bi方fang法fa有you多duo模mo表biao決jue冗rong餘yu和he屏ping蔽bi邏luo輯ji兩liang種zhong,多duo模mo表biao決jue冗rong餘yu就jiu是shi在zai設she備bei的de多duo個ge裝zhuang置zhi中zhong,隻zhi要yao至zhi少shao有you一yi個ge裝zhuang置zhi正zheng常chang工gong作zuo,係xi統tong就jiu能neng完wan成cheng其qi功gong能neng;屏蔽邏輯主要用於門級電路的故障屏蔽,它能有效地限製邏輯線路門輸出的臨界故障與亞臨界故障。
(4)故障限製
故障限製就是規定故障的傳播範圍,把故障效應的傳播限製到某一區域內。故障限製可以用軟件和硬件來實現。
(5)故障隔離
故障隔離就是將故障隔離起來以防其進一步擴散和對設備產生影響。
(6)故障修複
當設備發生故障經檢測和定位後,就可采取更換、修理、自修複等方式使設備複原。
(7)係統重組
當設備發生故障時,通過任務的重新分配或內部器件的重新組合,以切除或替換故障部件。
(8)係統重構
重構就是把修複的模件重新加入到係統中去。
(9)係統恢複
係統恢複就是經過屏蔽、重組等,使故障恢複到故障前的工作狀態,不丟失或少丟失信息,並保證下一步的正常運行,係統恢複通常用軟件實現。
4、智能容錯的實現方法
智能容錯的實現方法分為: (1)故障信號檢測;(2)故障特征識別;(3)故障狀態預測;(4)故障維修決策;(5)故障容錯控製。
故障容錯的目的在於針對不同的故障源和故障特征,采取相應的容錯處理措施,對故障進行補償、消除或自動修複,以保證設備繼續安全可靠運行,或以犧牲性能損失為代價,保證設備在規定時間內完成其基本功能。結構框圖如圖5所示。

圖 5 故障容錯控製過程框圖
二、冗餘技術
所謂冗餘(Redundancy)就是多餘資源,冗餘技術可供用來處理故障,冗餘技術分為:
(1)硬件冗餘法:
硬件冗餘HR(Hardware Redundancy)jiushiyikaofujiayingjianderongyuxinghehubuxinglaishixianguzhangrongcuo,fujiayingjiantongchangcaiyongchubeixingshi,dangshebeimougehuomouxieguanjianbujianfashengguzhanghou,keyiyongbeifenyingjiantidaiguzhangbujian,yixueruohuoxiaochuguzhangdeyingxiang。
(2)軟件冗餘法:
軟件冗餘SR(Software Redundancy)可以通過增加軟件功能來實現,其中包括修改容錯控製策略、重新配置係統軟件、有效地降低設備的運行速度、多模塊並行診斷決策等。
冗餘附加技術指為實現上述榮譽另外所需的資源和技術,包括程序、指令、數(shu)據(ju)以(yi)及(ji)存(cun)放(fang)和(he)調(tiao)動(dong)他(ta)們(men)的(de)空(kong)間(jian)和(he)通(tong)道(dao)。他(ta)們(men)和(he)硬(ying)件(jian)冗(rong)餘(yu)中(zhong)冗(rong)餘(yu)備(bei)份(fen)一(yi)樣(yang),在(zai)沒(mei)有(you)容(rong)錯(cuo)要(yao)求(qiu)的(de)係(xi)統(tong)中(zhong)是(shi)不(bu)需(xu)要(yao)的(de),而(er)在(zai)容(rong)錯(cuo)係(xi)統(tong)中(zhong)卻(que)是(shi)必(bi)不(bu)可(ke)少(shao)的(de)。以(yi)屏(ping)蔽(bi)硬(ying)件(jian)故(gu)障(zhang)為(wei)目(mu)的(de)容(rong)錯(cuo)技(ji)術(shu)中(zhong),冗(rong)餘(yu)附(fu)加(jia)技(ji)術(shu)包(bao)括(kuo):
1)關鍵程序和數據的榮譽存儲和調用;
2)進行檢測、表決、切換、重構、糾錯、複算的實現。在屏蔽軟件故障的容錯係統中,冗餘附加件的構成不同。
冗餘附加件包括:
1)獨立設計的相同功能冗餘備份程序的存儲及調用;
2)實現糾錯誤檢測及恢複的程序;
3)為實現容錯軟件所需固化了的程序。
冗餘、容rong錯cuo技ji術shu發fa展zhan現xian狀zhuang伴ban隨sui著zhe大da規gui模mo和he超chao大da規gui模mo集ji成cheng電dian路lu的de發fa展zhan,硬ying件jian可ke靠kao性xing大da大da提ti高gao而er價jia格ge卻que大da幅fu度du降jiang低di,使shi采cai用yong各ge種zhong容rong錯cuo技ji術shu在zai經jing濟ji上shang更geng易yi接jie受shou。
rongcuojishuyingyongfanweikuozhanyuyinxingshiwuchulijigezhongshishikongzhixitong,shenzhixuduotongyongjisuanjixitongyecaiyonglerongcuojishu。zaiqibashiniandai,rongcuojishuyingyongyijinghenguangfan,liru:1975年的美國貝爾實驗室的3A號ESS處理係統和美國 TANDEM16容錯事務處理係統:1976年的美國AMDAHL470V/6 容錯通用計算機和 1978 年容錯空間計算機 FTSC;1979年BIM推出容錯的4300通用計算機係列;1980年容錯多處理機 FTMP 及軟件實現的容錯計算機sift研製成功等等。
隨著電子交易的日益廣泛,出現了商用容錯計算機市場和以分布式為體係的容錯計算機係統。容錯的VLSI技術和人工智能在容錯技術上的應用——計算機故障診斷專家係統,給冗餘、容錯技術的發展增添了新的活力。
冗餘、容錯技術理論的研究,也是相當活躍的。1952 年,馮·諾依曼作了一係列關於用重複邏輯模塊改善係統可靠性的報告;1956 年,他發表了論文《概率邏輯及用不可靠元件設計可靠的結構》。
1971 年以來,IEEE 計算機學會容錯技術委員會每年召開一次國際容錯計算學術會議;1987 年中國計算機學會成立了容錯計算專業委員會等等。基於容錯控製(TFC)基本思想,FTC 的研究主要有被動容錯控製(Passives)和主動容錯控製(Activate)兩種途徑。
主動容錯控製是在控製係統故障檢測與 FDD(Fau1t Detection and Diagnose)的基礎上,當 FDD huanjiejiancechuxitongguzhanghou,zhongxintiaozhengkongzhiqicanshu,shenzhigaibiankongzhiqijiegou,zaibaozhengxitongwendingdeqiantixia,jinlianghuifuxitongguzhangqiandexingneng。beidongrongcuokongzhishishejiduiguzhangjuyourongrennenglideqianglubangkongzhiqi,beidongrongcuokongzhideyanjiukeyichongfenliyonglubangkongzhijishudeyanjiuchengguo,qiebushou FDD 發展水平的限製,所以對於被動容錯控製的研究取得的成果較多。
1、主動容錯控製
主動容錯控製一般需要兩個基本步驟:控製係統的故障檢測、診斷與隔離及控製係統重構。
控製係統故障檢測、診斷與隔離是在現代控製理論、可靠性理論、數理統計、信號處理技術、模式識別技術,以及人工智能和計算機控製技術等技術基礎上的一門應用型的邊緣學科,FDD 技術是容錯控製重要的支撐技術之一。
由於控製係統 FDD wentibenshendefuzaxinghexiangguanlingyujishushuipingdexianzhi,suiranrenmenduitadeyanjiujidadaoleyidingdeshuiping,danzhijinrengmeiyoujiejuezheyiwentitebieyouxiaodefangfa。
目前的控製係統FDD研究主要是沿著基於模型和基於知識兩種途徑展開。
控製係統重構的方法主要有:控製律重新調度、控kong製zhi器qi重zhong構gou設she計ji和he模mo型xing跟gen蹤zong重zhong組zu控kong製zhi,控kong製zhi律lv重zhong新xin調tiao度du的de基ji本ben思si想xiang是shi,在zai離li線xian的de情qing況kuang下xia計ji算suan出chu各ge種zhong故gu障zhang條tiao件jian下xia所suo需xu的de控kong製zhi律lv增zeng益yi參can數shu,存cun儲chu在zai計ji算suan機ji中zhong,係xi統tong根gen據ju FDD 單元所給出的結果,選擇合適增益參數,實現對各種故障的容錯控製;控kong製zhi器qi重zhong構gou設she計ji是shi根gen據ju故gu障zhang係xi統tong的de新xin環huan境jing,重zhong新xin設she置zhi係xi統tong的de工gong作zuo點dian,並bing給gei出chu可ke改gai善shan係xi統tong性xing能neng的de新xin控kong製zhi器qi,現xian有you的de控kong製zhi器qi重zhong構gou方fang法fa主zhu要yao有you基ji於yu直zhi接jie狀zhuang態tai反fan饋kui或huo輸shu出chu反fan饋kui的de方fang法fa,以yi及ji基ji於yu動dong態tai補bu償chang器qi的de設she計ji方fang法fa等deng;模(mo)型(xing)跟(gen)蹤(zong)重(zhong)組(zu)控(kong)製(zhi)的(de)基(ji)本(ben)原(yuan)理(li)是(shi)采(cai)用(yong)模(mo)型(xing)參(can)考(kao)自(zi)適(shi)應(ying)控(kong)製(zhi)的(de)思(si)想(xiang),使(shi)得(de)被(bei)控(kong)過(guo)程(cheng)的(de)輸(shu)出(chu)自(zi)適(shi)應(ying)地(di)跟(gen)蹤(zong)參(can)考(kao)模(mo)型(xing)的(de)輸(shu)出(chu),因(yin)此(ci)這(zhe)種(zhong)容(rong)錯(cuo)控(kong)製(zhi)不(bu)需(xu)要(yao)FDD單元。
在主動容錯控製方法中,能夠較好地將FDD環節與係統重構相結合的是基於人工智能的容錯控製方法。在容錯控製中所運用的人工智能方法主要是人工神經元網絡 ANN(Artifictial Neural Network),利用 ANN 對非線性特性的任意逼近能力和ANN所具有的從樣本中學習、歸納和推理的能力,通過訓練,使ANN能準確地估計出故障的大小,在此基礎上再通過故障補償來實現主動容錯控製。
被動容錯控製在目前的容錯控製研究中,因為不受控製係統 DFD 環節的限製,被動容錯控製相對於主動容錯控製要更容易實現,已有的可以實現被動容錯控製的主要方法有:
完整性控製器設計、同時鎮定和可靠鎮定。
完整性控製(Intgearl Contron)的概念由Niederlinski 在 1971年(nian)提(ti)出(chu),完(wan)整(zheng)性(xing)控(kong)製(zhi)是(shi)研(yan)究(jiu)最(zui)早(zao)的(de)一(yi)種(zhong)容(rong)錯(cuo)控(kong)製(zhi)技(ji)術(shu),因(yin)為(wei)控(kong)製(zhi)係(xi)統(tong)中(zhong)傳(chuan)感(gan)器(qi)和(he)執(zhi)行(xing)器(qi)是(shi)最(zui)容(rong)易(yi)發(fa)生(sheng)故(gu)障(zhang)的(de)部(bu)件(jian),所(suo)以(yi)完(wan)整(zheng)性(xing)控(kong)製(zhi)具(ju)有(you)很(hen)高(gao)的(de)應(ying)用(yong)價(jia)值(zhi),在(zai)控(kong)製(zhi)理(li)論(lun)中(zhong),稱(cheng)多(duo)變(bian)量(liang)係(xi)統(tong)中(zhong)出(chu)現(xian)故(gu)障(zhang)時(shi)仍(reng)能(neng)保(bao)持(chi)係(xi)統(tong)穩(wen)定(ding)性(xing)的(de)控(kong)製(zhi)器(qi)為(wei)完(wan)整(zheng)性(xing)控(kong)製(zhi)器(qi),完(wan)整(zheng)性(xing)控(kong)製(zhi)器(qi)設(she)計(ji)是(shi)多(duo)變(bian)量(liang)係(xi)統(tong)中(zhong)特(te)有(you)的(de)問(wen)題(ti);
多模型設計方法又稱同時鎮定問題,自從Ackermann,Sakes 和Vidyasagar 等(deng)人(ren)提(ti)出(chu)來(lai)以(yi)後(hou),己(ji)經(jing)成(cheng)為(wei)容(rong)錯(cuo)控(kong)製(zhi)的(de)一(yi)個(ge)重(zhong)要(yao)研(yan)究(jiu)方(fang)向(xiang),同(tong)時(shi)穩(wen)定(ding)容(rong)錯(cuo)控(kong)製(zhi)的(de)設(she)計(ji)方(fang)法(fa)是(shi)力(li)求(qiu)尋(xun)找(zhao)一(yi)個(ge)公(gong)共(gong)的(de)狀(zhuang)態(tai)反(fan)饋(kui)控(kong)製(zhi)器(qi),使(shi)之(zhi)能(neng)夠(gou)同(tong)時(shi)穩(wen)定(ding)盡(jin)可(ke)能(neng)多(duo)的(de)故(gu)障(zhang)情(qing)況(kuang)下(xia)的(de)係(xi)統(tong)模(mo)型(xing),同(tong)時(shi)兼(jian)顧(gu)到(dao)係(xi)統(tong)的(de)動(dong)、靜態品質特性的要求;使用多個補償器進行可靠鎮定的概念是由 Silage 於1980年最早提出,可靠鎮定實際上是關於控製器的容錯問題。
與(yu)被(bei)動(dong)容(rong)錯(cuo)控(kong)製(zhi)相(xiang)比(bi)較(jiao),主(zhu)動(dong)容(rong)錯(cuo)控(kong)製(zhi)具(ju)有(you)更(geng)多(duo)的(de)優(you)點(dian)。從(cong)理(li)論(lun)上(shang)講(jiang),被(bei)動(dong)容(rong)錯(cuo)控(kong)製(zhi)是(shi)故(gu)障(zhang)情(qing)況(kuang)下(xia)的(de)強(qiang)魯(lu)棒(bang)控(kong)製(zhi),主(zhu)動(dong)容(rong)錯(cuo)控(kong)製(zhi)是(shi)故(gu)障(zhang)情(qing)況(kuang)下(xia)的(de)強(qiang)自(zi)適(shi)應(ying)控(kong)製(zhi)。被(bei)動(dong)容(rong)錯(cuo)控(kong)製(zhi)即(ji)使(shi)在(zai)係(xi)統(tong)正(zheng)常(chang)的(de)情(qing)況(kuang)下(xia)控(kong)製(zhi)率(lv)也(ye)要(yao)滿(man)足(zu)故(gu)障(zhang)條(tiao)件(jian)下(xia)的(de)要(yao)求(qiu),這(zhe)在(zai)係(xi)統(tong)正(zheng)常(chang)時(shi)顯(xian)然(ran)是(shi)一(yi)種(zhong)過(guo)高(gao)的(de)要(yao)求(qiu),設(she)計(ji)未(wei)免(mian)過(guo)於(yu)保(bao)守(shou),必(bi)然(ran)要(yao)以(yi)犧(xi)牲(sheng)性(xing)能(neng)指(zhi)標(biao)為(wei)代(dai)價(jia)。另(ling)外(wai),在(zai)預(yu)想(xiang)故(gu)障(zhang)數(shu)目(mu)較(jiao)多(duo)時(shi),被(bei)動(dong)容(rong)錯(cuo)控(kong)製(zhi)問(wen)題(ti)可(ke)能(neng)根(gen)本(ben)沒(mei)有(you)解(jie),所(suo)以(yi)被(bei)動(dong)容(rong)錯(cuo)控(kong)製(zhi)有(you)較(jiao)大(da)的(de)局(ju)限(xian)性(xing)。
基於控製係統FDDdezhudongrongcuokongzhishizhishiyizhongqiangzishiyingkongzhi,tatongguoshishididuixitongjinxingguzhangjianceyuzhenduan,dangjiancechuxitongguzhanghou,genjubutongdeguzhangcaiquxiangyingdecuoshi,baozhengxitongdewendingxingheweichiyidingdexingnengzhibiao。zhudongrongcuokongzhisuoyongdezhuyaofangfashikongzhizhonggouheguzhangbuchang,qianzhexuyaogenjuguzhangzhongxinshejikongzhiqi,houzhezeshiliyongguzhangdexinxiquedingyigekongzhibuchangliang,mudedoushilitushiguzhanghoudexitongjinliangjiejinshenzhidengjiayuyuanxitong。
對於演變速度較慢的所謂軟故障,多模自適應方法比較適合,但多模自適應方法中存在較多的算法上的問題,限製了這種方法的使用。
2、容錯控製研究中需要解決的主要問題
盡管控製係統 FDD 和 TFC 技ji術shu的de研yan究jiu在zai理li論lun上shang己ji取qu得de了le較jiao為wei豐feng富fu的de成cheng果guo,但dan距ju離li實shi際ji工gong程cheng應ying用yong的de要yao求qiu還hai有you相xiang當dang大da的de差cha距ju,理li論lun上shang也ye還hai有you許xu多duo問wen題ti有you待dai人ren們men去qu研yan究jiu和he探tan索suo。
本文主要研究了實時係統多機冗餘、容錯係統的故障檢測與診斷、控製係統重構、容錯實時運行庫技術以及容錯控製在工程中的應用等問題,而在目前的研究中,上述領域主要存在的問題分述如下:
(1)控製係統故障檢測與診斷中存在的問題:
控製係統故障的模型是從理論上進行FDD 研究的前提,但現有故障建模方法簡單,與實際係統故障具有的複雜性和多樣性成為一對急待解決的矛盾。目前還沒有一個在 FDD 和 FTC 中比較統一的故障表示方法。就拿CPU 測試來說,多數的結構測試法需要詳細的係統邏輯電路圖,並在此基礎上建立故障模型。
jiegouceshifatongguoyanzhengdianluzhongmeiyourenhefuheguzhangmoxingdeguzhangcunzai,laishuomingdianluzhongmeiyouyingxiangdianlugongnengdeshijiwuliguzhangcunzai。youyuweichuliqishiyigeshuru、輸出引線數目有限,內部結構異常複雜的大規模集成電路,很難在邏輯門這一級確立準確的故障模型;另一方麵受到引出腳數目的限製,使得故障的可控製性與可觀察性大大降低;此外控製邏輯部分與數據處理邏輯部分都在一塊芯片上,不能預先假定哪一部分總是好的。
(2)係統重構方麵存在的主要問題:
目前的係統重構問題研究較少。現有的運用廣義逆的方法、基於狀態反饋或輸出反饋、特(te)征(zheng)值(zhi)和(he)結(jie)構(gou)配(pei)置(zhi)等(deng)方(fang)法(fa),僅(jin)是(shi)從(cong)數(shu)學(xue)模(mo)型(xing)角(jiao)度(du)將(jiang)係(xi)統(tong)恢(hui)複(fu),而(er)不(bu)是(shi)從(cong)係(xi)統(tong)性(xing)能(neng)角(jiao)度(du)恢(hui)複(fu),所(suo)以(yi)重(zhong)構(gou)後(hou)的(de)係(xi)統(tong)魯(lu)棒(bang)性(xing)不(bu)能(neng)保(bao)證(zheng),有(you)時(shi)甚(shen)至(zhi)穩(wen)定(ding)性(xing)也(ye)難(nan)以(yi)保(bao)證(zheng)。而(er)且(qie),多(duo)數(shu)重(zhong)構(gou)對(dui)係(xi)統(tong)模(mo)型(xing)的(de)要(yao)求(qiu)也(ye)很(hen)苛(ke)刻(ke)。就(jiu)目(mu)前(qian)的(de)控(kong)製(zhi)係(xi)統(tong) FDD研(yan)究(jiu)水(shui)平(ping)來(lai)看(kan),想(xiang)獲(huo)得(de)故(gu)障(zhang)後(hou)係(xi)統(tong)模(mo)型(xing)的(de)全(quan)部(bu)信(xin)息(xi)是(shi)相(xiang)當(dang)困(kun)難(nan)的(de),所(suo)以(yi)尋(xun)求(qiu)故(gu)障(zhang)後(hou)控(kong)製(zhi)完(wan)全(quan)重(zhong)構(gou)是(shi)理(li)想(xiang)化(hua)的(de)。由(you)於(yu)故(gu)障(zhang)的(de)大(da)小(xiao)是(shi)未(wei)知(zhi)的(de),所(suo)以(yi)在(zai)設(she)計(ji)時(shi)進(jin)行(xing)穩(wen)定(ding)性(xing)分(fen)析(xi)是(shi)非(fei)常(chang)困(kun)難(nan)的(de),隻(zhi)能(neng)對(dui)預(yu)想(xiang)的(de)故(gu)障(zhang)進(jin)行(xing)穩(wen)定(ding)性(xing)分(fen)析(xi)。
(3)實時係統和容錯技術相結合存在的主要問題:如何將軟件容錯技術有機地融合到實時係統中去,具有與發展軟件容錯技術本身同樣重要的地位。
目前,盡管實時係統的軟件容錯技術已經取得了非常巨大的進步,但在實時係統中並未得到充分地應用。
(4)用戶在冗餘、容錯係統設計中存在的主要問題:應(ying)用(yong)程(cheng)序(xu)設(she)計(ji)者(zhe)在(zai)考(kao)慮(lv)如(ru)何(he)實(shi)現(xian)應(ying)用(yong)軟(ruan)件(jian)的(de)功(gong)能(neng)要(yao)求(qiu)同(tong)時(shi),要(yao)兼(jian)顧(gu)軟(ruan)件(jian)容(rong)錯(cuo),這(zhe)不(bu)可(ke)避(bi)免(mian)地(di),甚(shen)至(zhi)是(shi)成(cheng)倍(bei)地(di)加(jia)大(da)了(le)應(ying)用(yong)係(xi)統(tong)開(kai)發(fa)的(de)工(gong)作(zuo)量(liang),增(zeng)加(jia)係(xi)統(tong)的(de)複(fu)雜(za)程(cheng)度(du),反(fan)而(er)加(jia)大(da)應(ying)用(yong)出(chu)錯(cuo)的(de)可(ke)能(neng)性(xing)。應(ying)用(yong)層(ceng)容(rong)錯(cuo)將(jiang)容(rong)錯(cuo)機(ji)製(zhi)的(de)實(shi)現(xian)和(he)應(ying)用(yong)程(cheng)序(xu)融(rong)為(wei)一(yi)體(ti),當(dang)需(xu)要(yao)在(zai)同(tong)一(yi)操(cao)作(zuo)係(xi)統(tong)上(shang)開(kai)發(fa)新(xin)的(de)應(ying)用(yong)時(shi),所(suo)有(you)工(gong)作(zuo)必(bi)須(xu)從(cong)頭(tou)開(kai)始(shi),不(bu)符(fu)合(he)工(gong)程(cheng)實(shi)際(ji)中(zhong)提(ti)高(gao)軟(ruan)件(jian)重(zhong)用(yong)性(xing),開(kai)發(fa)低(di)成(cheng)本(ben)、高可靠係統的大趨勢。
(5)容錯控製理論運用於工程實際時需要解決的問題:容(rong)錯(cuo)控(kong)製(zhi)在(zai)理(li)論(lun)研(yan)究(jiu)上(shang)比(bi)較(jiao)困(kun)難(nan),在(zai)實(shi)際(ji)工(gong)程(cheng)中(zhong)的(de)應(ying)用(yong)更(geng)少(shao)。由(you)於(yu)不(bu)同(tong)的(de)工(gong)程(cheng)領(ling)域(yu)所(suo)遇(yu)到(dao)的(de)問(wen)題(ti)有(you)很(hen)大(da)的(de)差(cha)異(yi),不(bu)可(ke)能(neng)以(yi)一(yi)個(ge)統(tong)一(yi)的(de)框(kuang)架(jia)來(lai)解(jie)決(jue)所(suo)有(you)的(de)問(wen)題(ti)。理(li)論(lun)研(yan)究(jiu)所(suo)用(yong)的(de)模(mo)型(xing)和(he)假(jia)設(she)同(tong)工(gong)程(cheng)實(shi)際(ji)的(de)差(cha)別(bie)比(bi)較(jiao)大(da),這(zhe)也(ye)是(shi)容(rong)錯(cuo)控(kong)製(zhi)理(li)論(lun)在(zai)工(gong)程(cheng)實(shi)際(ji)中(zhong)運(yun)用(yong)所(suo)遇(yu)到(dao)的(de)主(zhu)要(yao)困(kun)難(nan)。各(ge)個(ge)領(ling)域(yu)的(de)工(gong)程(cheng)技(ji)術(shu)人(ren)員(yuan),應(ying)結(jie)合(he)自(zi)己(ji)的(de)工(gong)程(cheng)實(shi)際(ji),選(xuan)擇(ze)相(xiang)應(ying)的(de)控(kong)製(zhi)方(fang)案(an)。因(yin)此(ci),統(tong)一(yi)係(xi)統(tong)架(jia)構(gou),構(gou)建(jian)支(zhi)持(chi)多(duo)種(zhong)主(zhu)流(liu)冗(rong)餘(yu)、容錯模式的運行庫,對工程設計人員來說是很重要的。
來源:可靠性技術交流
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 貿澤EIT係列新一期,探索AI如何重塑日常科技與用戶體驗
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 創新不止,創芯不已:第六屆ICDIA創芯展8月南京盛大啟幕!
- AI時代,為什麼存儲基礎設施的可靠性決定數據中心的經濟效益
- 矽典微ONELAB開發係列:為毫米波算法開發者打造的全棧工具鏈
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索




