從業20年工程師講述軟錯誤是怎麼損壞存儲器中信息的?
發布時間:2015-06-16 責任編輯:echolady
【導讀】本文由從業20年nian工gong程cheng師shi傾qing情qing講jiang述shu軟ruan錯cuo誤wu是shi如ru何he發fa生sheng,如ru何he破po壞huai半ban導dao體ti存cun儲chu器qi中zhong的de重zhong要yao信xin息xi。有you此ci問wen題ti引yin出chu軟ruan錯cuo誤wu的de來lai源yuan及ji其qi發fa生sheng概gai率lv問wen題ti。軟ruan錯cuo誤wu影ying響xiang著zhe存cun儲chu單dan元yuan中zhong的de每mei個ge存cun儲chu位wei,改gai變bian它ta們men的de狀zhuang態tai。但dan是shi存cun儲chu器qi中zhong的de片pian上shang糾jiu錯cuo碼ma卻que可ke以yi消xiao減jian軟ruan錯cuo誤wu的de影ying響xiang。
近年來,半導體技術取得了巨大進步,但這種進步也帶來了新的問題。當今的CMOS工(gong)藝(yi)已(yi)縮(suo)至(zhi)很(hen)小(xiao)的(de)尺(chi)寸(cun),以(yi)至(zhi)於(yu)地(di)外(wai)輻(fu)射(she)和(he)芯(xin)片(pian)封(feng)裝(zhuang)正(zheng)導(dao)致(zhi)越(yue)來(lai)越(yue)多(duo)的(de)故(gu)障(zhang)。由(you)於(yu)這(zhe)些(xie)故(gu)障(zhang)是(shi)可(ke)逆(ni)的(de),它(ta)們(men)被(bei)稱(cheng)為(wei)軟(ruan)錯(cuo)誤(wu)。軟(ruan)錯(cuo)誤(wu)首(shou)次(ci)出(chu)現(xian)於(yu)1978年,由於受鈾汙染的封裝模塊,英特爾公司無法向AT&T交付其生產的芯片。20世紀70年代,軟錯誤主要與動態RAM(DRAM)有關,這是因為它們的芯片封裝材料含有微量的放射性汙染物。
軟錯誤是指高能粒子與矽元素之間的相互作用而在半導體中造成的隨機、臨時的狀態改變或瞬變。但與硬錯誤不同的是,一個簡單的複位/重寫操作可以恢複受影響器件的正常運行。數字和模擬電路、傳(chuan)輸(shu)線(xian)路(lu)和(he)磁(ci)存(cun)儲(chu)器(qi)中(zhong)都(dou)可(ke)能(neng)發(fa)生(sheng)軟(ruan)錯(cuo)誤(wu),但(dan)半(ban)導(dao)體(ti)存(cun)儲(chu)器(qi)最(zui)易(yi)出(chu)現(xian)軟(ruan)錯(cuo)誤(wu),其(qi)原(yuan)因(yin)是(shi)它(ta)們(men)的(de)單(dan)元(yuan)尺(chi)寸(cun)較(jiao)大(da),而(er)且(qie)每(mei)個(ge)位(wei)保(bao)持(chi)某(mou)種(zhong)狀(zhuang)態(tai)的(de)時(shi)間(jian)較(jiao)長(chang)(因此增加了風險)。 ruancuowuyoukenengfanzhuanyigehuoduogewei,zhequjueyuyoufalizidaodaqijianshidenengliang。yigegaonengliziyubandaotichendizhijiandexianghuzuoyongjiangchanshengduogedianzikongxuedui。tamenzaihaojinquzhongchanshengdedianchangjiangdaozhiyicidianhepiaoyi,congerdaozhidianliuraodong。ruguozhegedianliuyidongdedianhekuayuelecunchudanyuan(每個單元存儲一個位)的臨界電荷,所存儲的數據就有可能翻轉,從而導致下一次被讀取時出現錯誤。
軟錯誤分為兩級-芯片級和係統級。當芯片中的放射性原子衰變並釋放出阿爾法粒子時,芯片級軟錯誤將發生。它們通常是由高能粒子的輻射導致的(在下文中解釋)。zhexieeerfaliziyumougecunchudanyuanpengzhuang,congerdaozhiqigaibianzhuangtai。dangsuochuanshudeshujuyudaozaoshengshi,xitongjiruanxingcuowujiangfasheng。zhezhongcuowutongchangzaishujuweiyuzongxianerfeicunchuqizhongshifasheng。kongzhiqijiangzaoshengjieduweishuju。zhegecuowushujuzuizhongbeishiweizhengqueshuju,congerdaozhixunzhihuochulicuowu。
用於衡量軟錯誤發生率的軟錯誤率(SER)決jue定ding了le器qi件jian因yin高gao能neng粒li子zi發fa生sheng故gu障zhang的de概gai率lv。由you於yu軟ruan錯cuo誤wu是shi隨sui機ji的de,軟ruan錯cuo誤wu的de發fa生sheng並bing不bu決jue定ding存cun儲chu器qi的de可ke靠kao性xing,而er是shi決jue定ding其qi故gu障zhang率lv。在zai那na些xie采cai用yong了le軟ruan錯cuo誤wu應ying對dui機ji製zhi的de係xi統tong中zhong(主要是高安全性和高可靠性係統),如果一個軟錯誤(被稱為“所檢測到的不可恢複的錯誤”-DUE)被檢測到,係統將重啟,以避免損壞重要數據。如果未重啟,它最終將成為一次無記載數據損壞(SDC)。SDC要比DUE危險得多,因為SDC會導致數據丟失,而DUE隻會導致係統在短時間內不可用。在大量的消費電子設備中,軟錯誤的風險並不很大,它們更可能因軟件錯誤或部件損耗發生故障。
軟錯誤的發生概率取決於眾多因素,如入射粒子、撞擊區域和電路設計等。電容和電壓更高的電路更不容易出現軟錯誤, 但(dan)這(zhe)會(hui)招(zhao)致(zhi)更(geng)慢(man)的(de)邏(luo)輯(ji)門(men)和(he)更(geng)高(gao)的(de)功(gong)耗(hao)。因(yin)此(ci),隨(sui)著(zhe)芯(xin)片(pian)工(gong)藝(yi)的(de)不(bu)斷(duan)進(jin)步(bu),軟(ruan)錯(cuo)誤(wu)的(de)發(fa)生(sheng)概(gai)率(lv)也(ye)越(yue)來(lai)越(yue)大(da)。電(dian)容(rong)和(he)電(dian)壓(ya)的(de)組(zu)合(he)被(bei)稱(cheng)為(wei)臨(lin)界(jie)電(dian)荷(he)(Qcrit)。它被定義為一次粒子撞擊導致電路發生故障所必需擁有的電荷。由於邏輯電路中的每個節點都有其獨特的電容和輸出距離,因此,Qcrit通常以節點為單位測量。此外還必須注意,Qcrit 會隨溫度緩慢變化。
電路軟錯誤 = k X 通量 X 麵積 X e-Qcrit/Qcoil
其中,k = 取決於具體工藝的常數
通量 =中子通量
麵積 = 對軟錯誤敏感的電路麵積
Qcoll = 所采集電荷與所生成電荷的比率
該模型被稱為中子誘發型電路軟錯誤的Hazucha & Svensson模型。
導致軟錯誤的原因
阿爾法粒子
阿爾法粒子由兩個質子和兩個中子組成,類似於一個氦核。它們由放射性原子核在阿爾法衰變過程中釋放。 阿爾法粒子擁有數個MeV的(de)動(dong)能(neng),低(di)於(yu)中(zhong)子(zi)。阿(e)爾(er)法(fa)粒(li)子(zi)擁(yong)有(you)一(yi)個(ge)致(zhi)密(mi)的(de)電(dian)荷(he)層(ceng),在(zai)穿(chuan)過(guo)半(ban)導(dao)體(ti)襯(chen)底(di)時(shi)將(jiang)產(chan)生(sheng)多(duo)個(ge)電(dian)子(zi)空(kong)穴(xue)對(dui)。如(ru)果(guo)這(zhe)種(zhong)擾(rao)動(dong)足(zu)夠(gou)強(qiang),它(ta)就(jiu)有(you)可(ke)能(neng)翻(fan)轉(zhuan)某(mou)個(ge)位(wei)。由(you)於(yu)這(zhe)種(zhong)情(qing)況(kuang)通(tong)常(chang)隻(zhi)會(hui)持(chi)續(xu)幾(ji)分(fen)之(zhi)一(yi)納(na)秒(miao),因(yin)此(ci)很(hen)難(nan)被(bei)檢(jian)測(ce)出(chu)。
芯片被封裝在含有微量放射性汙染物的材料,如錫球或加工材料中。塑封材料、封裝和其它裝配材料中的微量鈾- 238、鈾- 232的放射性衰變會產生低能阿爾法粒子。然而,我們幾乎不可能維持實現大多數電路的可靠性能所需的理想材料純度(小於0.001次/小時/平方厘米)。微量的環氧樹脂可為芯片屏蔽阿爾法輻射,從而降低軟錯誤的發生概率。
[page]
宇宙射線
製zhi造zao商shang已yi設she法fa控kong製zhi了le釋shi放fang阿e爾er法fa粒li子zi的de汙wu染ran物wu,但dan他ta們men卻que無wu法fa抗kang擊ji宇yu宙zhou輻fu射she。事shi實shi上shang,在zai現xian代dai半ban導dao體ti器qi件jian中zhong,宇yu宙zhou射she線xian是shi最zui可ke能neng導dao致zhi軟ruan錯cuo誤wu的de原yuan因yin。宇yu宙zhou射she線xian中zhong的de主zhu要yao粒li子zi通tong常chang不bu能neng抵di達da地di球qiu表biao麵mian,但dan它ta們men會hui產chan生sheng一yi串chuan高gao能neng次ci級ji粒li子zi,其qi中zhong大da多duo數shu是shi高gao能neng中zhong子zi。中zhong子zi不bu帶dai電dian荷he,因yin此ci不bu會hui導dao致zhi軟ruan錯cuo誤wu,但dan卻que能neng被bei芯xin片pian中zhong的de原yuan子zi核he俘fu獲huo,從cong而er生sheng成cheng阿e爾er法fa粒li子zi,繼ji而er導dao致zhi軟ruan錯cuo誤wu。中zhong子zi所suo經jing曆li的de衰shuai減jian很hen小xiao,可ke穿chuan透tou厚hou達da5英寸的混凝土。
由於大氣屏蔽效應隨著海拔的升高而減弱,宇宙輻射將隨之增加。因此,飛機和衛星中的存儲器模塊極ji易yi出chu現xian軟ruan錯cuo誤wu,軟ruan錯cuo誤wu率lv是shi地di麵mian模mo塊kuai的de數shu百bai倍bei甚shen至zhi數shu千qian倍bei。此ci外wai,由you於yu上shang述shu大da氣qi屏ping蔽bi效xiao應ying的de減jian弱ruo,位wei於yu極ji地di的de存cun儲chu模mo塊kuai也ye極ji易yi出chu現xian軟ruan錯cuo誤wu。為wei減jian少shao軟ruan錯cuo誤wu,高gao風feng險xian應ying用yong中zhong所suo使shi用yong的de模mo塊kuai需xu要yao經jing過guo一yi個ge名ming為wei輻fu射she硬ying化hua的de工gong藝yi。盡jin管guan如ru此ci,由you於yu生sheng產chan輻fu射she硬ying化hua芯xin片pian需xu要yao大da量liang測ce試shi(和時間),它們一般都屬於舊的工藝節點。
熱中子
由於存在中子俘獲反應,欠缺動能的中子是軟錯誤的一個重要來源。(硼磷矽玻璃介電層中大量存在的)硼同位素(10B)原子核俘獲一個熱中子後將釋放一個阿爾法粒子、鋰li原yuan子zi核he和he伽jia馬ma射she線xian。阿e爾er法fa粒li子zi和he鋰li原yuan子zi核he都dou能neng導dao致zhi軟ruan錯cuo誤wu。硼peng在zai生sheng產chan中zhong被bei用yong於yu降jiang低di玻bo璃li的de融rong化hua溫wen度du,因yin此ci具ju備bei更geng好hao的de回hui流liu和he整zheng平ping特te性xing。
在重要設計中,貧硼(隻含11B)可用於降低軟錯誤率,通過使用磷矽玻璃(PSG)氧化層替代硼磷矽玻璃(BPSG)來(lai)實(shi)現(xian)。貧(pin)硼(peng)對(dui)於(yu)腫(zhong)瘤(liu)放(fang)射(she)治(zhi)療(liao)中(zhong)使(shi)用(yong)的(de)醫(yi)療(liao)電(dian)子(zi)設(she)備(bei)尤(you)其(qi)重(zhong)要(yao)。中(zhong)子(zi)和(he)治(zhi)療(liao)中(zhong)使(shi)用(yong)的(de)光(guang)子(zi)束(shu)相(xiang)結(jie)合(he)將(jiang)形(xing)成(cheng)一(yi)個(ge)熱(re)中(zhong)子(zi)通(tong)量(liang),從(cong)而(er)導(dao)致(zhi)極(ji)高(gao)的(de)軟(ruan)錯(cuo)誤(wu)率(lv)。盡(jin)管(guan)如(ru)此(ci),熱(re)中(zhong)子(zi)並(bing)非(fei)目(mu)前(qian)導(dao)致(zhi)軟(ruan)錯(cuo)誤(wu)的(de)主(zhu)要(yao)原(yuan)因(yin),製(zhi)造(zao)商(shang)已(yi)通(tong)過(guo)150nm工藝節點消除了含硼酸介電層。
消減軟錯誤的影響
改進工藝和存儲單元布局
womenkeyitongguozengjiacunchudanyuanzhongsuocunchudelinjiedianhetishengcunchuqidekekaoxing。ciwai,womenhaikeyishiyongyizhongkexiaojiankuosancenghoududegongyitigaocunchuqidiyuruancuowudenengli。gaigongyikesuoduandaidianlizizaicunchudanyuanzhongcunzaideshijian。sanjingjiagouyekeyongyujiangdianhequliyouyuanqu。gaigongyixingchengyigeyuNMOS耗盡區相反的電場,迫使電荷進入襯底。它僅適用於NMOS區發生軟錯誤的情況。
係統層麵的消減技術
在係統層麵上,設計人員可以使用外部糾錯碼(ECC)luojixiaojianruancuowudeyingxiang。zaigaijishuzhong,yonghushiyongewaidedaiqiouxiaoyanweidecunchuxinpianjiancehejiuzhengcuowu。zhengrurenmensuoliao,xitongcengmiandexiaojianjishujiaoweianggui,erqiezengjialeFPGA軟件的複雜性。
改變芯片設計和架構
這是抗擊軟錯誤的最佳方法。芯片設計人員可以通過將ECC算法植入到芯片中消減軟錯誤的影響。在寫操作時,ECC編碼器算法為存儲器中存儲的每一個可尋址的數據字寫入奇偶校驗位。在讀操作時,ECC檢測算法使用奇偶校驗位確定數據位是否已經改變。如果出現單位錯誤,ECC糾錯算法將確定相關位的位置,然後通過將該數據位翻轉至其互補值協助糾錯。
盡管如此,ECCbunengduliyingduiduoweifanzhuancuowu。yinci,shejirenyuanbixucaiyongweijiaozhijishu。gaijishuzuzhiweixiandefangfashijiangwulishangxianglindeweiyingshedaobutongdezijicunqishang。weijiaozhijulijiangyingshedaotongyigezijicunqishangdelianggelianxuweifenkai。ruguoweijiaozhijulidayuyiciduodanyuanzhuangjidekuosanfanwei,tajiangzaiduogezizhongdaozhidanweifanzhuan,erbushizaiyigezizhongdaozhiyiciduoweifanzhuan。

隨著半導體芯片變得越來越小,發生軟錯誤的風險也在不斷升高。存儲單元的Qcrithuisuizheqichicundesuoxiaoerjianshao,zheshideqigengyifanzhuan。yinci,henduozhuanjiayuce,ruancuowujiangchengweizhezhongqushidezhiyueyinsu,erqiezuizhongjiangdadaobaohedian,chufeiwomenkaifachunenggoukefuruancuowudexinjishu。ciwai,suizhejishujinrurenleishenghuodegengduolingyu,renmenduiyukekaoxingdeyaoqiuzhihuiyuelaiyuegao。zhezhongqushicuishengleduicunchuqimokuaidepianshangECC的需求。所有存儲器廠商都已開始推出具備片上ECC功能的芯片,以滿足市場對高可靠性存儲器的需求。SRAM領域的全球領導者賽普拉斯公司擁有一個基於ECC的異步SRAM係列,該係列是當今市場上可靠性最高的異步SRAM。具備ECC功能的16Mbit異步SRAM已開始投產,4Mbi版本也已開始提供樣品。
相關閱讀:
霍尼韋爾半導體封裝新材料,顯著減少軟錯誤故障頻率
三星爆存儲器存隱患,都是穀歌的錯嗎?
專家發言:快閃存儲器儲存陣列強勁成長
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 從技術研發到規模量產:恩智浦第三代成像雷達平台,賦能下一代自動駕駛!
- 從機械執行到智能互動:移遠Q-Robotbox助力具身智能加速落地
- 品英Pickering將亮相2026航空電子國際論壇,展示航電與電池測試前沿方案
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
按鈕開關
白色家電
保護器件
保險絲管
北鬥定位
北高智
貝能科技
背板連接器
背光器件
編碼器型號
便攜產品
便攜醫療
變容二極管
變壓器
檳城電子
並網
撥動開關
玻璃釉電容
剝線機
薄膜電容
薄膜電阻
薄膜開關
捕魚器
步進電機
測力傳感器
測試測量
測試設備
拆解
場效應管
超霸科技




