處理器芯片的局部永久故障恢復。
[0063]【具體實施方式】二:本實施方式具體為一種支持局部永久故障恢復的多核處理器芯片可重構(gòu)方法,所述方法包括如下步驟:
[0064]步驟1:四個處理器核以鎖步模式運行程序,當校驗器發(fā)現(xiàn)比對結(jié)果不匹配時,認為檢測到故障發(fā)生,通過校驗器輸出診斷故障發(fā)生在哪一個核上,確定故障核;
[0065]步驟2:首先對故障核進行瞬時故障恢復;若恢復不成功,轉(zhuǎn)步驟3;
[0066]步驟3:將故障核進行隔離,其余三個核工作在TMR模式下,可保障在故障修復期內(nèi)處理器扔具有較高的可靠性;
[0067]步驟4:采用回讀方法,從可重構(gòu)硬件的配置存儲器中讀取隔離的故障核的配置文件,與初始配置文件進行差異比對,并根據(jù)配置文件碼流與可重構(gòu)硬件的資源映射關(guān)系獲取故障的位置、地址和類型信息,實現(xiàn)對故障點的定位;
[0068]步驟5:根據(jù)故障點的定位分析,確定重構(gòu)布線的約束條件和需要重構(gòu)的最小電路模塊,將其存儲到器件特征庫中;
[0069]步驟6:采用硬件演化算法生成與需要重構(gòu)的最小電路模塊功能一直的等效模塊,從而生成新的配置碼流;
[0070]步驟7:將新的配置碼流重新下載,存入配置文件存儲器中,再注入到配置文件寄存器中,實現(xiàn)對故障核的重構(gòu),實現(xiàn)其正常功能。
[0071 ]所述步驟6中,硬件演化算法包括如下步驟:
[0072]步驟一:確定布局評價方法,此處采用半周長法;即代價函數(shù)為:L = q(i)*[max(xi)-min(xi)+max(yi)-max(yi)],將其存入?yún)?shù)庫中;
[0073]步驟二:確定算法中的各個參數(shù):編碼串長度I;群體規(guī)模η;交叉概率pc,此處使用部分匹配交叉法;變異概率Pm,此處使用隨機翻轉(zhuǎn)配置信息位的方法;自適應(yīng)度函數(shù)F(i),此處F( i) = 1-Cost(i )/n_Sum[Cost( i)/cost_sum)],其中,Sum(F( i )) = 1,Cost = q( i )*[max(xi)-min(xi)+max(yi)-max(yi)],將各參數(shù)存入?yún)?shù)庫;
[0074]步驟三:確定功能模型,將其存入技術(shù)特征庫,功能模型為:以FPGA芯片的基本功能單元4-LUT為例,其分布邏輯輸出由輸入信號和配置信息決定,其功能模型為:
[0075]Ρ0=(α)Λ??0Λ?ι?Λ??2Λ??3)ν(αΛ??0Λ?ι?Λ??2Λ??3)
[0076]......
[0077](C14A ?Ι0Λ ?Ι1Λ ?Ι2Λ ?13) V(C15A ?Ι0Λ ?Ι1Λ ?Ι2Λ ?13)
[0078]其中Ii為輸入信息,Ci為配置碼流中控制改4-LUT功能的相關(guān)位,i= 0,I,2,3。
[0079]對于其他4-LUT、連線資源等可建立類似的功能模型,并構(gòu)成硬件模塊功能模型為:
[0080]Fout = f (F0,F1,......Fn)
[0081]如果存在一個新的配置碼流(:’=0)’(:1’02’...011’,11表示(:與(:’的差異位數(shù),令
[0082]M= (Fout(C,,0) ? Fout(C1O)) Λ (Fout(C,, I) ? Fout(C, I))
[0083]Λ......
[0084](Fout(C,,2'n-l)?Fout(C,2'n-l))
[0085]滿足M=I的解C’就是滿足條件的故障核中重構(gòu)部分的配置碼流;
[0086]步驟四:在重構(gòu)布線的約束條件下,對需要重構(gòu)的最小電路模塊進行布局,產(chǎn)生初始布局種群;
[0087]步驟五:計算現(xiàn)有種群的適應(yīng)度,若滿足退出條件,則算法結(jié)束,否則,轉(zhuǎn)步驟六;
[0088]步驟六:通過適應(yīng)度選擇種群中適應(yīng)度高的個體;
[0089]步驟七:使用賭輪盤法選取適應(yīng)度較高的個體以相應(yīng)概率進行交叉和變異操作,
轉(zhuǎn)步驟五。
[0090]得到最終解,下載新的配置碼流,存入配置文件存儲器中,且將新的配置碼流注入到FPGA內(nèi)部的配置文件寄存器中,實現(xiàn)對故障核部分重構(gòu),恢復其正常功能。
[0091]以上所述,僅為本發(fā)明較佳的【具體實施方式】,這些【具體實施方式】都是基于本發(fā)明整體構(gòu)思下的不同實現(xiàn)方式,而且本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1.一種支持局部永久故障恢復的多核處理器芯片可重構(gòu)系統(tǒng),其特征在于,所述系統(tǒng)包括故障檢測模塊、故障定位模塊和故障恢復模塊; 故障檢測模塊,用于確定多核處理器中發(fā)生局部永久故障的故障核,并對該核進行隔離; 故障定位模塊,采用回讀方法,從故障核的配置存儲器中讀取隔離的臨時配置文件,與故障核的全局配置文件進行差異比對,并根據(jù)配置文件碼流與故障核的資源映射關(guān)系獲取故障的位置、地址和類型信息,實現(xiàn)對故障點的定位;通過對故障點的定位分析,確定重構(gòu)布線的約束條件和需要重構(gòu)的最小電路模塊; 故障恢復模塊,用于避開故障點所在位置,采用硬件演化算法生成與需要重構(gòu)的最小電路模塊功能一致的等效模塊,獲得新的配置碼流,基于局部重配置方法將配置文件的差異碼流重新下載,實現(xiàn)對故障核的重構(gòu),恢復其正常功能,完成多核處理器芯片的局部永久故障恢復。2.根據(jù)權(quán)利要求1所述的支持局部永久故障恢復的多核處理器芯片可重構(gòu)系統(tǒng),其特征在于,所述故障檢測模塊包括校驗器和多核處理器瞬時故障恢復系統(tǒng); 校驗器,用于根據(jù)多核處理器每個核的運算結(jié)果,輸出診斷故障發(fā)生在哪一個核上,確定故障核; 所述多核處理器以鎖步模式運行程序; 多核處理器故障恢復系統(tǒng),用于對故障核進行瞬時故障恢復,當恢復不成功,則對該故障核進行隔離,進行局部永久故障恢復。3.根據(jù)權(quán)利要求1所述的支持局部永久故障恢復的多核處理器芯片可重構(gòu)系統(tǒng),其特征在于,所述故障定位模塊包括外部微控制器、故障定位器、配置文件存儲器和配置數(shù)據(jù)總線; 外部微控制器,用于控制回讀操作,從故障核的配置文件寄存器中讀取隔離的臨時配置文件; 故障定位器,用于將故障核的臨時配置文件與全局配置文件進行差異比對,并根據(jù)配置文件碼流與故障核的資源映射關(guān)系獲取故障的位置、地址和類型信息;通過對故障點的定位分析,確定重構(gòu)布線的約束條件和需要重構(gòu)的最小電路模塊; 配置文件存儲器,用于存儲故障核的全局配置文件和局部配置文件; 配置數(shù)據(jù)總線,用于讀寫內(nèi)部配置寄存器。4.根據(jù)權(quán)利要求3所述的支持局部永久故障恢復的多核處理器芯片可重構(gòu)系統(tǒng),其特征在于,所述故障恢復模塊包括故障恢復器、功能單元庫、期間特征庫和技術(shù)庫和參數(shù)庫; 功能單元庫,用于識別資源使用量和各個功能單元的特征; 器件特征庫,用于存儲確定的重構(gòu)布線的約束條件和需要重構(gòu)的最小電路模塊; 技術(shù)特征庫,用于存儲硬件演化算法中的功能模型; 參數(shù)庫,用于存儲硬件演化算法中的參數(shù); 故障恢復器,用于避開故障點所在位置,采用硬件演化算法生成與需要重構(gòu)的最小電路模塊功能一致的等效模塊,獲得新的配置碼流,基于局部重配置方法將配置文件的差異碼流重新下載,注入故障核的配置文件寄存器器中,實現(xiàn)對故障核的重構(gòu),恢復其正常功能,完成多核處理器芯片的局部永久故障恢復。5.—種支持局部永久故障恢復的多核處理器芯片可重構(gòu)方法,其特征在于,所述方法包括如下步驟: 步驟1:四個處理器核以鎖步模式運行程序,當校驗器發(fā)現(xiàn)比對結(jié)果不匹配時,認為檢測到故障發(fā)生,通過校驗器輸出診斷故障發(fā)生在哪一個核上,確定故障核; 步驟2:首先對故障核進行瞬時故障恢復;若恢復不成功,轉(zhuǎn)步驟3; 步驟3:將故障核進行隔離,其余三個核工作在TMR模式下,可保障在故障修復期內(nèi)處理器扔具有較高的可靠性; 步驟4:采用回讀方法,從可重構(gòu)硬件的配置存儲器中讀取隔離的故障核的配置文件,與初始配置文件進行差異比對,并根據(jù)配置文件碼流與可重構(gòu)硬件的資源映射關(guān)系獲取故障的位置、地址和類型信息,實現(xiàn)對故障點的定位; 步驟5:根據(jù)故障點的定位分析,確定重構(gòu)布線的約束條件和需要重構(gòu)的最小電路模塊,將其存儲到器件特征庫中; 步驟6:采用硬件演化算法生成與需要重構(gòu)的最小電路模塊功能一直的等效模塊,從而生成新的配置碼流; 步驟7:將新的配置碼流重新下載,存入配置文件存儲器中,再注入到故障核的配置文件寄存器中,實現(xiàn)對故障核的重構(gòu),實現(xiàn)其正常功能。6.根據(jù)權(quán)利要求1所述的支持局部永久故障恢復的多核處理器芯片可重構(gòu)方法,其特征在于:所述步驟6中,硬件演化算法包括如下步驟: 步驟一:確定布局評價方法; 步驟二:確定算法中的各個參數(shù):編碼串長度、群體規(guī)模、交叉概率、變異概率和自適應(yīng)度函數(shù);并將各個參數(shù)存入?yún)?shù)庫; 步驟三:確定功能模型,將其存入技術(shù)特征庫; 步驟四:在重構(gòu)布線的約束條件下,對需要重構(gòu)的最小電路模塊進行布局,產(chǎn)生初始布局種群; 步驟五:計算現(xiàn)有種群的適應(yīng)度,若滿足退出條件,則算法結(jié)束,否則,轉(zhuǎn)步驟六; 步驟六:通過適應(yīng)度選擇種群中適應(yīng)度高的個體; 步驟七:使用賭輪盤法選取適應(yīng)度較高的個體以相應(yīng)概率進行交叉和變異操作,轉(zhuǎn)步驟五。
【專利摘要】支持局部永久故障恢復的多核處理器芯片可重構(gòu)系統(tǒng),屬于計算機技術(shù)領(lǐng)域。為了解決現(xiàn)有多核處理器芯片的局部故障恢復存在可用性差的問題。所述系統(tǒng)包括:故障檢測模塊,用于檢測多核處理器芯片的故障,并將故障核隔離;故障定位模塊,用于獲取故障的位置,地址和類型等信息,實現(xiàn)對故障的準確定位;根據(jù)故障點的定位分析,確定重構(gòu)布線的約束條件和需要重構(gòu)的最小電路模塊;故障恢復模塊,避開故障點所在位置,采用硬件演化算法生成與需要重構(gòu)的最小電路模塊功能一致的等效模塊,獲得新的配置碼流,基于局部重配置方法將配置文件的差異碼流重新下載,實現(xiàn)對故障核的重構(gòu),恢復其正常功能。用于多核處理器局部永久故障恢復。
【IPC分類】G06F11/22
【公開號】CN105653411
【申請?zhí)枴?br>【發(fā)明人】季振洲, 劉君, 吳倩倩, 張源悍, 王楷
【申請人】哈爾濱工業(yè)大學
【公開日】2016年6月8日
【申請日】2015年12月28日