專(zhuān)利名稱(chēng):隨機(jī)存儲(chǔ)器失效的檢測(cè)處理方法、裝置和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及#企測(cè)領(lǐng)域,尤其涉及一種CPU/DSP的RAM存儲(chǔ)空間失效的 牙企測(cè)處理方法、裝置和系統(tǒng)。
背景技術(shù):
帶有隨才/U^儲(chǔ)器(Random Access Memory, RAM)的器件在其生命周期 中,會(huì)由于各種各樣的原因?qū)е鹿δ苁В?一般而言,硬件本身發(fā)生損壞的, 我們稱(chēng)之為器件硬失效(Firm Error),否則,稱(chēng)之為器件軟失效(Soft Error )。軟失效主要是由于帶電粒子撞擊器件的存儲(chǔ)單元RAM引起的,這些高能 粒子和半導(dǎo)體存儲(chǔ)器的原子相互作用產(chǎn)生電子空穴對(duì),該電子空穴對(duì)導(dǎo)致存儲(chǔ) 單元中存儲(chǔ)信息的改變,進(jìn)而導(dǎo)致器件功能錯(cuò)誤。上世紀(jì)70年代末的時(shí)候,工程人員就發(fā)現(xiàn)了軟失效的現(xiàn)象,當(dāng)時(shí)的原因 是器件封裝材料放射性雜質(zhì)衰變發(fā)出ct粒子,引起了電離效應(yīng),導(dǎo)致存儲(chǔ)單元 狀態(tài)發(fā)生改變。隨著半導(dǎo)體技術(shù)的發(fā)展、器件工藝尺寸的降低、工作電壓的減 少,現(xiàn)在發(fā)現(xiàn)宇宙射線同樣也能引起器件軟失效,且其影響的程度將比以往嚴(yán) 重的多,因此現(xiàn)在器件軟失效再次受到業(yè)界的關(guān)注。所有帶RAM的器件都有可能發(fā)生軟失效,不過(guò)迄今為止業(yè)界關(guān)注較多的 是基于RAM的現(xiàn)場(chǎng)可編程門(mén)陣列(Field Programmable Gate Array, FPGA)和 專(zhuān)用集成電路(Application Specific Integrated Circuit, ASIC )等邏輯器件出現(xiàn) 的軟失效問(wèn)題,而且在設(shè)計(jì)和防護(hù)上已經(jīng)積累了一定的經(jīng)驗(yàn),但對(duì)于應(yīng)用更廣 泛的CPU/DSP的靜態(tài)隨機(jī)存儲(chǔ)器(Static Random Access Memory, SRAM )和 動(dòng)態(tài)隨4幾存儲(chǔ)器(Dynamic Random Access Memory, DRAM )的軟失效問(wèn)題則 關(guān)注4交少。實(shí)際上,CPU/DSP的SRAM和DRAM儲(chǔ)存器照樣存在嚴(yán)重的軟失效情況。 比如,根據(jù)多個(gè)器件廠商提供的數(shù)據(jù),折合成年失效率,l兆比特SRAM中出 現(xiàn)l比特空間軟失效的概率是千分之幾的級(jí)別,對(duì)于通訊、航天和軍用等對(duì)穩(wěn) 定性要求很?chē)?yán)的產(chǎn)品而言,這是一個(gè)很高的失效率??梢源_定的是,在那些對(duì)CPU/DSP使用很頻繁的商用產(chǎn)品中,出現(xiàn)SRAM 或DRAM軟失效的概率很大。其中有一些可以通過(guò)內(nèi)存分析找到并確認(rèn)是軟 失效引起的,但是絕大多數(shù)都會(huì)表現(xiàn)為一些無(wú)法重現(xiàn)的故障,比如復(fù)位、死機(jī)、 無(wú)異常記錄情況下部分功能錯(cuò)誤等等。這一方面會(huì)影響產(chǎn)品的可靠性,另一方 面為了定位這些問(wèn)題會(huì)投入大量的人力,因此有必要將軟失效的影響限制在最 低的限度。為了能及時(shí)發(fā)現(xiàn)并修復(fù)CPU/DSP的RAM軟失效,現(xiàn)有技術(shù)提供以下方 案利用CPU/DSP自身程序?qū)PU/DSP的RAM程序內(nèi)容進(jìn)行偶校驗(yàn),并在 發(fā)現(xiàn)RAM庫(kù)欠失效時(shí),人工進(jìn)行纟務(wù)復(fù)。在實(shí)現(xiàn)本發(fā)明的過(guò)程中,本發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)的方案至少存在以下問(wèn)題第一、從檢測(cè)機(jī)制上,現(xiàn)有技術(shù)采用CPU/DSP自身程序檢測(cè)CPU/DSP的 RAM程序內(nèi)容,并且采用偶校驗(yàn)的方式,存在不能實(shí)現(xiàn)完全準(zhǔn)確檢測(cè)的風(fēng)險(xiǎn)。第二、故障發(fā)生后的處理還依賴(lài)于人工方式,相對(duì)來(lái)說(shuō),人工維護(hù)工作量 比較大,同時(shí)不能實(shí)時(shí)進(jìn)行恢復(fù),對(duì)業(yè)務(wù)影響較大。發(fā)明內(nèi)容本發(fā)明實(shí)施方式要解決的主要技術(shù)問(wèn)題是提供一種RAM失效的檢測(cè)處理 方法、裝置和系統(tǒng),能夠在及時(shí)準(zhǔn)確發(fā)現(xiàn)RAM失效的基礎(chǔ)上進(jìn)行自動(dòng)修復(fù), 將RAM失效對(duì)業(yè)務(wù)的影響將至最低,并降低人工成本。為解決上述技術(shù)問(wèn)題,本發(fā)明的一個(gè)實(shí)施例提供了一種隨機(jī)存儲(chǔ)器RAM 失效的纟企測(cè)處理方法,應(yīng)用于對(duì)中央處理器CPU/數(shù)字信號(hào)處理器DSP的RAM失效的檢測(cè)處理,該方法包括獲取所述RAM中的程序內(nèi)容,將獲取的程序 內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì),若所述RAM中程序內(nèi)容出現(xiàn)錯(cuò)誤、且錯(cuò)誤 率低于預(yù)定值,則使用正確的程序內(nèi)容對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù); 通過(guò)檢測(cè)數(shù)據(jù)修復(fù)后的CPU/DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù)據(jù)修復(fù)是否成 功,若所述評(píng)估結(jié)果為數(shù)據(jù)修復(fù)失敗,則通過(guò)復(fù)位的方式重新加載RAM中的 程序內(nèi)容進(jìn)行修復(fù)。本發(fā)明的另一個(gè)實(shí)施例提供了一種RAM失效的4企測(cè)處理裝置,應(yīng)用于對(duì) CPU/DSP的RAM失效的檢測(cè)處理,該裝置包括檢測(cè)判斷單元、錯(cuò)誤數(shù)據(jù)修 復(fù)單元、評(píng)估單元和加載修復(fù)單元。其中,所述檢測(cè)判斷單元,用于讀取所述 RAM中的程序內(nèi)容,將讀取的程序內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì),若所述 RAM中程序內(nèi)容出現(xiàn)錯(cuò)誤、且錯(cuò)誤率低于預(yù)定值,則發(fā)送數(shù)據(jù)修復(fù)指令到所 述錯(cuò)誤數(shù)據(jù)修復(fù)單元;所述錯(cuò)誤數(shù)據(jù)修復(fù)單元,用于在接收到所述數(shù)據(jù)修復(fù)指 令后,使用正確的程序內(nèi)容對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);所述評(píng)估單 元,用于通過(guò)檢測(cè)經(jīng)過(guò)數(shù)據(jù)修復(fù)后的CPU/DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù) 據(jù)修復(fù)是否成功;所述加載修復(fù)單元,用于在所述評(píng)估單元評(píng)估數(shù)據(jù)修復(fù)失敗 時(shí),通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行修復(fù)。本發(fā)明的再一個(gè)實(shí)施例提供了一種RAM失效的檢測(cè)處理系統(tǒng),用于對(duì) CPU/DSP的RAM失效的檢測(cè)處理,包括前述的RAM失效檢測(cè)處理裝置,以 及作為被4企測(cè)對(duì)象的CPU/DSP的RAM。本發(fā)明實(shí)施例提供的方案與現(xiàn)有技術(shù)相比,主要區(qū)別及其效果在于本發(fā)明實(shí)施例提供的技術(shù)方案,在檢測(cè)到RAM中程序內(nèi)容發(fā)生錯(cuò)誤、且 錯(cuò)誤率低于預(yù)定值后,先對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);之后對(duì)數(shù)據(jù)修 復(fù)是否成功進(jìn)行評(píng)估,如果評(píng)估結(jié)果為數(shù)據(jù)修復(fù)失敗,則自動(dòng)通過(guò)復(fù)位的方式 重新加載RAM中的程序內(nèi)容,再次進(jìn)行4務(wù)復(fù)。通過(guò)這樣的兩級(jí)修復(fù)機(jī)制(數(shù)據(jù)修復(fù)和重新加載修復(fù)),能夠針對(duì)RAM失 效中存在的各種情況而采用相應(yīng)的處理方式,從而在及時(shí)發(fā)現(xiàn)RAM失效的基礎(chǔ)上,有條件的進(jìn)行針對(duì)性更為明確的自動(dòng)修復(fù),將RAM失效對(duì)業(yè)務(wù)的影響 將至最低。另外,本發(fā)明實(shí)施例提供的技術(shù)方案,由于檢測(cè)、評(píng)估和修復(fù)均為自動(dòng)實(shí) 現(xiàn),極大的降低了人工成本。
圖1為本發(fā)明實(shí)施例一提供的RAM失效的檢測(cè)處理方法流程圖; 圖2為本發(fā)明實(shí)施例二提供的RAM失效的檢測(cè)處理方法流程圖; 圖3為本發(fā)明實(shí)施例三提供的RAM失效的檢測(cè)處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明 作進(jìn)一步地詳細(xì)描述。對(duì)于實(shí)際的產(chǎn)品,按照其存儲(chǔ)空間是否可受高層訪問(wèn)的特性,CPU/DSP 可以分為兩種應(yīng)用類(lèi)型 一類(lèi)CPU/DSP的存儲(chǔ)空間可以被高層控制實(shí)體(比 如,可以采用高層的CPU或DSP作為控制實(shí)體)訪問(wèn),為了描述方便,簡(jiǎn)稱(chēng) 其為A類(lèi);另 一類(lèi)CPU/DSP的存儲(chǔ)空間不可被高層控制實(shí)體訪問(wèn),筒稱(chēng)其為 B類(lèi)。本發(fā)明實(shí)施例提供的技術(shù)方案,主要是針對(duì)A類(lèi)CPU/DSP的存儲(chǔ)空間 RAM。另外,CPU/DSP的RAM空間分為程序內(nèi)容和數(shù)據(jù)內(nèi)容兩部分,通常 CPU/DSP的RAM程序內(nèi)容是固定不變的,而CPU/DSP的RAM數(shù)據(jù)內(nèi)容會(huì) 隨著數(shù)據(jù)的處理而不斷發(fā)生變化。RAM失效的檢測(cè)處理中,其對(duì)象是CPU/DSP 的RAM禾呈序內(nèi)容。本發(fā)明實(shí)施例提供的技術(shù)方案,在檢測(cè)到RAM中程序內(nèi)容發(fā)生錯(cuò)誤、且 錯(cuò)誤率低于預(yù)定值后,先對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);之后對(duì)數(shù)據(jù)修 復(fù)是否成功進(jìn)行評(píng)估,如果評(píng)估結(jié)果為數(shù)據(jù)^^復(fù)失敗,則自動(dòng)通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容,再次進(jìn)行^ff復(fù)。圖1是本發(fā)明實(shí)施例一提供的RAM失效的檢測(cè)處理方法流程圖。如圖1 所示,該方法包括如下步驟步驟101:獲取RAM中的程序內(nèi)容;步驟102:將獲取的程序內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì),若所述RAM 中程序內(nèi)容出現(xiàn)錯(cuò)誤、且錯(cuò)誤率低于預(yù)定值,則執(zhí)行步驟102;可以理解的是,當(dāng)RAM中程序內(nèi)容沒(méi)有錯(cuò)誤時(shí),流程可以就此結(jié)束(簡(jiǎn) 便起見(jiàn),圖中未示出)。值得說(shuō)明的是,步驟101和102可以視為對(duì)RAM中程序內(nèi)容的檢測(cè)環(huán)節(jié)。 步驟103:使用正確的程序內(nèi)容對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù); 步驟104:通過(guò)檢測(cè)數(shù)據(jù)修復(fù)后的CPU/DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù) 據(jù)修復(fù)是否成功,如果評(píng)估結(jié)果為數(shù)據(jù)修復(fù)成功,則執(zhí)行步驟105,如果評(píng)估 結(jié)果為數(shù)據(jù)修復(fù)失敗,則執(zhí)行步驟106;步驟105:數(shù)據(jù)修復(fù)成功后,判斷所述RAM發(fā)生軟失效,進(jìn)行事件提示; 步驟106:通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行修復(fù)。 圖2是本發(fā)明實(shí)施例二提供的RAM失效的^r測(cè)處理方法流程圖。簡(jiǎn)便起 見(jiàn),本實(shí)施例以檢測(cè)處理對(duì)象為DSP的RAM為例進(jìn)行說(shuō)明。由于用DSP自 身程序檢測(cè)DSP的RAM,會(huì)帶來(lái)檢測(cè)處理的不可靠性,所以,需要使用高層 控制實(shí)體來(lái)實(shí)現(xiàn)對(duì)DSP的RAM的檢測(cè),以此保證檢測(cè)結(jié)果的可靠性。另夕卜, 為了實(shí)現(xiàn)實(shí)時(shí)對(duì)DSP軟失效的恢復(fù)處理,也需要借助高層控制實(shí)體進(jìn)行管理。 本實(shí)施例中,簡(jiǎn)便起見(jiàn),僅以高層控制實(shí)體為CPU為例進(jìn)行說(shuō)明,但不限于 此。而且,本發(fā)明實(shí)施例提供的技術(shù)方案中,RAM包括CPU/DSP的SRAM 和DRAM。本實(shí)施例是針對(duì)DSP的RAM可以直接被高層控制實(shí)體CPU訪問(wèn)的情況。 在這種情況下,DSP的RAM程序內(nèi)容一般而言也是由CPU下發(fā)加載的。在本 實(shí)施例中,DSP程序(包括RAM程序在內(nèi))可以由CPU通過(guò)CPU和DSP之間的HPI (hardware platform interface,硬件平臺(tái)接口 )接口進(jìn)行加載的。CPU 在HPI 口加載DSP程序時(shí),可以在CPU自身的存儲(chǔ)器中中保留相關(guān)DSP的 RAM程序內(nèi)容,也即存儲(chǔ)正確的RAM程序內(nèi)容,記錄為A。如圖2所示,該方法包括如下步驟201: CPU獲取DSP的RAM程序內(nèi)容;本步驟中,可以由CPU啟動(dòng)定時(shí)器,定時(shí)器時(shí)間到時(shí),由CPU軟件獲取 DSP當(dāng)前正在運(yùn)行中的RAM程序內(nèi)存,記錄為B;具體的,該定時(shí)器可以根據(jù)各種應(yīng)用業(yè)務(wù)所能承受的情況而決定,比如, 可以是2分鐘、5分鐘、IO分鐘或是其它周期,本實(shí)施例中以IO分鐘為例。 這樣,當(dāng)定時(shí)器超時(shí)時(shí),由CPU軟件通過(guò)HPI 口獲取DSP當(dāng)前正在運(yùn)行中的 RAM程序內(nèi)容,記錄為B;步驟202: CPU將獲取的RAM程序B與正確的程序內(nèi)容A進(jìn)行比對(duì),判 斷RAM程序內(nèi)容在發(fā)生錯(cuò)誤的情況下,其錯(cuò)誤率是否低于預(yù)定值,如果是, 則執(zhí)行步驟203 (數(shù)據(jù)修復(fù)),如果判斷結(jié)果為否,則執(zhí)行步驟207 (重新加載 修復(fù));本步驟中,可以由CPU程序?qū)和B按比特bit位逐個(gè)比對(duì)。比對(duì)的結(jié) 果可能為l)如果A和B完全一致,則認(rèn)為該DSP中當(dāng)前正在運(yùn)行的RAM 程序內(nèi)容正確無(wú)誤,處于正常狀態(tài),可以繼續(xù)運(yùn)行,整個(gè)RAM失效才全測(cè)處理 流程就此結(jié)束;2 )如果A和B不一致,則由CPU記錄不一致的bit位和正確 的程序內(nèi)容A對(duì)應(yīng)bit位的正確值信息(比如,正確的程序代碼)。在2)的情況下,由CPU統(tǒng)計(jì)累計(jì)錯(cuò)誤比特位,如果錯(cuò)誤比特位低于預(yù)定 值(例如3比特),則判斷當(dāng)前DSP的RAM程序內(nèi)容錯(cuò)誤率較低,并轉(zhuǎn)入步 驟203;如果累計(jì)錯(cuò)誤比特位大于或等于預(yù)定值(例如3比特),則判斷當(dāng)前 DSP的RAM程序內(nèi)容錯(cuò)誤率較高,并轉(zhuǎn)入步驟207 (重新加載修復(fù))。根據(jù)系統(tǒng)的實(shí)際容錯(cuò)情況,可以設(shè)定不同的累計(jì)錯(cuò)誤比特位的預(yù)定值,例 如3比特、5比特、7比特或其它,本實(shí)施例中以3比特為例。值得說(shuō)明的是,步驟201和202可以視為對(duì)RAM中程序內(nèi)容的檢測(cè)環(huán)節(jié)。步驟203: CPU使用正確的程序內(nèi)容A對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修 復(fù),對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容全部修復(fù)后,執(zhí)行步驟204;步驟203中,高層控制實(shí)體CPU對(duì)發(fā)生錯(cuò)誤的DSP的RAM程序內(nèi)容進(jìn) 行數(shù)據(jù)修復(fù),即CPU將存儲(chǔ)于其中的正確程序代碼重新下發(fā)到RAM中出現(xiàn)數(shù) 據(jù)錯(cuò)誤的數(shù)據(jù)單元,進(jìn)行修復(fù)。具體的實(shí)現(xiàn)方式可以為由CPU程序通過(guò)HPI 口讀取步驟202中記錄的DSP的RAM程序內(nèi)容中的不一致bit位,并將對(duì)應(yīng) bit位的內(nèi)存信息修復(fù)為A中對(duì)應(yīng)bit位的正確值信息(比如,正確程序代碼)。 如果對(duì)應(yīng)bit位修復(fù)成功后,CPU程序繼續(xù)通過(guò)HPI 口修改DSP的RAM程序 內(nèi)容中下一個(gè)不一致的bit位,直至所有不一致bit位^修復(fù)結(jié)束。如果對(duì)所有不一致比特位都能夠成功修復(fù),則執(zhí)行步驟204,進(jìn)行數(shù)據(jù)修 復(fù)的評(píng)估環(huán)節(jié)。在該數(shù)據(jù)修復(fù)過(guò)程中,可能還會(huì)出現(xiàn)一種情況某比特位修復(fù)失敗(比如 根本不能修復(fù)),則轉(zhuǎn)入步驟206,進(jìn)行重新加載修復(fù)。步驟204:通過(guò)檢測(cè)數(shù)據(jù)修復(fù)后的DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù)據(jù)修 復(fù)是否成功,若所述評(píng)估結(jié)果為數(shù)據(jù)修復(fù)失敗,則執(zhí)行步驟206 (重新加載修 復(fù));本步驟中,評(píng)估數(shù)據(jù)修復(fù)是否成功的實(shí)現(xiàn)方式可以有多種 方式一計(jì)算相鄰檢測(cè)周期內(nèi)DSP數(shù)據(jù)處理異常記錄次數(shù)的差值,若所 述差值大于第一門(mén)限,則評(píng)估數(shù)據(jù)修復(fù)失敗。具體可以包括步驟A,啟動(dòng)評(píng)估超時(shí)定時(shí)器,定時(shí)器的周期為5分鐘。 評(píng)估超時(shí)定時(shí)器的具體時(shí)限可以視業(yè)務(wù)需求調(diào)整,可以是3分鐘,5分鐘、7 分鐘或是其它時(shí)限,在本實(shí)施例中,以5分鐘為例。步驟B, CPU讀取當(dāng)前 DSP數(shù)據(jù)處理異常記錄次數(shù),記為C。在CPU/DSP程序設(shè)計(jì)中,對(duì)于DSP數(shù) 據(jù)處理異常的情況,會(huì)累計(jì)異常記錄次數(shù),例如數(shù)據(jù)處理出現(xiàn)一次異常,則記 錄為1,出現(xiàn)兩次異常,則記錄為2,依次類(lèi)推。步驟C,在評(píng)估超時(shí)定時(shí)器超時(shí)時(shí),高層控制實(shí)體再次讀取當(dāng)前DSP數(shù)據(jù)處理異常記錄次數(shù),記為D,并計(jì)算D-C的差。相應(yīng)的,評(píng)估數(shù)據(jù)修復(fù)是否成功的方式可以為如果(D-C) 的差值大于第一門(mén)限,比如該門(mén)限可以設(shè)定為10 ( 10并不是一個(gè)唯一的差值, 具體的差值可以也可—見(jiàn)業(yè)務(wù)需求進(jìn)行調(diào)整),則CPU判斷對(duì)DSP的RAM程序 內(nèi)容進(jìn)行的數(shù)據(jù)修復(fù)失敗。方式二對(duì)CPU/DSP輸出的數(shù)據(jù)進(jìn)行校驗(yàn),若計(jì)算得到的校驗(yàn)錯(cuò)誤率大 于第二門(mén)限,則評(píng)估數(shù)據(jù)修復(fù)失敗;具體可以包括DSP在對(duì)數(shù)據(jù)處理時(shí)進(jìn)行CRC( Cyclic Redundancy Check, 循環(huán)冗余碼)校驗(yàn),在DSP將數(shù)據(jù)處理后輸出到CPU后,CPU針對(duì)DSP的輸 出數(shù)據(jù)也進(jìn)行CRC校驗(yàn),由CPU累計(jì)CRC校驗(yàn)錯(cuò)誤率。相應(yīng)的,評(píng)估數(shù)據(jù) 修復(fù)是否成功的方式可以為如果累計(jì)CRC校驗(yàn)錯(cuò)誤率大于第二門(mén)限,比如 該門(mén)限可以設(shè)定為50% (50%并不是一個(gè)固定不變的值,具體值也可視業(yè)務(wù)需 求進(jìn)行調(diào)整),則高層控制實(shí)體判斷對(duì)DSP的RAM程序內(nèi)容進(jìn)行的數(shù)據(jù)修復(fù) 失敗。方式三評(píng)估數(shù)據(jù)修復(fù)是否成功可以結(jié)合上述兩種方式來(lái)完成,即,計(jì)算 相鄰檢測(cè)周期內(nèi)DSP數(shù)據(jù)處理異常記錄次數(shù)的差值,若所述差值大于第三門(mén) 限,且對(duì)CPU/DSP輸出的數(shù)據(jù)進(jìn)行校驗(yàn)所得到的校驗(yàn)錯(cuò)誤率大于第四門(mén)限, 則評(píng)估數(shù)據(jù)修復(fù)失敗。其中,該第三門(mén)限可以與第一門(mén)限相同或不同,該第四 門(mén)限可以與第二門(mén)限相同或不同。通過(guò)以上的評(píng)估方式,如果評(píng)估結(jié)果為成功,則執(zhí)行步驟205;如果評(píng)估 結(jié)果為數(shù)據(jù)修復(fù)失敗,則需要執(zhí)行步驟206 (重新加載修復(fù))。值得說(shuō)明的是,在步驟204執(zhí)行評(píng)估之前,可選的,還可以包括步驟由 CPU程序通過(guò)HPI 口讀耳又步驟202記錄的DSP內(nèi)存不一致bit位,并將對(duì)應(yīng) bit位的程序內(nèi)容和A中對(duì)應(yīng)bit位的正確值信息相比較。如果兩者不 一致,則 不執(zhí)行評(píng)估的步驟,而直接進(jìn)入步驟206,進(jìn)行重新加載修復(fù)。即,若CPU對(duì) 發(fā)生錯(cuò)誤的比特位的程序代碼進(jìn)行數(shù)據(jù)修復(fù)后,該發(fā)生錯(cuò)誤的比特位的程序代碼仍與正確程序代碼不一致,則直接通過(guò)復(fù)位的方式重新加載RAM中的程序 內(nèi)容進(jìn)行修復(fù)。步驟205:數(shù)據(jù)修復(fù)成功后,判斷所述RAM發(fā)生軟失效,進(jìn)行事件提示; 本步驟中,因?yàn)樵u(píng)估結(jié)果為數(shù)據(jù)修復(fù)成功,則表明RAM發(fā)生了軟失效, 可以對(duì)上述信息以事件提示的方式,進(jìn)行上報(bào)。在事件信息中包含的信息中可 以包括以下信息之一或其組合發(fā)生失效的時(shí)間,失效的種類(lèi)(軟失效),數(shù) 據(jù)修復(fù)的時(shí)間,以及數(shù)據(jù)修復(fù)評(píng)估結(jié)果等。當(dāng)然,還可以對(duì)上述信息進(jìn)行記錄。 另外,在事件信息中包含的信息還可以包括提示操作管理員在本事件發(fā) 生前后若干分鐘內(nèi)可能產(chǎn)生了對(duì)業(yè)務(wù)通訊質(zhì)量的影響,需要基站設(shè)備操作管理 員確認(rèn)對(duì)于網(wǎng)絡(luò)業(yè)務(wù)通訊質(zhì)量KPI( Key Performance Indication,關(guān)4建業(yè)績(jī)指標(biāo)) 的影響。步驟206:通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行修復(fù);步驟207:對(duì)重新加載到RAM中的程序內(nèi)容進(jìn)行一致性比對(duì),若發(fā)生錯(cuò) 誤的程序內(nèi)容與正確的程序內(nèi)容全部一致,則判斷發(fā)生軟失效,執(zhí)行步驟205, 若發(fā)生錯(cuò)誤的程序內(nèi)容與正確的程序內(nèi)容仍不一致,則執(zhí)行步驟208;在DSP重新加載程序啟動(dòng)后,CPU程序再次對(duì)DSP的RAM程序內(nèi)容進(jìn) 行4企測(cè)(與正確的程序內(nèi)容A進(jìn)行一致性比對(duì)),如果發(fā)現(xiàn)步驟202記錄的DSP 內(nèi)存不一致bit位均已正確,則表明重新加載修復(fù)成功,執(zhí)行步驟205;如果發(fā) 現(xiàn)記錄的不一致bit位的信息仍不正確,則表明重新加載修復(fù)不成功(與正確 的程序內(nèi)容A相應(yīng)比特位仍不一致),則執(zhí)行步驟208。如果能夠通過(guò)重新加載修復(fù)成功,則表明RAM發(fā)生了軟失效。值得說(shuō)明 的是,此處在事件信息中包含的信息中,除了可以包括之前在步驟205中包含 的信息之外,還可以包括重新加載修復(fù)的時(shí)間,以及重新加載修復(fù)的結(jié)果。 當(dāng)然,此處在事件信息中包含的信息,也可以?xún)H僅包括重新加載修復(fù)的時(shí)間, 以及重新加載修復(fù)的結(jié)果。另外,還可以對(duì)上述信息進(jìn)行記錄。其中,在事件信息中包含的信息還可以包括提示操作管理員在本事件發(fā)生前后若干分鐘內(nèi)可能產(chǎn)生了對(duì)業(yè)務(wù)通訊質(zhì)量的影響,需要基站設(shè)備操作管理 員確認(rèn)對(duì)于網(wǎng)絡(luò)業(yè)務(wù)通訊質(zhì)量KPI的影響。步驟208:判斷所述RAM發(fā)生硬失效,上報(bào)器件故障告警。本步驟中,由于判斷發(fā)生了硬失效,需要通過(guò)上報(bào)器件故障告警的方式, 提示操作管理員通過(guò)更換單板的方式來(lái)修復(fù)。當(dāng)然,可以對(duì)上述信息以事件提示的方式,進(jìn)行上報(bào)。在事件信息中包含 的信息,可以包括以下信息之一或其組合發(fā)生失效的時(shí)間,失效的類(lèi)型(硬 失效),數(shù)據(jù)修復(fù)的時(shí)間,數(shù)據(jù)修復(fù)評(píng)估的結(jié)果,以及重新加載修復(fù)的時(shí)間和 結(jié)果。另外,也可以對(duì)上述信息進(jìn)行記錄。其中,事件信息中包含的信息還可以包括提示操作管理員在本事件發(fā)生 前后若干分鐘內(nèi)可能產(chǎn)生了對(duì)業(yè)務(wù)通訊質(zhì)量的影響,需要基站設(shè)備才喿作管理員 確認(rèn)對(duì)于網(wǎng)絡(luò)業(yè)務(wù)通訊質(zhì)量KPI的影響。值得說(shuō)明的是,上述實(shí)施例中,僅僅以一次數(shù)據(jù)修復(fù)和相應(yīng)的數(shù)據(jù)修復(fù)評(píng) 估為例進(jìn)行說(shuō)明。但本發(fā)明的實(shí)施例可以不限于此,比如,還可以采用另外一 種實(shí)現(xiàn)方式重復(fù)多次數(shù)據(jù)修復(fù)過(guò)程,以及相應(yīng)的數(shù)據(jù)修復(fù)評(píng)估過(guò)程,當(dāng)一次 數(shù)據(jù)修復(fù)不成功時(shí),則重復(fù)進(jìn)行數(shù)據(jù)修復(fù),以及進(jìn)行相應(yīng)的評(píng)估。比如,預(yù)設(shè) 最多可以重復(fù)修復(fù)3次,當(dāng)重復(fù)修復(fù)次數(shù)達(dá)到3,且數(shù)據(jù)修復(fù)的評(píng)估結(jié)果仍然 為失敗時(shí),再執(zhí)行步驟207的重新加載修復(fù)。此種情況下,上報(bào)的RAM失效 信息中,還可以包括數(shù)據(jù)修復(fù)的次數(shù)。本發(fā)明實(shí)施例提供的技術(shù)方案,使用高層控制實(shí)體來(lái)實(shí)現(xiàn)對(duì)DSP的RAM 的檢測(cè),以此保證檢測(cè)結(jié)果的可靠性;針對(duì)存放在CPU/DSPRAM中的程序內(nèi) 容,采用與正確數(shù)據(jù)進(jìn)行比對(duì)的方法,及時(shí)檢測(cè)RAM存儲(chǔ)器的失效情況。在 檢測(cè)到RAM中程序內(nèi)容發(fā)生錯(cuò)誤,且錯(cuò)誤率低于預(yù)定值后,先對(duì)發(fā)生錯(cuò)誤的 程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);之后對(duì)數(shù)據(jù)修復(fù)是否成功進(jìn)行評(píng)估,如果評(píng)估結(jié)果為 數(shù)據(jù)》務(wù)復(fù)失敗,則自動(dòng)通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容,再次進(jìn) 行修復(fù)。如果數(shù)據(jù)修復(fù)評(píng)估結(jié)果為成功,則判斷為發(fā)生RAM軟失效,在這種情況 下,可以記錄軟失效信息,并以事件的方式進(jìn)行上報(bào)。如果RAM中程序內(nèi)容 發(fā)生錯(cuò)誤、且錯(cuò)誤率不低于預(yù)定值,或數(shù)據(jù)修復(fù)評(píng)估結(jié)果不成功,或數(shù)據(jù)修復(fù) 過(guò)程中出現(xiàn)無(wú)法修復(fù)的情況,需要進(jìn)行重新加載修復(fù)。如果重新加載修復(fù)后檢 測(cè)結(jié)果為成功,則判斷發(fā)生RAM軟失效,可以記錄軟失效信息,并以事件的 方式進(jìn)行上報(bào);如果重新加載修復(fù)后檢測(cè)結(jié)果仍然為不成功(發(fā)生錯(cuò)誤的比特 位仍不正確),則判斷發(fā)生RAM硬失效,可以記錄硬失效信息,并以事件的方 式進(jìn)行上報(bào)。通過(guò)這樣的兩級(jí)修復(fù)機(jī)制(數(shù)據(jù)修復(fù)和重新加載修復(fù)), 一方面,能夠針 對(duì)RAM失效中存在的各種情況(可能是軟失效,也可能產(chǎn)生了硬失效)而采 用相應(yīng)的處理方式,從而在及時(shí)發(fā)現(xiàn)RAM失效的勤A上,有條件的進(jìn)行針對(duì) 性更為明確的自動(dòng)修復(fù),將RAM失效對(duì)業(yè)務(wù)的影響將至最低;另一方面,通 過(guò)將失效信息以事件方式上報(bào)或告警指示等方式,為失效提供準(zhǔn)確的信息參 考,比如,在發(fā)生硬失效的情況下,操作管理員可以根據(jù)告警信息,第一時(shí)間 更換單板,及時(shí)恢復(fù)通信。另外,本發(fā)明實(shí)施例提供的技術(shù)方案,由于檢測(cè)、評(píng)估和修復(fù)均為自動(dòng)實(shí) 現(xiàn),極大的降低了人工成本。本發(fā)明第三個(gè)實(shí)施例提供了一種RAM失效的檢測(cè)處理裝置,應(yīng)用于對(duì) CPU/DSP的RAM失效的檢測(cè)處理。該裝置包括檢測(cè)判斷單元301、錯(cuò)誤數(shù) 據(jù)》務(wù)復(fù)單元302、評(píng)估單元303和加載》務(wù)復(fù)單元304。其中,所述檢測(cè)判斷單元301,用于獲取所述RAM中的程序內(nèi)容,將獲取的程 序內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì),若所述RAM中程序內(nèi)容的錯(cuò)誤率低于預(yù) 定值,則發(fā)送數(shù)據(jù)修復(fù)指令到所述錯(cuò)誤數(shù)據(jù)修復(fù)單元;所述錯(cuò)誤數(shù)據(jù)修復(fù)單元302,用于在接收到所述數(shù)據(jù)修復(fù)指令后,使用正 確的程序內(nèi)容對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);所述評(píng)估單元303,用于通過(guò)檢測(cè)經(jīng)過(guò)數(shù)據(jù)修復(fù)后的CPU/DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù)據(jù)修復(fù)是否成功;所述加載修復(fù)單元304,用于在所述評(píng)估單元評(píng)估數(shù)據(jù)修復(fù)失敗時(shí),通過(guò) 復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)4亍修復(fù)。由于本發(fā)明實(shí)施例提供的技術(shù)方案中,除了數(shù)據(jù)修復(fù)失敗,還有多種情況 下,都可能出現(xiàn)需要通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行修復(fù)。 比如,如果RAM中程序內(nèi)容發(fā)生錯(cuò)誤、且錯(cuò)誤率不低于預(yù)定值,或數(shù)據(jù)修復(fù) 過(guò)程中出現(xiàn)無(wú)法修復(fù)的情況,則需要進(jìn)行重新加載修復(fù)。所以,相應(yīng)的,所述加載修復(fù)單元304還可以用于當(dāng)讀取所述RAM中 的程序內(nèi)容,將讀取的程序內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì)時(shí),若所述RAM 中程序內(nèi)容出現(xiàn)錯(cuò)誤且、錯(cuò)誤率大于等于預(yù)定值,通過(guò)復(fù)位的方式重新加載 RAM中的程序內(nèi)容進(jìn)行修復(fù)。和/或,當(dāng)數(shù)據(jù)修復(fù)過(guò)程中出現(xiàn)無(wú)法修復(fù)的情況 時(shí),通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行^修復(fù)。進(jìn)一步的,所述裝置還包括加載修復(fù)判斷單元,用于對(duì)重新加載到 RAM中的程序內(nèi)容進(jìn)行比對(duì),若發(fā)生錯(cuò)誤的程序內(nèi)容仍與正確的程序內(nèi)容不 一致,則判斷所述RAM發(fā)生硬失效;若發(fā)生錯(cuò)誤的程序內(nèi)容均與正確的程序 內(nèi)容一致,則判斷所述RAM發(fā)生軟失效。另外,所述裝置還可以包括事件提示單元,用于判斷所述RAM發(fā)生軟/ 硬失效時(shí),以事件的方式上報(bào)失效信息。其中,所述失效信息包括以下信息之 一或其組合發(fā)生失效的時(shí)間,失效的類(lèi)型,數(shù)據(jù)修復(fù)的時(shí)間,數(shù)據(jù)修復(fù)評(píng)估 結(jié)果,以及重新加載修復(fù)的時(shí)間和結(jié)果。而且,所述裝置還可以包括其他用以實(shí)現(xiàn)方法實(shí)施例中其他功能的模塊或 單元。值得說(shuō)明的是,該裝置可以為CPU/DSP,或是CPU/DSP的功能單元,或 是其他網(wǎng)絡(luò)單元。本發(fā)明第四個(gè)實(shí)施例還提供了一種RAM失效的檢測(cè)處理系統(tǒng),應(yīng)用于對(duì) CPU/DSP的RAM失效的才企測(cè)處理,包括第三個(gè)實(shí)施例所提供的RAM失效檢測(cè)處理裝置,以及作為被4企測(cè)對(duì)象的CPU/DSP的RAM。由于本發(fā)明實(shí)施例提供的技術(shù)方案的技術(shù)效果,已經(jīng)在方法實(shí)施例中進(jìn)行 了比較充分的描述,此處不再贅述。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步 驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī) 可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理才莫塊中, 也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)模塊 中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的 形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品 銷(xiāo)售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。 上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。 顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā) 明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及 其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1、一種隨機(jī)存儲(chǔ)器RAM失效的檢測(cè)處理方法,應(yīng)用于對(duì)中央處理器CPU/數(shù)字信號(hào)處理器DSP的RAM失效的檢測(cè)處理,其特征在于,該方法包括獲取所述RAM中的程序內(nèi)容,將獲取的程序內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì),若所述RAM中程序內(nèi)容出現(xiàn)錯(cuò)誤、且錯(cuò)誤率低于預(yù)定值,則使用正確的程序內(nèi)容對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);通過(guò)檢測(cè)數(shù)據(jù)修復(fù)后的CPU/DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù)據(jù)修復(fù)是否成功,若所述評(píng)估結(jié)果為數(shù)據(jù)修復(fù)失敗,則通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行修復(fù)。
2、 如權(quán)利要求1所述的方法,其特征在于,所述通過(guò)檢測(cè)數(shù)據(jù)修復(fù)后的 CPU/DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù)據(jù)修復(fù)是否成功包括計(jì)算相鄰;f全測(cè)周期內(nèi)CPU/DSP數(shù)據(jù)處理異常記錄次數(shù)的差值,若所述差 值大于第一門(mén)限,則評(píng)估數(shù)據(jù)修復(fù)失敗;或,對(duì)CPU/DSP輸出的數(shù)據(jù)進(jìn)行校驗(yàn),若計(jì)算得到的校驗(yàn)錯(cuò)誤率大于第二門(mén) 限,則評(píng)估數(shù)據(jù)修復(fù)失??;或,計(jì)算相鄰檢測(cè)周期內(nèi)CPU/DSP數(shù)據(jù)處理異常記錄次數(shù)的差值,若所述差 值大于第三門(mén)限,且對(duì)CPU/DSP輸出的數(shù)據(jù)進(jìn)行校驗(yàn)所得到的校驗(yàn)錯(cuò)誤率大 于第四門(mén)限,則評(píng)估數(shù)據(jù)修復(fù)失敗。
3、 如權(quán)利要求1所述的方法,其特征在于,所述方法還包括讀取所述 RAM中的程序內(nèi)容,將讀取的程序內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì)時(shí),若所 述RAM中程序內(nèi)容的錯(cuò)誤率大于或等于所述預(yù)定值,則通過(guò)復(fù)位的方式重新 加載RAM中的程序內(nèi)容進(jìn)行》務(wù)復(fù)。
4、 如權(quán)利要求1所述的方法,其特征在于,所述方法還包括所述正確 的程序內(nèi)容為高層控制實(shí)體存儲(chǔ)的正確的程序代碼,所述使用正確的程序內(nèi)容 對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù)包括所述高層控制實(shí)體將RAM中發(fā)生錯(cuò)誤的比特位的程序代碼,修復(fù)為所述 高層控制實(shí)體存儲(chǔ)的相應(yīng)比特位的正確程序代碼。
5、 如權(quán)利要求4所述的方法,其特征在于,所述方法還包括若所述高 層控制實(shí)體對(duì)發(fā)生錯(cuò)誤的比特位的程序代碼進(jìn)行數(shù)據(jù)修復(fù)后,該發(fā)生錯(cuò)誤的比 特位的程序代碼仍與正確程序代碼不一致,則通過(guò)復(fù)位的方式重新加載RAM 中的程序內(nèi)容進(jìn)行修復(fù)。
6、 如權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,所述方法還包括 對(duì)重新加載到RAM中的程序內(nèi)容進(jìn)行一致性比對(duì),若發(fā)生錯(cuò)誤的程序內(nèi)容仍 與正確的程序內(nèi)容不一致,則判斷所述RAM發(fā)生硬失效,以事件的方式上報(bào) 失效信息;若發(fā)生錯(cuò)誤的程序內(nèi)容均與正確的程序內(nèi)容一致,則判斷所述RAM發(fā)生 軟失效,以事件的方式上報(bào)失效信息。
7、 如權(quán)利要求6所述的方法,其特征在于,所述失效信息包括以下信息 之一或其組合發(fā)生失效的時(shí)間,失效的類(lèi)型,數(shù)據(jù)修復(fù)的時(shí)間,數(shù)據(jù)修復(fù)評(píng) 估結(jié)果,以及重新加載修復(fù)的時(shí)間和結(jié)果。
8、 一種RAM失效的檢測(cè)處理裝置,應(yīng)用于對(duì)CPU/DSP的RAM失效的 檢測(cè)處理,其特征在于包括檢測(cè)判斷單元、錯(cuò)誤數(shù)據(jù)修復(fù)單元、評(píng)估單元和 加載》務(wù)復(fù)單元,其中,所述檢測(cè)判斷單元,用于獲取所述RAM中的程序內(nèi)容,將獲取的程序內(nèi) 容與正確的程序內(nèi)容進(jìn)行比對(duì),若所述RAM中程序內(nèi)容出現(xiàn)錯(cuò)誤、且錯(cuò)誤率 低于預(yù)定值,則發(fā)送數(shù)據(jù)修復(fù)指令到所述錯(cuò)誤數(shù)據(jù)修復(fù)單元;所述錯(cuò)誤數(shù)據(jù)修復(fù)單元,用于在接收到所述數(shù)據(jù)修復(fù)指令后,使用正確的 程序內(nèi)容對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);所述評(píng)估單元,用于通過(guò)檢測(cè)經(jīng)過(guò)數(shù)據(jù)修復(fù)后的CPU/DSP的數(shù)據(jù)處理情 況,評(píng)估所述數(shù)據(jù)修復(fù)是否成功;所述加載修復(fù)單元,用于在所述評(píng)估單元評(píng)估數(shù)據(jù)修復(fù)失敗時(shí),通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行修復(fù)。
9、 如權(quán)利要求8所述的裝置,其特征在于,所述加載修復(fù)單元還用于 當(dāng)讀耳又所述RAM中的程序內(nèi)容,將讀取的程序內(nèi)容與正確的程序內(nèi)容進(jìn)行比 對(duì)時(shí),若所述RAM中程序內(nèi)容的錯(cuò)誤率大于等于所述預(yù)定值,則通過(guò)復(fù)位的 方式重新加載RAM中的程序內(nèi)容進(jìn)行《務(wù)復(fù)。
10、 如權(quán)利要求8或9所述的裝置,其特征在于,所述裝置還包括加載修復(fù)判斷單元,用于對(duì)重新加載到RAM中的程序內(nèi)容進(jìn)行比對(duì),若發(fā)生錯(cuò)誤的程序內(nèi)容仍與 正確的程序內(nèi)容不一致,則判斷所述RAM發(fā)生硬失效;若發(fā)生錯(cuò)誤的程序內(nèi)容均與正確的程序內(nèi)容一致,則判斷所述RAM發(fā)生 軟失效。
11、 一種RAM失效的4企測(cè)處理系統(tǒng),應(yīng)用于對(duì)CPU/DSP的RAM失效的 檢測(cè)處理,其特征在于,包括如權(quán)利要求8至IO任一項(xiàng)所述的RAM失效檢測(cè) 處理裝置,以及作為被檢測(cè)對(duì)象的CPU/DSP的RAM。
全文摘要
本發(fā)明公開(kāi)了一種RAM失效的檢測(cè)處理方法、裝置和系統(tǒng),應(yīng)用于對(duì)中央處理器CPU/數(shù)字信號(hào)處理器DSP的RAM失效的檢測(cè)處理。其中,該方法包括獲取所述RAM中的程序內(nèi)容,將獲取的程序內(nèi)容與正確的程序內(nèi)容進(jìn)行比對(duì),若所述RAM中程序內(nèi)容的錯(cuò)誤率低于預(yù)定值,則使用正確的程序內(nèi)容對(duì)發(fā)生錯(cuò)誤的程序內(nèi)容進(jìn)行數(shù)據(jù)修復(fù);通過(guò)檢測(cè)數(shù)據(jù)修復(fù)后的CPU/DSP的數(shù)據(jù)處理情況,評(píng)估所述數(shù)據(jù)修復(fù)是否成功,若所述評(píng)估結(jié)果為數(shù)據(jù)修復(fù)失敗,則通過(guò)復(fù)位的方式重新加載RAM中的程序內(nèi)容進(jìn)行修復(fù)。采用本發(fā)明提供的技術(shù)方案,能夠在及時(shí)準(zhǔn)確發(fā)現(xiàn)RAM失效的基礎(chǔ)上進(jìn)行自動(dòng)修復(fù),將RAM失效對(duì)業(yè)務(wù)的影響將至最低,并降低人工成本。
文檔編號(hào)G06F11/28GK101271419SQ20081006660
公開(kāi)日2008年9月24日 申請(qǐng)日期2008年4月3日 優(yōu)先權(quán)日2008年4月3日
發(fā)明者向 方 申請(qǐng)人:華為技術(shù)有限公司