一種故障檢測(cè)方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種故障檢測(cè)方法和裝置,該方法包括:當(dāng)外圍板檢測(cè)到本地資源失敗時(shí),所述外圍板更新自身記錄的所述本地資源失敗的次數(shù);當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),所述外圍板確定所述本地資源故障;所述外圍板判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源;若為獨(dú)立資源,所述外圍板向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障;若為非獨(dú)立資源,所述外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障。在本發(fā)明中,使主控板能及時(shí)發(fā)現(xiàn)外圍板的隱性故障。
【專利說明】一種故障檢測(cè)方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其是一種故障檢測(cè)方法和裝置。
【背景技術(shù)】
[0002]RNC (Radio Network Control,無線網(wǎng)絡(luò)控制)設(shè)備是由多板卡上各種應(yīng)用軟件協(xié)同工作的設(shè)備,隨著現(xiàn)網(wǎng)3G用戶的不斷增多,RNC設(shè)備的負(fù)荷日漸增大,RNC設(shè)備故障問題呈現(xiàn)多樣性,定義RNC設(shè)備的某一節(jié)點(diǎn)硬件故障或者軟件子系統(tǒng)故障這類影響RNC正常工作的故障為顯性故障,這類故障有成熟的定位方法和處理策略。與之對(duì)應(yīng)的隱性故障定義為外圍板運(yùn)行無異常告警,軟件運(yùn)行無明顯異常,但設(shè)備功能實(shí)質(zhì)已處于不正常工作狀態(tài)?,F(xiàn)網(wǎng)中已經(jīng)出現(xiàn)多起隱性故障問題而導(dǎo)致KPI (Key Performance Indicator,關(guān)鍵業(yè)績(jī)指標(biāo))指標(biāo)大幅下降,對(duì)RNC產(chǎn)品造成較大負(fù)面影響。
[0003]而在現(xiàn)網(wǎng)RNC實(shí)際運(yùn)行中,經(jīng)常發(fā)生這些部署在不同節(jié)點(diǎn)單元上的資源之間關(guān)聯(lián)關(guān)系是正確的,但某個(gè)節(jié)點(diǎn)單元已工作不正常而導(dǎo)致業(yè)務(wù)異常。目前本地資源中外圍板類資源目前主要依靠心跳監(jiān)測(cè)方式由全局處理板監(jiān)測(cè)外圍板的運(yùn)行狀態(tài),如果連續(xù)心跳監(jiān)測(cè)周期內(nèi)沒有接收到心跳消息,就認(rèn)為外圍板出現(xiàn)故障,對(duì)于這類顯性故障目前RNC設(shè)備會(huì)觸發(fā)相應(yīng)故障流程進(jìn)行業(yè)務(wù)恢復(fù),不會(huì)引起KPI指標(biāo)大幅下降現(xiàn)象。而對(duì)于外圍板狀態(tài)處于正常、心跳堅(jiān)守正常時(shí),其上承載的業(yè)務(wù)已經(jīng)無法正常運(yùn)行,即對(duì)于業(yè)務(wù)應(yīng)用而言實(shí)際上已經(jīng)處于故障狀態(tài)的隱性故障,由于目前RNC設(shè)備缺少相關(guān)檢測(cè)、處理流程,一旦部分本地資源發(fā)生隱性故障,基于本地資源的負(fù)荷分擔(dān)分配原則,分配到正常本地資源的業(yè)務(wù)成功、而分配到隱性故障資源的業(yè)務(wù)失敗,使得本地資源隱性故障不能及時(shí)發(fā)現(xiàn),直到累計(jì)到KPI指標(biāo)惡化后才能弓I發(fā)關(guān)注,而此時(shí)已經(jīng)產(chǎn)生較大負(fù)面影響。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供了一種故障檢測(cè)方法和裝置,使控制板能夠及時(shí)發(fā)現(xiàn)外圍板的隱性故障,并能夠判定隱性故障是否由于控制板與外圍板的連通性故障造成。
[0005]為了達(dá)到以上目的,本發(fā)明實(shí)施例提供了一種故障檢測(cè)方法,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式設(shè)備包括至少一塊控制板和至少一塊外圍板,所述方法包括:
[0006]當(dāng)外圍板檢測(cè)到本地資源失敗時(shí),所述外圍板更新自身記錄的所述本地資源失敗的次數(shù);
[0007]當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),所述外圍板確定所述本地資源故障;
[0008]所述外圍板判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源;
[0009]若為獨(dú)立資源,所述外圍板向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障,由所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;
[0010]若為非獨(dú)立資源,所述外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障,由所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。[0011]本發(fā)明實(shí)施例還提供一種故障檢測(cè)方法,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式設(shè)備包括至少一塊主控板和至少一塊外圍板,所述方法包括:
[0012]當(dāng)控制板接收到外圍板發(fā)送的用于通告所述外圍板獨(dú)立資源故障的故障報(bào)告消息時(shí),所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;其中,所述故障報(bào)告消息是所述外圍板在所述獨(dú)立資源失敗的次數(shù)超過第一門限值時(shí)向所述控制板發(fā)送的;
[0013]當(dāng)所述控制板接收到業(yè)務(wù)發(fā)送用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求時(shí),所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè);其中,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過所述第一門限值時(shí)向所述控制板發(fā)送的。
[0014]本發(fā)明實(shí)施例還提供一種外圍板,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式設(shè)備包括至少一塊主控板和至少一塊外圍板,所述外圍板包括:
[0015]故障檢測(cè)模塊,用于當(dāng)檢測(cè)到本地資源失敗時(shí),更新所述外圍板記錄的所述本地資源失敗的次數(shù),并當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),確定所述本地資源故障;
[0016]判斷模塊,用于判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源;
[0017]第一發(fā)送模塊,用于當(dāng)所述判斷模塊的判斷結(jié)果為獨(dú)立資源時(shí),向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障,由所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;
[0018]第二發(fā)送模塊,用于當(dāng)所述判斷模塊的判斷結(jié)果為非獨(dú)立資源時(shí),向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障,由所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
[0019]本發(fā)明實(shí)施例還提供一種主控板,所述機(jī)框式設(shè)備包括至少一塊主控板和至少一塊外圍板,其特征在于,所述主控板包括:
[0020]接收模塊,用于接收外圍板發(fā)送的用于通告所述外圍板獨(dú)立資源故障的故障報(bào)告消息,所述故障報(bào)告消息是所述外圍板在所述獨(dú)立資源失敗的次數(shù)超過第一門限值時(shí)向所述控制板發(fā)送的;以及外圍板發(fā)送的用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過所述第一門限值時(shí)向所述控制板發(fā)送的;
[0021]第一處理模塊,用于當(dāng)所述接收模塊接收到所述故障報(bào)告消息時(shí),向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;
[0022]第二處理模塊,用于當(dāng)所述接收模塊接收到所述連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
[0023]本發(fā)明實(shí)施例還提供一種框式設(shè)備,包括至少一塊主控板和至少一塊外圍板,其中:
[0024]所述外圍板,用于當(dāng)檢測(cè)到本地資源失敗時(shí),更新自身記錄的所述本地資源失敗的次數(shù);當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),確定所述本地資源故障;判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源;若該本地資源為獨(dú)立資源,向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障,由所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;若該本地資源為非獨(dú)立資源,向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障,由所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè);
[0025]所述控制板,用于當(dāng)接收到外圍板發(fā)送的用于通告所述外圍板獨(dú)立資源故障的故障報(bào)告消息時(shí),向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;當(dāng)接收到外圍板發(fā)送的用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
[0026]本發(fā)明的上述實(shí)施例中,外圍板檢測(cè)到本地資源失敗時(shí),更新自身記錄的該本地資源失敗的次數(shù),當(dāng)更新后的該本地資源失敗的次數(shù)超過第一門限值時(shí),外圍板確定該本地資源故障;若該本地資源為獨(dú)立資源,外圍板向控制板發(fā)送故障報(bào)告消息,以通告控制板該獨(dú)立資源故障,由控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)該獨(dú)立資源進(jìn)行復(fù)位操作;若該本地資源為非獨(dú)立資源,外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告控制板該非獨(dú)立資源故障,由控制板對(duì)控制板與外圍板之間的連通性進(jìn)行檢測(cè),使主控板及時(shí)得知所述外圍板發(fā)生的隱性故障,并能及時(shí)判定該隱性故障是否由控制板與外圍板之間的連通性故障造成。
【專利附圖】
【附圖說明】
[0027]圖1為本發(fā)明實(shí)施例一提供的一種故障檢測(cè)方法的流程示意圖;
[0028]圖2為本發(fā)明實(shí)施例二提供的一種故障檢測(cè)方法的流程示意圖;
[0029]圖3為本發(fā)明實(shí)施例三提供的一種故障檢測(cè)方法的流程示意圖;
[0030]圖4為本發(fā)明實(shí)施例提供的一種外圍板的結(jié)構(gòu)示意圖;
[0031]圖5為本發(fā)明實(shí)施例提供的一種控制板的結(jié)構(gòu)示意圖;
[0032]圖6為本發(fā)明實(shí)施例提供的一種框式設(shè)備的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0033]下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例進(jìn)行詳細(xì)描述。
[0034]在現(xiàn)有技術(shù)中,外圍板會(huì)按照預(yù)設(shè)的周期向控制板發(fā)送心跳報(bào)文,控制板根據(jù)接收到的心跳報(bào)文判斷自身與所述外圍板之間正常,即此時(shí)控制板不會(huì)判定所述外圍板異常。這樣,即使外圍板承載的業(yè)務(wù)流程失敗,只要控制板能夠接收到該外圍板發(fā)送的心跳報(bào)文,就不會(huì)判定該外圍板異常。
[0035]針對(duì)上述技術(shù)問題,本發(fā)明實(shí)施例一提供了一種故障檢測(cè)方法,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式包括至少一塊控制板和至少一塊外圍板,如圖1所示,本發(fā)明實(shí)施例一提供的故障檢測(cè)方法可以包括如下步驟:
[0036]步驟101,當(dāng)外圍板檢測(cè)到本地資源失敗時(shí),該外圍板更新自身記錄的該本地資源失敗的次數(shù),其中,外圍板可以包括接口板(如IUB接口板、IU接口板等)、業(yè)務(wù)板等單板。
[0037]具體的,在本發(fā)明實(shí)施例中,外圍板可以記錄本地資源失敗的次數(shù),并當(dāng)檢測(cè)到本地資源失敗時(shí),更新自身記錄的該本地資源失敗的次數(shù)。
[0038]為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供的一種實(shí)現(xiàn)方式可以為:
[0039]外圍板對(duì)應(yīng)本地資源設(shè)置失敗次數(shù)計(jì)數(shù)器,并當(dāng)檢測(cè)到本地資源失敗時(shí),將對(duì)應(yīng)該本地資源的失敗次數(shù)計(jì)數(shù)器的數(shù)值加I ;其中,外圍板初始化時(shí),需要將上述失敗次數(shù)計(jì)數(shù)器的值置為零。
[0040]需要注意的是,上述通過設(shè)置失敗次數(shù)計(jì)數(shù)器的記錄本地資源失敗的次數(shù)的方式僅僅是本發(fā)明實(shí)施例提供的記錄本地資源失敗的次數(shù)的一種具體實(shí)現(xiàn)方式,本發(fā)明實(shí)施例技術(shù)方案中,記錄本地資源失敗的次數(shù)的方式并不限于此,例如,外圍板還可以通過生成失敗記錄的方式記錄本地資源失敗的次數(shù),即外圍板每次檢測(cè)到本地資源失敗時(shí),均生成一條對(duì)應(yīng)該本地資源的失敗記錄,并根據(jù)該失敗記錄的條數(shù)確定該本地資源失敗的次數(shù);此夕卜,外圍板在更新本地資源失敗的次數(shù)時(shí),也并不限于每次檢測(cè)到本地資源失敗,就將該本地資源失敗的次數(shù)加1,例如,外圍板也可以在每次檢測(cè)到本地資源失敗時(shí),將該本地資源失敗的次數(shù)加2或其他數(shù)值,其僅需保證外圍板能夠根據(jù)該記錄確定本地資源失敗的次數(shù)即可,其具體實(shí)現(xiàn)在此不再贅述。
[0041]步驟102、當(dāng)更新后的該本地資源失敗的次數(shù)超過第一門限值時(shí),該外圍板確定該本地資源故障。
[0042]具體的,在本發(fā)明實(shí)施例中,可以預(yù)先設(shè)定一個(gè)門限值(即第一門限值),當(dāng)外圍板根據(jù)自身記錄的本地資源失敗的次數(shù)確定某本地資源失敗的次數(shù)超過該第一門限值時(shí),夕卜圍板就認(rèn)為該本地資源發(fā)生故障,需要進(jìn)行相應(yīng)的故障處理流程。
[0043]步驟103、外圍板判斷該本地資源為獨(dú)立資源或非獨(dú)立資源;若為獨(dú)立資源,則轉(zhuǎn)至步驟104 ;否則,轉(zhuǎn)至步驟106。
[0044]實(shí)際應(yīng)用中,由于同一塊外圍板上也可能承載多種不同類型的業(yè)務(wù)流程,比如對(duì)于RNC的外圍板來說,承載業(yè)務(wù)流程可能包括:RNC與NodeB (節(jié)點(diǎn)B,即基站)進(jìn)行用戶節(jié)點(diǎn)同步流程、以及與MSC (Mobile Switching Center,移動(dòng)交換中心)進(jìn)行IU UP (IU UserPlane, IU用戶面)初始化流程等。為了實(shí)現(xiàn)業(yè)務(wù)流程的處理,外圍板需要通過對(duì)應(yīng)的本地資源進(jìn)行相應(yīng)的業(yè)務(wù)處理。此時(shí),外圍板還可以針對(duì)處理不同的業(yè)務(wù)流程的本地資源分別進(jìn)行監(jiān)測(cè),并在檢測(cè)到某一本地資源失敗,并確定該本地資源故障后,進(jìn)一步判斷該本地資源為獨(dú)立資源或非獨(dú)立資源,并根據(jù)判斷結(jié)果進(jìn)行相應(yīng)處理。
[0045]其中,在本發(fā)明實(shí)施例中,本地資源可以具體包括以下兩類:
[0046]—類為單板資源,包括IUB接口板、IU接口板、業(yè)務(wù)板等,該類本地資源為非獨(dú)立資源;另一類則為單板內(nèi)資源,包括業(yè)務(wù)板的DSP (Digital Signal Processer,數(shù)字信號(hào)處理器)/VCPU(Virtual Central Processing Unit,虛擬中央處理器),接口板的 ATM Path或者Ip Path等,其中,業(yè)務(wù)板的DSP/VCPU等資源屬于獨(dú)立資源,接口板的ATM Path或者Ip Path屬于非獨(dú)立資源。
[0047]步驟104、外圍板向控制板發(fā)送故障報(bào)告消息,以通告控制板該獨(dú)立資源故障。
[0048]步驟105、控制板接收到外圍板發(fā)送的故障報(bào)告消息后,向管理系統(tǒng)進(jìn)行告警,并對(duì)該獨(dú)立資源進(jìn)行復(fù)位操作,并結(jié)束當(dāng)前流程。
[0049]具體的,當(dāng)外圍板判斷發(fā)生失敗的本地資源為獨(dú)立資源時(shí),該外圍板可以向控制板發(fā)送用于通告該獨(dú)立資源故障的故障報(bào)告消息,該故障報(bào)告消息中可以攜帶有發(fā)生失敗的獨(dú)立資源的標(biāo)識(shí);控制板接收到該故障報(bào)告消息后,由于發(fā)生失敗的為獨(dú)立資源,則控制板可以直接向管理系統(tǒng)進(jìn)行告警,并對(duì)該獨(dú)立資源進(jìn)行復(fù)位操作。
[0050]步驟106、外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告控制板非獨(dú)立資源故障。
[0051]步驟107、控制板接收到外圍板發(fā)送連通性檢測(cè)請(qǐng)求后,使用非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包對(duì)控制板與外圍板之間的連通性進(jìn)行檢測(cè)。
[0052]具體的,當(dāng)外圍板判斷發(fā)生失敗的本地資源為非獨(dú)立資源時(shí),該外圍板可以向控制板發(fā)送用于通告該非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求,該連通性檢測(cè)請(qǐng)求中可以攜帶有發(fā)生失敗的非獨(dú)立資源的標(biāo)識(shí);控制板接收到該連通性檢測(cè)請(qǐng)求后,根據(jù)該非獨(dú)立資源的標(biāo)識(shí)確定對(duì)應(yīng)的非獨(dú)立資源發(fā)生失敗。進(jìn)一步地,為了確定該非獨(dú)立資源故障是否是由于控制板與外圍板之間的連通性異常導(dǎo)致的,控制板可以向該外圍板發(fā)送相應(yīng)的檢測(cè)數(shù)據(jù)包,以進(jìn)行控制板與外圍板之間的連通性檢測(cè)。
[0053]實(shí)際應(yīng)用中,為了能夠判斷該非獨(dú)立資源故障是不是由于該控制板與該外圍板之間的連通性異常導(dǎo)致,控制板向外圍板發(fā)送的數(shù)據(jù)檢測(cè)包是用于進(jìn)行連通性檢測(cè)的數(shù)據(jù)包,其大小應(yīng)該和控制板與該非獨(dú)立資源進(jìn)行業(yè)務(wù)流程交互時(shí)的數(shù)據(jù)包的大小一致或相當(dāng)。
[0054]控制板向外圍板發(fā)送該非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包后,若在預(yù)設(shè)時(shí)間內(nèi)接收到該外圍板返回的數(shù)據(jù)檢測(cè)包,則判定自身與該外圍板之間的連通性正常,若在預(yù)設(shè)時(shí)間內(nèi)未接收到該外圍板返回的數(shù)據(jù)檢測(cè)包,則判定自身與該外圍板之間的連通性故障。
[0055]本申請(qǐng)實(shí)施例一中,外圍板在檢測(cè)到獨(dú)立資源故障后,向控制板發(fā)送故障報(bào)告消息,以通告所述控制板獨(dú)立資源故障,由控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)該獨(dú)立資源進(jìn)行復(fù)位操作。
[0056]外圍板在檢測(cè)到非獨(dú)立資源故障后,還會(huì)向控制板發(fā)送連通性檢測(cè)請(qǐng)求。這樣,如果外圍板與控制板之間完全不能連通,雖然控制板不能接收外圍板發(fā)送的連通性檢測(cè)請(qǐng)求,但是仍能根據(jù)心跳機(jī)制,即在距上一次接收到外圍板發(fā)送的心跳報(bào)文的時(shí)間超過預(yù)設(shè)值時(shí),判定所述外圍板故障;如果控制板能夠接收到連通性檢測(cè)請(qǐng)求,則直接判定所述外圍板發(fā)生非獨(dú)立資源故障,此時(shí),雖然控制板仍能夠接收到外圍板發(fā)送的心跳報(bào)文,控制板也能夠根據(jù)接收到的連通性檢測(cè)請(qǐng)求判定外圍板發(fā)生隱性故障。同時(shí),本發(fā)明實(shí)施例一中,控制板在接收到外圍板發(fā)送的連通性檢測(cè)請(qǐng)求后,還會(huì)使用發(fā)生失敗的非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包對(duì)自身與該外圍板之間的連通性進(jìn)行檢測(cè),從而能夠判斷上述業(yè)務(wù)流程的失敗是否由自身與該外圍板之間的通道的連通性異常引起。
[0057]需要注意的是,在本發(fā)明實(shí)施例中,對(duì)于非獨(dú)立資源,當(dāng)外圍板檢測(cè)到某非獨(dú)立資源失敗,且確定該非獨(dú)立資源失敗的次數(shù)超過第一門限值,即外圍板確定該非獨(dú)立資源故障時(shí),外圍板還可以進(jìn)一步確定發(fā)生故障的該非獨(dú)立資源的比例,判斷發(fā)生故障的該非獨(dú)立資源的比例是否超過預(yù)設(shè)的門限值(即第二門限值),并當(dāng)發(fā)生故障的該非獨(dú)立資源的比例超過第二門限值時(shí),該外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求。
[0058]例如,對(duì)于接口板的ATM Path (非獨(dú)立資源),當(dāng)外圍板檢測(cè)該ATM Path失敗,且根據(jù)所設(shè)置的對(duì)應(yīng)該ATM Path的失敗次數(shù)計(jì)數(shù)器確定該ATM Path失敗的次數(shù)超過第一門限值(如80次)時(shí),即確定該ATM Path故障時(shí),在向控制板發(fā)送連通性檢測(cè)請(qǐng)求之前,外圍板還可以統(tǒng)計(jì)當(dāng)前外圍板上發(fā)生失敗的ATM Path與該外圍板上總的ATM Path的比例,并當(dāng)當(dāng)前外圍板上發(fā)生失敗的ATM Path與該外圍板上總的ATM Path的比例超過第二門限值(如60%)時(shí),則向控制板發(fā)送連通性檢測(cè)請(qǐng)求。
[0059]在本發(fā)明實(shí)施例中,控制板向外圍板發(fā)送該非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包后,若外圍板能夠接收到控制板發(fā)送的數(shù)據(jù)檢測(cè)包,則說明控制板到外圍板之間的連通性正常,此時(shí),外圍板需要向控制板返回相應(yīng)的數(shù)據(jù)檢測(cè)包,使所述控制板根據(jù)接收到的所述數(shù)據(jù)檢測(cè)包判斷所述控制板與所述外圍板之間的連通性正常;若外圍板沒有接收到控制板發(fā)送的數(shù)據(jù)檢測(cè)包,則說明控制板到外圍板之間的傳輸通道異常,則外圍板也無法向控制板返回相應(yīng)的數(shù)據(jù)檢測(cè)包,控制板在預(yù)設(shè)時(shí)間內(nèi)沒有接收到外圍板返回的數(shù)據(jù)檢測(cè)包后會(huì)判定控制板到外圍板之間的連通性異常。
[0060]優(yōu)選的,本發(fā)明實(shí)施例中,還可以使控制板在接收到連通檢測(cè)報(bào)文后,向管理系統(tǒng)上報(bào)故障報(bào)告信息,并在故障報(bào)告信息中攜帶發(fā)生失敗的非獨(dú)立資源的標(biāo)識(shí),使管理系統(tǒng)根據(jù)該非獨(dú)立資源的標(biāo)識(shí)確定相應(yīng)的非獨(dú)立資源故障。
[0061]優(yōu)選的,本發(fā)明實(shí)施例中,還可以使控制板判定自身與所述外圍板之間的連通性正常時(shí),向管理系統(tǒng)上報(bào)故障原因排除消息,通告所述管理系統(tǒng)所述控制板與所述外圍板之間的連通性正常。從而能夠使管理系統(tǒng)及時(shí)得知導(dǎo)致非獨(dú)立資源故障的原因不在該機(jī)框式設(shè)備。
[0062]優(yōu)選的,本發(fā)明實(shí)施例中,還可以使控制板在判定自身與所述外圍板之間的連通性故障時(shí),對(duì)所述外圍板進(jìn)行復(fù)位操作。通過這種方式,能夠使機(jī)框式設(shè)備自動(dòng)對(duì)自身的故障進(jìn)行排除,避免了人工排除故障的操作。
[0063]下面結(jié)合具體應(yīng)用場(chǎng)景對(duì)本發(fā)明實(shí)施例提供的故障檢測(cè)方法進(jìn)行詳細(xì)說明,假設(shè)本發(fā)明實(shí)施二中,機(jī)框式設(shè)備為RNC設(shè)備,該RNC設(shè)備包括一塊控制板和一塊業(yè)務(wù)板,業(yè)務(wù)板對(duì)應(yīng)各本地資源設(shè)置有對(duì)應(yīng)的失敗次數(shù)計(jì)數(shù)器,且該業(yè)務(wù)板可以統(tǒng)計(jì)發(fā)生故障的非獨(dú)立資源(如Path)與該業(yè)務(wù)板上該非獨(dú)立資源的總數(shù)的比例,如圖2所示,當(dāng)Path失敗時(shí),本發(fā)明實(shí)施例二提供的故障檢測(cè)方法可以包括如下步驟:
[0064]步驟201,業(yè)務(wù)板檢測(cè)到Path失敗時(shí),該業(yè)務(wù)板將對(duì)應(yīng)該P(yáng)ath的失敗次數(shù)計(jì)數(shù)器的數(shù)值加I。
[0065]步驟202,業(yè)務(wù)板判斷該P(yáng)ath失敗的次數(shù)是否超過第一門限值,若是,則轉(zhuǎn)至步驟203;否則,結(jié)束當(dāng)前流程。
[0066]例如,假設(shè)預(yù)先設(shè)定的第一門限值為80次,而業(yè)務(wù)板設(shè)置的對(duì)應(yīng)該P(yáng)ath的失敗次數(shù)計(jì)數(shù)器的數(shù)值為81,則業(yè)務(wù)板確定該P(yáng)ath故障。
[0067]實(shí)際應(yīng)用中,本領(lǐng)域技術(shù)人員可以根據(jù)需要任意設(shè)定上述第一門限值,如何設(shè)定該第一門限值并不會(huì)影響本申請(qǐng)的保護(hù)范圍。
[0068]步驟203,業(yè)務(wù)板確定該P(yáng)ath故障。
[0069]步驟204、業(yè)務(wù)板判斷發(fā)生故障的Path的比例是否超過第二門限值;若超過,則轉(zhuǎn)至步驟205 ;否則,結(jié)束當(dāng)前流程。
[0070]具體的,當(dāng)業(yè)務(wù)板確定該P(yáng)ath故障時(shí),該業(yè)務(wù)板可以統(tǒng)計(jì)發(fā)生故障的Path的比例(即發(fā)生故障的Path的數(shù)量與該業(yè)務(wù)板上Path的總數(shù)的比值),并判斷其是否超過第二門限值。
[0071]例如,假設(shè)預(yù)設(shè)的第二門限值為60%,該業(yè)務(wù)板上Path的總數(shù)為50,且發(fā)生故障的Path的數(shù)量為31,則該業(yè)務(wù)板確定發(fā)生故障的Path的比例超過第二門限值,需要進(jìn)行故障處理流程。
[0072]步驟205、業(yè)務(wù)板向控制板發(fā)送連通性檢測(cè)請(qǐng)求,所述連通性檢測(cè)請(qǐng)求中攜帶有Path的標(biāo)識(shí)。[0073]此時(shí),如果業(yè)務(wù)板與控制板之間的傳輸通道完全不能連通,不能傳輸任何類型或大小的報(bào)文,則控制板不能接收到業(yè)務(wù)板發(fā)送的連通性檢測(cè)請(qǐng)求,也無法接收到業(yè)務(wù)板發(fā)送的心跳報(bào)文,此時(shí)控制板根據(jù)心跳機(jī)制判定所述業(yè)務(wù)板發(fā)生故障,根據(jù)心跳機(jī)制判定業(yè)務(wù)板發(fā)生故障的過程與現(xiàn)有技術(shù)中一致,在此不再贅述。
[0074]如果業(yè)務(wù)板與控制板之間的傳輸通道仍能進(jìn)行心跳報(bào)文的傳輸,則由于心跳報(bào)文的大小與連通性檢測(cè)請(qǐng)求的報(bào)文的大小相當(dāng),同樣也能接收到連通性檢測(cè)請(qǐng)求??刂瓢逶诮邮盏竭B通性檢測(cè)請(qǐng)求后,本發(fā)明實(shí)施例提供的故障檢測(cè)方法還可以包括如下步驟:
[0075]步驟206,控制板根據(jù)連通性檢測(cè)請(qǐng)求確定業(yè)務(wù)板上Path故障,并向業(yè)務(wù)板發(fā)送Path對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包。
[0076]其中,Path對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包為一類用于進(jìn)行連通性檢測(cè)的,大小和控制板與Path進(jìn)行業(yè)務(wù)流程交互時(shí)的數(shù)據(jù)包大小一致或相當(dāng)?shù)臄?shù)據(jù)包。
[0077]如果Path故障不是由于控制板與業(yè)務(wù)板之間的連通性導(dǎo)致,則控制板發(fā)送的數(shù)據(jù)檢測(cè)包能被業(yè)務(wù)板正常接收,此時(shí),本發(fā)明提供的故障檢測(cè)方法還可包括如下步驟:
[0078]步驟207,業(yè)務(wù)板接收到控制板發(fā)送的數(shù)據(jù)檢測(cè)包后,向控制板返回相應(yīng)的數(shù)據(jù)檢測(cè)包。
[0079]步驟208,控制板根據(jù)接收到的數(shù)據(jù)檢測(cè)包判定自身與業(yè)務(wù)板之間的連通性正常。
[0080]如果Path故障正是由于控制板與業(yè)務(wù)板之間的連通性異常導(dǎo)致,則控制板發(fā)送的數(shù)據(jù)檢測(cè)包不能被業(yè)務(wù)板接收到,此時(shí)業(yè)務(wù)板也不會(huì)向控制板返回相應(yīng)的數(shù)據(jù)檢測(cè)包,控制板也就無法接收到相應(yīng)的數(shù)據(jù)檢測(cè)包,此時(shí)控制板判定自身與業(yè)務(wù)板之間的連通性異
堂
巾O
[0081]實(shí)施例三
[0082]如圖3所示,當(dāng)控制板發(fā)送的數(shù)據(jù)檢測(cè)包不能被業(yè)務(wù)板接收到時(shí),本發(fā)明提供的故障檢測(cè)方法可包括如下步驟:
[0083]步驟301,控制板判斷距發(fā)送數(shù)據(jù)檢測(cè)包的時(shí)間超過預(yù)設(shè)值時(shí),確定自身與業(yè)務(wù)板之間的連通性異常。
[0084]步驟302,控制板復(fù)位業(yè)務(wù)板。
[0085]通過以上描述可以看出,在本發(fā)明實(shí)施例提供的技術(shù)方案中,通過外圍板檢測(cè)本地資源,并當(dāng)檢測(cè)到本地資源失敗時(shí),更新自身記錄的該本地資源失敗的次數(shù),并當(dāng)更新后的該本地資源失敗的次數(shù)超過第一門限值時(shí),該外圍板確定該本地資源故障;對(duì)于獨(dú)立資源,外圍板向控制板發(fā)送故障報(bào)告消息,以通告控制板該獨(dú)立資源故障,由控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)該獨(dú)立資源進(jìn)行復(fù)位操作;對(duì)于非獨(dú)立資源,外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求;控制板接收到外圍板發(fā)送的連通性檢測(cè)請(qǐng)求后,對(duì)該控制板與該外圍板之間的連通性進(jìn)行檢測(cè),使設(shè)備及時(shí)發(fā)現(xiàn)本地資源發(fā)生的隱性故障,并能夠判定隱性故障是否由于自身設(shè)備的故障造成。
[0086]基于上述方法實(shí)施例相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供了一種外圍板,可以應(yīng)用于上述方法實(shí)施例中。
[0087]如圖4所示,為本發(fā)明實(shí)施例提供的一種外圍板的結(jié)構(gòu)示意圖,該外圍板可以應(yīng)用于包括至少一塊控制板和至少一塊外圍板的機(jī)框式設(shè)備中,該外圍板可以包括:
[0088]故障檢測(cè)模塊41,用于當(dāng)檢測(cè)到本地資源失敗時(shí),更新所述外圍板記錄的所述本地資源失敗的次數(shù),并當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),確定所述本地資源故障;
[0089]判斷模塊42,用于判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源;
[0090]第一發(fā)送模塊43,用于當(dāng)所述判斷模塊42的判斷結(jié)果為獨(dú)立資源時(shí),向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障,由所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;
[0091]第二發(fā)送模塊44,用于當(dāng)所述判斷模塊42的判斷結(jié)果為非獨(dú)立資源時(shí),向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障,由所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
[0092]其中,所述外圍板對(duì)應(yīng)本地資源設(shè)置有失敗次數(shù)計(jì)數(shù)器,用于記錄對(duì)應(yīng)的本地資源失敗的次數(shù);
[0093]所述故障檢測(cè)模塊41具體用于,通過以下方式實(shí)現(xiàn)更新所述外圍板記錄的所述本地資源失敗的次數(shù):
[0094]將對(duì)應(yīng)所述本地資源的失敗次數(shù)計(jì)數(shù)器的數(shù)值加I。
[0095]其中,本發(fā)明實(shí)施例提供的外圍板還可以包括:
[0096]統(tǒng)計(jì)模塊45,用于當(dāng)所述故障檢測(cè)模塊41確定所述本地資源故障,且該本地資源為非獨(dú)立資源時(shí),統(tǒng)計(jì)發(fā)生故障的所述非獨(dú)立資源的比例;
[0097]所述第二發(fā)送模塊44具體用于,當(dāng)所述統(tǒng)計(jì)模塊45所統(tǒng)計(jì)的發(fā)生故障的所述非獨(dú)立資源的比例超過第二門限值時(shí),向控制板發(fā)送連通性檢測(cè)請(qǐng)求。
[0098]優(yōu)選地,所述第二發(fā)送模塊44還可用于,在向所述控制板發(fā)送連通性檢測(cè)請(qǐng)求之后,若所述外圍板接收到所述控制板發(fā)送的用于檢測(cè)所述控制板與所述外圍板之間的連通性,且與所述非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包,則向所述控制板返回所述數(shù)據(jù)檢測(cè)包,以使所述控制板根據(jù)接收到的所述數(shù)據(jù)檢測(cè)包判斷所述控制板與所述外圍板之間的連通性正常。
[0099]基于上述方法實(shí)施例相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供了 一種控制板,可以應(yīng)用于上述方法實(shí)施例中。
[0100]如圖5所示,為本發(fā)明實(shí)施例提供的一種控制板的結(jié)構(gòu)示意圖,該外圍板可以應(yīng)用于包括至少一塊控制板和至少一塊外圍板的機(jī)框式設(shè)備中,該控制板可以包括:
[0101]接收模塊51,用于接收外圍板發(fā)送的用于通告所述外圍板獨(dú)立資源故障的故障報(bào)告消息,所述故障報(bào)告消息是所述外圍板在所述獨(dú)立資源失敗的次數(shù)超過第一門限值時(shí)向所述控制板發(fā)送的;以及外圍板發(fā)送的用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過所述第一門限值時(shí)向所述控制板發(fā)送的;
[0102]第一處理模塊52,用于當(dāng)所述接收模塊51接收到所述故障報(bào)告消息時(shí),向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;
[0103]第二處理模塊53,用于當(dāng)所述接收模塊51接收到所述連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
[0104]優(yōu)選地,所述第二處理模塊53可具體用于,當(dāng)所述接收模塊51接收到所述連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè);其中,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過第一門限值,且失敗次數(shù)超過第一門限值的所述非獨(dú)立資源的比例超過第二門限值時(shí),向所述控制板發(fā)送的。
[0105]優(yōu)選地,所述第二處理模塊53可具體用于,向所述外圍板發(fā)送所述非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包,若所述控制板在預(yù)設(shè)時(shí)間內(nèi)接收到所述外圍板返回的數(shù)據(jù)檢測(cè)包,則判定所述控制板與所述外圍板之間的連通性正常;若所述控制板在所述預(yù)設(shè)時(shí)間內(nèi)未接收到所述外圍板返回的數(shù)據(jù)檢測(cè)包,則判定所述控制板與所述外圍板之間的連通性故障。
[0106]其中,本發(fā)明實(shí)施例提供的控制板還可以包括:
[0107]發(fā)送模塊54,用于在所述接收模塊51接收到所述外圍板發(fā)送的連通性檢測(cè)請(qǐng)求后,向管理系統(tǒng)發(fā)送故障報(bào)告信息,所述故障報(bào)告信息中攜帶了所述非獨(dú)立資源的標(biāo)識(shí),以使所述管理系統(tǒng)根據(jù)所述非獨(dú)立資源的標(biāo)識(shí)確定所述非獨(dú)立資源故障。
[0108]優(yōu)選地,所述發(fā)送模塊54還可用于,當(dāng)所述第二處理模塊53判定所述控制板與所述外圍板之間的連通性正常時(shí),向管理系統(tǒng)上報(bào)故障原因排除消息,通告所述管理系統(tǒng)所述控制板與所述外圍板之間的連通性正常。
[0109]優(yōu)選地,所述第二處理模塊53還可用于,當(dāng)判定所述控制板與所述外圍板之間的連通性故障時(shí),對(duì)所述外圍板進(jìn)行復(fù)位操作。
[0110]基于上述方法實(shí)施例相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供了一種框式設(shè)備,可以應(yīng)用于上述方法實(shí)施例中。
[0111]如圖6所示,為本發(fā)明實(shí)施例提供的一種框式設(shè)備的結(jié)構(gòu)示意圖,該框式設(shè)備可以包括至少一塊外圍板61和至少一塊控制板62 (圖中以一塊外圍板和一塊控制板為例);其中:
[0112]所述外圍板61,用于當(dāng)檢測(cè)到本地資源失敗時(shí),更新自身記錄的所述本地資源失敗的次數(shù);當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),確定所述本地資源故障;判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源;若該本地資源為獨(dú)立資源,向控制板62發(fā)送故障報(bào)告消息,以通告所述控制板62所述獨(dú)立資源故障,由所述控制板62向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;若該本地資源為非獨(dú)立資源,向控制板62發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板62所述非獨(dú)立資源故障,由所述控制板62對(duì)所述控制板62與所述外圍板61之間的連通性進(jìn)行檢測(cè);
[0113]所述控制板62,用于當(dāng)接收到外圍板61發(fā)送的用于通告所述外圍板61獨(dú)立資源故障的故障報(bào)告消息時(shí),向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;當(dāng)接收到外圍板61發(fā)送的用于通告所述外圍板61非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板62與所述外圍板61之間的連通性進(jìn)行檢測(cè)。
[0114]通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
[0115]本領(lǐng)域技術(shù)人員可以理解附圖只是一個(gè)優(yōu)選實(shí)施例的示意圖,附圖中的模塊或流程并不一定是實(shí)施本發(fā)明所必須的。
[0116]本領(lǐng)域技術(shù)人員可以理解實(shí)施例中的裝置中的模塊可以按照實(shí)施例描述進(jìn)行分布于實(shí)施例的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施例的一個(gè)或多個(gè)裝置中。上述實(shí)施例的模塊可以合并為一個(gè)模塊,也可以進(jìn)一步拆分成多個(gè)子模塊。
[0117]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
[0118]以上公開的僅為本發(fā)明的幾個(gè)具體實(shí)施例,但是,本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種故障檢測(cè)方法,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式設(shè)備包括至少一塊控制板和至少一塊外圍板,其特征在于,所述方法包括: 當(dāng)外圍板檢測(cè)到本地資源失敗時(shí),所述外圍板更新自身記錄的所述本地資源失敗的次數(shù); 當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),所述外圍板確定所述本地資源故障; 所述外圍板判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源; 若為獨(dú)立資源,所述外圍板向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障,由所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作; 若為非獨(dú)立資源,所述外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障,由所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
2.如權(quán)利要求1所述的方法,其特征在于,所述外圍板對(duì)應(yīng)本地資源設(shè)置有失敗次數(shù)計(jì)數(shù)器,用于記錄對(duì)應(yīng)的本地資源失敗的次數(shù); 所述外圍板更新自身記錄的所述本地資源失敗的次數(shù),具體為: 所述外圍板將對(duì)應(yīng)所述本地資源的失敗次數(shù)計(jì)數(shù)器的數(shù)值加I。
3.如權(quán)利要求1所述的方 法,其特征在于,若所述本地資源為非獨(dú)立資源,在所述外圍板確定所述本地資源故障之后,還包括: 所述外圍板統(tǒng)計(jì)發(fā)生故障的所述非獨(dú)立資源的比例; 所述外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求,具體為: 當(dāng)發(fā)生故障的所述非獨(dú)立資源的比例超過第二門限值時(shí),所述外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求。
4.如權(quán)利要求1所述的方法,其特征在于,所述外圍板向控制板發(fā)送連通性檢測(cè)請(qǐng)求之后還包括: 若所述外圍板接收到所述控制板發(fā)送的用于檢測(cè)所述控制板與所述外圍板之間的連通性,且與所述非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包,則向所述控制板返回所述數(shù)據(jù)檢測(cè)包,以使所述控制板根據(jù)接收到的所述數(shù)據(jù)檢測(cè)包判斷所述控制板與所述外圍板之間的連通性正堂巾O
5.一種故障檢測(cè)方法,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式設(shè)備包括至少一塊控制板和至少一塊外圍板,其特征在于,所述方法包括: 當(dāng)控制板接收到外圍板發(fā)送的用于通告所述外圍板獨(dú)立資源故障的故障報(bào)告消息時(shí),所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;其中,所述故障報(bào)告消息是所述外圍板在所述獨(dú)立資源失敗的次數(shù)超過第一門限值時(shí)向所述控制板發(fā)送的;當(dāng)所述控制板接收到外圍板發(fā)送的用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求時(shí),所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè);其中,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過所述第一門限值時(shí)向所述控制板發(fā)送的。
6.如權(quán)利要求5所述的方法,其特征在于,所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè),具體為: 當(dāng)所述控制板接收到外圍板發(fā)送的用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求時(shí),所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè);其中,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過第一門限值,且失敗次數(shù)超過第一門限值的所述非獨(dú)立資源的比例超過第二門限值時(shí),向所述控制板發(fā)送的。
7.如權(quán)利要求5所述的方法,其特征在于,所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè),具體為: 所述控制板向所述外圍板發(fā)送所述非獨(dú)立資源對(duì)應(yīng)的的數(shù)據(jù)檢測(cè)包,若在預(yù)設(shè)時(shí)間內(nèi)接收到所述外圍板返回的數(shù)據(jù)檢測(cè)包,則判定自身與所述外圍板之間的連通性正常,若在所述預(yù)設(shè)時(shí)間內(nèi)未接收到所述外圍板返回的數(shù)據(jù)檢測(cè)包,則判定自身與所述外圍板之間的連通性故障。
8.如權(quán)利要求7所述的方法,其特征在于,所述方法還包括: 所述控制板接收到所述外圍板發(fā)送的連通性檢測(cè)請(qǐng)求后,向管理系統(tǒng)發(fā)送故障報(bào)告信息,該故障報(bào)告信息中攜帶了所述非獨(dú)立資源的標(biāo)識(shí),以使所述管理系統(tǒng)根據(jù)所述非獨(dú)立資源的標(biāo)識(shí)確定所述非獨(dú)立資源故障。
9.如權(quán)利要求8所述的方法,其特征在于,所述方法還包括: 當(dāng)所述控制板判定自身與所述外圍板之間的連通性正常時(shí),向管理系統(tǒng)上報(bào)故障原因排除消息,通告所述管理系統(tǒng)所述控制板與所述外圍板之間的連通性正常。
10.如權(quán)利要求7所述的方法,其特征在于,所述方法還包括: 當(dāng)所述控制板判定自身與所述外圍板之間的連通性故障時(shí),對(duì)所述外圍板進(jìn)行復(fù)位操作。
11.一種外圍板,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式設(shè)備包括至少一塊控制板和至少一塊所述外圍板,其特征在于,所述外圍板包括: 故障檢測(cè)模塊,用于當(dāng)檢測(cè)到本地資源失敗時(shí),更新所述外圍板記錄的所述本地資源失敗的次數(shù),并當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),確定所述本地資源故障; 判斷模塊,用于判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源; 第一發(fā)送模塊,用于當(dāng)所述判斷模塊的判斷結(jié)果為獨(dú)立資源時(shí),向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障,由所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作; 第二發(fā)送模塊,用于當(dāng)所述判斷模塊的判斷結(jié)果為非獨(dú)立資源時(shí),向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障,由所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
12.如權(quán)利要求11所述的外圍板,其特征在于,所述外圍板對(duì)應(yīng)本地資源設(shè)置有失敗次數(shù)計(jì)數(shù)器,用于記錄對(duì)應(yīng)的本地資源失敗的次數(shù); 所述故障檢測(cè)模塊具體用于,通過以下方式實(shí)現(xiàn)更新所述外圍板記錄的所述本地資源失敗的次數(shù): 將對(duì)應(yīng)所述本地資源的失敗次數(shù)計(jì)數(shù)器的數(shù)值加I。
13.如權(quán)利要求11所述的外圍板,其特征在于,所述外圍板還包括: 統(tǒng)計(jì)模塊,用于當(dāng)所述故障檢測(cè)模塊確定所述本地資源故障,且該本地資源為非獨(dú)立資源時(shí),統(tǒng)計(jì)發(fā)生故障的所述非獨(dú)立資源的比例;所述第二發(fā)送模塊具體用于,當(dāng)所述統(tǒng)計(jì)模塊所統(tǒng)計(jì)的發(fā)生故障的所述非獨(dú)立資源的比例超過第二門限值時(shí),向控制板發(fā)送連通性檢測(cè)請(qǐng)求。
14.如權(quán)利要求11所述的外圍板,其特征在于, 所述第二發(fā)送模塊還用于,在向所述控制板發(fā)送連通性檢測(cè)請(qǐng)求之后,若所述外圍板接收到所述控制板發(fā)送的用于檢測(cè)所述控制板與所述外圍板之間的連通性,且與所述非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包,則向所述控制板返回所述數(shù)據(jù)檢測(cè)包,以使所述控制板根據(jù)接收到的所述數(shù)據(jù)檢測(cè)包判斷所述控制板與所述外圍板之間的連通性正常。
15.一種控制板,應(yīng)用于機(jī)框式設(shè)備,所述機(jī)框式設(shè)備包括至少一塊所述控制板和至少一塊外圍板,其特征在于,所述控制板包括: 接收模塊,用于接收外圍板發(fā)送的用于通告所述外圍板獨(dú)立資源故障的故障報(bào)告消息,所述故障報(bào)告消息是所述外圍板在所述獨(dú)立資源失敗的次數(shù)超過第一門限值時(shí)向所述控制板發(fā)送的;以及外圍板發(fā)送的用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過所述第一門限值時(shí)向所述控制板發(fā)送的; 第一處理模塊,用于當(dāng)所述接收模塊接收到所述故障報(bào)告消息時(shí),向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作; 第二處理模塊,用于當(dāng)所述接收模塊接收到所述連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè)。
16.如權(quán)利要求15所述 的控制板,其特征在于, 所述第二處理模塊具體用于,當(dāng)所述接收模塊接收到所述連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板與所述外圍板之間的 連通性進(jìn)行檢測(cè);其中,所述連通性檢測(cè)請(qǐng)求是所述外圍板在所述非獨(dú)立資源失敗的次數(shù)超過第一門限值,且失敗次數(shù)超過第一門限值的所述非獨(dú)立資源的比例超過第二門限值時(shí),向所述控制板發(fā)送的。
17.如權(quán)利要求15所述的控制板,其特征在于, 所述第二處理模塊具體用于,向所述外圍板發(fā)送所述非獨(dú)立資源對(duì)應(yīng)的數(shù)據(jù)檢測(cè)包,若所述控制板在預(yù)設(shè)時(shí)間內(nèi)接收到所述外圍板返回的數(shù)據(jù)檢測(cè)包,則判定所述控制板與所述外圍板之間的連通性正常;若所述控制板在所述預(yù)設(shè)時(shí)間內(nèi)未接收到所述外圍板返回的數(shù)據(jù)檢測(cè)包,則判定所述控制板與所述外圍板之間的連通性故障。
18.如權(quán)利要求17所述的控制板,其特征在于,所述控制板還包括: 發(fā)送模塊,用于在所述接收模塊接收到所述外圍板發(fā)送的連通性檢測(cè)請(qǐng)求后,向管理系統(tǒng)發(fā)送故障報(bào)告信息,所述故障報(bào)告信息中攜帶了所述非獨(dú)立資源的標(biāo)識(shí),以使所述管理系統(tǒng)根據(jù)所述非獨(dú)立資源的標(biāo)識(shí)確定所述非獨(dú)立資源故障。
19.如權(quán)利要求18所述的控制板,其特征在于, 所述發(fā)送模塊還用于,當(dāng)所述第二處理模塊判定所述控制板與所述外圍板之間的連通性正常時(shí),向管理系統(tǒng)上報(bào)故障原因排除消息,通告所述管理系統(tǒng)所述控制板與所述外圍板之間的連通性正常。
20.如權(quán)利要求17所述的控制板,其特征在于, 所述第二處理模塊還用于,當(dāng)判定所述控制板與所述外圍板之間的連通性故障時(shí),對(duì)所述外圍板進(jìn)行復(fù)位操作。
21.一種框式設(shè)備,其特征在于,包括至少一塊外圍板和至少一塊控制板,其中: 所述外圍板,用于當(dāng)檢測(cè)到本地資源失敗時(shí),更新自身記錄的所述本地資源失敗的次數(shù);當(dāng)更新后的所述本地資源失敗的次數(shù)超過第一門限值時(shí),確定所述本地資源故障;判斷所述本地資源為獨(dú)立資源或非獨(dú)立資源;若該本地資源為獨(dú)立資源,向控制板發(fā)送故障報(bào)告消息,以通告所述控制板所述獨(dú)立資源故障,由所述控制板向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;若該本地資源為非獨(dú)立資源,向控制板發(fā)送連通性檢測(cè)請(qǐng)求,以通告所述控制板所述非獨(dú)立資源故障,由所述控制板對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行檢測(cè); 所述控制板,用于當(dāng)接收到外圍板發(fā)送的用于通告所述外圍板獨(dú)立資源故障的故障報(bào)告消息時(shí),向管理系統(tǒng)進(jìn)行告警,并對(duì)所述獨(dú)立資源進(jìn)行復(fù)位操作;當(dāng)接收到外圍板發(fā)送的用于通告所述外圍板非獨(dú)立資源故障的連通性檢測(cè)請(qǐng)求時(shí),對(duì)所述控制板與所述外圍板之間的連通性進(jìn)行 檢測(cè)。
【文檔編號(hào)】H04L12/24GK103457792SQ201310362422
【公開日】2013年12月18日 申請(qǐng)日期:2013年8月19日 優(yōu)先權(quán)日:2013年8月19日
【發(fā)明者】田舒榕, 程岳 申請(qǐng)人:大唐移動(dòng)通信設(shè)備有限公司