專利名稱:基站內部硬件接口的故障檢測方法
技術領域:
本發(fā)明涉及通信技術,尤其涉及基站內部硬件接口的故障檢測方法。
背景技術:
NodeB(基站)在WCDMA(寬帶碼分多址)系統中是一個非常重要的實體,其主要是用于對WCDMALAY1(寬帶碼分多址物理層)的處理。
NodeB內部硬件極其復雜,大致可分為射頻、數字中頻、基帶、傳輸等若干單元,各單元又可再細分為多個模塊,以上行基帶處理單元為例,其可分為上行公共信道處理模塊、上行專用信道處理模塊、各種接口FPGA邏輯模塊、上行數據面處理模塊以及一些控制模塊等。各模塊間均通過例如串行接口等通用硬件接口或自定義硬件接口完成數據的通信。
由于NodeB內部的硬件接口較多,NodeB在運行時,就不可避免的會發(fā)生由于硬件接口的故障而導致的運行不穩(wěn)定的現象,所以,如何有效的對硬件接口進行故障檢測進而快速的排除故障是一個值得關注的問題。目前,為了簡化檢測硬件接口的過程,通常的方法是在硬件單板入庫前,利用單獨設計的硬件接口測試軟件對硬件接口進行測試。實現這種方法的流程如圖1所示,在步驟S101中,計算機中的測試軟件向硬件單板發(fā)送相應的接口測試命令;進入步驟S102,硬件單板中的CPU接收到命令后,對指定的某個或某些接口進行測試;進入步驟S103,CPU將測試結果上報給測試軟件;最后進入步驟S104,測試軟件通過用戶界面顯示所述測試結果。這種方法具有簡單、效率高、檢測集中的優(yōu)點,能夠確保入庫單板的質量,但是,這種方法只是在單板入庫前對其接口進行檢測,而單板正式在基站中運行時就無法對其接口進行檢測,在實際應用中,硬件接口在運行時出現器件老化或接口之間的通信中斷等現象都是有可能的,而上述方法明顯無法進行實時帶業(yè)務的在線檢測。
發(fā)明內容
本發(fā)明要解決的技術問題在于提供一種基站內部硬件接口的故障檢測方法,以實現對基站內部硬件接口的實時在線檢測。
為解決上述問題,本發(fā)明提供了一種基站內部硬件接口的故障檢測方法,包括A.數據發(fā)送端定時向數據接收端發(fā)送具有特殊標識的接口檢測數據幀;B.所述數據接收端通過判斷在統計周期內接收到接口檢測數據幀的次數是否超過第一統計門限,確定所述數據接收端與所述數據發(fā)送端之間的接口是否發(fā)生故障。
其中,所述接口檢測數據幀的幀結構與所述接口正常數據幀的幀結構至少可以在一個比特域中具有不同的字段范圍,所述不同的字段范圍作為所述接口檢測數據幀的特殊標識。
如果所述數據接收端在統計周期內接收到所述接口檢測數據幀的次數超過了第一統計門限,則確定所述接口未發(fā)生故障,否則,確定所述接口已發(fā)生故障。
所述數據接收端還可在所述統計周期內判斷接收到內容正確的所述接口檢測數據幀的次數是否超過第二統計門限,如果是,確定所述接口未發(fā)生故障,否則,確定所述接口已發(fā)生故障。
所述數據接收端在所述統計周期內判斷接收到內容錯誤的所述接口檢測數據幀的次數是否超過數據接收端在所述統計周期內應該接收到接口檢測數據幀的次數與第二統計門限之差或單獨設置的接收內容錯誤次數統計門限,如果是,確定所述接口已發(fā)生故障,否則,確定所述接口未發(fā)生故障。
所述數據接收端確定所述接口發(fā)生故障后,可以告警方式表明所述接口已發(fā)生故障。
如果所述數據接收端確定所述接口未發(fā)生故障,還可以返回步驟A。
本發(fā)明的數據發(fā)送端可向數據接收端定時發(fā)送具有特殊標識的接口檢測數據幀,數據接收端通過在統計周期內判斷接收到接口檢測數據幀的次數是否超過了第一統計門限,進而確定數據發(fā)送端與數據接收端之間的接口是否發(fā)生了故障,特殊標識就說明了接口檢測數據幀與正常發(fā)送的接口正常數據幀是有區(qū)別的,進一步說,由于接口檢測數據幀與接口正常數據幀具有明顯的區(qū)別,所以,數據發(fā)送端發(fā)送接口正常數據幀的同時,還可發(fā)送接口檢測數據幀,數據接收端通過這個明顯的區(qū)別,識別接收到的數據是接口檢測數據幀還是接口正常數據幀,并在一定時間內判斷接收到所述接口檢測數據幀的次數是否超過了一定的次數,進而確定數據發(fā)送端與數據接收端之間的接口是否發(fā)生了故障,利用這種方法可以解決基站運行過程中對硬件接口進行實時檢測的問題。
本發(fā)明的檢測方法不但可以通過在一定的時間內判斷接收到接口檢測數據幀的次數是否超過第一統計門限來判斷接口是否發(fā)生了故障,還可以進一步通過判斷接收的內容正確的接收接口檢測數據幀的次數是否超過第二統計門限來判斷接口是否發(fā)生了故障,這種做法有助于提高判斷接口故障的準確性。
本發(fā)明的檢測方法是對正在運行的接口進行檢測,而不是現有技術中提到的對單板進行檢測,對單板檢測可以檢測單板內部器件之間的接口,但不能檢測單板之間的接口,這是現有技術存在的一個檢測盲點,利用本發(fā)明的檢測方法完全可以解決這一問題。
此外,現有技術的檢測方法需要開發(fā)一套檢測軟件,而本發(fā)明的檢測方法只需增加一種數據,而且數據的幀結構可以與正常發(fā)送數據的幀結構接近,所以,相比于現有技術,本發(fā)明的檢測方法節(jié)省了檢測成本。
由于本發(fā)明的檢測方法是對正在運行的接口進行檢測,而不是現有技術中提到的在基站運行前單獨對硬件單板進行檢測,單板在倉庫的存儲過程中存在由于受到溫度、濕度或搬運過程中無意的碰觸而導致器件的破損的可能,所以本發(fā)明的在線實時檢測的方法可以避免現有技術中對單板檢測完成后出現破損失效的情況的發(fā)生。
圖1為現有的基站內部硬件接口的故障檢測方法的流程圖;圖2為本發(fā)明第一實施例的流程圖;圖3為本發(fā)明第一優(yōu)選實施例的流程圖;圖4為本發(fā)明第二優(yōu)選實施例的流程圖。
具體實施例方式
下面我們將結合附圖,對本發(fā)明的最佳實施方案進行詳細描述。首先要指出的是,本發(fā)明中用到的術語、字詞及權利要求的含義不能僅僅限于其字面和普通的含義去理解,還包括進而與本發(fā)明的技術相符的含義和概念,這是因為我們作為發(fā)明者,要適當地給出術語的定義,以便對我們的發(fā)明進行最恰當的描述。因此,本說明和附圖中給出的配置,只是本發(fā)明的首選實施方案,而不是要列舉本發(fā)明的所有技術特性。我們要認識到,還有各種各樣的可以取代我們方案的同等方案或修改方案。
首先,結合圖2,對本發(fā)明的第一實施例進行說明。在步驟S201中,數據發(fā)送端定時向數據接收端發(fā)送具有特殊標識的接口檢測數據幀。從邏輯的角度來看,數據發(fā)送端與數據接收端可以指基站內部的各個單元,例如射頻單元、基帶單元等,也可以指各個單元內部的模塊,從實際的物理載體來看,數據發(fā)送端與數據接收端可以指各個硬件單板或者單板內部的各個器件,其中,一塊單板可以集成多個模塊,這時,模塊的物理載體就是單板內部的器件。數據發(fā)送端向數據接收端發(fā)送數據的方式可以是直接發(fā)送,也可以是間接發(fā)送,直接發(fā)送是指數據發(fā)送端通過與數據接收端之間的硬件連線向數據接收端發(fā)送數據,間接發(fā)送是指數據發(fā)送端通過多個單元或模塊、以及這些單元或模塊之間的硬件連線向數據接收端發(fā)送數據。定時的時間可以根據實際的情況合理確定,但最好可以保證數據接收端在一定的時間范圍內能夠多次接收到接口檢測數據幀,這是因為數據發(fā)送端向數據接收端發(fā)送正常的數據一般都是不定時的,前一次發(fā)送的正常數據與后一次發(fā)送的正常數據的時間間隔可能很長,如果在這個時間間隔內數據發(fā)送端與數據接收端之間的接口發(fā)生了故障,而前后兩次發(fā)送接口檢測數據幀的時間間隔卻不小于前后兩次發(fā)送正常數據的時間間隔,數據接收端就不會及時發(fā)現故障,從而導致接口持續(xù)故障狀態(tài)的時間較長,甚至會影響整個基站的正常運行,同時,定時的時間也要保證數據發(fā)送端在一定的時間范圍內發(fā)送接口檢測數據幀的次數不超過整個基站或單元等所能承受的次數,如果數據發(fā)送端過于頻繁的向數據接收端發(fā)送接口檢測數據幀,則可能在客觀上造成接口的負荷過重而導致接口發(fā)生故障。
另外,特殊標識是接口檢測數據幀與其他正常數據的區(qū)別標志,一般來說,數據發(fā)送端發(fā)送的所有的接口檢測數據幀的特殊標識都應該相同,以便于數據接收端進行識別。
完成步驟S201后,進入步驟S202,所述數據接收端通過判斷在統計周期內接收到接口檢測數據幀的次數是否超過第一統計門限,確定所述數據接收端與所述數據發(fā)送端之間的接口是否發(fā)生故障。在這個步驟中,數據接收端可以在每接收一次接口檢測數據幀時計數一次,在統計周期結束時判斷接收接口檢測數據幀的次數是否超過了第一統計門限,這種情況下,數據接收端無需判斷接收到的每兩次接口檢測數據幀的時間間隔是否為數據發(fā)送端發(fā)送接口檢測數據幀的定時時間,而只需在接收到接口檢測數據幀時計數一次,在統計周期結束后判斷計數結果是否超過了第一統計門限即可,這對于數據接收端來說,操作簡單,工作量也比較小。此外,數據接收端也可以在每個定時時間內判斷是否接收到了接口檢測數據幀并記錄結果,在統計周期結束時判斷接收接口檢測數據幀的次數是否超過了第一統計門限,例如,數據接收端可在每個定時時間內判斷是否未接收到接口檢測數據幀,如果是,記錄一次,當記錄的未接收到接口檢測數據幀的次數超過在統計周期內應該接收的次數與第一統計門限之差,就可判斷接口已發(fā)生了故障,如果統計周期還未結束,則可提前判斷接口是否發(fā)生故障,這種統計方式雖然比前一個統計方式操作復雜,但有可能提前判斷接口是否發(fā)生故障,而無需等到統計周期結束時再判斷。如果數據接收端判斷在統計周期內接收到接口檢測數據幀的次數超過第一統計門限,則確定接口未發(fā)生故障,否則,確定接口發(fā)生了故障。需要說明的是,由于接口檢測數據幀從數據發(fā)送端到達數據接收端需要一定的時間,所以統計周期應該從接口檢測數據幀正常到達數據接收端時開始計時。
另外,數據接收端還可在統計周期結束時判斷定時接收到內容正確的接口檢測數據幀的次數是否超過了第二統計門限,如果是,確定接口未發(fā)生故障,否則,確定接口已發(fā)生了故障。相應的,數據接收端在計數過程中,就要對每次接收的接口檢測數據幀判斷其內容是否正確,如果是,計數一次,另外,數據接收端也可進一步判斷在統計周期結束前接收到內容錯誤的接口檢測數據幀的次數是否超過在統計周期內應該接收到接口檢測數據幀的次數與第二統計門限之差,如果是,可提前確定接口發(fā)生了故障。一般來說,接口檢測數據幀的標識都是固定的,可以先判斷標識是否正確,再判斷小區(qū)號或模塊號等其他內容是否正確,當然,判斷的方法不限于此。
此外,數據接收端如果確定接口已發(fā)生了故障,則可以告警的方式表明接口已發(fā)生了故障,告警的方式有很多種,例如,數據接收端的CPU通過各種連線向網管發(fā)出告警,或數據接收端以異常的光、聲等形式告警。數據接收端如果確定接口未發(fā)生故障,則可繼續(xù)執(zhí)行步驟S201,即,整個故障的檢測過程可以是循環(huán)的,而且,在繼續(xù)執(zhí)行步驟S201之前,可以重新對數據發(fā)送端或接收端進行設置,例如調整定時時間或接口檢測數據幀的內容等。
現在結合上述內容,對本發(fā)明的第一優(yōu)選實施例進行說明。請參照圖3,在步驟S301中,數據發(fā)送端定時向數據接收端發(fā)送具有特殊標識的接口檢測數據幀。進入步驟S302,數據接收端在統計周期內對每次接收到內容正確的接口檢測數據幀進行計數。在步驟S303中,統計周期結束時,數據接收端判斷所述次數是否超過了第二統計門限,如果是,進入步驟S304,否則進入步驟S305。在步驟S304中,數據接收端確定數據發(fā)送端與數據接收端之間的接口未發(fā)生故障。在步驟S305中,數據接收端確定數據發(fā)送端與數據接收端之間的接口已發(fā)生了故障。完成步驟S304后,返回步驟S301。完成步驟S305后,進入步驟S306,數據接收端以告警的方式表明數據發(fā)送端與數據接收端之間的接口發(fā)生了故障。
此外,需要說明的是,接口檢測數據幀的幀結構與接口正常數據幀的幀結構至少在一個比特域中具有不同的字段范圍,不同的字段范圍可以作為所述接口檢測數據幀的特殊標識,這里的接口正常數據幀是指數據發(fā)送端發(fā)送的正常數據。下面結合表1和表2,分別對接口檢測數據幀和接口正常數據幀的幀結構進行說明。
由于接口檢測數據幀一般都是在接口正常數據幀的基礎上設置的,所以,首先結合表1,對接口正常數據幀的幀結構進行說明。
表1
表1所示的為某硬件接口接口正常數據幀的幀結構。由表1可知,這個幀結構的長度是32比特,其中,第0位表示偶校驗位,第1-7為保留位,字段范圍為0,第8-15位表示模塊號,字段范圍為0-255,第16-23位表示PCB板號,字段范圍為0-255,第24-27位表示小區(qū)號,字段范圍為0-5,第28-31位表示消息編號,字段范圍為0-15。
為了識別相應接口的檢測數據幀,設置的接口檢測數據幀的幀結構如表2所示。
表2由表2的內容可知,接口檢測數據幀的幀結構的長度與接口正常數據幀的幀結構的長度相同,都是32比特,當然,長度也可以不同。兩種幀結構的數據位所代表的含義也相同,但字段范圍是有區(qū)別的,接口正常數據幀的小區(qū)號的字段范圍是0-5,而接口檢測數據幀的小區(qū)號則可固定一個0-5范圍之外的數字,例如表2的15,這個小區(qū)號15可以成為有別于接口檢測數據幀的特殊標識,表示這個數據為接口檢測數據幀,當然,接口檢測數據幀小區(qū)號的字段范圍可以取6-15中的任意一個值,此外,為了使接口檢測數據幀的內容固定,PCB板號和模塊號可以取特殊值,例如0xa5和0x5,當然也可以取其他值,其中,0x代表十六進制。
上述第一優(yōu)選實施例著重強調的是數據接收端統計接收到內容正確的接口檢測數據幀的次數,在統計周期結束時判斷統計的次數是否超過了第二統計門限,進而確定接口是否發(fā)生了故障,實際上,數據接收端也可統計接收到內容錯誤的接口檢測數據幀的次數,如果在統計周期結束前,接收到內容錯誤的接口檢測數據幀的次數已經超過了統計周期內應該接收到接口檢測數據幀的次數與第二統計門限之差,或者超過了單獨設置的接收內容錯誤次數統計門限,則數據接收端可不必對后續(xù)接收的接口檢測數據幀進行內容正確與否的判斷,就可確定接口已發(fā)生了故障,進而可在統計周期結束前提前告警,這種處理方式可以縮短故障持續(xù)時間,也可使故障盡快的被排除。為此,本發(fā)明還提供了第二優(yōu)選實施例。現在結合圖4,對本發(fā)明第二優(yōu)選實施例進行說明。在步驟S401中,數據發(fā)送端定時向數據接收端發(fā)送具有特殊標識的接口檢測數據幀。進入步驟S402,數據接收端對每次接收到內容錯誤的接口檢測數據幀計數一次。在步驟S403中,數據接收端判斷在統計周期結束前統計的次數是否超過統計周期內應該接收到接口檢測數據幀的次數與第二統計門限之差或者單獨設置的接收內容錯誤次數統計門限,如果是,進入步驟S404,否則,進入步驟S405。在步驟S404中,數據接收端確定數據發(fā)送端與數據接收端之間的接口已發(fā)生故障。在步驟S405中,數據接收端確定數據發(fā)送端與數據接收端之間的接口未發(fā)生故障,返回步驟S401。完成步驟S404后,數據接收端以告警的方式表明數據發(fā)送端與數據接收端之間的接口發(fā)生了故障。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。
權利要求
1.一種基站內部硬件接口的故障檢測方法,其特征在于包括A.數據發(fā)送端定時向數據接收端發(fā)送具有特殊標識的接口檢測數據幀;B.所述數據接收端通過判斷在統計周期內接收到所述接口檢測數據幀的次數是否超過第一統計門限,確定所述數據接收端與所述數據發(fā)送端之間的接口是否發(fā)生故障。
2.如權利要求1所述的基站內部硬件接口的故障檢測方法,其特征在于所述接口檢測數據幀的幀結構與所述接口正常數據幀的幀結構至少在一個比特域中具有不同的字段范圍,所述不同的字段范圍作為所述接口檢測數據幀的特殊標識。
3.如權利要求1所述的基站內部硬件接口的故障檢測方法,其特征在于如果所述數據接收端在所述統計周期內接收到所述接口檢測數據幀的次數超過了所述第一統計門限,則確定所述接口未發(fā)生故障,否則,確定所述接口已發(fā)生故障。
4.如權利要求3所述的基站內部硬件接口的故障檢測方法,其特征在于還包括所述數據接收端在所述統計周期內判斷接收到內容正確的所述接口檢測數據幀的次數是否超過第二統計門限,如果是,確定所述接口未發(fā)生故障,否則,確定所述接口已發(fā)生故障。
5.如權利要求3所述的基站內部硬件接口的故障檢測方法,其特征在于還包括所述數據接收端在所述統計周期內判斷接收到內容錯誤的所述接口檢測數據幀的次數是否超過數據接收端在所述統計周期內應該接收到接口檢測數據幀的次數與第二統計門限之差或單獨設置的接收內容錯誤次數統計門限,如果是,確定所述接口已發(fā)生故障,否則,確定所述接口未發(fā)生故障。
6.如權利要求1所述的基站內部硬件接口的故障檢測方法,其特征在于還包括所述數據接收端確定所述接口發(fā)生故障后,以告警方式表明所述接口已發(fā)生故障。
7.如權利要求1所述的基站內部硬件接口的故障檢測方法,其特征在于還包括如果所述數據接收端確定所述接口未發(fā)生故障,返回步驟A。
全文摘要
本發(fā)明公開了一種基站內部硬件接口的故障檢測方法,包括數據發(fā)送端定時向數據接收端發(fā)送具有特殊標識的接口檢測數據幀;所述數據接收端通過判斷在統計周期內接收到接口檢測數據幀的次數是否超過了第一統計門限,確定所述數據接收端與所述數據發(fā)送端之間的接口是否發(fā)生故障。本發(fā)明的檢測方法是對正在運行的接口進行檢測,而不是現有技術中提到的對單板進行檢測,對單板檢測可以檢測單板內部器件之間的接口,但不能檢測單板之間的接口,這是現有技術存在的一個檢測盲點,利用本發(fā)明的檢測方法完全可以解決這一問題。
文檔編號H04W88/08GK1968481SQ200610073188
公開日2007年5月23日 申請日期2006年4月12日 優(yōu)先權日2006年4月12日
發(fā)明者趙建榮 申請人:華為技術有限公司