故障定位系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)管理領(lǐng)域,特別涉及一種基于大數(shù)據(jù)技術(shù)能夠?qū)鬏斁W(wǎng)絡(luò)和數(shù)據(jù)網(wǎng)絡(luò)出現(xiàn)的跨專業(yè)故障進(jìn)行快速準(zhǔn)確處理的故障定位系統(tǒng)和方法。
【背景技術(shù)】
[0002]目前在運(yùn)營(yíng)商的承載網(wǎng)絡(luò)中,數(shù)據(jù)網(wǎng)絡(luò)承載在傳輸網(wǎng)絡(luò)上,因此當(dāng)數(shù)據(jù)業(yè)務(wù)出現(xiàn)故障時(shí),可能是數(shù)據(jù)網(wǎng)絡(luò)本身的問題,也可能是傳輸網(wǎng)絡(luò)的問題,這就涉及跨專業(yè)故障的分析處理技術(shù)。
[0003]針對(duì)跨專業(yè)故障的分析處理問題,目前有兩種比較常見的解決方法,一種是綜合告警平臺(tái),一種是專業(yè)網(wǎng)管系統(tǒng)。前一種方法對(duì)跨專業(yè)的各個(gè)告警信息進(jìn)行關(guān)聯(lián)分析;后一種方法需要網(wǎng)絡(luò)維護(hù)人員人工去各專業(yè)網(wǎng)管系統(tǒng)上查找告警信息,并進(jìn)行不同專業(yè)信息之間的比較分析,效率比較低。
[0004]上述兩種方法在解決故障時(shí)只對(duì)告警信息進(jìn)行分析,然而,除了告警能夠指示故障信息外,有些并未引發(fā)告警的性能劣化現(xiàn)象也能造成業(yè)務(wù)的故障,因此,現(xiàn)有技術(shù)對(duì)于由性能劣化現(xiàn)象造成的業(yè)務(wù)故障無能為力。另外,對(duì)于超大規(guī)模的通信網(wǎng)絡(luò)來說,全網(wǎng)的性能數(shù)據(jù)為海量數(shù)據(jù),如何有效地處理和利用海量的網(wǎng)絡(luò)性能數(shù)據(jù),也是故障分析的一個(gè)難點(diǎn)問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實(shí)施例所要解決的一個(gè)技術(shù)問題是:解決由性能劣化現(xiàn)象造成的業(yè)務(wù)故障的定位問題。
[0006]本發(fā)明實(shí)施例所要解決的再一個(gè)技術(shù)問題是:解決故障分析中海量網(wǎng)絡(luò)數(shù)據(jù)的有效處理和利用問題。
[0007]根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提出一種故障定位方法,包括:啟動(dòng)故障定位流程;根據(jù)故障定位流程的需要,從大數(shù)據(jù)處理平臺(tái)搜索得到所需要的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù);從大數(shù)據(jù)處理平臺(tái)提取故障相關(guān)的業(yè)務(wù)路由和正常性能曲線;根據(jù)業(yè)務(wù)路由確定故障相關(guān)的網(wǎng)元設(shè)備,并檢查網(wǎng)元設(shè)備的第一網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)是否正常,其中的第一網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)包括告警、配置、流量、日志中的至少一項(xiàng);響應(yīng)于異常的檢查結(jié)果,定位故障位置;響應(yīng)于正常的檢查結(jié)果,根據(jù)業(yè)務(wù)路由相關(guān)的網(wǎng)元設(shè)備當(dāng)前的網(wǎng)絡(luò)性能數(shù)據(jù)形成當(dāng)前性能曲線,根據(jù)當(dāng)前性能曲線和正常性能曲線的比對(duì)結(jié)果定位故障位置。
[0008]在一個(gè)實(shí)施例中,大數(shù)據(jù)處理平臺(tái)采用大數(shù)據(jù)技術(shù)對(duì)網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)進(jìn)行存儲(chǔ)和處理。
[0009]在一個(gè)實(shí)施例中,大數(shù)據(jù)處理平臺(tái)存儲(chǔ)的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)包括:傳輸網(wǎng)絡(luò)和數(shù)據(jù)網(wǎng)絡(luò)中與告警、性能、流量、日志或者配置相關(guān)的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù),其中的配置包括路由配置。
[0010]在一個(gè)實(shí)施例中,所述根據(jù)故障定位流程的需要,從大數(shù)據(jù)處理平臺(tái)搜索得到所需要的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)包括:根據(jù)故障定位流程的需要確定搜索參數(shù),并將搜索參數(shù)下發(fā)給大數(shù)據(jù)處理平臺(tái),大數(shù)據(jù)處理平臺(tái)利用大數(shù)據(jù)技術(shù)根據(jù)搜索參數(shù)在存儲(chǔ)的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)中進(jìn)行搜索,并返回搜索到的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)。
[0011]在一個(gè)實(shí)施例中,大數(shù)據(jù)處理平臺(tái)根據(jù)網(wǎng)元設(shè)備正常狀態(tài)下的歷史網(wǎng)絡(luò)性能數(shù)據(jù),利用設(shè)定的算法得到網(wǎng)元設(shè)備的正常性能模板,并由一條業(yè)務(wù)路由上各網(wǎng)元設(shè)備的正常性能模板組成正常性能曲線。
[0012]在一個(gè)實(shí)施例中,在檢測(cè)到告警信息或者接收到用戶申告信息時(shí)啟動(dòng)故障定位流程。
[0013]根據(jù)本發(fā)明實(shí)施例的再一個(gè)方面,提出一種故障定位系統(tǒng),包括:采集適配模塊,用于采集傳輸網(wǎng)絡(luò)和數(shù)據(jù)網(wǎng)絡(luò)中網(wǎng)絡(luò)運(yùn)行數(shù)據(jù),網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)包括告警、性能、流量、日志或者配置相關(guān)的數(shù)據(jù),其中的配置包括路由配置;大數(shù)據(jù)處理平臺(tái),用于采用大數(shù)據(jù)技術(shù)對(duì)采集的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)進(jìn)行存儲(chǔ)和處理,維護(hù)業(yè)務(wù)路由,形成正常性能曲線;以及故障處理模塊,用于啟動(dòng)故障定位流程;根據(jù)故障定位流程的需要,從大數(shù)據(jù)處理平臺(tái)搜索得到所需要的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù);從大數(shù)據(jù)處理平臺(tái)提取故障相關(guān)的業(yè)務(wù)路由和正常性能曲線;根據(jù)業(yè)務(wù)路由確定故障相關(guān)的網(wǎng)元設(shè)備,并檢查網(wǎng)元設(shè)備的第一網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)是否正常,其中的第一網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)包括告警、配置、流量、日志中的至少一項(xiàng);響應(yīng)于異常的檢查結(jié)果,定位故障位置;響應(yīng)于正常的檢查結(jié)果,根據(jù)業(yè)務(wù)路由相關(guān)的網(wǎng)元設(shè)備當(dāng)前的網(wǎng)絡(luò)性能數(shù)據(jù)形成當(dāng)前性能曲線,根據(jù)當(dāng)前性能曲線和正常性能曲線的比對(duì)結(jié)果定位故障位置。
[0014]在一個(gè)實(shí)施例中,采集適配模塊,還用于將網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)轉(zhuǎn)換為適合大數(shù)據(jù)技術(shù)的Hadoop文本格式。
[0015]在一個(gè)實(shí)施例中,大數(shù)據(jù)處理平臺(tái),還用于對(duì)網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)進(jìn)行統(tǒng)一建模。
[0016]在一個(gè)實(shí)施例中,故障處理模塊用于根據(jù)故障定位流程的需要確定搜索參數(shù),并將搜索參數(shù)下發(fā)給大數(shù)據(jù)處理平臺(tái);大數(shù)據(jù)處理平臺(tái)利用大數(shù)據(jù)技術(shù)根據(jù)搜索參數(shù)在存儲(chǔ)的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)中進(jìn)行搜索,并返回搜索到的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)給故障處理模塊。
[0017]在一個(gè)實(shí)施例中,大數(shù)據(jù)處理平臺(tái)在形成正常性能曲線時(shí),具體用于根據(jù)網(wǎng)元設(shè)備正常狀態(tài)下的歷史網(wǎng)絡(luò)性能數(shù)據(jù),利用設(shè)定的算法得到網(wǎng)元設(shè)備的正常性能模板,并由一條業(yè)務(wù)路由上各網(wǎng)元設(shè)備的正常性能模板組成正常性能曲線。
[0018]在一個(gè)實(shí)施例中,故障處理模塊在檢測(cè)到告警信息或者接收到用戶申告信息時(shí)啟動(dòng)故障定位流程。
[0019]在一個(gè)實(shí)施例中,故障處理模塊還用于在定位故障位置后,生成相應(yīng)的處理策略,還可以對(duì)處理策略進(jìn)行可行性分析。
[0020]本發(fā)明利用大數(shù)據(jù)技術(shù)存儲(chǔ)和處理承載網(wǎng)絡(luò)的海量網(wǎng)絡(luò)運(yùn)行數(shù)據(jù),解決了海量網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)的有效存儲(chǔ)和利用問題;并且,基于網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)形成網(wǎng)元設(shè)備間的性能曲線,在故障分析過程中,結(jié)合業(yè)務(wù)路由上各網(wǎng)元設(shè)備的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)的檢查結(jié)果以及性能曲線的比對(duì)結(jié)果進(jìn)行故障綜合定位,一方面可以定位告警指示的業(yè)務(wù)故障,另一方面可以定位由性能劣化現(xiàn)象造成的業(yè)務(wù)故障,適用于傳輸網(wǎng)絡(luò)和數(shù)據(jù)網(wǎng)絡(luò)出現(xiàn)的跨專業(yè)故障定位,能夠?qū)Τ休d網(wǎng)出現(xiàn)的跨專業(yè)故障進(jìn)行快速精確處理。
[0021]通過以下參照附圖對(duì)本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征及其優(yōu)點(diǎn)將會(huì)變得清楚。
【附圖說明】
[0022]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0023]圖1為本發(fā)明故障定位系統(tǒng)一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
[0024]圖2為本發(fā)明故障定位系統(tǒng)再一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
[0025]圖3為本發(fā)明由告警信息啟動(dòng)的故障定位流程示意圖。
[0026]圖4為本發(fā)明由用戶申告信息啟動(dòng)的故障定位流程示意圖。
[0027]圖5為本發(fā)明故障定位方法一個(gè)實(shí)施例的流程示意圖。
[0028]圖6為某種業(yè)務(wù)的業(yè)務(wù)路由示意圖。
【具體實(shí)施方式】
[0029]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。以下對(duì)至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說明性的,決不作為對(duì)本發(fā)明及其應(yīng)用或使用的任何限制。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0030]為了解決由性能劣化現(xiàn)象造成的業(yè)務(wù)故障的定位問題,以及故障分析中海量網(wǎng)絡(luò)數(shù)據(jù)的有效處理和利用問題,本發(fā)明利用大數(shù)據(jù)技術(shù)存儲(chǔ)和處理承載網(wǎng)絡(luò)的海量網(wǎng)絡(luò)運(yùn)行數(shù)據(jù),解決了海量網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)的有效存儲(chǔ)和利用問題;并且,基于網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)形成網(wǎng)元設(shè)備間的性能曲線,在故障分析過程中,結(jié)合業(yè)務(wù)路由上各網(wǎng)元設(shè)備的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)的檢查結(jié)果以及性能曲線的比對(duì)結(jié)果進(jìn)行故障綜合定位,一方面可以定位告警指示的業(yè)務(wù)故障,另一方面可以定位由性能劣化現(xiàn)象造成的業(yè)務(wù)故障,適用于傳輸網(wǎng)絡(luò)和數(shù)據(jù)網(wǎng)絡(luò)出現(xiàn)的跨專業(yè)故障定位,能夠?qū)Τ休d網(wǎng)出現(xiàn)的跨專業(yè)故障進(jìn)行快速精確處理。
[0031]圖1為本發(fā)明故障定位系統(tǒng)一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
[0032]如圖1所示,本發(fā)明故障定位系統(tǒng)包括:采集適配模塊11、大數(shù)據(jù)處理平臺(tái)12、故障處理模塊13。
[0033]采集適配模塊11,用于采集傳輸網(wǎng)絡(luò)和數(shù)據(jù)網(wǎng)絡(luò)的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù),并可以將網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)轉(zhuǎn)換為適合大數(shù)據(jù)技術(shù)的格式,如Hadoop文本格式。其中,網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)例如包括:告警、性能、流量、配置(包括路由配置)、日志等,但不限于此。
[0034]大數(shù)據(jù)處理平臺(tái)12,用于采用大數(shù)據(jù)技術(shù)對(duì)采集的網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)進(jìn)行存儲(chǔ)和處理,