一種基于bp神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法
【專利摘要】一種基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,屬于城市供水管網(wǎng)技術(shù)領(lǐng)域。所述方法包括:為預(yù)測(cè)管道破損概率進(jìn)行前期的數(shù)據(jù)準(zhǔn)備;選擇待預(yù)測(cè)的管網(wǎng)區(qū)域,分別通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)三種途徑確定訓(xùn)練數(shù)據(jù)范圍;選擇導(dǎo)致管道發(fā)生破損的影響因子,在訓(xùn)練數(shù)據(jù)范圍內(nèi)提取建模所需訓(xùn)練樣本;利用BP神經(jīng)網(wǎng)絡(luò)算法,使用訓(xùn)練樣本訓(xùn)練模型,采用基于10折交叉驗(yàn)證的ROC曲線評(píng)價(jià)模型的穩(wěn)定性和預(yù)測(cè)精確度;將訓(xùn)練好的模型應(yīng)用在待預(yù)測(cè)管網(wǎng)區(qū)域,得到每一條管道將要發(fā)生破損的概率;在ArcGIS中采用自然斷點(diǎn)法將管道破損概率分類,制作專題圖。本發(fā)明拓展了現(xiàn)有管道破損概率預(yù)測(cè)模型的研究?jī)?nèi)容,為供水管網(wǎng)資產(chǎn)管理科學(xué)方法的建立提供一種新的思路。
【專利說(shuō)明】
-種基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種對(duì)管道發(fā)生破損的概率進(jìn)行預(yù)測(cè)的方法,屬于城市供水管網(wǎng)領(lǐng) 域。
【背景技術(shù)】
[0002] 作為保障正常生產(chǎn)生活的城市命脈,供水管網(wǎng)是供水企業(yè)的核屯、資產(chǎn),占企業(yè)資 產(chǎn)總額的65-75%。管網(wǎng)深埋地下,檢測(cè)難度大,耗費(fèi)人力物力,每年因各種原因造成的破損 使得資產(chǎn)貶值非常嚴(yán)重。我國(guó)的供水管網(wǎng)建設(shè)滯后于城市總體建設(shè)水平,缺乏科學(xué)的資產(chǎn) 管理方法,基礎(chǔ)數(shù)據(jù)尚不十分完善,運(yùn)些問(wèn)題一直制約著供水企業(yè)的管理效率和服務(wù)水平。 因此,對(duì)管網(wǎng)資產(chǎn)的破損事故發(fā)生進(jìn)行預(yù)測(cè),輔助管理者的科學(xué)決策,對(duì)問(wèn)題管道早發(fā)現(xiàn)早 維護(hù),具有重要的經(jīng)濟(jì)意義和現(xiàn)實(shí)意義。
[0003] 常見(jiàn)的用于預(yù)測(cè)管道破損的模型主要分為兩大類:一類是基于實(shí)驗(yàn)室試驗(yàn)的物理 機(jī)理研究模型;一類是計(jì)算機(jī)模擬的數(shù)據(jù)分析模型,包括統(tǒng)計(jì)模型、概率模型、模糊邏輯模 型、機(jī)器學(xué)習(xí)模型等,通常基于大量的歷史數(shù)據(jù)。由于第一類模型需要對(duì)導(dǎo)致管道破損的多 種因素間關(guān)系有較明確的認(rèn)知,因此第二類模型為目前的研究熱點(diǎn)。
[0004] 我國(guó)城市供水管網(wǎng)數(shù)據(jù)量大,基礎(chǔ)數(shù)據(jù)質(zhì)量不高,導(dǎo)致管道破損的因素眾多且關(guān) 系復(fù)雜非線性?,F(xiàn)有的預(yù)測(cè)管道破損的數(shù)據(jù)分析模型,大多基于管道自身的基本屬性數(shù)據(jù), 受數(shù)據(jù)完整性限制缺乏對(duì)周邊地理環(huán)境因素的考慮;大多評(píng)估模型的準(zhǔn)確性,缺乏對(duì)模型 穩(wěn)定性的探討。
【發(fā)明內(nèi)容】
[0005] 鑒于上述問(wèn)題,本發(fā)明的目的是提供一種新的可處理大量數(shù)據(jù)、挖掘非線性關(guān)系、 融入地理環(huán)境因素、綜合評(píng)估模型效果的基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,W便 在日常管理中及早發(fā)現(xiàn)具有破損風(fēng)險(xiǎn)的管道,降低事故發(fā)生頻率,減少經(jīng)濟(jì)損失,輔助水司 管理者的科學(xué)決策。
[0006] 本發(fā)明的技術(shù)方案如下:
[0007] -種基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,其特征在于該方法包括如下步 驟:
[000引1)為預(yù)測(cè)管道破損概率進(jìn)行前期的數(shù)據(jù)準(zhǔn)備:
[0009] a.信息完善:在城市供水管網(wǎng)GIS系統(tǒng)(Geographic Information System,地理信 息系統(tǒng))的管道圖層中,完善管道的基本信息,包括管道編號(hào)、所在行政區(qū)、影響因子、W及 有無(wú)破損記錄;
[0010] b.信息數(shù)字化:根據(jù)影響因子的數(shù)據(jù)屬性,將其分為連續(xù)變量和分類變量,對(duì)分類 變量進(jìn)行數(shù)字編碼,用不同數(shù)字表示數(shù)據(jù)類別,特別的,針對(duì)有無(wú)破損記錄,用0表示無(wú)破損 記錄,用1表示發(fā)生過(guò)破損;
[0011] 2)選擇待預(yù)測(cè)的管網(wǎng)區(qū)域,分別通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑確 定訓(xùn)練數(shù)據(jù)范圍:
[0012] 確定訓(xùn)練數(shù)據(jù)范圍的方法包括:
[0013] a.全管網(wǎng):該城市的全部供水管道;
[0014] b.所在行政區(qū):被選擇的待預(yù)測(cè)管網(wǎng)區(qū)域所在行政區(qū)的全部供水管道;
[0015] C.周邊緩沖區(qū):被選擇的待預(yù)測(cè)管網(wǎng)區(qū)域周邊500-2000米內(nèi)所覆蓋的全部供水管 道;
[0016] 3)選擇導(dǎo)致管道發(fā)生破損的影響因子,在訓(xùn)練數(shù)據(jù)范圍內(nèi)提取建模所需訓(xùn)練樣 本:
[0017] 在訓(xùn)練數(shù)據(jù)范圍內(nèi),提取全部有破損記錄的管道,再隨機(jī)提取等量無(wú)破損記錄的 管道,組成建模所需訓(xùn)練樣本,訓(xùn)練樣本的屬性信息包括管道編號(hào)、影響因子、有無(wú)破損記 錄立部分;
[0018] 4)利用BP神經(jīng)網(wǎng)絡(luò)算法建立影響因子與有無(wú)破損記錄之間的關(guān)系,并用訓(xùn)練樣本 進(jìn)行訓(xùn)練,采用基于10折交叉驗(yàn)證的ROC曲線評(píng)價(jià)模型的穩(wěn)定性和預(yù)測(cè)精確度:
[0019] a.模型的輸入因子為管道破損的影響因子,輸出因子為管道有無(wú)破損記錄;
[0020] b.輸入因子需進(jìn)行歸一化,將各影響因子的數(shù)值轉(zhuǎn)化到[0,1]范圍內(nèi),歸一化公式 為:
[0021]
[0022] 式中,y代表歸一化后的數(shù)據(jù),X代表輸入的原始數(shù)據(jù),Xmax和Xmin分別代表輸入數(shù)據(jù) 的最大值和最小值;
[0023] C.基于 10折交叉驗(yàn)證的ROC(Receive;r-〇perating Qiaracteristic)曲線,通過(guò)箱 式圖反映模型的穩(wěn)定性,通過(guò)ROC曲線下面積AUC(Area化der Curve)的值反映模型的預(yù)測(cè) 精確度;
[0024] 5)將訓(xùn)練好的模型應(yīng)用在待預(yù)測(cè)管網(wǎng)區(qū)域,得到每一條管道將要發(fā)生破損的概 率,即介于[0,1 ]之間的數(shù)值,其值越大代表管道越容易發(fā)生破損事故;
[0025] 通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)S種途徑得到S個(gè)訓(xùn)練樣本,分別用于訓(xùn)練 BP神經(jīng)網(wǎng)絡(luò)模型得到=個(gè)破損概率預(yù)測(cè)結(jié)果,將=個(gè)結(jié)果加權(quán)得到最終破損概率值;
[00%] 6)在ArcGIS中采用自然斷點(diǎn)法將管道破損概率分類,制作專題圖,使計(jì)算結(jié)果可 視化。
[0027] 上述方案中,步驟1)選擇導(dǎo)致管道發(fā)生破損的影響因子時(shí),包括管材、管徑、管齡、 管長(zhǎng)、接口類型、埋深、道路負(fù)荷、運(yùn)行壓力。
[0028] 步驟2)通過(guò)周邊緩沖區(qū)確定訓(xùn)練數(shù)據(jù)范圍中,應(yīng)用ArcGIS的緩沖區(qū)工具,設(shè)置緩 沖距離為1000米。
[0029] 步驟5)將=個(gè)結(jié)果加權(quán)得到最終破損概率值時(shí),全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū) =種途徑得到結(jié)果的權(quán)重占比為2:4: 4。
[0030] 本發(fā)明步驟6)中所述的制作專題圖,應(yīng)用ArcGIS的符號(hào)化功能,將管道破損概率 劃分為高、較高、中、低四類,用不同的顏色表示。
[0031] 與現(xiàn)有城市供水管網(wǎng)破損預(yù)測(cè)方法相比,本發(fā)明具有W下優(yōu)點(diǎn)及突出性的技術(shù)效 果:
[0032] ①BP神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的處理非線性系統(tǒng)的能力,在難W給出描述輸入-輸出關(guān) 系的數(shù)學(xué)公式時(shí),可W學(xué)習(xí)和存儲(chǔ)大量的映射關(guān)系,能夠較好地模擬管道破損及其影響因 素間復(fù)雜的非線性關(guān)系,且可W應(yīng)對(duì)我國(guó)城市供水管網(wǎng)數(shù)據(jù)量大的問(wèn)題。
[0033] ②我國(guó)城市供水管網(wǎng)管理技術(shù)發(fā)展較晚,數(shù)據(jù)收集標(biāo)準(zhǔn)不完善不統(tǒng)一,大多數(shù)水 司缺乏管道地理環(huán)境信息。本發(fā)明采用全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑提取樣本 進(jìn)行模型訓(xùn)練,并將預(yù)測(cè)結(jié)果加權(quán)處理,其中所在行政區(qū)和周邊緩沖區(qū)兩種途徑均考慮到 地理環(huán)境的相似性,相當(dāng)于間接將地理環(huán)境因素融入模型。
[0034] ③傳統(tǒng)方法通常只關(guān)注模型的精確度,本發(fā)明采用基于10折交叉驗(yàn)證的ROC曲線, 同時(shí)評(píng)價(jià)模型的穩(wěn)定性和預(yù)測(cè)精確度,全面評(píng)估模型效果。
[0035] ④與傳統(tǒng)的等間隔分類法不同,本發(fā)明采用自然斷點(diǎn)法對(duì)預(yù)測(cè)結(jié)果進(jìn)行分類,使 得類內(nèi)差異最小,類間差異最大,更好地展示管道發(fā)生破損的風(fēng)險(xiǎn)梯度,為水司管理者的科 學(xué)決策提供支持。因此,本發(fā)明具有一定的技術(shù)優(yōu)越性。
【附圖說(shuō)明】
[0036] 圖1示出了基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法的流程圖。
[0037] 圖2示出了 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖。
[0038] 圖3(a)、圖3(b)和3(c)示出了確定訓(xùn)練數(shù)據(jù)的S種范圍示意圖。
[0039] 圖4示出了基于10折交叉驗(yàn)證的ROC曲線圖。
[0040] 圖5示出了管道破損概率預(yù)測(cè)專題圖。
【具體實(shí)施方式】
[0041 ]為更好的理解和實(shí)施本發(fā)明,下面將結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)闡 述。
[0042] 為了節(jié)省人力物力,降低供水管網(wǎng)的事故發(fā)生頻率,減少經(jīng)濟(jì)損失,需要在日常管 理中基于管網(wǎng)的歷史數(shù)據(jù),綜合考慮管道自身屬性、地理環(huán)境等因素,挖掘影響因子與管道 破損之間的非線性關(guān)系,建立預(yù)測(cè)精確度好且泛化能力強(qiáng)的模型,對(duì)管道發(fā)生破損的概率 進(jìn)行預(yù)測(cè),劃分管道的風(fēng)險(xiǎn)梯度,為管道維護(hù)優(yōu)先次序的制定提供依據(jù)。為實(shí)現(xiàn)上述目的, 本發(fā)明提供一種基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,利用R軟件編寫相應(yīng)代碼進(jìn)行 模型開(kāi)發(fā),基于ArcGIS平臺(tái)完成管道數(shù)據(jù)的提取和專題圖展示。
[0043] 圖1示出了基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法的流程圖,主要步驟如下:
[0044] 1)為預(yù)測(cè)管道破損概率進(jìn)行前期的數(shù)據(jù)準(zhǔn)備。
[0045] a.信息完善:在城市供水管網(wǎng)GIS系統(tǒng)的管道圖層中,完善管道的基本信息,包括 管道編號(hào)、所在行政區(qū)、影響因子、W及有無(wú)破損記錄,其中影響因子包括管道編號(hào)、所在行 政區(qū)、管材、管徑、管齡、管長(zhǎng)、接口類型、埋深、道路負(fù)荷、運(yùn)行壓力、有無(wú)破損記錄。如管道 信息與破損信息分別位于兩個(gè)圖層中,需將兩個(gè)圖層進(jìn)行關(guān)聯(lián),匹配出有無(wú)破損記錄信息。
[0046] b.信息數(shù)字化:根據(jù)影響因子的數(shù)據(jù)屬性,將其分為連續(xù)變量和分類變量,對(duì)分類 變量進(jìn)行數(shù)字編碼,用不同數(shù)字表示數(shù)據(jù)類別,特別的,針對(duì)有無(wú)破損記錄,用0表示無(wú)破損 記錄,用1表示發(fā)生過(guò)破損。
[0047] 2)選擇待預(yù)測(cè)的管網(wǎng)區(qū)域,分別通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑確 定訓(xùn)練數(shù)據(jù)范圍。
[0048] 在ArcGIS中選擇待預(yù)測(cè)的管網(wǎng)區(qū)域時(shí),可通過(guò)"選擇要素"功能進(jìn)行框選,也可通 過(guò)"按屬性選擇"功能根據(jù)位置字段篩選某小區(qū)內(nèi)管網(wǎng)。
[0049] 確定訓(xùn)練數(shù)據(jù)范圍的方法包括:
[0050] a.全管網(wǎng):該城市的全部供水管道;
[0051] b.所在行政區(qū):被選擇的待預(yù)測(cè)管網(wǎng)區(qū)域所在行政區(qū)的全部供水管道,若待預(yù)測(cè) 區(qū)域跨域兩個(gè)行政區(qū),則為運(yùn)兩個(gè)行政區(qū)的全部供水管道;
[0052] C.周邊緩沖區(qū):被選擇的待預(yù)測(cè)管網(wǎng)區(qū)域周邊500-2000米內(nèi)所覆蓋的全部供水管 道,應(yīng)用ArcGIS的緩沖區(qū)工具。
[0053] 3)選擇導(dǎo)致管道發(fā)生破損的影響因子,在訓(xùn)練數(shù)據(jù)范圍內(nèi)提取建模所需訓(xùn)練樣 本。
[0054] 選擇對(duì)管道發(fā)生破損事故有直接或間接影響的因子時(shí),根據(jù)數(shù)據(jù)的可采集性、完 整性、準(zhǔn)確性,在管材、管徑、管齡、管長(zhǎng)、接口類型、埋深、道路負(fù)荷、運(yùn)行壓力中選擇盡可能 多的因子。
[0055] 在訓(xùn)練數(shù)據(jù)范圍內(nèi),提取全部有破損記錄的管道,再隨機(jī)提取等量無(wú)破損記錄的 管道,組成建模所需訓(xùn)練樣本,即訓(xùn)練樣本中有破損記錄和無(wú)破損記錄的管道數(shù)量之比為 1:1。訓(xùn)練樣本的屬性信息包括管道編號(hào)、影響因子、有無(wú)破損記錄=部分。
[0056] 4)利用BP神經(jīng)網(wǎng)絡(luò)算法建立影響因子與有無(wú)破損記錄之間的關(guān)系,并用訓(xùn)練樣本 進(jìn)行訓(xùn)練,采用基于10折交叉驗(yàn)證的ROC曲線評(píng)價(jià)模型的穩(wěn)定性和預(yù)測(cè)精確度。
[0化7] BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò),即誤差反向傳播人工神經(jīng)網(wǎng)絡(luò),是一種機(jī)器學(xué) 習(xí)方法,是目前應(yīng)用最為廣泛的人工神經(jīng)網(wǎng)絡(luò)模型之一。圖2示出了典型的BP神經(jīng)網(wǎng)絡(luò)拓?fù)?結(jié)構(gòu),即輸入層-隱藏層-輸出層。BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程由正向傳播和反向傳播組成,根據(jù) 最速下降法的學(xué)習(xí)規(guī)則,信息從輸入層正向逐層傳播到輸出層,再由輸出層反向回到輸入 層逐層調(diào)整神經(jīng)元之間的權(quán)值和闊值,經(jīng)過(guò)反復(fù)迭代達(dá)到減小輸出誤差到目標(biāo)值的目的, 完成對(duì)網(wǎng)絡(luò)的訓(xùn)練。B巧巾經(jīng)網(wǎng)絡(luò)可W看成一個(gè)非線性函數(shù),表達(dá)自變量到因變量的函數(shù)映 射關(guān)系。
[0058] 模型的輸入因子為管道破損的影響因子,輸出因子為管道有無(wú)破損記錄。
[0059] 為了減小不同量綱和較大的數(shù)值差別對(duì)模型效果的影響,輸入因子需進(jìn)行歸一 化,將各影麻巧早的撕估掉化到[0,1 ]范圍內(nèi),歸一化公式為:
[0060]
[0061] 巧甲,y代巧歸一化后的數(shù)據(jù),X代表輸入的原始數(shù)據(jù),Xmax和Xmin分別代表輸入數(shù)據(jù) 的最大值和最小值。
[0062] 在檢驗(yàn)?zāi)P途葧r(shí),采用ROC曲線及曲線下面積AUC來(lái)表示。通常,AUC值越接近于 1,模型效果越好。當(dāng)AUC = O . 5~0.7時(shí),準(zhǔn)確性較差;當(dāng)AUC = O. 7~0.9時(shí),準(zhǔn)確性較好;當(dāng) AUO0.9時(shí),準(zhǔn)確性很高。
[0063] 泛化能力,即模型的穩(wěn)定性,是模型效果最直接的表征。為此,本發(fā)明采用10折交 叉檢驗(yàn)法,將原始樣本集隨機(jī)平均劃分為10個(gè)不相交的子集,訓(xùn)練和檢驗(yàn)10次,每次用一個(gè) 子集進(jìn)行檢驗(yàn),其余的子集用于訓(xùn)練模型。
[0064] 本發(fā)明采用10折交叉驗(yàn)證的ROC曲線全面評(píng)價(jià)模型效果。圖3(a)、圖3(b)和圖3(c) 示出了基于10折交叉驗(yàn)證的ROC曲線圖。圖中虛線表示10折交叉驗(yàn)證的10條ROC曲線,箱線 圖表示10條虛線中同一橫坐標(biāo)下縱坐標(biāo)值的變化范圍,實(shí)線表示10折交叉驗(yàn)證的平均ROC 曲線。箱線圖由上下邊緣值、四分位數(shù)、中位數(shù)和異常值組成,上下邊緣間距越小,異常值越 少,說(shuō)明模型的泛化能力越強(qiáng),模型效果越穩(wěn)定。實(shí)線ROC曲線的AUC值反映模型的預(yù)測(cè)精確 度。
[0065] 5)將訓(xùn)練好的模型應(yīng)用在待預(yù)測(cè)管網(wǎng)區(qū)域,得到每一條管道將要發(fā)生破損的概 率。介于[0,1]之間的數(shù)值,其值越大代表管道越容易發(fā)生破損事故。
[0066] 通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑得到=個(gè)訓(xùn)練樣本,分別用于訓(xùn)練 BP神經(jīng)網(wǎng)絡(luò)模型,得到=個(gè)破損概率預(yù)測(cè)結(jié)果,將=個(gè)結(jié)果按2:4:4的權(quán)重加權(quán)得到最終破 損概率值。
[0067] 6)在ArcGIS中采用自然斷點(diǎn)法將管道破損概率分類,制作專題圖。
[0068] 自然斷點(diǎn)法是基于數(shù)據(jù)中固有的自然分組,對(duì)分類間隔加 W識(shí)別,對(duì)相似值進(jìn)行 最恰當(dāng)?shù)胤纸M,使各個(gè)類之間的差異最大化。全部數(shù)據(jù)被劃分為多個(gè)類,對(duì)于運(yùn)些類,在數(shù) 據(jù)值的差異相對(duì)較大的位置處設(shè)置其邊界。
[0069] 應(yīng)用ArcGIS的符號(hào)化功能,將管道破損概率劃分為高、較高、中、低四類,用不同的 顏色表示。
[0070] 下面W我國(guó)北方某城市供水管網(wǎng)為實(shí)施例,詳細(xì)介紹基于BP神經(jīng)網(wǎng)絡(luò)的管道破損 概率預(yù)測(cè)的具體步驟:
[0071] (1)為預(yù)測(cè)管道破損概率進(jìn)行前期的數(shù)據(jù)準(zhǔn)備。
[0072] 完善該城市供水管網(wǎng)破損GIS系統(tǒng)中的管道信息,針對(duì)管道編號(hào)、所在行政區(qū)、管 材、管徑、管齡、管長(zhǎng)、接口類型、埋深、道路負(fù)荷、運(yùn)行壓力、有無(wú)破損記錄等信息,進(jìn)行錄入 錯(cuò)誤、異常數(shù)據(jù)的篩選與修正,提高數(shù)據(jù)質(zhì)量。
[0073] 根據(jù)影響因子的數(shù)據(jù)屬性,將其分為連續(xù)變量和分類變量,對(duì)分類變量進(jìn)行數(shù)字 編碼,分別用從1開(kāi)始的不同數(shù)字替代表示數(shù)據(jù)類別。
[0074] (2)選擇待預(yù)測(cè)的管網(wǎng)區(qū)域,分別通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑 確定訓(xùn)練數(shù)據(jù)范圍。
[0075] 本實(shí)施例通過(guò)矩形框選選擇了一塊待預(yù)測(cè)管網(wǎng)區(qū)域,區(qū)域內(nèi)共有906根管道。針對(duì) 該區(qū)域,通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑確定訓(xùn)練數(shù)據(jù)范圍概況見(jiàn)表1。圖3 (a)(b)(c)依次示出了全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)S種范圍。
[0076] 表1訓(xùn)練數(shù)據(jù)范圍概況 「00771
~(3)選擇導(dǎo)致管道發(fā)生破損的影響因子,在訓(xùn)練數(shù)據(jù)范圍內(nèi)提取建模所需訓(xùn)練樣胃 本。
[0079]根據(jù)數(shù)據(jù)的可采集性和數(shù)據(jù)質(zhì)量,選擇管材、管徑、管齡、管長(zhǎng)、接口類型五個(gè)屬性 作為管道破損的影響因子。
[0080] 在通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑確定的訓(xùn)練數(shù)據(jù)范圍內(nèi),提取全 部有破損記錄的管道,再隨機(jī)提取等量無(wú)破損記錄的管道,組成建模所需的訓(xùn)練樣本。
[0081] (4)利用BP神經(jīng)網(wǎng)絡(luò)算法建立影響因子與有無(wú)破損記錄之間的關(guān)系,并用訓(xùn)練樣 本進(jìn)行訓(xùn)練,采用基于10折交叉驗(yàn)證的ROC曲線評(píng)價(jià)模型的穩(wěn)定性和預(yù)測(cè)精確度。
[0082] 針對(duì)本實(shí)施例,建立典型的3層BP神經(jīng)網(wǎng)絡(luò),輸入層節(jié)點(diǎn)數(shù)為5,隱藏層節(jié)點(diǎn)數(shù)為3, 輸出層節(jié)點(diǎn)數(shù)為1。分別輸入通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑提取的訓(xùn)練樣 本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練。
[0083] 圖4示出了通過(guò)全管網(wǎng)提取訓(xùn)練樣本的10折交叉驗(yàn)證ROC曲線圖。本實(shí)施例中,通 過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑提取訓(xùn)練樣本的建模結(jié)果相近,經(jīng)過(guò)10折交叉 驗(yàn)證的AUC均值達(dá)到0.78,模型準(zhǔn)確性較為理想;箱線圖顯示,ROC曲線的變化范圍均較小, 分布相對(duì)集中,模型較為穩(wěn)定,不易受樣本集劃分影響。因此整體來(lái)看,模型的效果較好。
[0084] (5)將訓(xùn)練好的模型應(yīng)用在待預(yù)測(cè)管網(wǎng)區(qū)域,得到每一條管道將要發(fā)生破損的概 率。
[0085] 分別將通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)=種途徑選取的訓(xùn)練樣本訓(xùn)練后的 BP神經(jīng)網(wǎng)絡(luò)模型應(yīng)用在待預(yù)測(cè)管網(wǎng)區(qū)域,得到S個(gè)破損概率預(yù)測(cè)結(jié)果,將S個(gè)結(jié)果按2:4:4 的權(quán)重加權(quán)得到最終破損概率值。
[0086] (6)采在ArcGIS中用自然斷點(diǎn)法將管道破損概率分類,制作專題圖。
[0087] 采用自然斷點(diǎn)法對(duì)管道破損概率分類的標(biāo)準(zhǔn)見(jiàn)表2。
[0088] 表2管道破損概率分類標(biāo)準(zhǔn)
[0089]
123 ~將分類結(jié)果在ArcGIS中用不同的顏色顯示,制作專題圖。圖4示出了在本具體實(shí)施 例中管道破損概率預(yù)測(cè)專題圖。破損概率為高的管線發(fā)生事故的可能性大,建議重點(diǎn)關(guān)注, 結(jié)合實(shí)際情況優(yōu)先更新改造;破損概率較高的管線,建議加強(qiáng)監(jiān)督,定期維護(hù);破損概率為 中的管線,發(fā)生事故的可能性較小,可采用較長(zhǎng)時(shí)間間隔進(jìn)行監(jiān)督檢查;破損概率為低的管 線,發(fā)生事故的可能性小,運(yùn)行不受影響。 2 W上結(jié)果說(shuō)明,基于BP神經(jīng)網(wǎng)絡(luò)對(duì)城市供水管網(wǎng)發(fā)生破損的概率進(jìn)行預(yù)測(cè),模型 的預(yù)測(cè)精確度和穩(wěn)定性均較好,在保障模型效果的同時(shí)增加了影響因素的綜合性、提高了 方法的實(shí)用性,本發(fā)明拓展了現(xiàn)有管道破損概率預(yù)測(cè)模型的研究?jī)?nèi)容,為供水管網(wǎng)資產(chǎn)管 理科學(xué)方法的建立提供一種新的思路。 3 W上實(shí)施例僅用于更好地描述本發(fā)明,但并不限制本發(fā)明的應(yīng)用范圍。
【主權(quán)項(xiàng)】
1. 一種基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,其特征在于該方法包括如下步驟: 1) 為預(yù)測(cè)管道破損概率進(jìn)行前期的數(shù)據(jù)準(zhǔn)備: a. 信息完善:在城市供水管網(wǎng)地理信息系統(tǒng)的管道圖層中,完善管道的基本信息,包括 管道編號(hào)、所在行政區(qū)、影響因子、以及有無(wú)破損記錄; b. 信息數(shù)字化:根據(jù)影響因子的數(shù)據(jù)屬性,將其分為連續(xù)變量和分類變量,對(duì)分類變量 進(jìn)行數(shù)字編碼,用不同數(shù)字表示數(shù)據(jù)類別;針對(duì)有無(wú)破損記錄,用〇表示無(wú)破損記錄,用1表 示發(fā)生過(guò)破損; 2) 選擇待預(yù)測(cè)的管網(wǎng)區(qū)域,分別通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)三種途徑確定訓(xùn) 練數(shù)據(jù)范圍: 訓(xùn)練數(shù)據(jù)范圍包括: a. 全管網(wǎng):該城市的全部供水管道; b. 所在行政區(qū):被選擇的待預(yù)測(cè)管網(wǎng)區(qū)域所在行政區(qū)的全部供水管道; c. 周邊緩沖區(qū):被選擇的待預(yù)測(cè)管網(wǎng)區(qū)域周邊500-2000米內(nèi)所覆蓋的全部供水管道; 3) 選擇導(dǎo)致管道發(fā)生破損的影響因子,在訓(xùn)練數(shù)據(jù)范圍內(nèi)提取建模所需訓(xùn)練樣本: 在訓(xùn)練數(shù)據(jù)范圍內(nèi),提取全部有破損記錄的管道,再隨機(jī)提取等量無(wú)破損記錄的管道, 組成建模所需訓(xùn)練樣本,訓(xùn)練樣本的屬性信息包括管道編號(hào)、影響因子、有無(wú)破損記錄三部 分; 4) 利用BP神經(jīng)網(wǎng)絡(luò)算法建立影響因子與有無(wú)破損記錄之間的關(guān)系,并用訓(xùn)練樣本進(jìn)行 訓(xùn)練,采用基于10折交叉驗(yàn)證的ROC曲線評(píng)價(jià)模型的穩(wěn)定性和預(yù)測(cè)精確度: a. 模型的輸入因子為管道破損的影響因子,輸出因子為管道有無(wú)破損記錄; b. 輸入因子需進(jìn)行歸一化,將各影響因子的數(shù)值轉(zhuǎn)化到[0,1]范圍內(nèi),歸一化公式為:式中,y代表歸一化后的數(shù)據(jù),X代表輸入的原始數(shù)據(jù),和1_分別代表輸入數(shù)據(jù)的最 大值和最小值; c. 基于10折交叉驗(yàn)證的ROC曲線,通過(guò)箱式圖反映模型的穩(wěn)定性,通過(guò)ROC曲線下面積 AUC的值反映模型的預(yù)測(cè)精確度; 5) 將訓(xùn)練好的模型應(yīng)用在待預(yù)測(cè)管網(wǎng)區(qū)域,得到每一條管道將要發(fā)生破損的概率,即 介于[〇,1 ]之間的數(shù)值,其值越大代表管道越容易發(fā)生破損事故; 將通過(guò)全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)三種途徑得到三個(gè)訓(xùn)練樣本,分別用于訓(xùn)練BP 神經(jīng)網(wǎng)絡(luò)模型得到三個(gè)破損概率預(yù)測(cè)結(jié)果,將三個(gè)結(jié)果加權(quán)得到最終破損概率值; 6) 在ArcGIS中采用自然斷點(diǎn)法將管道破損概率分類,制作專題圖,使計(jì)算結(jié)果可視化。2. 按照權(quán)利要求1所述的基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,其特征在于,步驟 1) 所述的選擇導(dǎo)致管道發(fā)生破損的影響因子,包括管材、管徑、管齡、管長(zhǎng)、接口類型、埋深、 道路負(fù)荷和運(yùn)行壓力。3. 按照權(quán)利要求1所述的基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,其特征在于,步驟 2) 所述的通過(guò)周邊緩沖區(qū)確定訓(xùn)練數(shù)據(jù)范圍中,應(yīng)用ArcGIS的緩沖區(qū)工具,設(shè)置緩沖距離 為1000米。4. 按照權(quán)利要求1所述的基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,其特征在于,步驟 5) 所述的將三個(gè)結(jié)果加權(quán)得到最終破損概率值中,全管網(wǎng)、所在行政區(qū)、周邊緩沖區(qū)三種途 徑得到結(jié)果的權(quán)重占比為2:4:4。5.按照權(quán)利要求1所述的基于BP神經(jīng)網(wǎng)絡(luò)的管道破損概率預(yù)測(cè)方法,其特征在于,步驟 6) 所述的制作專題圖,應(yīng)用ArcGIS的符號(hào)化功能,將管道破損概率劃分為高、較高、中、低四 類,用不同的顏色表示。
【文檔編號(hào)】G06N3/08GK106022518SQ201610327251
【公開(kāi)日】2016年10月12日
【申請(qǐng)日】2016年5月17日
【發(fā)明人】劉書明, 常田, 吳雪
【申請(qǐng)人】清華大學(xué)