一種亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配方法
【專利摘要】一種亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配算法,針對(duì)大數(shù)據(jù)中亂序數(shù)據(jù)流難以在短時(shí)間內(nèi)獲取有價(jià)值的信息的問(wèn)題,提出了一個(gè)改進(jìn)型匹配模型,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;提出了動(dòng)態(tài)自適應(yīng)調(diào)整機(jī)制,重新定義了性能均方差函數(shù)、輸出層節(jié)點(diǎn)誤差項(xiàng)、隱層節(jié)點(diǎn)誤差項(xiàng)、閾值、連接權(quán)值、學(xué)習(xí)指數(shù)。根據(jù)匹配模型未知的亂序數(shù)據(jù)流以及用戶的不同需求,確定所需的匹配模板,并對(duì)數(shù)據(jù)流進(jìn)行預(yù)處理,同時(shí)加入遺忘因子,動(dòng)態(tài)調(diào)整匹配模板。設(shè)定好匹配模板之后,同時(shí)運(yùn)用自適應(yīng)調(diào)整機(jī)制修正閾值、連接權(quán)值和學(xué)習(xí)指數(shù)。仿真結(jié)果表明,算法在精度以及運(yùn)行速度上有著明顯的提升,并具有較好的穩(wěn)定性。
【專利說(shuō)明】ー種亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明是一種在亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配方法,屬于大數(shù)據(jù)的模板匹配算法領(lǐng)域。
【背景技術(shù)】
[0002]大數(shù)據(jù)其所涉及的數(shù)據(jù)量規(guī)模巨大,無(wú)法通過(guò)目前主流軟件工具在合理時(shí)間內(nèi)獲得亂序數(shù)據(jù)中用戶所需的有價(jià)值信息。傳統(tǒng)的數(shù)據(jù)處理模式將采集到的數(shù)據(jù)先存儲(chǔ)起來(lái),然后用戶主動(dòng)進(jìn)行查詢,得到最終答案,而對(duì)于亂序數(shù)據(jù)流這種方式并不合適。因此,為了對(duì)數(shù)據(jù)及時(shí)的進(jìn)行存儲(chǔ)和計(jì)算,模板匹配機(jī)制被廣泛運(yùn)用于亂序數(shù)據(jù)流中。但目前大部分模板匹配機(jī)制是根據(jù)事件發(fā)生的先后順序進(jìn)行匹配,這就使得來(lái)自不同數(shù)據(jù)源的事件由于網(wǎng)絡(luò)質(zhì)量不穩(wěn)定等原因而導(dǎo)致事件不按照時(shí)間順序到達(dá)處理節(jié)點(diǎn),進(jìn)而造成模板匹配的精確度不高,無(wú)法應(yīng)用于實(shí)時(shí)性較高的場(chǎng)合,并給緩存單元帶來(lái)極大的計(jì)算壓力。
[0003]誤差反向傳播(Error Back Propagation, BP)算法是ー種有效的學(xué)習(xí)匹配算法,能進(jìn)行大規(guī)模并行信息處理,并用數(shù)據(jù)代表簡(jiǎn)單事件,進(jìn)行匹配操作,能在短時(shí)間內(nèi)獲得較高的算法收斂效率。但傳統(tǒng)BP算法的學(xué)習(xí)模板往往是固定不變的,在數(shù)據(jù)量增加的情況下,算法性能會(huì)變差,這樣就使得算法的運(yùn)行速度和穩(wěn)定性之間產(chǎn)生很大的矛盾。
【發(fā)明內(nèi)容】
[0004]技術(shù)問(wèn)題:本發(fā)明針對(duì)上述問(wèn)題,提出ー種亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配方法,該方法對(duì)BP算法的隱層與輸出層的連接權(quán)值進(jìn)行了修正,同時(shí)利用梯度比值改進(jìn)學(xué)習(xí)指數(shù)。將改進(jìn)后的BP算法運(yùn)用到模板匹配機(jī)制中,來(lái)加速匹配過(guò)程中的算法速度和精度,并提高算法的穩(wěn)定性。
`[0005]技術(shù)方案:本發(fā)明的ー種亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配方法為:
[0006]基本思想:本發(fā)明針對(duì)大數(shù)據(jù)中亂序數(shù)據(jù)流難以在短時(shí)間內(nèi)獲取有價(jià)值的信息的問(wèn)題,提出了一個(gè)改進(jìn)型匹配模型,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;提出了動(dòng)態(tài)自適應(yīng)調(diào)整機(jī)制,重新定義了性能均方差函數(shù)、輸出層節(jié)點(diǎn)誤差項(xiàng)、隱層節(jié)點(diǎn)誤差項(xiàng)、閾值、連接權(quán)值、學(xué)習(xí)指數(shù)。根據(jù)匹配模型未知的亂序數(shù)據(jù)流以及用戶的不同需求,確定所需的匹配模板,并對(duì)數(shù)據(jù)流進(jìn)行預(yù)處理,同時(shí)加入遺忘因子,動(dòng)態(tài)調(diào)整匹配模板。設(shè)定好匹配模板之后,同時(shí)運(yùn)用自適應(yīng)調(diào)整機(jī)制修正閾值、連接權(quán)值和學(xué)習(xí)指數(shù)。
[0007]模型定義:
[0008]定義1:模板匹配模型:BP網(wǎng)絡(luò)的非線性映射特性適用于亂序數(shù)據(jù)流的非結(jié)構(gòu)性映射,而且可以利用算法自學(xué)習(xí)功能,通過(guò)對(duì)樣本的分析辨識(shí)出有價(jià)值的數(shù)值序列。在亂序數(shù)據(jù)流中,我們可利用數(shù)值來(lái)代替事件,以此給BP網(wǎng)絡(luò)的參數(shù)修正和自適應(yīng)匹配創(chuàng)造條件。而網(wǎng)絡(luò)的模型是影響網(wǎng)絡(luò)學(xué)習(xí)性能的主要因素之一,通常根據(jù)經(jīng)驗(yàn)人工獲取。對(duì)于匹配模型未知的亂序數(shù)據(jù)流序列,數(shù)據(jù)是隨時(shí)間而不斷變化的,使用靜態(tài)匹配模板顯然不能完全滿足用戶的不同時(shí)刻段的不同需求,因此將輸入層樣本輸入設(shè)為U1, X2X3,…,xk,I ≤ k≤n),n為輸入層節(jié)點(diǎn)個(gè)數(shù),輸出層樣本輸出為も=JXh >,其中f (Xk)表示網(wǎng)絡(luò)的輸出函數(shù)。網(wǎng)絡(luò)通過(guò)對(duì)樣本學(xué)習(xí)訓(xùn)練,調(diào)整各神經(jīng)元之間的連接權(quán)值來(lái)實(shí)現(xiàn)對(duì)模型參數(shù)的逼近,同時(shí)加入遺忘因子,使得網(wǎng)絡(luò)在連接權(quán)值調(diào)整的同時(shí)也進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí),從而實(shí)現(xiàn)對(duì)模板的動(dòng)態(tài)建模和參數(shù)辯識(shí)。在改進(jìn)型模型中我們?cè)诰W(wǎng)絡(luò)輸入層對(duì)輸入樣本作了預(yù)處理,對(duì)亂序數(shù)據(jù)流進(jìn)行歸ー化操作,并用公式(I)事先計(jì)算好誤差項(xiàng)。隱層誤差計(jì)算采用的Sigmoid作用函數(shù),在閉區(qū)間[0,1]上的S型函數(shù)(Sigmoid函數(shù))表達(dá)式及其導(dǎo)數(shù)定義為公式(2)。其中\(zhòng)決定Sigmoid函數(shù)的壓縮程度,為避免陷入局部最小一般取I。
【權(quán)利要求】
1.一種亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配方法,其特征在于對(duì)誤差反向傳播進(jìn)行改進(jìn)修正,并將改進(jìn)后的BP算法運(yùn)用到模板匹配機(jī)制中,提出一個(gè)改進(jìn)型匹配模型,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;提出神經(jīng)元優(yōu)化機(jī)制,重新定義神經(jīng)元計(jì)算公式,加入相關(guān)系數(shù)和離散度;提出動(dòng)態(tài)自適應(yīng)調(diào)整機(jī)制,重新定義性能均方差函數(shù)、輸出層節(jié)點(diǎn)誤差項(xiàng)、隱層節(jié)點(diǎn)誤差項(xiàng)、閾值、連接權(quán)值、學(xué)習(xí)指數(shù);根據(jù)匹配模型未知的亂序數(shù)據(jù)流以及用戶的不同需求,確定所需的匹配模板,并對(duì)數(shù)據(jù)流進(jìn)行預(yù)處理,同時(shí)加入遺忘因子,動(dòng)態(tài)調(diào)整匹配模板;設(shè)定好匹配模板之后,運(yùn)用神經(jīng)元優(yōu)化機(jī)制,動(dòng)態(tài)調(diào)整神經(jīng)元個(gè)數(shù),自動(dòng)刪除無(wú)效冗余節(jié)點(diǎn);同時(shí)運(yùn)用自適應(yīng)調(diào)整機(jī)制修正閾值、連接權(quán)值和學(xué)習(xí)指數(shù);其具體步驟如下: 1)利用隨機(jī)發(fā)生器產(chǎn)生亂序數(shù)據(jù)流,在輸入層讀取數(shù)據(jù),并在隱層中設(shè)定可接受誤差范圍; 2)動(dòng)態(tài)設(shè)定匹配模板,初始化各層參數(shù),在輸入層對(duì)數(shù)據(jù)流進(jìn)行預(yù)處理; 3)進(jìn)行模板匹配,計(jì)算各節(jié)點(diǎn)誤差;若數(shù)據(jù)在誤差范圍之內(nèi)則視為匹配成功,直接輸出結(jié)果;若不在誤差范圍之內(nèi),則視為此次匹配失敗,修正連接權(quán)值、閾值及學(xué)習(xí)指數(shù),來(lái)進(jìn)行下次匹配,再反向傳播至隱層進(jìn)行迭代計(jì)算; 4)匹配結(jié)束后,輸出輸出層的匹配結(jié)果。
2.根據(jù)權(quán)利要求書(shū)I所述的亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配算法,其特征在于提出一個(gè)改進(jìn)型匹配模型,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,具體描述如下: BP網(wǎng)絡(luò)的非線性映射特性適用于亂序數(shù)據(jù)流的非結(jié)構(gòu)性映射,而且可以利用算法自學(xué)習(xí)功能,通過(guò)對(duì)樣本的分析辨識(shí)出有價(jià)值的數(shù)值序列;在亂序數(shù)據(jù)流中,利用數(shù)值來(lái)代替事件,以此給BP網(wǎng)絡(luò)的參數(shù)修正和自適 應(yīng)匹配創(chuàng)造條件;而網(wǎng)絡(luò)的模型是影響網(wǎng)絡(luò)學(xué)習(xí)性能的主要因素之一,通常根據(jù)經(jīng)驗(yàn)人工獲取;對(duì)于匹配模型未知的亂序數(shù)據(jù)流序列,數(shù)據(jù)是隨時(shí)間而不斷變化的,使用靜態(tài)匹配模板顯然不能完全滿足用戶的不同時(shí)刻段的不同需求,因此將輸入層樣本輸入設(shè)為(X1, X2X3,…,xk, I≤k≤η) ,η為輸入層節(jié)點(diǎn)個(gè)數(shù),輸出層樣本輸出為毛=/<Χ),其中f (xk)表示網(wǎng)絡(luò)的輸出函數(shù),網(wǎng)絡(luò)通過(guò)對(duì)樣本學(xué)習(xí)訓(xùn)練,調(diào)整各神經(jīng)元之間的連接權(quán)值來(lái)實(shí)現(xiàn)對(duì)模型參數(shù)的逼近,同時(shí)加入遺忘因子,使得網(wǎng)絡(luò)在連接權(quán)值調(diào)整的同時(shí)也進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí),從而實(shí)現(xiàn)對(duì)模板的動(dòng)態(tài)建模和參數(shù)辯識(shí);在改進(jìn)型模型中在網(wǎng)絡(luò)輸入層對(duì)輸入樣本作了預(yù)處理,對(duì)亂序數(shù)據(jù)流進(jìn)行歸一化操作,并用公式(I)事先計(jì)算好誤差項(xiàng),隱層誤差計(jì)算采用的Sigmoid作用函數(shù),在閉區(qū)間[0,1]上的Sigmoid函數(shù)表達(dá)式及其導(dǎo)數(shù)定義為公式(2),其中λ決定Sigmoid函數(shù)的壓縮程度,為避免陷入局部最小一般取Iek=xk-hO)
I
f(x) =——:- *(1 + e.1X) (2)
fix) = Af(X)Il-f(x)] 假設(shè)網(wǎng)絡(luò)中第j個(gè)節(jié)點(diǎn)輸出為將其表示為公式(3)
η U) = ^ (%h(Si k/ = O, I,…,BPJ
1=1式中Wu為連接權(quán)值;式中Ii(Si)為隱層的第i個(gè)神經(jīng)元的輸出,其中Si為其輸入和,表示為公式(4)
3.根據(jù)權(quán)利要求書(shū)I所述的亂序數(shù)據(jù)流中基于誤差反向傳播的模板匹配算法,其特征在于提出動(dòng)態(tài)自適應(yīng)調(diào)整機(jī)制,具體描述如下: 在自適應(yīng)調(diào)整機(jī)制中,將學(xué)習(xí)樣本輸入至已確定的網(wǎng)絡(luò)匹配模型中,進(jìn)行迭代計(jì)算,在計(jì)算過(guò)程中,計(jì)算隱層節(jié)點(diǎn)性能均方差,并將訓(xùn)練的結(jié)果誤差值傳播至輸出層,在輸出層中繼續(xù)計(jì)算各節(jié)點(diǎn)誤差值;將所計(jì)算出的誤差反向傳播至隱層,利用公式(5)繼續(xù)迭代,直到滿足預(yù)設(shè)條件
【文檔編號(hào)】G06N3/02GK103559537SQ201310526631
【公開(kāi)日】2014年2月5日 申請(qǐng)日期:2013年10月30日 優(yōu)先權(quán)日:2013年10月30日
【發(fā)明者】王堃, 卓林超, 孫雁飛, 吳蒙, 郭篁, 高會(huì) 申請(qǐng)人:南京郵電大學(xué)