亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于FP?Growth算法的隧道交通事故關(guān)聯(lián)規(guī)則算法的制作方法

文檔序號:11230710閱讀:766來源:國知局
基于FP?Growth算法的隧道交通事故關(guān)聯(lián)規(guī)則算法的制造方法與工藝

本發(fā)明涉及數(shù)據(jù)挖掘、關(guān)聯(lián)分析和隧道交通事故領(lǐng)域,特別是涉及一種基于fp-growth算法的隧道交通事故關(guān)聯(lián)規(guī)則算法。



背景技術(shù):

現(xiàn)如今,隨著我國經(jīng)濟(jì)的快速發(fā)展,城市的公路隧道建設(shè)蓬勃發(fā)展,全國公路隧道為14006處,共1268.39萬米,公路隧道數(shù)量年增長率約為11.5%。隨著隧道建設(shè)數(shù)量的增多,從而引發(fā)的交通事故也相應(yīng)增加。而現(xiàn)在我國對隧道交通事故數(shù)據(jù)的分析,主要是運(yùn)用數(shù)據(jù)統(tǒng)計(jì)分析引起隧道交通事故的主要原因。在頻繁模式挖掘fp-growth算法的挖掘過程中,對數(shù)據(jù)的度量是事先設(shè)定好的最小支持度與最小置信度,若最小支持度與直銷置信度設(shè)置的過高,會使得頻率較低的關(guān)鍵因素的丟失,若設(shè)置的過低則會挖掘過多無用的關(guān)聯(lián)規(guī)則。



技術(shù)實(shí)現(xiàn)要素:

針對引起交通事故的因素中某些出現(xiàn)頻率較低但是至關(guān)重要的因素,本發(fā)明提出一種基于fp-growth算法的隧道交通事故關(guān)聯(lián)規(guī)則算法,目的是挖掘處更加可靠的關(guān)聯(lián)規(guī)則,用以進(jìn)一步指導(dǎo)交通部門對預(yù)防隧道交通事故采取相應(yīng)的措施。

為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:

一種基于fp-growth算法的隧道交通事故關(guān)聯(lián)規(guī)則算法,包括以下步驟:

s1:首次對隧道事故事務(wù)數(shù)據(jù)庫d進(jìn)行掃描;

s2:計(jì)算出每個(gè)隧道事故事務(wù)中各個(gè)項(xiàng)以及事務(wù)本身的權(quán)重,之后根據(jù)事務(wù)的權(quán)重計(jì)算出各個(gè)項(xiàng)的關(guān)鍵度量,將關(guān)鍵度量作為此項(xiàng)的支持度,根據(jù)之前預(yù)定好的最小支持度,得到頻繁項(xiàng)集之后調(diào)整隧道事故事務(wù)數(shù)據(jù)庫;

s3:建立標(biāo)記為“null”的根節(jié)點(diǎn)和頻繁項(xiàng)目頭表;

s4:再次掃描隧道事故事務(wù)數(shù)據(jù)庫,其中每個(gè)事務(wù)的項(xiàng)按頻繁項(xiàng)集中的次序處理,根據(jù)建立完成的頻繁項(xiàng)目頭表創(chuàng)建隧道事故頻繁模式樹fp樹;

s5:根據(jù)隧道事故fp樹產(chǎn)生條件模式基,產(chǎn)生頻繁模式項(xiàng)集;

s6:根據(jù)產(chǎn)生的頻繁模式項(xiàng)集,計(jì)算每個(gè)項(xiàng)集的關(guān)鍵度量作為支持度,滿足最小支持度與置信度的項(xiàng)集就是最后挖掘得到的隧道交通事故關(guān)聯(lián)規(guī)則。

步驟s2中:

用i={i1,i2,i3,…,in}表示隧道事故事務(wù)數(shù)據(jù)庫d的項(xiàng)集,n表示項(xiàng)的個(gè)數(shù);項(xiàng)ii(i=1,2,3,…,k)在隧道事故事務(wù)數(shù)據(jù)庫的權(quán)重標(biāo)記為w(ii),公式為w(ii)=m/l,公式中的l為ii在事務(wù)集中出現(xiàn)的次數(shù),m是數(shù)據(jù)庫中事務(wù)的個(gè)數(shù);事務(wù)tj為事務(wù)數(shù)據(jù)庫中的第j條數(shù)據(jù),該事務(wù)的權(quán)重為其本身包含項(xiàng)的權(quán)重的平均值,記為wt(tj),公式為項(xiàng)的關(guān)鍵度量是包含該項(xiàng)的事務(wù)權(quán)重與隧道事故事務(wù)數(shù)據(jù)可中所有事務(wù)權(quán)重之比,記為d(s),公式為

步驟s6中:

計(jì)算項(xiàng)集的關(guān)鍵度量,比如模式<i1,i2>的關(guān)鍵度量,則是求包含i1和i2項(xiàng)的事務(wù)權(quán)重與隧道事故事務(wù)數(shù)據(jù)庫中所有事務(wù)權(quán)重之比。最后滿足最小支持度與置信度的項(xiàng)集就是最后挖掘得到的關(guān)聯(lián)規(guī)則。

與傳統(tǒng)的運(yùn)用數(shù)據(jù)統(tǒng)計(jì)分析相比,本發(fā)明的有益效果是:該算法通過權(quán)重來定義項(xiàng)在事務(wù)中的關(guān)鍵性,從而能夠更加有效地挖掘處隱藏的,更加有意義的關(guān)聯(lián)規(guī)則,可以指導(dǎo)交通部門對預(yù)防隧道交通事故采取相應(yīng)的措施。

附圖說明

圖1為本發(fā)明一實(shí)施例的一種基于fp-growth算法的隧道交通事故關(guān)聯(lián)規(guī)則算法的流程圖;

圖2為本發(fā)明一實(shí)施例的頻繁項(xiàng)目頭表和頻繁模式樹的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面結(jié)合附圖對本發(fā)明的較佳實(shí)施例進(jìn)行詳細(xì)闡述,以使本發(fā)明的優(yōu)點(diǎn)和特征能更易于被本領(lǐng)域技術(shù)人員理解,從而對本發(fā)明的保護(hù)范圍做出更為清楚明確的界定。

如圖1所示,一種基于fp-growth算法的隧道交通事故關(guān)聯(lián)規(guī)則算法,包括以下步驟:

step1:首次對隧道事故事務(wù)數(shù)據(jù)庫d進(jìn)行掃描。

step2:計(jì)算出每個(gè)隧道事故事務(wù)中各個(gè)項(xiàng)以及事務(wù)本身的權(quán)重,之后根據(jù)事務(wù)的權(quán)重計(jì)算出各個(gè)項(xiàng)的關(guān)鍵度量,將關(guān)鍵度量作為此項(xiàng)的支持度,根據(jù)之前預(yù)定好的最小支持度,得到頻繁項(xiàng)集之后調(diào)整隧道事故事務(wù)數(shù)據(jù)庫。

step3:建立標(biāo)記為“null”的根節(jié)點(diǎn)和頻繁項(xiàng)目頭表,如表1所示。

表1頻繁項(xiàng)目頭表

step4:再次掃描隧道事故事務(wù)數(shù)據(jù)庫,其中每個(gè)事務(wù)的項(xiàng)按頻繁項(xiàng)集中的次序處理,根據(jù)建立完成的頻繁項(xiàng)目頭表創(chuàng)建隧道事故頻繁模式樹fp樹,如圖2所示。

step5:根據(jù)隧道事故fp樹產(chǎn)生條件模式基,產(chǎn)生頻繁模式項(xiàng)集。

step6:根據(jù)產(chǎn)生的頻繁模式項(xiàng)集,計(jì)算每個(gè)項(xiàng)集的關(guān)鍵度量作為支持度,滿足最小支持度與置信度的項(xiàng)集就是最后挖掘得到的隧道交通事故關(guān)聯(lián)規(guī)則。

其中步驟step2包括:

用i={i1,i2,i3,…,in}表示隧道事故事務(wù)數(shù)據(jù)庫d的項(xiàng)集,n表示項(xiàng)的個(gè)數(shù);項(xiàng)ii(i=1,2,3,…,k)在隧道事故事務(wù)數(shù)據(jù)庫的權(quán)重標(biāo)記為w(ii),公式為w(ii)=m/l,公式中的l為ii在事務(wù)集中出現(xiàn)的次數(shù),m是數(shù)據(jù)庫中事務(wù)的個(gè)數(shù);事務(wù)tj為事務(wù)數(shù)據(jù)庫中的第j條數(shù)據(jù),該事務(wù)的權(quán)重為其本身包含項(xiàng)的權(quán)重的平均值,記為wt(tj),公式為項(xiàng)的關(guān)鍵度量是包含該項(xiàng)的事務(wù)權(quán)重與隧道事故事務(wù)數(shù)據(jù)可中所有事務(wù)權(quán)重之比,記為d(s),公式為

權(quán)重思想描述:

簡單假設(shè)頻繁1項(xiàng)集為i1、i2、i3、i4、i5,隧道事故事務(wù)數(shù)據(jù)庫如表2所示:

表2隧道事故事務(wù)數(shù)據(jù)表

舉例計(jì)算i1的關(guān)鍵度量:

1)首先分別計(jì)算i1、i2、i3、i4、i5的權(quán)重,公式為w(ii)=m/l,即w(i1)=1.5,w(i2)=1.286,w(i3)=1.5,w(i4)=4.5,w(i5)=4.5。

2)計(jì)算事務(wù)數(shù)據(jù)庫中各個(gè)事務(wù)的權(quán)重,事務(wù)的權(quán)重為其本身包含項(xiàng)的權(quán)重的平均值,公式為即wt(t1)=2.43,wt(t2)=2.895,wt(t3)=1.393,wt(t4)=2.43,wt(t5)=1.5,wt(t6)=1.393,wt(t7)=1.5,wt(t8)=2.197,wt(t9)=1.429。

3)之后在計(jì)算i1的關(guān)鍵度量,i1的關(guān)鍵度量是包含i1項(xiàng)的事務(wù)權(quán)重與事務(wù)數(shù)據(jù)庫中所有事務(wù)權(quán)重之比,公式為按照上述公式即可計(jì)算出i1的關(guān)鍵度量,為d(i1)=0.669。

計(jì)算完每個(gè)項(xiàng)的關(guān)鍵度量之后,將各項(xiàng)的關(guān)鍵度量作為它的支持度,用來與實(shí)現(xiàn)設(shè)定好的最小支持度比較,生成頻繁項(xiàng)集表。

在step6中需要計(jì)算模式項(xiàng)集的關(guān)鍵度量,比如模式<i1,i2>的關(guān)鍵度量,則是求包含i1與i2項(xiàng)的事務(wù)權(quán)重與事務(wù)數(shù)據(jù)庫中所有事務(wù)權(quán)重之比。滿足最小支持度與置信度的項(xiàng)集就是最后挖掘得到的隧道交通事故關(guān)聯(lián)規(guī)則。

以上所述僅為本發(fā)明的實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1