亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)方法和裝置與流程

文檔序號(hào):11155383閱讀:931來(lái)源:國(guó)知局
一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)方法和裝置與制造工藝

本發(fā)明涉及計(jì)算機(jī)信息處理技術(shù),更具體地說(shuō),涉及一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)方法和裝置。



背景技術(shù):

從SGI的首席科學(xué)家John R.Masey在1998年提出大數(shù)據(jù)概念,到大數(shù)據(jù)分析技術(shù)廣泛應(yīng)用于社會(huì)的各個(gè)領(lǐng)域,已經(jīng)走過(guò)了18年的時(shí)間?,F(xiàn)在再也沒(méi)有企業(yè)懷疑大數(shù)據(jù)分析的力量,并且都在競(jìng)相利用大數(shù)據(jù)來(lái)增強(qiáng)自己企業(yè)的業(yè)務(wù)競(jìng)爭(zhēng)力。但是,即使18年過(guò)去,大數(shù)據(jù)分析行業(yè)仍然處于快速發(fā)展的初期,每時(shí)每刻都在產(chǎn)生新的變化。從概念到實(shí)用、從結(jié)構(gòu)化數(shù)據(jù)分析到非結(jié)構(gòu)化數(shù)據(jù)分析,大數(shù)據(jù)分析技術(shù)在不斷地進(jìn)化。大數(shù)據(jù)分析的研究已經(jīng)進(jìn)入到了一個(gè)全新的階段,“預(yù)測(cè)分析”技術(shù)成為最具有代表性的未來(lái)技術(shù)方向。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的是提供一種可以有效的進(jìn)行數(shù)據(jù)預(yù)測(cè)的方法和裝置,優(yōu)點(diǎn)是實(shí)施方便,并可以方便的根據(jù)新增數(shù)據(jù)對(duì)預(yù)測(cè)規(guī)則進(jìn)行修正改進(jìn)。

為解決上述技術(shù)問(wèn)題,根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)方法,包括步驟:為每個(gè)數(shù)據(jù)集建立索引;提取每個(gè)數(shù)據(jù)集中的數(shù)據(jù)元素;確定每個(gè)數(shù)據(jù)集中數(shù)據(jù)元素之間的關(guān)聯(lián)關(guān)系,根據(jù)所述關(guān)聯(lián)關(guān)系確定數(shù)據(jù)預(yù)測(cè)規(guī)則;利用所述數(shù)據(jù)預(yù)測(cè)規(guī)則對(duì)目標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果準(zhǔn)確性的反饋來(lái)改進(jìn)數(shù)據(jù)預(yù)測(cè)規(guī)則。

優(yōu)選的,所述提取每個(gè)數(shù)據(jù)集中的數(shù)據(jù)元素,包括:

判斷當(dāng)前數(shù)據(jù)集的數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù),如果當(dāng)前數(shù)據(jù)集的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù),則將當(dāng)前數(shù)據(jù)集的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并從當(dāng)前數(shù)據(jù)集的結(jié)構(gòu)化數(shù)據(jù)中提取數(shù)據(jù)元素,并為每個(gè)數(shù)據(jù)元素設(shè)置唯一標(biāo)識(shí)。

優(yōu)選的,所述確定每個(gè)數(shù)據(jù)集中數(shù)據(jù)元素之間的關(guān)聯(lián)關(guān)系,根據(jù)所述關(guān)聯(lián)關(guān)系確定數(shù)據(jù)預(yù)測(cè)規(guī)則,包括:針對(duì)每個(gè)數(shù)據(jù)集,按照計(jì)算公式計(jì)算當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率;根據(jù)所述當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率,確定所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,所述頻繁數(shù)據(jù)元素集中包括至少兩個(gè)數(shù)據(jù)元素;根據(jù)所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,確定數(shù)據(jù)預(yù)測(cè)規(guī)則;

所述計(jì)算公式為:

或者,

其中,P(A,B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的概率,C(A∩B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的次數(shù),C(A)表示數(shù)據(jù)元素A在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),C(B)表示數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),T為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素的集合,∑X∈TC(X)為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素出現(xiàn)的次數(shù),α和β為可調(diào)節(jié)的修正系數(shù),用于使特殊情況計(jì)算得到的P(A,B)所受數(shù)據(jù)偏差的影響更小,n1和n2為可調(diào)節(jié)系數(shù),用于更精細(xì)的調(diào)節(jié),其值大于0。

優(yōu)選的,根據(jù)所述當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率,確定所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,包括:當(dāng)兩個(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率達(dá)到預(yù)設(shè)概率閾值時(shí),確定該兩個(gè)數(shù)據(jù)元素構(gòu)成了一頻繁數(shù)據(jù)元素集;當(dāng)兩個(gè)頻繁數(shù)據(jù)元素集具有相同的數(shù)據(jù)元素時(shí),提取該兩個(gè)頻繁數(shù)據(jù)元素集中不同的數(shù)據(jù)元素,計(jì)算不同的數(shù)據(jù)元素在當(dāng)前數(shù)據(jù)集中出現(xiàn)的概率;當(dāng)不同的數(shù)據(jù)元素在當(dāng)前數(shù)據(jù)集中出現(xiàn)的概率達(dá)到預(yù)設(shè)概率閾值時(shí),確定不同的數(shù)據(jù)元素構(gòu)成了一頻繁數(shù)據(jù)元素集。

優(yōu)選的,所述利用所述數(shù)據(jù)預(yù)測(cè)規(guī)則對(duì)目標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè),包括:根據(jù)已被規(guī)則引擎解析過(guò)的數(shù)據(jù)預(yù)測(cè)規(guī)則對(duì)目標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè)。

優(yōu)選的,所述方法還可以包括:利用神經(jīng)網(wǎng)絡(luò)方法,根據(jù)當(dāng)前大數(shù)據(jù)及歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)。

優(yōu)選的,所述方法還可以包括:根據(jù)預(yù)測(cè)結(jié)果準(zhǔn)確性的反饋,對(duì)所述數(shù)據(jù)預(yù)測(cè)規(guī)則及其形成機(jī)制進(jìn)行修正改進(jìn)。

根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)裝置,包括:

索引建立模塊,用于為每個(gè)數(shù)據(jù)集建立索引;

數(shù)據(jù)元素提取模塊,用于提取每個(gè)數(shù)據(jù)集中的數(shù)據(jù)元素;

預(yù)測(cè)規(guī)則建立模塊,用于確定每個(gè)數(shù)據(jù)集中數(shù)據(jù)元素之間的關(guān)聯(lián)關(guān)系,根據(jù)所述關(guān)聯(lián)關(guān)系確定數(shù)據(jù)預(yù)測(cè)規(guī)則;

預(yù)測(cè)模塊,用于利用所述數(shù)據(jù)預(yù)測(cè)規(guī)則對(duì)目標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果準(zhǔn)確性的反饋來(lái)改進(jìn)數(shù)據(jù)預(yù)測(cè)規(guī)則。

優(yōu)選的,數(shù)據(jù)元素提取模塊,用于判斷當(dāng)前數(shù)據(jù)集的數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù),如果當(dāng)前數(shù)據(jù)集的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù),則將當(dāng)前數(shù)據(jù)集的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并從當(dāng)前數(shù)據(jù)集的結(jié)構(gòu)化數(shù)據(jù)中提取數(shù)據(jù)元素,并為每個(gè)數(shù)據(jù)元素設(shè)置唯一標(biāo)識(shí)。

優(yōu)選的,預(yù)測(cè)規(guī)則建立模塊,用于針對(duì)每個(gè)數(shù)據(jù)集:按照計(jì)算公式計(jì)算當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率;根據(jù)所述當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率,確定所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,所述頻繁數(shù)據(jù)元素集中包括至少兩個(gè)數(shù)據(jù)元素;根據(jù)所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,確定數(shù)據(jù)預(yù)測(cè)規(guī)則;

所述計(jì)算公式為:

或者,

其中,P(A,B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的概率,C(A∩B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的次數(shù),C(A)表示數(shù)據(jù)元素A在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),C(B)表示數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),T為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素的集合,∑X∈TC(X)為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素出現(xiàn)的次數(shù),α和β為可調(diào)節(jié)的修正系數(shù),用于使特殊情況計(jì)算得到的P(A,B)所受數(shù)據(jù)偏差的影響更小,n1和n2為可調(diào)節(jié)系數(shù),用于更精細(xì)的調(diào)節(jié),其值大于0。

優(yōu)選的,還可以包括:修正模塊,用于根據(jù)預(yù)測(cè)結(jié)果準(zhǔn)確性的反饋,對(duì)所述數(shù)據(jù)預(yù)測(cè)規(guī)則及其形成機(jī)制進(jìn)行修正改進(jìn)。

附圖說(shuō)明

圖1是根據(jù)本發(fā)明實(shí)施例的一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)方法的流程圖;

圖2是根據(jù)本發(fā)明實(shí)施例的一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)裝置的示意圖。

具體實(shí)施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

圖1是根據(jù)本發(fā)明實(shí)施例的一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)方法的流程圖。

在步驟101,為每個(gè)數(shù)據(jù)集建立索引。

在步驟102,提取每個(gè)數(shù)據(jù)集中的數(shù)據(jù)元素。

在一個(gè)實(shí)施例中,判斷當(dāng)前數(shù)據(jù)集的數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù),如果當(dāng)前數(shù)據(jù)集的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù),則將當(dāng)前數(shù)據(jù)集的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并從當(dāng)前數(shù)據(jù)集的結(jié)構(gòu)化數(shù)據(jù)中提取數(shù)據(jù)元素,并為每個(gè)數(shù)據(jù)元素設(shè)置唯一標(biāo)識(shí)。在本發(fā)明的一個(gè)實(shí)施例中,提取出的數(shù)據(jù)元素的標(biāo)識(shí)分別為A1,A2,A3,A4,A5。

在步驟103,確定每個(gè)數(shù)據(jù)集中數(shù)據(jù)元素之間的關(guān)聯(lián)關(guān)系,根據(jù)所述關(guān)聯(lián)關(guān)系確定數(shù)據(jù)預(yù)測(cè)規(guī)則。

在一個(gè)實(shí)施例中,數(shù)據(jù)元素之間的關(guān)聯(lián)關(guān)系可用數(shù)據(jù)元素在數(shù)據(jù)集中同時(shí)出現(xiàn)的概率來(lái)表征。此時(shí),步驟103中,針對(duì)每個(gè)數(shù)據(jù)集可實(shí)施為如下步驟B1-B3:

步驟B1、按照計(jì)算公式計(jì)算當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率。

步驟B2、根據(jù)所述當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率,確定所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,所述頻繁數(shù)據(jù)元素集中包括至少兩個(gè)數(shù)據(jù)元素。

在一個(gè)實(shí)施例中,當(dāng)兩個(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率達(dá)到預(yù)設(shè)概率閾值時(shí),確定該兩個(gè)數(shù)據(jù)元素構(gòu)成了一頻繁數(shù)據(jù)元素集;

當(dāng)兩個(gè)頻繁數(shù)據(jù)元素集具有相同的數(shù)據(jù)元素時(shí),提取該兩個(gè)頻繁數(shù)據(jù)元素集中不同的數(shù)據(jù)元素,計(jì)算不同的數(shù)據(jù)元素在當(dāng)前數(shù)據(jù)集中出現(xiàn)的概率;當(dāng)不同的數(shù)據(jù)元素在當(dāng)前數(shù)據(jù)集中出現(xiàn)的概率達(dá)到預(yù)設(shè)概率閾值時(shí),確定不同的數(shù)據(jù)元素構(gòu)成了一頻繁數(shù)據(jù)元素集。

步驟B3、根據(jù)所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,確定數(shù)據(jù)預(yù)測(cè)規(guī)則。

上述步驟B1中的計(jì)算公式為:

或者,

其中,P(A,B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的概率,C(A∩B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的次數(shù),C(A)表示數(shù)據(jù)元素A在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),C(B)表示數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),T為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素的集合,ΣX∈TC(X)為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素出現(xiàn)的次數(shù),α和β為可調(diào)節(jié)的修正系數(shù),用于使特殊情況計(jì)算得到的P(A,B)所受數(shù)據(jù)偏差的影響更小,n1和n2為可調(diào)節(jié)系數(shù),用于更精細(xì)的調(diào)節(jié),其值大于0。在本發(fā)明的一個(gè)實(shí)施例中,使用前一個(gè)公式,其中,0≤α≤3,0≤β≤0.1。

在本發(fā)明的一個(gè)實(shí)施例中,給定在一個(gè)數(shù)據(jù)集中,A1出現(xiàn)11次,A2出現(xiàn)9次,A3-A5均出現(xiàn)10次,A1和A2同時(shí)出現(xiàn)的次數(shù)有8次,此處給定α=1,β=0.05,則按照前述計(jì)算公式可以計(jì)算出:

在本實(shí)施例中,設(shè)定預(yù)設(shè)概率閾值為0.5,由于P(A1,A2)大于0.5,所以將A1和A2歸入同一個(gè)頻繁數(shù)據(jù)元素集{A1,A2},可得到一個(gè)數(shù)據(jù)預(yù)測(cè)規(guī)則為A1:—A2,表示當(dāng)A1出現(xiàn)的時(shí)候,可預(yù)測(cè)A2也會(huì)出現(xiàn)。

如果在當(dāng)前數(shù)據(jù)集中,P(A1,A3)也大于0.5,則將A1和A3歸入同一個(gè)頻繁數(shù)據(jù)元素集{A1,A3},可得到一個(gè)數(shù)據(jù)預(yù)測(cè)規(guī)則為A1:—A3,表示當(dāng)A1出現(xiàn)的時(shí)候,可預(yù)測(cè)A3也會(huì)出現(xiàn)。

進(jìn)一步可推測(cè)A2,A3有可能也是兩個(gè)頻繁同時(shí)出現(xiàn)的數(shù)據(jù)元素,接下來(lái)可根據(jù)前述計(jì)算公式計(jì)算P(A2,A3),如果計(jì)算得出P(A2,A3)也大于0.5,則可將A1、A2和A3歸入同一個(gè)頻繁數(shù)據(jù)元素集{A1,A2,A3},可得到一個(gè)數(shù)據(jù)預(yù)測(cè)規(guī)則為A1:—(A2,A3),表示當(dāng)A1出現(xiàn)的時(shí)候,可預(yù)測(cè)A2和A3也會(huì)出現(xiàn)。

根據(jù)頻繁數(shù)據(jù)元素集中元素的出現(xiàn),可以預(yù)期同一個(gè)頻繁數(shù)據(jù)元素集中其他的元素也有較高的概率出現(xiàn)。

在步驟104,利用所述數(shù)據(jù)預(yù)測(cè)規(guī)則對(duì)目標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果準(zhǔn)確性的反饋來(lái)改進(jìn)數(shù)據(jù)預(yù)測(cè)規(guī)則。在本發(fā)明的一個(gè)實(shí)施例中,將一批新的數(shù)據(jù)被提交至智能分析引擎,新的數(shù)據(jù)包含(A1,A6,A7……)。判斷當(dāng)中是否包含已有預(yù)測(cè)規(guī)則中的數(shù)據(jù)元素,發(fā)現(xiàn)A1包含在已有的預(yù)測(cè)規(guī)則中。由于新提交的數(shù)據(jù)當(dāng)中存在A1,根據(jù)已有的預(yù)測(cè)規(guī)則:A1:—A2,則預(yù)測(cè)A2也會(huì)出現(xiàn)。

通過(guò)數(shù)據(jù)預(yù)測(cè)規(guī)則進(jìn)行預(yù)測(cè)后,進(jìn)行預(yù)測(cè)準(zhǔn)確性的比較,當(dāng)添加新數(shù)據(jù)后的預(yù)測(cè)準(zhǔn)確性較差時(shí)(如A1和A2同時(shí)出現(xiàn)的概率低于0.3,已經(jīng)小于預(yù)設(shè)概率閾值0.5),則刪除該規(guī)則。

確定新數(shù)據(jù)中的數(shù)據(jù)元素之間的關(guān)聯(lián)關(guān)系,再根據(jù)新數(shù)據(jù)元素間的關(guān)聯(lián)關(guān)系確定新的數(shù)據(jù)預(yù)測(cè)規(guī)則,并將新的數(shù)據(jù)預(yù)測(cè)規(guī)則加入原有的數(shù)據(jù)預(yù)測(cè)規(guī)則中。

本發(fā)明通過(guò)優(yōu)點(diǎn)是實(shí)施方便,可以實(shí)時(shí)添加數(shù)據(jù)并根據(jù)新的數(shù)據(jù)內(nèi)容對(duì)預(yù)測(cè)規(guī)則進(jìn)行修改。

圖2是根據(jù)本發(fā)明實(shí)施例的一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)裝置的示意圖;

根據(jù)本發(fā)明的另一個(gè)方面,提供了一種用于大數(shù)據(jù)分析的數(shù)據(jù)預(yù)測(cè)裝置,包括:

索引建立模塊,用于為每個(gè)數(shù)據(jù)集建立索引;

數(shù)據(jù)元素提取模塊,用于提取每個(gè)數(shù)據(jù)集中的數(shù)據(jù)元素;

預(yù)測(cè)規(guī)則建立模塊,用于確定每個(gè)數(shù)據(jù)集中數(shù)據(jù)元素之間的關(guān)聯(lián)關(guān)系,根據(jù)所述關(guān)聯(lián)關(guān)系確定數(shù)據(jù)預(yù)測(cè)規(guī)則;

預(yù)測(cè)模塊,用于利用所述數(shù)據(jù)預(yù)測(cè)規(guī)則對(duì)目標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果準(zhǔn)確性的反饋來(lái)改進(jìn)數(shù)據(jù)預(yù)測(cè)規(guī)則。

優(yōu)選的,數(shù)據(jù)元素提取模塊,用于判斷當(dāng)前數(shù)據(jù)集的數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù),如果當(dāng)前數(shù)據(jù)集的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù),則將當(dāng)前數(shù)據(jù)集的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并從當(dāng)前數(shù)據(jù)集的結(jié)構(gòu)化數(shù)據(jù)中提取數(shù)據(jù)元素,并為每個(gè)數(shù)據(jù)元素設(shè)置唯一標(biāo)識(shí)。

優(yōu)選的,預(yù)測(cè)規(guī)則建立模塊,用于針對(duì)每個(gè)數(shù)據(jù)集:按照計(jì)算公式計(jì)算當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率;根據(jù)所述當(dāng)前數(shù)據(jù)集中每?jī)蓚€(gè)數(shù)據(jù)元素同時(shí)出現(xiàn)的概率,確定所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,所述頻繁數(shù)據(jù)元素集中包括至少兩個(gè)數(shù)據(jù)元素;根據(jù)所述當(dāng)前數(shù)據(jù)集的頻繁數(shù)據(jù)元素集,確定數(shù)據(jù)預(yù)測(cè)規(guī)則;

所述計(jì)算公式為:

或者,

其中,P(A,B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的概率,C(A∩B)表示數(shù)據(jù)元素A和數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中同時(shí)出現(xiàn)的次數(shù),C(A)表示數(shù)據(jù)元素A在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),C(B)表示數(shù)據(jù)元素B在當(dāng)前數(shù)據(jù)集中出現(xiàn)的次數(shù),T為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素的集合,∑X∈TC(X)為當(dāng)前數(shù)據(jù)集中所有數(shù)據(jù)元素出現(xiàn)的次數(shù),α和β為可調(diào)節(jié)的修正系數(shù),用于使特殊情況計(jì)算得到的P(A,B)所受數(shù)據(jù)偏差的影響更小,n1和n2為可調(diào)節(jié)系數(shù),用于更精細(xì)的調(diào)節(jié),其值大于0。

優(yōu)選的,還可以包括:修正模塊,用于根據(jù)預(yù)測(cè)結(jié)果準(zhǔn)確性的反饋,對(duì)所述數(shù)據(jù)預(yù)測(cè)規(guī)則及其形成機(jī)制進(jìn)行修正改進(jìn)。

以上述依據(jù)本發(fā)明的理想實(shí)施例為啟示,通過(guò)上述的說(shuō)明內(nèi)容,本領(lǐng)域普通技術(shù)人員完全可以在不偏離本項(xiàng)發(fā)明技術(shù)思想的范圍內(nèi),進(jìn)行多樣的變更以及修改。本項(xiàng)發(fā)明的技術(shù)性范圍并不局限于說(shuō)明書(shū)上的內(nèi)容,必須要根據(jù)權(quán)利要求范圍來(lái)確定其技術(shù)性范圍。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1