旅客目的地預(yù)測(cè)方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及航空領(lǐng)域的數(shù)據(jù)處理技術(shù),尤其涉及一種旅客目的地預(yù)測(cè)方法及系 統(tǒng)。
【背景技術(shù)】
[0002] 隨著航空市場(chǎng)的飛速發(fā)展,越來(lái)越多的旅客選擇乘坐飛機(jī)出行,但對(duì)于旅客出行 目的地的預(yù)測(cè)技術(shù)目前在航空領(lǐng)域寥寥無(wú)幾,其問(wèn)題主要在于如果以小規(guī)模數(shù)據(jù)進(jìn)行預(yù) 測(cè),結(jié)果的準(zhǔn)確度不盡如人意;而使用全市場(chǎng)民航旅客數(shù)據(jù),計(jì)算時(shí)間過(guò)長(zhǎng),所需空間過(guò)大, 這些都是不可接受的。
[0003] 為了解決旅客目的地預(yù)測(cè)在計(jì)算時(shí)間與計(jì)算空間上的技術(shù)難題,需要一種能夠應(yīng) 用于航空領(lǐng)域的旅客目的地預(yù)測(cè)技術(shù)。
【發(fā)明內(nèi)容】
[0004] 為解決現(xiàn)有存在的技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種旅客目的地預(yù)測(cè)方法及系 統(tǒng)。
[0005] 為達(dá)到上述目的,本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0006] -種旅客目的地預(yù)測(cè)方法,所述方法包括:
[0007] 根據(jù)旅客歷史出行記錄的多種特征向量,判斷出行類(lèi)型,得到包含出行類(lèi)型信息 的旅客歷史出行記錄;
[0008] 對(duì)所述旅客歷史出行記錄進(jìn)行目的區(qū)域整合,得到包含目的地區(qū)域信息的旅客歷 史出行記錄;
[0009] 根據(jù)所述出行類(lèi)型,將所述旅客歷史出行記錄進(jìn)行分類(lèi),并計(jì)算各分類(lèi)的權(quán)重;
[0010] 對(duì)指定目的地的旅客歷史出行記錄進(jìn)行統(tǒng)計(jì)歸納,得到各個(gè)目的地的指定出行概 率;
[0011]使用頻繁模式樹(shù)FPTree算法對(duì)隨機(jī)目的地的旅客歷史出行記錄進(jìn)行關(guān)聯(lián)分析,得 到各個(gè)目的地與其他所有目的地之間的隨機(jī)出行概率;
[0012]根據(jù)各個(gè)目的地的指定出行概率與隨機(jī)出行概率、以及各分類(lèi)的權(quán)重,進(jìn)行權(quán)重 整合計(jì)算,得到旅客到各個(gè)目的地的出行概率,以基于所述出現(xiàn)概率預(yù)測(cè)旅客到各個(gè)目的 地的概率。
[0013]其中,在對(duì)所述旅客歷史出行記錄進(jìn)行目的區(qū)域整合之前,所述方法還包括:將所 述旅客歷史出行記錄中的中轉(zhuǎn)地以及常駐地去除,以去除所述旅客歷史出行記錄的噪音。
[0014] 其中,所述對(duì)所述旅客歷史出行記錄進(jìn)行目的區(qū)域整合,包括:
[0015] 以旅客量越大分類(lèi)越細(xì)致的原則對(duì)各個(gè)目的地機(jī)場(chǎng)進(jìn)行整合細(xì)分,得到機(jī)場(chǎng)三字 碼與目的地區(qū)域之間的映射列表;
[0016] 對(duì)于目的地為機(jī)場(chǎng)三字碼的旅客歷史出行記錄,根據(jù)所述機(jī)場(chǎng)三字碼與目的地區(qū) 域之間的映射列表,將機(jī)場(chǎng)三字碼轉(zhuǎn)換為目的地區(qū)域信息,得到包含目的地區(qū)域信息的旅 客歷史出行記錄。
[0017] 其中,根據(jù)所述出行類(lèi)型,將所述旅客歷史出行記錄進(jìn)行分類(lèi),并計(jì)算各分類(lèi)的權(quán) 重,包括:
[0018] 根據(jù)所述出行類(lèi)型,將所述旅客歷史出行記錄分為兩類(lèi):指定目的地和隨機(jī)目的 地;
[0019] 根據(jù)旅客不同分類(lèi)的出行次數(shù),確定各個(gè)分類(lèi)的權(quán)重,得到指定目的地權(quán)重和隨 機(jī)目的地權(quán)重。
[0020] 其中:所述出行類(lèi)型為預(yù)先配置;所述出行類(lèi)型與所述旅客歷史出行記錄分類(lèi)之 間的關(guān)系為預(yù)先配置;根據(jù)所述出行類(lèi)型,將所述旅客歷史出行記錄分為兩類(lèi),為:基于預(yù) 先配置的出行類(lèi)型與所述旅客歷史出行記錄分類(lèi)之間的關(guān)系,將將所述旅客歷史出行記錄 分為兩類(lèi)。
[0021] 其中,所述使用頻繁模式樹(shù)FPTree算法對(duì)隨機(jī)目的地的旅客歷史出行記錄進(jìn)行關(guān) 聯(lián)分析,包括:
[0022] 掃描當(dāng)前旅客的事務(wù)數(shù)據(jù)庫(kù),計(jì)算每個(gè)目的地在所有旅客歷史出行記錄中出現(xiàn)的 頻數(shù),并刪除頻數(shù)小于預(yù)設(shè)的最小支持度的目的地,將剩余的所有目的地按照頻數(shù)遞減排 序,得到頻繁項(xiàng)集;
[0023] 基于所述頻繁項(xiàng)集,對(duì)當(dāng)前旅客的每條旅客歷史出行記錄中各個(gè)目的地進(jìn)行重新 排序;
[0024] 將重新排序得到的旅客歷史出行記錄插入FPTree,所述FPTree中一個(gè)節(jié)點(diǎn)表示一 個(gè)目的地,一條路徑對(duì)應(yīng)一條旅客歷史出行記錄,每條路徑上節(jié)點(diǎn)的計(jì)數(shù)值表示支持度,所 述支持度用于確定任意兩個(gè)目的地間的關(guān)聯(lián)程度;
[0025]從所述FPTree找出頻繁項(xiàng),得到每個(gè)目的地二項(xiàng)之間的頻繁項(xiàng)集合,所述頻繁項(xiàng) 集合包括每個(gè)目的地與其他各個(gè)目的地之間的支持度;
[0026] 基于所述每個(gè)目的地二項(xiàng)之間的頻繁項(xiàng)集合,得到每個(gè)目的地到其它各個(gè)目的地 的隨機(jī)出行概率。
[0027] 其中,一個(gè)目的地到其它任意一個(gè)目的地的隨機(jī)出行概率為:該目的地與其它任 意一個(gè)目的地之間的支持度與該目的地到各個(gè)目的地的支持度之和之間的比值。
[0028] -種旅客目的地預(yù)測(cè)系統(tǒng),所述系統(tǒng)包括:出行類(lèi)型判斷模塊、目的地整合模塊、 歷史記錄分類(lèi)模塊、統(tǒng)計(jì)歸納模塊、關(guān)聯(lián)分析模塊以及權(quán)重整合模塊;其中,
[0029] 出行類(lèi)型判斷模塊,用于根據(jù)旅客歷史出行記錄的多種特征向量,判斷出行類(lèi)型, 得到包含出行類(lèi)型信息的旅客歷史出行記錄;
[0030] 目的地整合模塊,用于對(duì)所述旅客歷史出行記錄進(jìn)行目的區(qū)域整合,得到包含目 的地區(qū)域信息的旅客歷史出行記錄;
[0031] 歷史記錄分類(lèi)模塊,用于根據(jù)所述出行類(lèi)型,將所述旅客歷史出行記錄進(jìn)行分類(lèi), 并計(jì)算各分類(lèi)的權(quán)重;
[0032] 統(tǒng)計(jì)歸納模塊,用于對(duì)指定目的地的旅客歷史出行記錄進(jìn)行統(tǒng)計(jì)歸納,得到各個(gè) 目的地的指定出行概率;
[0033]關(guān)聯(lián)分析模塊,用于使用頻繁模式樹(shù)FPTree算法對(duì)隨機(jī)目的地的旅客歷史出行記 錄進(jìn)行關(guān)聯(lián)分析,得到各個(gè)目的地與其他所有目的地之間的隨機(jī)出行概率;
[0034] 權(quán)重整合模塊,用于根據(jù)各個(gè)目的地的指定出行概率與隨機(jī)出行概率、以及各分 類(lèi)的權(quán)重,進(jìn)行權(quán)重整合計(jì)算,得到旅客到各個(gè)目的地的出行概率,以基于所述出現(xiàn)概率預(yù) 測(cè)旅客到各個(gè)目的地的概率。
[0035] 其中,所述系統(tǒng)還包括:歷史記錄篩選模塊,用于在所述目的地整合模塊對(duì)所述旅 客歷史出行記錄進(jìn)行目的區(qū)域整合之前,將所述旅客歷史出行記錄中的中轉(zhuǎn)地以及常駐地 去除,以去除所述旅客歷史出行記錄的噪音。
[0036] 其中,所述目的地整合模塊,具體用于:以旅客量越大分類(lèi)越細(xì)致的原則對(duì)各個(gè)目 的地機(jī)場(chǎng)進(jìn)行整合細(xì)分,得到機(jī)場(chǎng)三字碼與目的地區(qū)域之間的映射列表;對(duì)于目的地為機(jī) 場(chǎng)三字碼的旅客歷史出行記錄,根據(jù)所述機(jī)場(chǎng)三字碼與目的地區(qū)域之間的映射列表,將機(jī) 場(chǎng)三字碼轉(zhuǎn)換為目的地區(qū)域信息,得到包含目的地區(qū)域信息的旅客歷史出行記錄。
[0037] 其中,所述歷史記錄分類(lèi)模塊,具體用于:根據(jù)所述出行類(lèi)型,將所述旅客歷史出 行記錄分為兩類(lèi):指定目的地和隨機(jī)目的地;根據(jù)旅客不同分類(lèi)的出行次數(shù),確定各個(gè)分類(lèi) 的權(quán)重,得到指定目的地權(quán)重和隨機(jī)目的地權(quán)重。
[0038] 其中,所述出行類(lèi)型為預(yù)先配置;所述出行類(lèi)型與所述旅客歷史出行記錄分類(lèi)之 間的關(guān)系為預(yù)先配置;所述歷史記錄分類(lèi)模塊具體用于基于預(yù)先配置的出行類(lèi)型與所述旅 客歷史出行記錄分類(lèi)之間的關(guān)系,將將所述旅客歷史出行記錄分為兩類(lèi)。
[0039] 其中,所述關(guān)聯(lián)分析模塊具體用于:掃描當(dāng)前旅客的事務(wù)數(shù)據(jù)庫(kù),計(jì)算每個(gè)目的地 在當(dāng)前旅客所有旅客歷史出行記錄中出現(xiàn)的頻數(shù),并刪除頻數(shù)小于預(yù)設(shè)的最小支持度的目 的地,將剩余的所有目的地按照頻數(shù)遞減排序,得到頻繁項(xiàng)集;基于所述頻繁項(xiàng)集,對(duì)當(dāng)前 旅客的每條旅客歷史出行記錄中各個(gè)目的地進(jìn)行重新排序;將重新排序得到的旅客歷史出 行記錄插入FPTree,所述FPTree中一個(gè)節(jié)點(diǎn)表示一個(gè)目的地,一條路徑對(duì)應(yīng)一條旅客歷史 出行記錄,每條路徑上節(jié)點(diǎn)的計(jì)數(shù)值表示支持度,所述支持度用于確定任意兩個(gè)目的地間 的關(guān)聯(lián)程度;從所述FPTree找出頻繁項(xiàng),得到每個(gè)目的地二項(xiàng)之間的頻繁項(xiàng)集合,所述頻繁 項(xiàng)集合包括每個(gè)目的地與其他各個(gè)目的地之間的支持度;基于所述每個(gè)目的地二項(xiàng)之間的 頻繁項(xiàng)集合,得到每個(gè)目的地到其它各個(gè)目的地的隨機(jī)出行概率。
[0040] 其中,一個(gè)目的地到其它任意一個(gè)目的地的隨機(jī)出行概率為:該目的地與其它任 意一個(gè)目的地之間的支持度與該目的地到各個(gè)目的地的支持度之和之間的比值。
[0041] 本發(fā)明實(shí)施例將關(guān)聯(lián)分析算法頻繁模式樹(shù)(FPTree,F(xiàn)requent Pattern tree)與 旅客歷史出行記錄相結(jié)合,結(jié)合旅客出行目的劃分,使用關(guān)聯(lián)分析與統(tǒng)計(jì)歸納預(yù)測(cè)旅客出 行目的地,使得計(jì)算時(shí)間大幅減少,解決了旅客目的地預(yù)測(cè)在計(jì)算時(shí)間與計(jì)算空間上的技 術(shù)難題,為旅客級(jí)數(shù)據(jù)增加了新的元素。
[0042]本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):使用FPTree算法進(jìn)行數(shù)據(jù)關(guān)聯(lián)分析,大幅減少計(jì)算 時(shí)間。由于旅客級(jí)別數(shù)據(jù)在數(shù)據(jù)融合方面也有著得天獨(dú)厚的條件,所有旅客級(jí)數(shù)據(jù)均可以 以旅客身份唯一標(biāo)識(shí)進(jìn)行數(shù)據(jù)融合,從而得到多維度的旅客個(gè)體信息,大而全的旅客數(shù)據(jù) 集保證了本發(fā)明實(shí)施例預(yù)測(cè)結(jié)果的準(zhǔn)確性與實(shí)用性。
【附圖說(shuō)明】
[0043]在附圖(其不一定是按比例繪制的)中,相似的附圖標(biāo)記可在不同的視圖中描述相 似的部件。具有不同字母后綴的相似附圖標(biāo)記可表示相似部件的不同示例。附圖以示例而 非限制的方式大體示出了本文中所討論的各個(gè)實(shí)施例。
[0044] 圖1為本發(fā)明實(shí)施例旅客目的地預(yù)測(cè)方法的流程示意圖;
[0045] 圖2為本發(fā)明實(shí)施例旅客目的地預(yù)測(cè)方法具體實(shí)現(xiàn)過(guò)程的流程示意圖;
[0046] 圖3為本發(fā)明實(shí)施例旅客目的地預(yù)測(cè)系統(tǒng)的組成結(jié)構(gòu)示意圖;
[0047]圖4~7為本發(fā)明實(shí)施例一示例中生成FP-Tree的示意圖。
【具體實(shí)施方式】
[0048] 實(shí)施例一
[0049] 本發(fā)明實(shí)施例提供了一種旅客目的地預(yù)測(cè)方法,如圖1所示,主要可以包括如下步 驟:
[0050] 步驟101:根據(jù)旅客歷史出行記錄的多種特征向量,判斷出行類(lèi)型,得到包含出行 類(lèi)型信息的旅客歷史出行記錄;
[0051] 步驟102:對(duì)所述旅客歷史出行記錄進(jìn)行目的區(qū)域整合,得到包含目的地區(qū)域信息 的旅客歷史出行記錄;
[0052] 步驟103:根據(jù)所述出行類(lèi)型,將所述旅客歷史出行記錄進(jìn)行