一種面向移動(dòng)社交環(huán)境的用戶行為預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于無(wú)線通信技術(shù)領(lǐng)域,具體涉及一種面向移動(dòng)社交環(huán)境的用戶行為預(yù)測(cè) 方法。
【背景技術(shù)】
[0002] 隨著智能移動(dòng)設(shè)備和移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,移動(dòng)社交網(wǎng)絡(luò)(MSN)也呈蓬勃 發(fā)展勢(shì)頭。移動(dòng)社交網(wǎng)絡(luò)是在傳統(tǒng)的社交網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展起來(lái)的,主要是為用戶提供方 便的網(wǎng)絡(luò)服務(wù)和幫助。作為一種新興的社交網(wǎng)絡(luò),移動(dòng)社交網(wǎng)絡(luò)為用戶提供了一個(gè)交流平 臺(tái),用戶可以通過(guò)移動(dòng)設(shè)備和其他人進(jìn)行交互,找到擁有相同興趣愛(ài)好的朋友圈。用戶是移 動(dòng)社交網(wǎng)絡(luò)的主體,通過(guò)了解用戶的特性采取一定的措施,這樣才能保證移動(dòng)社交網(wǎng)絡(luò)的 正常發(fā)展。為用戶提供更好的服務(wù),滿足大部分用戶的需求,已經(jīng)成為移動(dòng)社交網(wǎng)絡(luò)研究的 重要組成部分。
[0003] 而現(xiàn)階段,移動(dòng)互聯(lián)網(wǎng)服務(wù)和信息內(nèi)容的日益增長(zhǎng)將逐漸超出人們所能接受的范 圍,加之移動(dòng)設(shè)備的界面顯示、終端處理、輸入/輸出等能力有限,為移動(dòng)用戶帶來(lái)沉重的 "移動(dòng)信息過(guò)載問(wèn)題",導(dǎo)致移動(dòng)網(wǎng)絡(luò)資源利用率和用戶體驗(yàn)受到嚴(yán)重影響。而且對(duì)于大型 的發(fā)展中的移動(dòng)社交圈而言,網(wǎng)絡(luò)中是否存在用戶群體,如何識(shí)別用戶群體及其特征,以及 為用戶提供更好的服務(wù),這都是需要進(jìn)行深入研究的。而且,移動(dòng)社交環(huán)境下的用戶行為分 析和網(wǎng)絡(luò)本身的性能是息息相關(guān)的,用戶是網(wǎng)絡(luò)服務(wù)的主體,適應(yīng)用戶行為的網(wǎng)絡(luò)體系才 能實(shí)現(xiàn)資源的最優(yōu)配置。用戶行為顯著影響網(wǎng)絡(luò)性能,而網(wǎng)絡(luò)應(yīng)用也必須建立在深刻了解 用戶行為的基礎(chǔ)上。因此,在未來(lái)移動(dòng)社交網(wǎng)絡(luò)的發(fā)展中,研究用戶的行為特征,不僅可以 為用戶提供更好的服務(wù),提升用戶體驗(yàn),而且對(duì)移動(dòng)社交網(wǎng)絡(luò)的資源優(yōu)化有一定的研究意 義。
[0004] 移動(dòng)社交網(wǎng)絡(luò)的核心是"以人為本",提供各種社交應(yīng)用滿足用戶需求。雖然,群體 性是移動(dòng)社交網(wǎng)絡(luò)的一大特點(diǎn),但是,在研究群體之前,必須清楚個(gè)體的行為特征。"個(gè)性化 推薦服務(wù)"已經(jīng)成為提升用戶體驗(yàn)的重要渠道。隨著大數(shù)據(jù)時(shí)代的到來(lái),用戶在移動(dòng)社交網(wǎng) 絡(luò)中的業(yè)務(wù)行為也變得越來(lái)越復(fù)雜?,F(xiàn)有的算法難以滿足日益復(fù)雜的移動(dòng)社交網(wǎng)絡(luò)的推薦 需求。因此,在移動(dòng)服務(wù)推薦系統(tǒng)中,常用關(guān)聯(lián)挖掘方法來(lái)獲得用戶行為之間的關(guān)聯(lián)關(guān)系, 分析用戶的當(dāng)前時(shí)刻及上一時(shí)刻的業(yè)務(wù)行為,預(yù)測(cè)其下一時(shí)刻的業(yè)務(wù)行為。
[0005]目前,有很多關(guān)聯(lián)規(guī)則挖掘算法,而Apriori算法是最經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法。 它利用逐層搜索的迭代方法找出數(shù)據(jù)庫(kù)中項(xiàng)集的關(guān)系,以形成規(guī)則,其過(guò)程由連接與剪枝 組成。針對(duì)該算法的效率瓶頸問(wèn)題,結(jié)合移動(dòng)社交環(huán)境的特點(diǎn)采用一種基于編碼的二維 Apriori方法用于挖掘用戶行為來(lái)提高運(yùn)行效率。該方法的核心思想和步驟是:首先統(tǒng)計(jì) 用戶上一時(shí)刻和當(dāng)前時(shí)刻的業(yè)務(wù)行為,并對(duì)統(tǒng)計(jì)后的數(shù)據(jù)進(jìn)行二進(jìn)制編碼,然后采用"與" 運(yùn)算取代傳統(tǒng)Apriori算法得到頻繁集。而且,朋友圈的劃分以及關(guān)聯(lián)結(jié)果的數(shù)據(jù)融合,提 高了算法的準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0006] 為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提出一種面向移動(dòng)社交環(huán)境的用戶行為預(yù) 測(cè)方法。該方法考慮用戶受到自身的影響以及朋友圈其他用戶對(duì)其的影響。對(duì)移動(dòng)社交網(wǎng) 絡(luò)的中用戶行為進(jìn)行預(yù)測(cè),可有效地提高預(yù)測(cè)的準(zhǔn)確性,適用于用戶業(yè)務(wù)推薦。
[0007] 為了解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案是:
[0008] 本發(fā)明即面向移動(dòng)社交環(huán)境的用戶行為預(yù)測(cè)方法,其具體過(guò)程為:
[0009] 步驟A,采用基于編碼的二維Apriori方法實(shí)現(xiàn)用戶行為的關(guān)聯(lián)分析,所述用戶行 為是指用戶的業(yè)務(wù)行為,包括視頻業(yè)務(wù)行為,新聞業(yè)務(wù)行為,聊天文本業(yè)務(wù)行為等,所述關(guān) 聯(lián)分析的具體步驟如下:
[0010] 步驟A-1,將目標(biāo)用戶上一時(shí)刻的業(yè)務(wù)行為及當(dāng)前時(shí)刻的業(yè)務(wù)行為做關(guān)聯(lián)分析, 首先統(tǒng)計(jì)各條記錄中目標(biāo)用戶上一時(shí)刻和當(dāng)前時(shí)刻產(chǎn)生的業(yè)務(wù)行為,即各條記錄中如果業(yè) 務(wù)行為發(fā)生記為1,不發(fā)生記為0,并對(duì)統(tǒng)計(jì)的數(shù)據(jù)進(jìn)行二進(jìn)制編碼處理,然后采用"與"運(yùn) 算取代傳統(tǒng)Apriori算法得到頻繁集,進(jìn)而可獲得頻繁關(guān)聯(lián)規(guī)則,由頻繁關(guān)聯(lián)規(guī)則預(yù)測(cè)目 標(biāo)用戶下一時(shí)刻產(chǎn)生的業(yè)務(wù)行為;
[0011] 步驟A-2,將目標(biāo)用戶當(dāng)前時(shí)刻的業(yè)務(wù)行為分別與所述移動(dòng)社交環(huán)境中其η個(gè)朋 友圈用戶上一時(shí)刻的業(yè)務(wù)行為做關(guān)聯(lián)分析,首先統(tǒng)計(jì)各條記錄中目標(biāo)用戶當(dāng)前時(shí)刻產(chǎn)生的 業(yè)務(wù)行為及其η個(gè)朋友圈用戶上一時(shí)刻產(chǎn)生的業(yè)務(wù)行為,即各條記錄中如果業(yè)務(wù)行為發(fā)生 記為1,不發(fā)生記為0,并對(duì)統(tǒng)計(jì)的數(shù)據(jù)進(jìn)行二進(jìn)制編碼,最后采用編碼"與"運(yùn)算取代傳統(tǒng) Apriori算法得到頻繁集,進(jìn)而可獲得頻繁關(guān)聯(lián)規(guī)則,由頻繁關(guān)聯(lián)規(guī)則預(yù)測(cè)目標(biāo)用戶下一時(shí) 刻產(chǎn)生的業(yè)務(wù)行為;
[0012] 步驟B,使用影響力因子公式在目標(biāo)用戶的朋友圈中獲得η個(gè)朋友圈用戶,影響力 因子公式為:
[0014] 其中義叫表不一個(gè)時(shí)間段內(nèi)用戶以卩用戶叫間的影響力因子:^^…表不一個(gè) 時(shí)間段內(nèi)用戶m和用戶叫同時(shí)在線的在線時(shí)長(zhǎng),i是用戶標(biāo)號(hào),為正整數(shù);SN"表示一個(gè)時(shí) 間段內(nèi)用戶m的在線時(shí)長(zhǎng);表示一個(gè)時(shí)間段內(nèi)用戶m和用戶ηι交互的次數(shù),ΙΝηι表示 一個(gè)時(shí)間段內(nèi)用戶m總的交互次數(shù)。α,β為權(quán)重參數(shù),且α+β= 1。α,β通過(guò)多次實(shí) 驗(yàn)獲得,而且影響力因子^,Μ的值是介于〇和1之間的,由于考慮到實(shí)際情況,用戶受自身 的影響較大,所以用戶受自身影響的影響力因子設(shè)為TM= 1 ;
[0015] 步驟C,將步驟A中獲得的n+1個(gè)關(guān)聯(lián)分析結(jié)果視為n+1個(gè)節(jié)點(diǎn),對(duì)其進(jìn)行融合分 析;
[0016] 假設(shè)各節(jié)點(diǎn)的方差分別為of,σ22,crf+17各個(gè)節(jié)點(diǎn)支持度的均值分別設(shè)為 Χι,X2,--,χη+1,這些值彼此間相互獨(dú)立,各個(gè)節(jié)點(diǎn)的權(quán)值系數(shù)分別為ω1;ω2, . . . ,ωη+1,則 融合分析包含步驟如下:
[0017] 步驟c-l,對(duì)每個(gè)節(jié)點(diǎn)多次采樣取平均值,求出各個(gè)節(jié)點(diǎn)關(guān)于一個(gè)頻繁關(guān)聯(lián)規(guī)則支 持度的方差;
[0018] 步驟C-2,求出各個(gè)節(jié)點(diǎn)最終的權(quán)值系數(shù)<?
[0019]初始權(quán)值系數(shù)4為:
[0021] 則最終的權(quán)值系數(shù)< 為:
[0023] 其中,1是節(jié)點(diǎn)標(biāo)號(hào),為正整數(shù),且1<1彡η+1 ;
[0024]步驟C-3,求出節(jié)點(diǎn)融合值X;
[0026]權(quán)值系數(shù)ω/^必須滿足:
*節(jié)點(diǎn)融合值X即為這個(gè)頻繁關(guān)聯(lián)規(guī)則的最終支 持度,X越大則表明這個(gè)頻繁關(guān)聯(lián)規(guī)則發(fā)生的可能性越高,由此針對(duì)用戶行為關(guān)聯(lián)分析的預(yù) 測(cè)建模,有效提高用戶行為預(yù)測(cè)的準(zhǔn)確性。
[0027] 有益效果:
[0028] 1、本發(fā)明提出了基于編碼的二維Apriori方法實(shí)現(xiàn)用戶行為的關(guān)聯(lián)分析,克服了 傳統(tǒng)Apriori方法的效率瓶頸問(wèn)題,有利于提高預(yù)測(cè)模型的效率。
[0029] 2、基于編碼的二維Apriori方法使用編碼方式來(lái)實(shí)現(xiàn)頻繁集的獲取,在做用戶行 為的關(guān)聯(lián)分析時(shí)可以大大降低掃描數(shù)據(jù)庫(kù)的次數(shù),節(jié)約時(shí)間。
[0030] 3、本發(fā)明根據(jù)影響力因子公式獲得朋友圈用戶,然后分別與目標(biāo)用戶做關(guān)聯(lián)分 析,從而有效提高預(yù)測(cè)方法的準(zhǔn)確性。
[0031] 4、本發(fā)明采用基于影響力因子改進(jìn)的最優(yōu)加權(quán)融合方法將關(guān)聯(lián)分析結(jié)果進(jìn)行融 合。有利于提高預(yù)測(cè)方法的準(zhǔn)確性。
[0032] 5、本發(fā)明產(chǎn)生的面向移動(dòng)社交環(huán)境的用戶行為預(yù)測(cè)方法非常簡(jiǎn)單而易于實(shí)現(xiàn),具 有很好的應(yīng)用前景。
【附圖說(shuō)明】
[0033] 圖1為數(shù)據(jù)融合框圖。
[0034] 圖2為面向移動(dòng)社交環(huán)境的用戶行為預(yù)測(cè)方法流程圖。
【具體實(shí)施方式】
[0035] 下面結(jié)合附圖對(duì)發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明:
[0036] 本發(fā)明提出了一種面向移動(dòng)社交環(huán)境的用戶行為預(yù)測(cè)方法,根據(jù)移動(dòng)社交環(huán)境的 群體性,交互性,實(shí)時(shí)性特點(diǎn),通過(guò)基于編碼的二維Apriori方法實(shí)現(xiàn)用戶行為分析,為用 戶提供準(zhǔn)確的聯(lián)合業(yè)務(wù)推薦。
[0037] 本發(fā)明主要包括三個(gè)內(nèi)容:一是用戶行為的關(guān)聯(lián)分析,利用基于編碼的二維 Apriori方法實(shí)現(xiàn)用戶業(yè)務(wù)行為的關(guān)聯(lián)分析;二是朋友圈的劃分,采用影響力因子公式獲 得目標(biāo)用戶的朋友圈用戶;三是將關(guān)聯(lián)分析結(jié)果融合在一起,預(yù)測(cè)目標(biāo)用戶下一時(shí)刻的業(yè) 務(wù)行為。
[0038] 1.基于編碼的二維Apriori方法實(shí)現(xiàn)用戶行為的關(guān)聯(lián)分析
[0039] 基于用戶自身業(yè)務(wù)行為的關(guān)聯(lián)分析:
[0040] 首先,將某一個(gè)用戶上一時(shí)刻的業(yè)務(wù)行為和當(dāng)前時(shí)刻的業(yè)務(wù)行為做關(guān)聯(lián)分析。為 了便于分辨,記某個(gè)目標(biāo)用戶為m。表1-1所示為一個(gè)簡(jiǎn)單的移動(dòng)社交環(huán)境用戶m的業(yè)務(wù)行 為數(shù)據(jù)表,共有7條記錄,2個(gè)屬性(維)。用戶的業(yè)務(wù)類型可以分成η類,如:新聞業(yè)務(wù),視 頻業(yè)務(wù),音樂(lè)業(yè)務(wù),聊天文本業(yè)務(wù)等。
[0041] 表1-1移動(dòng)社交環(huán)境用戶m的業(yè)務(wù)行為數(shù)據(jù)表
[0042]
[0043] 對(duì)表1-1的業(yè)務(wù)行為數(shù)據(jù)表用符號(hào)來(lái)表示,最終得表1-2事務(wù)數(shù)據(jù)表。
[0044] 表1-2