專利名稱:一種基于交易網(wǎng)絡(luò)的商家推薦方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子商務(wù)領(lǐng)域中的商家推薦,特別涉及存在大量歷史交易數(shù)據(jù)的情況下,充分發(fā)掘買家和賣家的交易偏好,構(gòu)成用戶簇;同時引入社會網(wǎng)絡(luò)因素,為買家或賣家劃分社團(tuán);通過隨機(jī)行走完成商 家推薦。
背景技術(shù):
推薦系統(tǒng)已應(yīng)用到信息檢索、新聞傳媒、電子商務(wù)、社會網(wǎng)絡(luò)服務(wù)等諸多領(lǐng)域。在電子商務(wù)領(lǐng)域,良好的推薦系統(tǒng)能夠有效提升用戶體驗(包括買家和賣家),增加用戶黏著度,促進(jìn)更多交易行為的發(fā)生。目前眾多的電子商務(wù)網(wǎng)站,如淘寶、大眾點評、亞馬遜、億貝、京東等都建立了各自的推薦系統(tǒng),在商品層面進(jìn)行有效的統(tǒng)計、建模、挖掘和推薦工作,取得了良好成果。目前的推薦技術(shù)大致可分為三大類基于內(nèi)容的推薦、協(xié)同過濾、以及混合推薦?;趦?nèi)容的推薦為用戶(買家)推薦與其之前的選擇相類似的物品(商品);協(xié)同過濾為用戶推薦與其偏好最相近的用戶所選擇過的物品;混合方式采用多種推薦方法的組合為用戶推薦物品,一種策略是結(jié)合基于內(nèi)容和協(xié)同過濾為用戶提供推薦,另一種目前比較流行的策略是在協(xié)同過濾中引入社會網(wǎng)絡(luò)技術(shù)為用戶推薦物品。目前電子商務(wù)網(wǎng)站在交易過程中主要承擔(dān)平臺和中介的角色,每一次交易實際發(fā)生在買家和賣家之間?,F(xiàn)有的推薦系統(tǒng)在為買家發(fā)掘商品、促進(jìn)買家體驗和交易量方面已取得良好成果;但對賣家的關(guān)注度仍然不夠,實際是較少考慮到社會網(wǎng)絡(luò)因素的影響。已有市場調(diào)查報告顯示超過65%的買家更傾向于同信任的賣家進(jìn)行交易,并建立所謂“老客”、“回頭客”等相對穩(wěn)固的信任交易關(guān)系;考慮到在線商品交易中更高的劣質(zhì)商品風(fēng)險和質(zhì)保代價,合理的商家推薦是當(dāng)前電子商務(wù)領(lǐng)域需要立即考慮的問題?,F(xiàn)有的推薦方法和技術(shù)尚未考慮商家推薦的問題,有效的商家推薦方法將填補這一空白。
發(fā)明內(nèi)容
本發(fā)明主要目的是針對傳統(tǒng)推薦系統(tǒng)沒有考慮商家推薦的問題,提出一種基于交易網(wǎng)絡(luò)的商家推薦方法,通過在買家和賣家之間建立偏好相似的用戶簇,根據(jù)交易網(wǎng)絡(luò)的連接模式劃分社團(tuán),通過隨機(jī)行走完成商家推薦。為實現(xiàn)本發(fā)明所述目的,本發(fā)明采用如下的步驟
1)整理交易數(shù)據(jù)并建立交易網(wǎng)絡(luò),包含兩個工作其一為每個用戶(包括買家和賣家)建立和維護(hù)偏好向量;其二根據(jù)歷史交易記錄在用戶之間建立交易網(wǎng)絡(luò);
2)根據(jù)用戶交易歷史對用戶聚類;采用期望最大化算法EM,通過用戶偏好向量進(jìn)行用戶聚類,形成偏好相似的用戶簇;
3)對交易網(wǎng)絡(luò)進(jìn)行社團(tuán)劃分;采用K均值算法KM,根據(jù)交易網(wǎng)絡(luò)中各(用戶)節(jié)點的連接模式劃分社團(tuán);4)應(yīng)用隨機(jī)行走方法實現(xiàn)商家推薦,從買家(目標(biāo)用戶)出發(fā),在社團(tuán)間隨機(jī)行走,根據(jù)用戶簇決定停止概率,完成商家推薦。上述步驟I)中用戶的偏好向量用數(shù)組表示令in表示電子商務(wù)網(wǎng)站中商品類別的數(shù)量;用戶《<的偏好向量為二-■ );其中元素^ (I < k < M )的定義如下
{] H1 IMHiglit or sold fomnich! it irs ofk
0r tIn*rwiHo。上述步驟I)中的交易網(wǎng)絡(luò)是一個有向圖U= (d/),其中;/表示電子商務(wù)網(wǎng)站中的用戶集合;有向邊集合£ C F X反映用戶之間的交易歷史,對于任意兩個用戶 和"j ^ P),有向邊< rH >€ E表示用戶h曾經(jīng)從用戶購買過商品;/:丑—N是一個映射,其中W為自然數(shù)集,作用是為£中的每一條有向邊賦予權(quán)重;簡化處理有向邊
>■的權(quán)重表示為叫代表_向w,購買商品的次數(shù),若< .<-+ >i E, IjiiJ u<tJ 二 U,另有
=()。上述步驟2)中的EM算法包含兩個階段E-Step (Expectation)根據(jù)用戶簇的當(dāng)前組成計算每個簇的中心點;M-Step (Maximization)將每個用戶重新分配到從屬概率最高的用戶簇;
2. I)考慮E-Step,計算用戶族的中心點A.; ~ (:.a. .Va ,1,其中in表不商品類別的數(shù)量,元素¥的計算公式如下
印―=士 ^噸.
I '。病
其中|4|表示用戶簇4的規(guī)模,即簇中包含的用戶數(shù)量是用戶Uf的偏好向量_中的對應(yīng)元素,〃;必須屬于4 ;
2.2)考慮M-St印,用戶+ , 屬于用戶簇Z,的從屬概率由 (W1IZi)表示,為計算引入背景向量〃=(辦取..…知),其中元素ft的計算公式如下
—i ( . = TTTT 乙
I' I ,er
其中f/為用戶集合;再引入平滑因子A,A可設(shè)為0. 01,取值范圍0. OOfO. 06,交易數(shù)據(jù)越稀疏,A取值越大;計算用戶簇4的特征向量朽=..…朽《),其中元素朽n 的計算公式如下
PA:: U. — ^}Sjk + Mk進(jìn)一步計算系數(shù)向量4 - 1 .4、…為其中元素‘的計算公式如下
fpIy^J1A'
= m---Ig -—-—■
I — Pjp I — Aift
基于上述,計算用戶化屬于用戶簇4的從屬概率坪,公式如下
權(quán)利要求
1.一種基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于包括以下步驟 1)整理交易數(shù)據(jù)并建立交易網(wǎng)絡(luò),包括為每個用戶,即買家和賣家,建立和維護(hù)偏好向量;并根據(jù)歷史交易記錄在用戶之間建立交易網(wǎng)絡(luò); 2)根據(jù)用戶交易歷史對用戶聚類;采用期望最大化算法EM,通過用戶偏好向量進(jìn)行用戶聚類,形成偏好相似的用戶簇; 3)對交易網(wǎng)絡(luò)進(jìn)行社團(tuán)劃分;采用K均值算法KM,根據(jù)交易網(wǎng)絡(luò)中各用戶節(jié)點的連接模式劃分社團(tuán); 4)應(yīng)用隨機(jī)行走方法實現(xiàn)商家推薦,從買家出發(fā),在社團(tuán)間隨機(jī)行走,根據(jù)用戶簇決定停止概率,完成商家推薦。
2.根據(jù)權(quán)利要求I所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟I)中用戶的偏好向量用數(shù)組表示令■表不電子商務(wù)網(wǎng)站中商品類別的數(shù)量;用戶《.f的偏好向量為二 ;其中兀素S A 5 W )的定義如下
3.根據(jù)權(quán)利要求I所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟I)中的交易網(wǎng)絡(luò)是一個有向圖DV =(〖/.£./),其中£/表示電子商務(wù)網(wǎng)站中的用戶集合;有向邊集合I' X反映用戶之間的交易歷史,對于任意兩個用戶 和e f+「),有向邊< H >€ £'表示用戶Uf曾經(jīng)從用戶~購買過商品;/ : E ^ N是一個映射,其中N為自然數(shù)集,作用是為E中的每一條有向邊賦予權(quán)重;簡化處理有向邊< >的權(quán)重表示為 ,代表 向+";:購買商品的次數(shù),若< “,+■技j >f ,則.另有二 O。
4.根據(jù)權(quán)利要求I、2或3所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟2)中的EM算法包含兩個階段=E-Step根據(jù)用戶簇的當(dāng)前組成計算每個簇的中心點;M_Step將每個用戶重新分配到從屬概率最高的用戶簇;具體過程為 .2.I)考慮E-St印,計算用戶簇Zf的中心點<,:(―二…. ,),其中m表示商品類別的數(shù)量,元素%1的計算公式如下
5.根據(jù)權(quán)利要求4所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟2)中采用EM算法完成用戶聚類的過程是首先根據(jù)電子商務(wù)網(wǎng)站中的用戶總數(shù)設(shè)置用戶簇的數(shù)量,保證用戶簇規(guī)模的平均范圍為50(T3000個用戶;隨機(jī)設(shè)定個用戶簇,對每一個用戶,以均一概率分配到某一個簇中;然后開始迭代第一步執(zhí)行EM算法為每一個用戶重新分配用戶簇;第二步對過大和過小的用戶簇做處理,過程是 · 2.3)判定過小的用戶簇設(shè)定用戶簇規(guī)模的最小值e,一般= 30 ;如果存在用戶簇&的規(guī)模小于e,則解散I,其成員以均一概率分配到其他用戶簇中; ·2.4)判定過大的用戶簇計算所有用戶簇規(guī)模取對數(shù)后的均值,用M Ig P:)表示,再計算用戶簇規(guī)模取對數(shù)后的方差值,用〃表示,如果用戶簇4滿足以下公式則4過大,在其中隨機(jī)設(shè)定2個用戶簇,&的每個成員以均一概率1/2分配到一個新簇中; 迭代結(jié)束時判斷用戶簇的組成是否發(fā)生變化如果發(fā)生變化,則進(jìn)入下一次迭代;如果沒有發(fā)生變化,則迭代結(jié)束,輸出聚類好的用戶簇。
6.根據(jù)權(quán)利要求I、2或3所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟·3)中的KM算法包含兩個階段K-Step將每個用戶重新分配到匹配度最高的社團(tuán);M_Step根據(jù)社團(tuán)的當(dāng)前組成計算每個社團(tuán)的特征向量;具體過程為 ·3.I)考慮M-Step,計算社團(tuán)C,.的特征向量Cr = hi, d .…其中》為用戶總數(shù);元素I.. (I. < k < )的計算公式如下
7.根據(jù)權(quán)利要求6所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟3)中采用KM算法完成交易網(wǎng)絡(luò)中社團(tuán)劃分的過程是首先根據(jù)電子商務(wù)網(wǎng)站中的用戶總數(shù)設(shè)置社團(tuán)的數(shù)量保證社團(tuán)規(guī)模的平均值范圍為50(T3000個用戶;然后初始化社團(tuán)對交易網(wǎng)絡(luò)中的用戶節(jié)點按度數(shù),即出度+入度排序,等分為個區(qū)間;從每個區(qū)間隨機(jī)選擇10 30個用戶節(jié)點;每個用戶節(jié)點單獨作為一個社團(tuán),社團(tuán)特征向量等于用戶特征向量;每次選擇兩個特征向量的歐氏距離最近的社團(tuán),將這兩個社團(tuán)合并為一個社團(tuán),重新計算新社團(tuán)的特征向量;重復(fù)上述操作,直至剩余個社團(tuán);然后迭代執(zhí)行KM算法,迭代過程的收斂條件是一次迭代后,每個用戶同社團(tuán)的從屬關(guān)系沒有發(fā)生改變;最后輸出社團(tuán)劃分結(jié)果。
8.根據(jù)權(quán)利要求I、2或3所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟4)中應(yīng)用隨機(jī)行走方法實現(xiàn)商家推薦的過程是首先確定推薦的商家數(shù)量Y , N =3^20 ;然后從目標(biāo)用戶^出發(fā)隨機(jī)行走,選擇下一個用戶& ;判定隨機(jī)行走是否終止;如果未能終止,則將 作為當(dāng)前用戶 繼續(xù)隨機(jī)行走;如果過程終止,輸出為推薦的商家;上述過程重復(fù)』V次,最后輸出所推薦的一組商家。
9.根據(jù)權(quán)利要求8所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于, 上述步驟4)中的隨機(jī)行走過程包含兩個階段其一是按概率選擇一個社團(tuán)G ;其二是按概率從G中選擇一個用戶; .4.I)令當(dāng)前用戶為U4,計算選擇社團(tuán)C:,.的概率IUD),公式如下
10.根據(jù)權(quán)利要求9所述的基于交易網(wǎng)絡(luò)的商家推薦方法,其特征在于,上述步驟4)中計算隨機(jī)行走的終止概率#分四種情況,其中令所選用戶為…,目標(biāo)用戶為 情況I. 1 不是賣家,或者已經(jīng)同%交易過,不需要再推薦;此時G = U ; 情況2. %和《 屬于同一個用戶簇,此時^二 I,即隨機(jī)行走立即終止; 情況3. 1%所屬用戶簇各與《 所屬用戶簇瓦不相同,此時計算%對石的隸屬度/^名),公式如下
全文摘要
本發(fā)明公開了一種基于交易網(wǎng)絡(luò)的商家推薦方法,其步驟為(1)整理交易數(shù)據(jù)并建立交易網(wǎng)絡(luò);(2)根據(jù)用戶交易歷史對用戶聚類;(3)對交易網(wǎng)絡(luò)進(jìn)行社團(tuán)劃分;(4)應(yīng)用隨機(jī)行走方法實現(xiàn)商家推薦。本發(fā)明可廣泛應(yīng)用于各類電子商務(wù)網(wǎng)站中的商家(賣家)推薦,為廣大買家推薦合適的賣家;充分利用買家和賣家的歷史交易數(shù)據(jù),發(fā)掘買家和賣家的偏好特征,分析買家和賣家交易的相似性,合理應(yīng)用隨機(jī)行走方法,有效提高商家推薦的準(zhǔn)確性和針對性。所采用的計算方法簡單高效,切合電子商務(wù)網(wǎng)站海量交易數(shù)據(jù)、同時買家和賣家交易信息稀疏的特性,有較好的擴(kuò)展性和適用性;有效填補目前電子商務(wù)網(wǎng)站商家推薦方面的空白。
文檔編號G06Q30/02GK102750647SQ201210219288
公開日2012年10月24日 申請日期2012年6月29日 優(yōu)先權(quán)日2012年6月29日
發(fā)明者湯九斌, 蔣智威, 許鼎鼎, 陳道蓄, 顧慶 申請人:南京大學(xué)