一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法
【專利摘要】本發(fā)明公開了一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法,包括如下步驟:1)根據(jù)用戶在不同視圖下的行為數(shù)據(jù)構(gòu)建用戶數(shù)據(jù)的多視圖錨點圖表示;2)利用得到的多視圖錨點圖與用戶的行為數(shù)據(jù)生成連續(xù)空間中的用戶哈希編碼;3)對連續(xù)空間中的哈希編碼進(jìn)行量化,得到用戶對應(yīng)的二進(jìn)制哈希編碼;4)利用得到的用戶哈希編碼為目標(biāo)用戶搜索相似用戶;5)將相似用戶對應(yīng)的偏好物品集合作為推薦候選列表,計算目標(biāo)用戶對候選物品的偏好程度,返回偏好程度最大的若干個物品作為推薦結(jié)果。本發(fā)明將用戶在不同視圖下的數(shù)據(jù)進(jìn)行了整合,提高了推薦結(jié)果的質(zhì)量。同時利用相似度保留的哈希編碼實現(xiàn)了相似用戶的快速搜索,提高了推薦結(jié)果計算的效率。
【專利說明】
-種基于多視圖貓點圖哈希技術(shù)的個性化推薦方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及個性化推薦技術(shù),尤其設(shè)及一種基于多視圖錯點圖哈希技術(shù)的個性化 推薦方法。
【背景技術(shù)】
[0002] 隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)上的信息和資源出現(xiàn)了爆炸性的增 長。然而,龐大的信息量W及其中所混雜的大量低質(zhì)量、低價值信息的存在使得用戶對信息 的獲取和利用效率不斷下降。為了應(yīng)對海量數(shù)據(jù)規(guī)模下的信息獲取難題,個性化推薦系統(tǒng) 是一種有效的解決方案。個性化推薦系統(tǒng)根據(jù)用戶的個人資料、行為數(shù)據(jù)、社交關(guān)系等信 息,通過不同方法對用戶的偏好進(jìn)行預(yù)測,從而將一些特定的物品或信息主動推送給目標(biāo) 用戶,提高了用戶信息獲取的效率和質(zhì)量。
[0003] 在實際應(yīng)用中,對用戶偏好的預(yù)測通常采用協(xié)同過濾方法進(jìn)行,主要利用其他用 戶的信息來預(yù)測目標(biāo)用戶對物品的評分。傳統(tǒng)的協(xié)同過濾推薦方法大多將用戶對物品的評 分矩陣作為用戶的表示,通過對評分矩陣進(jìn)行處理,從而得到用戶偏好的預(yù)測結(jié)果。但是運 些方法僅僅利用了用戶在單個視圖下的數(shù)據(jù),無法全面表示用戶的特征,此外,傳統(tǒng)方法通 常直接利用用戶行為數(shù)據(jù)計算用戶之間的相似度,導(dǎo)致了大量的高維向量運算,嚴(yán)重影響 了計算效率。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種基于多視圖錯點圖哈希技術(shù)的個 性化推薦方法。
[0005] 本發(fā)明的目的是通過W下技術(shù)方案來實現(xiàn)的:
[0006] -種基于多視圖錯點圖哈希技術(shù)的個性化推薦方法,包括W下步驟:
[0007] 1)根據(jù)訓(xùn)練用戶在不同視圖下的行為數(shù)據(jù),構(gòu)建用戶數(shù)據(jù)的多視圖錯點圖表示;
[0008] 2)利用多視圖錯點圖與訓(xùn)練用戶的行為數(shù)據(jù)生成連續(xù)空間中的用戶哈希編碼;
[0009] 3)對連續(xù)空間中的哈希編碼進(jìn)行量化,得到訓(xùn)練用戶對應(yīng)的二進(jìn)制哈希編碼;
[0010] 4)利用多視圖錯點圖、訓(xùn)練用戶的二進(jìn)制哈希編碼及目標(biāo)用戶的行為數(shù)據(jù)生成目 標(biāo)用戶對應(yīng)的二進(jìn)制哈希編碼;
[0011] 5)利用得到的目標(biāo)用戶和訓(xùn)練用戶的哈希編碼為目標(biāo)用戶捜索相似用戶;
[0012] 6)將相似用戶對應(yīng)的偏好物品集合作為推薦候選列表,計算目標(biāo)用戶對候選物品 的偏好程度,返回偏好程度最大的K個物品作為推薦結(jié)果,K表示推薦結(jié)果的數(shù)量。
[0013] 所述的步驟1)包括W下子步驟:
[0014] 1.1)對于訓(xùn)練用戶在第i個視圖下的行為數(shù)據(jù)矩陣公€其中N表示訓(xùn)練用 戶的數(shù)量,d康示第i個視圖下用戶數(shù)據(jù)的維度,利用K-means聚類方法生成Tl個聚類中屯、, 作為該視圖下數(shù)據(jù)的錯點,Tl的取值與用戶數(shù)量相關(guān),大于設(shè)定的哈希編碼的位數(shù)R;
[001引1.2)將不同視圖下的訓(xùn)練用戶數(shù)據(jù)進(jìn)行水平連接得到矩陣X =掉,X2,妒化#xdt。:叫其 中M表示視圖的數(shù)量,dtDtal表示所有視圖下用戶數(shù)據(jù)的維度之和;
[0016] 1.3)對于每個訓(xùn)練用戶,捜索該用戶在各視圖下最近鄰的2個錯點,組成集合 Uj e贓ZXA',利用不同視圖下的最近鄰錯點集合構(gòu)建對角矩陣Ui =diag郵,巧Uf) e ffiZMxcWai;
[0017] 1.4)對于每個訓(xùn)練用戶,利用化Sterov梯度方法和投影梯度方法求解優(yōu)化問題
,其中化G膠IXZM表示該用戶到所有最近鄰錯點的轉(zhuǎn)移概率, 初值均為^,xi表示矩陣X的第i行;
[0018] 1.5)將用戶到非最近鄰錯點的轉(zhuǎn)移概率設(shè)定為0,根據(jù)得到的各用戶到最近鄰錯 點的轉(zhuǎn)移概率,得到所有用戶到所有錯點的轉(zhuǎn)移概率矩陣P e膠WxTtotai,其中TtDtai表示所 有視圖下錯點數(shù)量的總和,運個轉(zhuǎn)移概率矩陣就是所構(gòu)建的用戶數(shù)據(jù)的多視圖錯點圖表 /J、- O
[0019] 所述的步驟2)包括W下子步驟:
[0020] 2.1)計算得到轉(zhuǎn)移概率矩陣P的列和向量V巨膠IXTtOtal.
[0021] 2.2)構(gòu)造對角
[0022] 2.3)計算矩陣
[0023] 2.4)計算矩陣M的除1W外的最大R個特征值對應(yīng)的串
[0024] 2.5)計算訓(xùn)練用戶對應(yīng)的連續(xù)空間中哈希編碼矩陣
[0025] 所述的步驟3)包括W下子步驟:
[00%] 3.1)使用符號二值化方法計算二進(jìn)制編碼矩陣的初值B = Sgn(Y),其中Sgn表示符 號函數(shù),對于負(fù)數(shù)返回-1,否則返回1;
[0027] 3.2)計算當(dāng)前二進(jìn)制編碼梯度矩巧
其中P表示二 進(jìn)制編碼的相似度保留程度與編碼各位平衡無關(guān)程度的平衡參數(shù);
[0028] 3.3)根據(jù)計算得到的梯度矩陣中各元素的符號更新二進(jìn)制編碼矩陣對應(yīng)位置上 的值;
[00巧]3.4)重復(fù)步驟3.2)和步驟3.3),直至二進(jìn)制編碼矩陣則欠斂;
[0030] 3.5)計算矩陣 ;
[0031] 3.6)計算矩陣
[0032] 3.7)對矩陣巧
[0033] 3.8)取出矩陣Q和A中對應(yīng)非零特征值的部分
[0034] 3.9)計算矩陣
[0035] 3.10)構(gòu)造隨 3
[0036] 3.11)對矩聞
進(jìn)行格拉姆-施密特正交化,并取出正交化后矩陣的最后R- r列為
[0037] 3.12)更新連續(xù)空間中編碼矩陣夫
[0038] 3.13)重復(fù)步驟3.2)至步驟3.12),直至二進(jìn)制編碼矩陣B和連續(xù)空間中編碼矩陣Y 收斂,則得到最終的訓(xùn)練用戶二進(jìn)制哈希編碼矩陣B。
[0039] 所述的步驟4)具體為:根據(jù)目標(biāo)用戶在不同視圖下的斤^數(shù)據(jù),利用步驟1.2)至 步驟1.4)得到目標(biāo)用戶到所有錯點的轉(zhuǎn)移概率向量
則目標(biāo)用戶對應(yīng)的二 進(jìn)制哈希編碼為bq=S即(Pq八-VB)。
[0040] 所述的步驟5)具體為:根據(jù)步驟4)得到的目標(biāo)用戶二進(jìn)制哈希編碼和步驟3)得到 的訓(xùn)練用戶二進(jìn)制哈希編碼矩陣,計算目標(biāo)用戶編碼到所有訓(xùn)練用戶編碼之間的漢明距 離,選取漢明距離最小的n個用戶作為目標(biāo)用戶的相似用戶集合U,并記錄相似用戶集合中 的用戶哈希編碼與目標(biāo)用戶哈希編碼之間對應(yīng)的漢明距離。
[0041] 所述的步驟6)包括W下子步驟:
[0042] 6.1)計算捜索得到的相似用戶與目標(biāo)用戶之間的相似度戈
,其中di表示 步驟5)中得到的相似用戶i與目標(biāo)用戶對應(yīng)哈希編碼之間的漢明距離;
[0043] 6.2)將相似用戶集合對應(yīng)的偏好物品集合進(jìn)行歸并,忽略目標(biāo)用戶曾經(jīng)選擇過的 物品,得到目標(biāo)用戶的偏好物品候選集合I;
[0044] 6.3)對于偏好物品候選集合中的每一個物品,計算目標(biāo)用戶對物品的偏好評分預(yù) 測值
串中Su表示步驟6.1)中得到的相似用戶與目標(biāo)用戶之間的相似 度,表示用戶U對物品i的評分,若無評分則視為零分,Ni表示相似用戶集合眾對該物品做 出過有效評分的用戶數(shù)量;
[0045] 6.4)根據(jù)步驟6.3)計算得到的目標(biāo)用戶對候選物品的偏好預(yù)測評分進(jìn)行排序,將 排名前K的候選物品作為最終推薦結(jié)果。
[0046] 本發(fā)明的有益效果是:本發(fā)明根據(jù)個性化推薦中的多視圖、大規(guī)模數(shù)據(jù)場景,將多 試圖哈希學(xué)習(xí)算法與基于協(xié)同過濾的推薦技術(shù)相結(jié)合,融合了不同來源、不同類型的多視 圖用戶數(shù)據(jù),提高了對用戶相似度評估的質(zhì)量,從而提高了推薦結(jié)果的質(zhì)量;此外,通過將 用戶表示為對應(yīng)的二進(jìn)制哈希編碼,實現(xiàn)了快速的相似用戶捜索,極大提高了推薦結(jié)果計 算的效率。
【附圖說明】
[0047] 圖1是本發(fā)明基于多視圖錯點圖哈希技術(shù)的個性化推薦方法流程圖。
【具體實施方式】
[0048] 下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)說明。
[0049] 如圖1所示,本發(fā)明一種基于多視圖錯點圖哈希技術(shù)的個性化推薦方法,包括W下 步驟:
[0050] 1)根據(jù)訓(xùn)練用戶在不同視圖下的行為數(shù)據(jù),構(gòu)建用戶數(shù)據(jù)的多視圖錯點圖表示; 具體包括W下子步驟:
[0051] 1.1)對于訓(xùn)練用戶在第i個視圖下的行為數(shù)據(jù)矩陣扭E驚NXdi,其中N表示訓(xùn)練 用戶的數(shù)量,di表示第i個視圖下用戶數(shù)據(jù)的維度,利用K-means聚類方法生成Tl個聚類中 屯、,作為該視圖下數(shù)據(jù)的錯點,Tl的取值與用戶數(shù)量相關(guān),一般取為N/200左右,但必須大于 設(shè)定的哈希編碼的位數(shù)R;
[0化^ 1.2)將不同視圖下的訓(xùn)練用戶數(shù)據(jù)進(jìn)行水平連接得到矩陣X =悼,X2,,XM}e INXdtMai:, 其中M表示視圖的數(shù)量,dtDtal表示所有視圖下用戶數(shù)據(jù)的維度之和;
[0053] 1.3)對于每個訓(xùn)練用戶,捜索該用戶在各視圖下最近鄰的2個錯點,組成集合 U! 6取ZX心,利用不同視圖下的最近鄰錯點集合構(gòu)建對角矩陣化=diag郵巧,…,Uf) e H2MXdwai';
[0054] 1.4)對于每個訓(xùn)練用戶,利用化Sterov梯度方法和投影梯度方法求解優(yōu)化問題
,其中G聰1X2W表示該用戶到所有最近鄰錯點的轉(zhuǎn)移概率, 初值均為康示矩陣X的第i行;
[0055] 1.5)將用戶到非最近鄰錯點的轉(zhuǎn)移概率設(shè)定為0,根據(jù)得到的各用戶到最近鄰錯 點的轉(zhuǎn)移概率,得到所有用戶到所有錯點的轉(zhuǎn)移概率矩陣P G膠WxTtotal,其中TtDtai表示所 有視圖下錯點數(shù)量的總和,運個轉(zhuǎn)移概率矩陣就是所構(gòu)建的用戶數(shù)據(jù)的多視圖錯點圖表 /J、- O
[0056] 2)利用多視圖錯點圖與訓(xùn)練用戶的行為數(shù)據(jù)生成連續(xù)空間中的用戶哈希編碼;具 體包括W下子步驟:
[0057] 2.1)計算得到轉(zhuǎn)移概率矩陣P的列和向量V G E-IXTtotal;
[0化引 2.2)構(gòu)造對角
[0化9] 2.3)計算矩陣
[0060] 2.4)計算矩陣M的除IW外的最大R個特征值對應(yīng)的特征向量護(hù)G股TtMazXK;
[0061] 2.5)計算訓(xùn)練用戶對應(yīng)的連續(xù)空間中哈希編碼矩P
[0062] 3)對連續(xù)空間中的哈希編碼進(jìn)行量化,得到訓(xùn)練用戶對應(yīng)的二進(jìn)制哈希編碼;具 體包括W下子步驟:
[0063] 3.1)使用符號二值化方法計算二進(jìn)制編碼矩陣的初值B = Sgn(Y),其中Sgn表示符 號函數(shù),對于負(fù)數(shù)返回-1,否則返回1;
[0064] 3.2)計算當(dāng)前二進(jìn)制編碼梯度矩巧
,其中P表示二 進(jìn)制編碼的相似度保留程度與編碼各位平衡無關(guān)程度的平衡參數(shù);
[0065] 3.3)根據(jù)計算得到的梯度矩陣中各元素的符號更新二進(jìn)制編碼矩陣對應(yīng)位置上 的值;
[0066] 3.4)重復(fù)步驟3.2)和步驟3.3 ),直至二進(jìn)制編碼矩陣則欠斂;
[0067] 3.5)計算矩[
[0068] 3.6)計算矩[
[0069] 3.7)對矩陣 f
[0070] 3.8)取出矩陣Q和A中對應(yīng)非零特征值的部巧
[0071] 3.9)計算矩時
[0072] 3.10)構(gòu)造隨 ^
[0073] 3.11)對矩陣[1. Ur巧]進(jìn)行格拉姆-施密特正交化,并取出正交化后矩陣的最后R- 巧U為i
;
[0074] 3.12)更新連續(xù)空間中編碼矩陣為
[00巧]3.13)重復(fù)步驟3.2)至步驟3.12),直至二進(jìn)制編碼矩陣B和連續(xù)空間中編碼矩陣Y 收斂,則得到最終的訓(xùn)練用戶二進(jìn)制哈希編碼矩陣B。
[0076] 4)利用多視圖錯點圖、訓(xùn)練用戶的二進(jìn)制哈希編碼及目標(biāo)用戶的行為數(shù)據(jù)生成目 標(biāo)用戶對應(yīng)的二進(jìn)制哈希編碼;具體為:根據(jù)目標(biāo)用戶在不同視圖下的行為數(shù)據(jù),利用步驟 1.2)至步驟1.4)得到目標(biāo)用戶到所有錯點的轉(zhuǎn)移概率向量Pq e藍(lán)IxTtntai,則目標(biāo)用戶對 應(yīng)的二進(jìn)制哈希編碼為bq = S即(Pq A -IpTB)。
[0077] 5)利用得到的目標(biāo)用戶和訓(xùn)練用戶的哈希編碼為目標(biāo)用戶捜索相似用戶;具體 為:根據(jù)步驟4得到的目標(biāo)用戶二進(jìn)制哈希編碼和步驟3得到的訓(xùn)練用戶二進(jìn)制哈希編碼矩 陣,計算目標(biāo)用戶編碼到所有訓(xùn)練用戶編碼之間的漢明距離。選取漢明距離最小的n個用戶 作為目標(biāo)用戶的相似用戶集合U,并記錄相似用戶集合中的用戶哈希編碼與目標(biāo)用戶哈希 編碼之間對應(yīng)的漢明距離,n-般可取50至80左右。
[0078] 6)將相似用戶對應(yīng)的偏好物品集合作為推薦候選列表,計算目標(biāo)用戶對候選物品 的偏好程度,返回偏好程度最大的K個物品作為推薦結(jié)果,K表示推薦結(jié)果的數(shù)量。具體包括 W下子步驟:
[0079] 6.1)計算捜索得到的相似用戶與目標(biāo)用戶之間的相似度呆
癢中di表示 步驟5)中得到的相似用戶i與目標(biāo)用戶對應(yīng)哈希編碼之間的漢明距離;
[0080] 6.2)將相似用戶集合對應(yīng)的偏好物品集合進(jìn)行歸并,忽略目標(biāo)用戶曾經(jīng)選擇過的 物品,得到目標(biāo)用戶的偏好物品候選集合I;
[0081] 6.3)對于偏好物品候選集合中的每一個物品,計算目標(biāo)用戶對物品的偏好評分預(yù) 測值
,其中Su表示步驟6.1)中得到的相似用戶與目標(biāo)用戶之間的相似 度,表示用戶U對物品i的評分,若無評分則視為零分,Ni表示相似用戶集合眾對該物品做 出過有效評分的用戶數(shù)量;
[0082] 6.4)根據(jù)步驟6.3)計算得到的目標(biāo)用戶對候選物品的偏好預(yù)測評分進(jìn)行排序,將 排名前K的候選物品作為最終推薦結(jié)果,在實際應(yīng)用中,k 一般可取5至20左右。
【主權(quán)項】
1. 一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法,其特征在于,包括以下步驟: 1) 根據(jù)訓(xùn)練用戶在不同視圖下的行為數(shù)據(jù),構(gòu)建用戶數(shù)據(jù)的多視圖錨點圖表示; 2) 利用多視圖錨點圖與訓(xùn)練用戶的行為數(shù)據(jù)生成連續(xù)空間中的用戶哈希編碼; 3) 對連續(xù)空間中的哈希編碼進(jìn)行量化,得到訓(xùn)練用戶對應(yīng)的二進(jìn)制哈希編碼; 4) 利用多視圖錨點圖、訓(xùn)練用戶的二進(jìn)制哈希編碼及目標(biāo)用戶的行為數(shù)據(jù)生成目標(biāo)用 戶對應(yīng)的二進(jìn)制哈希編碼; 5) 利用得到的目標(biāo)用戶和訓(xùn)練用戶的哈希編碼為目標(biāo)用戶搜索相似用戶; 6) 將相似用戶對應(yīng)的偏好物品集合作為推薦候選列表,計算目標(biāo)用戶對候選物品的偏 好程度,返回偏好程度最大的K個物品作為推薦結(jié)果,K表示推薦結(jié)果的數(shù)量。2. 根據(jù)權(quán)利要求1所述一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法,其特征在 于,所述的步驟1)包括以下子步驟: 1.1) 對于訓(xùn)練用戶在第i個視圖下的行為數(shù)據(jù)矩陣g e ENxdi,其中N表示訓(xùn)練用戶的 數(shù)量,cU表示第i個視圖下用戶數(shù)據(jù)的維度,利用K-means聚類方法生成個聚類中心,作為 該視圖下數(shù)據(jù)的錨點,!^的取值與用戶數(shù)量相關(guān),大于設(shè)定的哈希編碼的位數(shù)R; 1.2) 將不同視圖下的訓(xùn)練用戶數(shù)據(jù)進(jìn)行水平連接得到矩陣X = {AXU,e 其中Μ表示視圖的數(shù)量,dtcltal表示所有視圖下用戶數(shù)據(jù)的維度之和; 1.3) 對于每個訓(xùn)練用戶,搜索該用戶在各視圖下最近鄰的2個錨點,組成集合 以e通2X氣利用不同視圖下的最近鄰錨點集合構(gòu)建對角矩陣% tdiag^u?,...,uh e 1.4) 對于每個訓(xùn)練用戶,利用Nesterov梯度方法和投影梯度方法求解優(yōu)化問題良示該用戶到所有最近鄰錨點的轉(zhuǎn)移概率, 初值均為^,xi表示矩陣X的第i行; 1.5) 將用戶到非最近鄰錨點的轉(zhuǎn)移概率設(shè)定為0,根據(jù)得到的各用戶到最近鄰錨點的 轉(zhuǎn)移概率,得到所有用戶到所有錨點的轉(zhuǎn)移概率矩陣p j|NxTtatal,其中Ttcital表示所有視 圖下錨點數(shù)量的總和,這個轉(zhuǎn)移概率矩陣就是所構(gòu)建的用戶數(shù)據(jù)的多視圖錨點圖表示。3. 根據(jù)權(quán)利要求1所述一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法,其特征在 于,所述的步驟2)包括以下子步驟: 2.1) 計算得到轉(zhuǎn)移概率矩陣P的列和向量V e 2.2) 構(gòu)造對角矩罔2.3) 計算矩庫2.4) 計算矩陣_勺除1以外的最大1?個特征值對應(yīng)的特征向量\^£膠7^~>^; 2.5) 計算訓(xùn)練用戶對應(yīng)的連續(xù)空間中哈希編碼矩罔4. 根據(jù)權(quán)利要求1所述一種基于多視圖錨點圖哈希技術(shù)的個性化推薦萬法,其特征在 于,所述的步驟3)包括以下子步驟: 3.1)使用符號二值化方法計算二進(jìn)制編碼矩陣的初值B = sgn (Υ),其中sgn表示符號函 數(shù),對于負(fù)數(shù)返回-1,否則返回1; 3.2) 計算當(dāng)前二進(jìn)制編碼梯度矩:中P表不二進(jìn)制 編碼的相似度保留程度與編碼各位平衡無關(guān)程度的平衡參數(shù); 3.3) 根據(jù)計算得到的梯度矩陣中各元素的符號更新二進(jìn)制編碼矩陣對應(yīng)位置上的值; 3.4) 重復(fù)步驟3.2)和步驟3.3 ),直至二進(jìn)制編碼矩陣B收斂; 3.5) 計算矩¥ ^3.6) 計算矩陣,一 j; 3.7) 對矩陣T進(jìn)行特征分解為T = Q Λ QT; 3.8) 取出矩陣Q和Λ中對應(yīng)非零特征值的部夕3.9) 計算矩p3.1〇)構(gòu)造隨機(jī)矩陣0£11_(|?一7^ 3.11) 對矩陣|'11^^|進(jìn)行格拉姆-施密特正交化,并取出正交化后矩陣的最后1?1列為3.12) 更新連續(xù)空間中編碼矩陣)3.13) 重復(fù)步驟3.2)至步驟3.12),直至二進(jìn)制編碼矩陣Β和連續(xù)空間中編碼矩陣Υ收 斂,則得到最終的訓(xùn)練用戶二進(jìn)制哈希編碼矩陣Β。5. 根據(jù)權(quán)利要求1所述一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法,其特征在 于,所述的步驟4)具體為:根據(jù)目標(biāo)用戶在不同視圖下的行為數(shù)據(jù),利用步驟1.2)至步驟 1.4)得到目標(biāo)用戶到所有錨點的轉(zhuǎn)移概率向量Pg 6 ,則目標(biāo)用戶對應(yīng)的二進(jìn)制 哈希編碼為bq = Sgn(Pq Λ - Vb)。6. 根據(jù)權(quán)利要求1所述一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法,其特征在 于,所述的步驟5)具體為:根據(jù)步驟4)得到的目標(biāo)用戶二進(jìn)制哈希編碼和步驟3)得到的訓(xùn) 練用戶二進(jìn)制哈希編碼矩陣,計算目標(biāo)用戶編碼到所有訓(xùn)練用戶編碼之間的漢明距離,選 取漢明距離最小的η個用戶作為目標(biāo)用戶的相似用戶集合U,并記錄相似用戶集合中的用戶 哈希編碼與目標(biāo)用戶哈希編碼之間對應(yīng)的漢明距離。7. 根據(jù)權(quán)利要求1所述一種基于多視圖錨點圖哈希技術(shù)的個性化推薦方法,其特征在 于,所述的步驟6)包括以下子步驟: 6.1) 計算搜索得到的相似用戶與目標(biāo)用戶之間的相似度為_cU表示步驟 5)中得到的相似用戶i與目標(biāo)用戶對應(yīng)哈希編碼之間的漢明距離; 6.2) 將相似用戶集合對應(yīng)的偏好物品集合進(jìn)行歸并,忽略目標(biāo)用戶曾經(jīng)選擇過的物 品,得到目標(biāo)用戶的偏好物品候選集合I; 6.3) 對于偏好物品候選集合中的每一個物品,計算目標(biāo)用戶對物品的偏好評分預(yù)測值,其中^表示步驟6.1)中得到的相似用戶與目標(biāo)用戶之間的相似度, rul表示用戶u對物品i的評分,若無評分則視為零分,化表示相似用戶集合眾對該物品做出 過有效評分的用戶數(shù)量; 6.4)根據(jù)步驟6.3)計算得到的目標(biāo)用戶對候選物品的偏好預(yù)測評分進(jìn)行排序,將排名 前K的候選物品作為最終推薦結(jié)果。
【文檔編號】G06F17/30GK105956093SQ201610285239
【公開日】2016年9月21日
【申請日】2016年4月29日
【發(fā)明人】張寅 , 魏寶剛, 金登科
【申請人】浙江大學(xué)