亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

在位置社交網(wǎng)絡中基于時間分布相對熵的好友推薦方法與流程

文檔序號:11263590閱讀:335來源:國知局
在位置社交網(wǎng)絡中基于時間分布相對熵的好友推薦方法與流程

本發(fā)明屬于無線網(wǎng)絡技術領域,涉及在線社交網(wǎng)絡的好友推薦方法,可應用于基于位置的在線社交網(wǎng)絡服務。



背景技術:

基于位置的社交網(wǎng)絡幫助用戶在線分享他們的實時位置以便于用戶可以發(fā)現(xiàn)感興趣的位置并結交朋友。例如,用戶可以通過好友分享的位置發(fā)現(xiàn)自己感興趣的地點,或者通過查找與自己分享相似地點的用戶來結交新的好友。此外,隨著智能手機的普及,其內(nèi)置的gps模塊可以更加精確的探測用戶的位置,使得用戶可以更加便利的分享各自的位置。因此,這種簽到服務吸引了越來越多的用戶。如何使用大量的簽到信息為用戶進行好友推薦需要得到重視。

推薦系統(tǒng)在社交網(wǎng)絡和電子商務網(wǎng)站中扮演了重要的角色,在電子商務網(wǎng)站中,現(xiàn)有的推薦系統(tǒng)通常使用用戶的購買記錄來分析用戶的偏好,正如電子商務網(wǎng)站的購買記錄,用戶在基于位置的社交網(wǎng)絡中的簽到歷史也包含了大量的關于用戶偏好的信息。

在使用用戶的簽到信息進行好友推薦時,由于用戶通常只會在數(shù)據(jù)庫中的一小部分地點進行簽到行為,因此進行好友推薦的可用數(shù)據(jù)較為稀疏。為了緩解數(shù)據(jù)稀疏的問題,現(xiàn)有方案分為如下幾種:根據(jù)簽到地點的密度進行分類,將一些地理位置較為接近的簽到地點看作同一個簽到地點;使用用戶好友的簽到數(shù)據(jù)填充到用戶的簽到數(shù)據(jù)中。但是,地理位置接近的地點可能代表了用戶不同的興趣愛好,同樣,好友的愛好并不能完全代替用戶自身的興趣愛好,這兩種行為都在一定程度上降低了好友推薦的精度。

在考慮時間信息的推薦系統(tǒng)方面,現(xiàn)有系統(tǒng)多用在電子商務網(wǎng)站與電影推薦網(wǎng)站,通過分析用戶長期的購買記錄與電影的觀看記錄分析用戶的偏好來進行推薦。相比于長期的趨勢,用戶的簽到行為在一天的具體時間可以提供更多反映用戶偏好的信息。而在現(xiàn)有社交網(wǎng)絡推薦系統(tǒng)中,只通過分析簽到地點的時間屬性對簽到地點進行了分類,并未對用戶簽到行為的時間分布進行分析來進行好友推薦,因此推薦的準確率不夠理想。



技術實現(xiàn)要素:

本發(fā)明的目的在于針對上述已有技術的不足,提出一種在位置社交網(wǎng)絡中基于時間分布相對熵的好友推薦方法,以提高推薦的準確率。

本發(fā)明的技術思路是:通過將擁有相似語義信息的地點歸為一類,解決推薦系統(tǒng)中可用數(shù)據(jù)稀疏的問題,使用詞頻-逆文檔頻率平衡熱門地點與用戶自身的興趣,并選出用戶最感興趣的地點類別,同時通過計算用戶間簽到行為隨時間分布的相對熵,綜合考慮用戶感興趣的地點類別和用戶間的簽到分布相對熵,實現(xiàn)更加準確的好友推薦。其實現(xiàn)方案包括如下:

(1)建立一個由用戶、定位設施和社交網(wǎng)絡服務器構成的通信系統(tǒng),

(2)用戶將位置的經(jīng)緯度與當前的時間信息發(fā)送給社交網(wǎng)絡服務器,生成簽到信息;

(3)社交網(wǎng)絡服務器對存儲的簽到信息進行預處理:

(3a)針對簽到信息中的經(jīng)緯度查找服務器的位置語義數(shù)據(jù)庫,獲取與簽到地點對應的語義信息,再將每個用戶的簽到信息按其簽到地點的語義信息分類統(tǒng)計簽到次數(shù);

(3b)針對簽到信息中的時間信息,在步驟(3a)的基礎上,統(tǒng)計每個用戶在每個地點類別下的簽到行為隨時間的分布;

(4)根據(jù)用戶在各地點類別下簽到行為隨時間的分布,計算兩個用戶在相同地點類別下簽到分布的相對熵d(p||q),其中p和q分別為兩個不同用戶在相同地點類別的簽到次數(shù)隨時間的概率分布;

(5)根據(jù)用戶u在各地點類別下的簽到次數(shù),分別計算用戶u對于地點類別c的詞頻值tu,c和地點類別c的逆文檔頻率值ic,得到社交網(wǎng)絡服務器計算用戶u對于每個地點類別c的詞頻-逆文檔頻率分值f:

f=tu,c×ic

(6)根據(jù)用戶u對于每個地點類別c的詞頻-逆文檔頻率分值f,提取該用戶u最感興趣的地點類別:

(6a)對f中的逆文檔頻率值ic作冪運算,得到新的詞頻-逆文檔頻率分值f*=tu,c×icα,其中icα為逆文檔頻率值ic的α次冪;

(6b)選擇f*最高的m個地點類別作為用戶u最感興趣的地點類別,其中m和α由實驗確定;

(7)社交網(wǎng)絡服務器根據(jù)用戶最感興趣的地點類別,選取所有其他用戶中在這些地點類別下相對熵較小的n個用戶作為推薦結果發(fā)送給請求推薦的用戶,其中n的數(shù)量根據(jù)請求推薦的用戶所請求的好友推薦數(shù)量確定。

本發(fā)明與現(xiàn)有技術相比具有如下優(yōu)點:

1)本發(fā)明由于使用了簽到地點的語義信息進行分類,在緩解推薦可用數(shù)據(jù)稀疏性的同時,保持了較高的推薦精度。

2)本發(fā)明由于使用了詞頻-逆文檔頻率模型提取用戶感興趣的地點類別,平衡了熱門簽到地點與用戶自身的偏好。

3)本發(fā)明由于對用戶的簽到行為隨時間的分布進行了分析,并以用戶間簽到隨時間分布的相對熵為好友推薦的主要依據(jù),充分利用了簽到信息的地理信息與時間信息,從而保證了較高的推薦準確性。

附圖說明

圖1是本發(fā)明使用的通信系統(tǒng)框架圖;

圖2是本發(fā)明的實現(xiàn)流程圖;

圖3是本發(fā)明所用推薦方案與未考慮時間因素的推薦方案的推薦準確率對比圖;

圖4是本發(fā)明所用推薦方案與未考慮時間因素的推薦方案的推薦召回率對比圖。

具體實施方案

本發(fā)明的核心思想是在基于位置的社交網(wǎng)絡場景下,通過分析用戶簽到地點的語義信息將簽到數(shù)據(jù)進行分類以緩解可用數(shù)據(jù)較為稀疏的問題,并綜合分析了簽到地點的熱度,用戶個人的偏好以及用戶簽到行為隨時間的分布規(guī)律用來對用戶進行好友推薦,提高推薦的準確度。

參照圖2,本發(fā)明實現(xiàn)步驟如下:

步驟1,建立通信系統(tǒng)框架。

參照圖1,本步驟建立的通信系統(tǒng)包括:用戶、定位設施、社交網(wǎng)絡服務器,其中用戶與定位設施和社交網(wǎng)絡服務器均通過移動蜂窩網(wǎng)或wifi進行雙向無線連接;

所述用戶,包含應用模塊、數(shù)據(jù)庫模塊和gps模塊三個功能模塊;應用模塊主要用于生成并發(fā)送簽到信息給社交網(wǎng)絡服務器;gps模塊主要用于向定位設施查詢位置信息并向應用模塊提供用戶的地理位置信息;數(shù)據(jù)庫模塊主要用于存儲和管理用戶簽到和好友信息;

所述定位設施,主要包含gps模塊,該gps模塊主要用于對用戶的位置查詢進行響應并返回用戶的地理位置信息;

所述社交網(wǎng)絡服務器,包含應用模塊和數(shù)據(jù)庫模塊兩個功能模塊;應用模塊主要用于對用戶的簽到信息進行分析整理并為用戶的好友推薦請求返回推薦結果,數(shù)據(jù)庫模塊主要用于存儲用戶的簽到數(shù)據(jù)和簽到地點的語義信息。

步驟2,采集簽到信息。

用戶借助定位設施獲得自身所在的地理位置信息,并將此地理位置信息與當時的時間信息發(fā)送給社交網(wǎng)絡服務器生成簽到信息。

步驟3,社交網(wǎng)絡服務器對存儲的大量簽到信息進行預處理。

(3a)針對簽到信息中的地理位置信息,查找服務器的位置語義數(shù)據(jù)庫獲取與簽到地點對應的語義信息,然后將每個用戶的簽到信息按其簽到地點的語義信息分類統(tǒng)計簽到次數(shù);

(3b)針對簽到信息中的時間信息,將一天時間平均分成24個區(qū)間,統(tǒng)計用戶在地點類別c上每一時間區(qū)間上的簽到次數(shù)vc(i)和用戶在該地點類別總的簽到次數(shù)sc,得到用戶在地點類別c每一時間區(qū)間的簽到頻率pc(i)=vc(i)/sc,i=1,2,...,24,分別對應所劃分的24個時間區(qū)間,由此得到用戶在某個地點類別簽到行為隨時間的分布。

步驟4,根據(jù)用戶在各地點類別下簽到行為隨時間的分布,計算兩個用戶在某地點類別下簽到分布的相對熵d(p||q):

其中,pc為用戶up在地點類別c下簽到數(shù)據(jù)隨時間的概率分布,qc為另一用戶uq在地點類別c下簽到數(shù)據(jù)隨時間的概率分布;i=1,2,...,24,其分別對應步驟(3b)計算用戶簽到隨時間的概率分布時所劃分的24個時間區(qū)間。

步驟5,社交網(wǎng)絡服務器計算每個用戶u對于每個地點類別c的詞頻-逆文檔頻率分值f,并在此基礎上提取用戶最感興趣的地點類別。

(5a)社交網(wǎng)絡服務器計算用戶u在地點類別c下簽到信息的詞頻分值tu,c:

其中|cuc|表示用戶u在地點類別c下簽到的數(shù)量,|cu|表示用戶u的簽到總次數(shù);

(5b)社交網(wǎng)絡服務器計算每個地點類別c的逆文檔頻率分值ic:

其中,|u|表示服務器中所有用戶的數(shù)量,|uc|表示曾在地點類別c簽到的用戶的數(shù)量;

(5c)社交網(wǎng)絡服務器將用戶u在地點類別c下的詞頻分值tu,c與地點類別c的逆文檔頻率分值ic相乘,得到其在該地點類別下的詞頻-逆文檔頻率分值f:

f=tu,c×ic。

步驟6,根據(jù)用戶u對于每個地點類別c的詞頻-逆文檔頻率分值f,提取該用戶u最感興趣的地點類別。

(6a)對f中的逆文檔頻率值ic作冪運算,得到新的詞頻-逆文檔頻率分值f*=tu,c×icα,其中icα為逆文檔頻率值ic的α次冪;

(6b)選擇f*最高的m個地點類別作為用戶u最感興趣的地點類別,其中m和α由實驗確定。

步驟7,社交網(wǎng)絡服務器根據(jù)用戶最感興趣的地點類別,選取所有其他用戶中在這些地點類別下相對熵較小的n個用戶作為推薦結果發(fā)送給請求推薦的用戶。

(7a)將用戶最感興趣的地點類別下的用戶按相對熵升序排列;

(7b)選取用戶最感興趣的各地點類別下的前1個用戶,生成候選隊列;

(7c)判斷在這些候選隊列中同時出現(xiàn)的用戶數(shù)量:

如果有n個用戶同時出現(xiàn)在這些選中的列表中,則將這些用戶作為好友推薦的結果;

如果沒有n個用戶同時出現(xiàn)在這些選中的列表中,則選取用戶最感興趣的各地點類別下的前2個用戶,生成新的候選隊列,重新判斷,直到有n個用戶同時出現(xiàn)在這些列表中,其中n的數(shù)量根據(jù)請求推薦的用戶所請求的好友推薦數(shù)量確定。

本發(fā)明的效果可通過以下仿真實驗進一步說明:

1.實驗條件設置

條件1,在gowalla獲得簽到數(shù)據(jù)集,選取其中紐約市的簽到數(shù)據(jù)組成數(shù)據(jù)集合,并選取其中簽到數(shù)量大于100次的用戶的58715條簽到數(shù)據(jù)作為實驗的源數(shù)據(jù)。

條件2,在intel(r)corei3-2310mcpu(2.10ghz)處理器,4.00gb內(nèi)存,windows10家庭版32位操作系統(tǒng)的計算機上測試實驗的結果。

2.實驗內(nèi)容與結果

實驗1:本發(fā)明好友推薦方案與傳統(tǒng)好友推薦方案推薦準確率對比實驗。

將條件1中實驗數(shù)據(jù)平均分為3份,依次取其中一份作為測試集,其余兩份作訓練集,首先在訓練集上運行本發(fā)明的推薦方案,方案提取用戶最感興趣的地點類別數(shù)量m為2,得到推薦準確率最高的逆文檔頻率值ic的指數(shù)α,將α用于在測試集上提取用戶感興趣的地點類別,生成好友推薦結果;

在實驗數(shù)據(jù)集上運行未考慮時間因素的傳統(tǒng)好友推薦方案,得到相應的好友列表和推薦結果,最后對兩種推薦方法的準確率進行計算,計算公式如下:

其中r(u)表示真實數(shù)據(jù)集中用戶u的好友列表,t(u)表示好友推薦系統(tǒng)返回的用戶u的推薦結果,u表示數(shù)據(jù)集中所有的用戶;

比較本發(fā)明推薦方案與傳統(tǒng)好友推薦方案推薦結果的準確率隨推薦好友數(shù)量增加的變化情況,結果如圖3所示,其中本發(fā)明的推薦準確率取三次交叉驗證的平均值。

從圖3可見,本發(fā)明所用的好友推薦方案的準確率明顯高于未考慮時間因素的傳統(tǒng)的好友推薦方案,推薦準確率平均提升約9.1%。

實驗2:本發(fā)明好友推薦方案與傳統(tǒng)好友推薦方案推薦召回率對比實驗。

將條件1中實驗數(shù)據(jù)平均分為3份,依次取其中一份作為測試集,其余兩份作訓練集,首先在訓練集上運行本發(fā)明的推薦方案,方案提取用戶最感興趣的地點類別數(shù)量m為2,得到推薦準確率最高的逆文檔頻率值ic的指數(shù)α,將α用于在測試集上提取用戶感興趣的地點類別,生成好友推薦結果;隨后在實驗數(shù)據(jù)集上運行未考慮時間因素的傳統(tǒng)好友推薦方案得到相應的好友列表和推薦結果,最后對兩種推薦方法的召回率進行計算,計算公式如下:

其中r(u)表示真實數(shù)據(jù)集中用戶u的好友列表,t(u)表示好友推薦系統(tǒng)返回的用戶u的推薦結果,u表示數(shù)據(jù)集中所有的用戶。

比較本發(fā)明推薦方案與傳統(tǒng)好友推薦方案推薦結果的召回率隨推薦好友數(shù)量增加的變化情況,結果如圖4所示,其中本發(fā)明的推薦召回率取三次交叉驗證的平均值。

從圖4可見,本發(fā)明所用的方案召回率明顯高于未考慮時間的好友推薦方案,推薦召回率平均提升約19.0%。

綜上所述,本發(fā)明在推薦結果的準確率與召回率方面均優(yōu)于傳統(tǒng)的好友推薦系統(tǒng),可以為基于位置社交網(wǎng)絡的用戶提供質(zhì)量更高的好友推薦服務。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1