亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種協(xié)同過濾推薦方法及系統(tǒng)的制作方法

文檔序號:9667341閱讀:413來源:國知局
一種協(xié)同過濾推薦方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別涉及一種協(xié)同過濾推薦方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)通信技術(shù)的迅速發(fā)展,用戶可以從第三方視頻播放網(wǎng)站中觀看大量的視 頻項目。當面對大量可以進行播放的項目時,用戶無法快速找到自己感興趣的項目。
[0003] 現(xiàn)有技術(shù)中,可以使用聚類方式來完成項目推薦,該方式可以包括:按照用戶屬 性,將所有用戶分別聚集成多個類,使得聚集成的每一個類中所包括的用戶之間的相似性 盡可能大,各個類之間的相似性盡可能小,將同一個類中其他用戶感興趣的項目推薦給當 前用戶。
[0004] 然而,傳統(tǒng)聚類方式是通過用戶屬性進行聚類,對于某些屬性特征不明顯的用戶, 在進行聚類時容易造成聚類錯誤,因此傳統(tǒng)聚類方式實現(xiàn)的項目推薦準確率較低。

【發(fā)明內(nèi)容】

[0005] 有鑒于此,本發(fā)明提供一種協(xié)同過濾推薦方法及系統(tǒng),以提高項目推薦的準確率。
[0006] 第一方面,本發(fā)明提供了一種協(xié)同過濾推薦方法,包括:
[0007] 獲取用戶群組中每一個用戶分別感興趣的項目;
[0008] 確定每一個用戶對其感興趣的每一個項目的權(quán)重值;
[0009] 根據(jù)所述用戶群組中的每一個用戶分別感興趣的項目以及根據(jù)每一個用戶對其 感興趣的每一個項目的權(quán)重值,獲取推薦給每一個用戶的項目列表。
[0010] 優(yōu)選地,根據(jù)所述用戶群組中的每一個用戶分別感興趣的項目以及根據(jù)每一個用 戶對其感興趣的每一個項目的權(quán)重值,獲取推薦給每一個用戶的項目列表,包括:
[0011] 根據(jù)用戶群組中每一個用戶分別感興趣的項目生成項目-用戶矩陣;其中,所述 項目-用戶矩陣用于表征同時對任意兩個項目感興趣的用戶的個數(shù);
[0012] 根據(jù)每一個用戶對其感興趣的每一個項目的權(quán)重值生成權(quán)重矩陣;所述權(quán)重矩陣 中第i行第j列的項目用于表征用戶j對項目i賦予的權(quán)重值;
[0013] 根據(jù)所述項目-用戶矩陣與所述權(quán)重矩陣的乘積,確定推薦給每一個用戶的項目 列表。
[0014] 優(yōu)選地,所述確定推薦給每一個用戶的項目列表,包括:
[0015] 根據(jù)所述項目-用戶矩陣與所述權(quán)重矩陣的乘積,確定推薦給每一個用戶的初始 項目列表,其中,每一個用戶的初始項目列表中包括該用戶對每一個項目的總分值;
[0016] 按照總分值從大到小的順序?qū)γ恳粋€用戶的初始項目列表中的各個項目排序;
[0017] 將排序后的各個項目作為最終推薦給相應(yīng)用戶的項目列表。
[0018] 優(yōu)選地,所述確定每一個項目的權(quán)重值,包括:
[0019] 確定每一個項目的發(fā)生年代;
[0020] 根據(jù)發(fā)生年代,對各個項目賦權(quán)重值;其中,發(fā)生年代距離當前時間越近的項目, 權(quán)重值越大;反之,發(fā)生年代距離當前時間越遠的項目,權(quán)重值越小。
[0021] 優(yōu)選地,所述獲取用戶群組中每一個用戶分別感興趣的項目,包括:
[0022] 在用戶群組所對應(yīng)的每一臺日志服務(wù)器中,搭建Flume,并利用每一臺日志服務(wù)器 上搭建的該Flume采集相應(yīng)日志服務(wù)器中產(chǎn)生的日志信息;所述日志信息包括用戶標識、 項目標識和項目發(fā)生年代;
[0023] 將每一臺日志服務(wù)器上搭建的Flume將采集的日志信息發(fā)送給中轉(zhuǎn)Flume;
[0024] 利用中轉(zhuǎn)Flume將接收到的日志信息發(fā)送給HDFS進行存儲;
[0025] 利用MapReduce算法對存儲在HDFS中的日志信息進行分析,以確定每一個用戶分 別感興趣的項目。
[0026] 第二方面,本發(fā)明還提供了一種協(xié)同過濾推薦系統(tǒng),包括:
[0027] 第一獲取單元,用于獲取用戶群組中每一個用戶分別感興趣的項目;
[0028] 確定單元,用于確定每一個用戶對其感興趣的每一個項目的權(quán)重值;
[0029] 第二獲取單元,用于根據(jù)所述用戶群組中的每一個用戶分別感興趣的項目以及根 據(jù)每一個用戶對其感興趣的每一個項目的權(quán)重值,獲取推薦給每一個用戶的項目列表。
[0030] 優(yōu)選地,所述第二獲取單元,具體用于根據(jù)用戶群組中每一個用戶分別感興趣的 項目生成項目-用戶矩陣;其中,所述項目-用戶矩陣用于表征同時對任意兩個項目感興 趣的用戶的個數(shù);根據(jù)每一個用戶對其感興趣的每一個項目的權(quán)重值生成權(quán)重矩陣;所述 權(quán)重矩陣中第i行第j列的項目h用于表征用戶j對項目i賦予的權(quán)重值;根據(jù)所述項 目-用戶矩陣與所述權(quán)重矩陣的乘積,確定推薦給每一個用戶的項目列表。
[0031] 優(yōu)選地,所述第二獲取單元,具體用于根據(jù)所述項目-用戶矩陣與所述權(quán)重矩陣 的乘積,確定推薦給每一個用戶的初始項目列表,其中,每一個用戶的初始項目列表中包括 該用戶對每一個項目的總分值;按照總分值從大到小的順序?qū)γ恳粋€用戶的初始項目列表 中的各個項目排序;將排序后的各個項目作為最終推薦給相應(yīng)用戶的項目列表。
[0032] 優(yōu)選地,所述確定單元,具體用于確定每一個項目的發(fā)生年代;根據(jù)發(fā)生年代,對 各個項目賦權(quán)重值;其中,發(fā)生年代距離當前時間越近的項目,權(quán)重值越大;反之,發(fā)生年 代距離當前時間越遠的項目,權(quán)重值越小。
[0033] 優(yōu)選地,所述第一獲取單元,具體用于在用戶群組所對應(yīng)的每一臺日志服務(wù)器中, 搭建Flume,并利用每一臺日志服務(wù)器上搭建的該Flume采集相應(yīng)日志服務(wù)器中產(chǎn)生的日 志信息;所述日志信息包括用戶標識、項目標識和項目發(fā)生年代;將每一臺日志服務(wù)器上 搭建的Flume將采集的日志信息發(fā)送給中轉(zhuǎn)Flume;利用中轉(zhuǎn)Flume將接收到的日志信息 發(fā)送給HDFS進行存儲;利用MapReduce算法對存儲在HDFS中的日志信息進行分析,以確定 每一個用戶分別感興趣的項目。
[0034] 本發(fā)明實施例提供了一種協(xié)同過濾推薦方法及系統(tǒng),通過獲取用戶群組中每一個 用戶分別感興趣的項目,以及確定每一個用戶對其感興趣的每一個項目的權(quán)重值,來最終 確定推薦給每一個用戶的項目列表,通過結(jié)合每一個用戶所感興趣的項目,以及每一個用 戶對感興趣的每個項目賦予的權(quán)重值,來確定項目列表,可以提高項目推薦的準確率。
【附圖說明】
[0035] 圖1是本發(fā)明實施例提供的方法流程圖;
[0036] 圖2是本發(fā)明另一實施例提供的方法流程圖;
[0037]圖3是本發(fā)明實施例提供的日志信息采集系統(tǒng)示意圖;
[0038]圖4是本發(fā)明實施例提供的協(xié)同過濾推薦系統(tǒng)的硬件架構(gòu)圖;
[0039]圖5是本發(fā)明實施例提供的協(xié)同過濾推薦系統(tǒng)結(jié)構(gòu)示意圖。
【具體實施方式】
[0040] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述。顯然,所描述的實施例僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本 發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實 施例,都屬于本發(fā)明保護的范圍。
[0041] 如圖1所示,本發(fā)明實施例提供了一種協(xié)同過濾推薦方法,該方法可以包括以下 步驟:
[0042] 步驟101:獲取用戶群組中每一個用戶分別感興趣的項目。
[0043] 步驟102:確定每一個用戶對其感興趣的每一個項目的權(quán)重值。
[0044] 步驟103:根據(jù)所述用戶群組中的
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1