一種基于協(xié)作的推薦系統(tǒng)及其工作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于協(xié)作的推薦系統(tǒng)及其工作方法,屬于推薦系統(tǒng)的技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時(shí)代走入了信息過(guò)載的時(shí) 代,在這個(gè)時(shí)代,無(wú)論是信息消費(fèi)者還是信息生產(chǎn)者都遇到了很大的挑戰(zhàn):作為信息消費(fèi) 者,如何從大量信息中找到自己感興趣的信息是一件非常困難的事情;而作為信息生產(chǎn)者, 如何讓自己生產(chǎn)的信息脫穎而出,受到廣大用戶的關(guān)注,也是一件非常困難的事情。搜索引 擎是一種具有代表性的解決信息過(guò)載的方法,用戶通過(guò)關(guān)鍵詞搜索可以快速找到自己需要 的信息。但是,搜索引擎需要用戶主動(dòng)提供準(zhǔn)確的關(guān)鍵詞,因此不能解決用戶的很多其他需 求,比如當(dāng)用戶無(wú)法找到準(zhǔn)確描述自己需求的關(guān)鍵詞時(shí),搜索引擎就無(wú)法得到理想的效果。
[0003] 推薦系統(tǒng)是一種幫助用戶快速發(fā)現(xiàn)有用信息的工具。和現(xiàn)有搜索引擎不同的是, 推薦系統(tǒng)不需要用戶提供明確的需求,而是通過(guò)分析用戶的歷史行為給用戶的興趣建模, 從而主動(dòng)為用戶推薦能夠滿足他們潛在興趣和需求的信息。因此,相對(duì)于用戶來(lái)說(shuō),搜索引 擎和推薦系統(tǒng)是兩個(gè)互補(bǔ)的工具:搜索引擎滿足了用戶有明確目的時(shí)的主動(dòng)查找需求,而 推薦系統(tǒng)能夠在用戶沒(méi)有明確目的的情況下幫助他們發(fā)現(xiàn)感興趣的新內(nèi)容。在電子商務(wù)應(yīng) 用領(lǐng)域,推薦系統(tǒng)通過(guò)分析用戶的行為信息,挖掘用戶的個(gè)性化需求,從而將長(zhǎng)尾商品準(zhǔn)確 地推薦給用戶,幫助用戶找到那些他們感興趣但很難發(fā)現(xiàn)的商品。
[0004] 在當(dāng)今大數(shù)據(jù)環(huán)境下,可以獲取用戶數(shù)據(jù)的智能設(shè)備越來(lái)越多,然而就某個(gè)特定 的獨(dú)立的推薦系統(tǒng)可能存在用戶數(shù)據(jù)不足的問(wèn)題,即推薦系統(tǒng)中的冷啟動(dòng)問(wèn)題。現(xiàn)有冷啟 動(dòng)問(wèn)題的解決方案一般是向新用戶推薦熱門物品,但這種解決方式向用戶提供的是粗粒度 的個(gè)性化推薦,因此,如何處理和利用特定用戶的多源數(shù)據(jù),提供準(zhǔn)確的面向特定用戶的個(gè) 性化服務(wù)就成了推薦系統(tǒng)面臨的一大挑戰(zhàn)。
【發(fā)明內(nèi)容】
[0005] 針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明公開(kāi)了一種基于協(xié)作的推薦系統(tǒng);
[0006] 本發(fā)明還公開(kāi)了上述系統(tǒng)的工作方法;
[0007] 推薦系統(tǒng)旨在通過(guò)分析和利用用戶歷史行為信息向用戶提供主動(dòng)式的推薦服務(wù)。 協(xié)作機(jī)制是一個(gè)數(shù)據(jù)融合的過(guò)程,解決了單一推薦系統(tǒng)中的冷啟動(dòng)問(wèn)題,使推薦系統(tǒng)提供 的服務(wù)能準(zhǔn)確地契合用戶個(gè)性化需求。
[0008] 本發(fā)明的技術(shù)方案為:
[0009] 一種基于協(xié)作的推薦系統(tǒng),包括:邊緣系統(tǒng)模塊、協(xié)作中心系統(tǒng)模塊、目標(biāo)系統(tǒng)模 塊,所述邊緣系統(tǒng)模塊、所述協(xié)作中心系統(tǒng)模、所述目標(biāo)系統(tǒng)模塊依次連接;
[0010] 所述邊緣系統(tǒng)模塊采集和存儲(chǔ)用戶信息并向所述協(xié)作中心系統(tǒng)模塊提供所需的 特定用戶信息;所述協(xié)作中心系統(tǒng)模塊響應(yīng)所述目標(biāo)系統(tǒng)模塊的協(xié)作請(qǐng)求,向所述邊緣系 統(tǒng)模塊發(fā)出協(xié)作請(qǐng)求,并對(duì)從所述邊緣系統(tǒng)模塊獲取的用戶信息進(jìn)行不一致性消除和推理 融合,向所述目標(biāo)系統(tǒng)模塊輸出所需的特定用戶數(shù)據(jù);所述目標(biāo)系統(tǒng)模塊向用戶提供個(gè)性 化推薦服務(wù),在冷啟動(dòng)時(shí)向所述協(xié)作中心系統(tǒng)模塊發(fā)起協(xié)作請(qǐng)求。
[0011] 根據(jù)本發(fā)明優(yōu)選的,所述目標(biāo)系統(tǒng)模塊包括:用戶數(shù)據(jù)庫(kù)單元、推薦引擎單元、初 始推薦單元、過(guò)濾單元、排名單元、推薦結(jié)果展示及解釋單元、用戶單元,所述用戶數(shù)據(jù)庫(kù)單 元包括情景信息模塊和行為信息模塊,所述用戶數(shù)據(jù)庫(kù)單元、所述推薦引擎單元、所述初 始推薦單元、所述過(guò)濾單元、所述排名單元、所述推薦結(jié)果展示及解釋單元、所述用戶單元 依次連接,所述用戶單元與所述用戶數(shù)據(jù)庫(kù)單元相連。
[0012] 根據(jù)本發(fā)明優(yōu)選的,所述用戶數(shù)據(jù)庫(kù)單元用來(lái)存儲(chǔ)用戶信息,用戶信息包括行為 信息和情景信息,所述行為信息是指用戶使用過(guò)某一物品并對(duì)其進(jìn)行評(píng)分,所述情景信息 是指用戶所處的周圍環(huán)境信息,如時(shí)間,地點(diǎn)等信息。用戶信息為多維笛卡爾乘積形式;比 如"用戶AsX物品BsX時(shí)間CsX地點(diǎn)DsX評(píng)分",其含義為用戶As在時(shí)間Cs在地點(diǎn)Ds 對(duì)物品Bs評(píng)分;根據(jù)用戶反饋信息獲取方式的不同,所述評(píng)分包括兩種:一種是顯式評(píng)分 信息,即用戶As對(duì)物品Bs直接給予的打分信息,二是隱式評(píng)分信息,即通過(guò)分析用戶As的 行為間接給出的評(píng)分信息。所述推薦引擎單元提取出所述用戶信息,并通過(guò)基于物品的協(xié) 同過(guò)濾算法即itemCF算法得到初始推薦結(jié)果;所述初始推薦單元存儲(chǔ)經(jīng)過(guò)所述推薦引擎 單元得到的初始推薦結(jié)果;所述過(guò)濾單元采用三種策略逐步對(duì)得到的初始推薦結(jié)果進(jìn)行過(guò) 濾;所述排名單元對(duì)經(jīng)過(guò)所述過(guò)濾單元得到的推薦結(jié)果進(jìn)行排名,對(duì)熱門物品進(jìn)行降權(quán), 熱門物品是指推薦結(jié)果中流行度較高的物品;所述推薦結(jié)果展示及解釋單元用于展示經(jīng)過(guò) 所述排名單元得到的推薦結(jié)果,并向用戶解釋推薦結(jié)果的理由,得到最終推薦結(jié)果;所述用 戶單元接受所述最終推薦結(jié)果,并將用戶對(duì)最終推薦結(jié)果服務(wù)滿意度信息反饋到所述用戶 數(shù)據(jù)庫(kù)單元中。
[0013] 根據(jù)本發(fā)明優(yōu)選的,所述過(guò)濾單元采用三種策略逐步對(duì)得到的初始推薦結(jié)果進(jìn)行 過(guò)濾,具體步驟包括:首先,過(guò)濾掉用戶已經(jīng)使用過(guò)的物品,保證推薦結(jié)果的新穎性;其次, 過(guò)濾掉不符合候選條件的物品,所述候選條件是指用戶已經(jīng)設(shè)定的選擇條件,比如用戶確 定的價(jià)格區(qū)間;最后,過(guò)濾掉某些質(zhì)量很差的物品,即評(píng)分較低的物品。
[0014] 對(duì)熱門物品進(jìn)行降權(quán),如果給用戶推薦的全是流行的、大眾的物品,推薦系統(tǒng)就 無(wú)法挖掘用戶的潛在興趣,那么推薦就失去了其意義。
[0015] 根據(jù)本發(fā)明優(yōu)選的,所述協(xié)作中心系統(tǒng)模塊包括知識(shí)庫(kù)單元、行為聚合單元、情景 聚合單元、數(shù)據(jù)不一致性檢測(cè)消除單元、數(shù)據(jù)推理融合單元,所述知識(shí)庫(kù)單元、所述行為聚 合單元、所述情景聚合單元、所述數(shù)據(jù)不一致性檢測(cè)消除單元、所述數(shù)據(jù)推理融合單元依次 相連接;所述數(shù)據(jù)融合單元與所述知識(shí)庫(kù)單元相連。
[0016] 根據(jù)本發(fā)明優(yōu)選的,所述知識(shí)庫(kù)單元為所述推薦系統(tǒng)的知識(shí)存儲(chǔ)中心,用于存儲(chǔ) 所述目標(biāo)系統(tǒng)模塊和所述邊緣系統(tǒng)模塊中各組成單元的數(shù)據(jù)庫(kù)中的用戶信息;所述行為聚 合單元對(duì)所述目標(biāo)系統(tǒng)模塊中的物品和所述邊緣系統(tǒng)模塊中的同用戶使用過(guò)的其他物品 進(jìn)行聚合,所述行為聚合單元根據(jù)物品屬性給物品標(biāo)記標(biāo)簽,選取標(biāo)簽集合交集超過(guò)閾值 的行為聚合為同一物品,所述閾值的取值范圍為6-12 ;所述物品屬性是指,比如物品的作 者、主題、生產(chǎn)日期和造型風(fēng)格等;所述情景聚合單元計(jì)算用戶不同情景信息的相似度,選 取相似度較高的情景信息進(jìn)行融合;所述數(shù)據(jù)不一致性檢測(cè)消除單元根據(jù)信息不一致性消 除算法,消除從所述邊緣系統(tǒng)模塊和所述目標(biāo)系統(tǒng)模塊獲得的用戶信息之間的不一致性; 所述數(shù)據(jù)不一致性檢測(cè)消除算法包括:基于可信度的信息不一致性消除算法、基于投票法 的信息不一致性消除算法以及基于證據(jù)論的信息不一致性消除算法;所述數(shù)據(jù)推理融合單 元根據(jù)經(jīng)過(guò)所述數(shù)據(jù)不一致性檢測(cè)消除單元處理后的信息,按照推理方法推理得到融合信 息,所述推理方法為本體推理、基于規(guī)則的推理、基于證據(jù)論的推理、基于貝葉斯網(wǎng)絡(luò)的推 理方法。
[0017] 根據(jù)本發(fā)明優(yōu)選的,所述邊緣系統(tǒng)模塊包括若干推薦單元,所述推薦單元為已知 的除所述目標(biāo)系統(tǒng)模塊之外的、含有用戶信息的推薦系統(tǒng),用戶信息存儲(chǔ)在所述推薦單元 的數(shù)據(jù)庫(kù)中,用戶信息的表示方式"用戶X物品X情景信息X評(píng)分"。
[0018] 上述推薦系統(tǒng)的工作方法,具體步驟如下:
[0019] ⑴請(qǐng)求協(xié)作
[0020] 所述目標(biāo)系統(tǒng)模塊接收到新的"用戶AX物品BX情景信息C"組合后,經(jīng)過(guò)檢索, 用戶數(shù)據(jù)庫(kù)單元中沒(méi)有用戶A的歷史行為信息時(shí),所述目標(biāo)系統(tǒng)模塊向所述協(xié)作中心系統(tǒng) 模塊發(fā)起協(xié)作請(qǐng)求;
[0021] (2)協(xié)作中心響應(yīng)
[0022] 所述協(xié)作中心系統(tǒng)模塊接受所述目標(biāo)系統(tǒng)模塊發(fā)起的協(xié)作請(qǐng)求,所述知識(shí)庫(kù)單元 分析協(xié)作請(qǐng)求,檢索出存有用戶A信息的所述邊緣系統(tǒng)模塊中的推薦單元,并向所述邊緣 系統(tǒng)模塊中的推薦單元發(fā)送協(xié)作命令;
[0023] (3)邊緣系統(tǒng)響應(yīng)
[0024] 所述邊緣系統(tǒng)模塊中的推薦單元接收到協(xié)作命令后,查看各自的數(shù)據(jù)庫(kù)中是否含 有所述目標(biāo)系統(tǒng)模塊所需數(shù)據(jù),所述目標(biāo)系統(tǒng)模塊所需數(shù)據(jù)包括:m、用戶A在情景信息C下 對(duì)物品B的評(píng)分;n、用戶A在非情景信息C下對(duì)物品B的評(píng)分;
[0025] (4)判斷是否含有協(xié)作數(shù)據(jù)
[0026] 如果所述邊緣系統(tǒng)模塊中推薦單元數(shù)據(jù)庫(kù)中有所述目標(biāo)系統(tǒng)模塊所需數(shù)據(jù),則 將所述目標(biāo)系統(tǒng)模塊所需數(shù)據(jù)輸出至所述協(xié)作中心系統(tǒng)模塊中的知識(shí)庫(kù)單元,否則,無(wú)輸 出;
[0027] (5)協(xié)作中心接收數(shù)據(jù)
[0028] 所述協(xié)作中心系統(tǒng)模塊中的知識(shí)庫(kù)單元接收所述目標(biāo)系統(tǒng)模塊所需數(shù)據(jù);
[0029] (6)行為聚合
[0030] 所述行為聚合單元對(duì)所述目標(biāo)系統(tǒng)模塊中的物品B和所述邊緣系統(tǒng)模塊中的用 戶A使用過(guò)的除物品B之外的其他物品進(jìn)行聚合,所述行為聚合單元根據(jù)物品屬性給物品 標(biāo)記標(biāo)簽,選取標(biāo)簽集合交集超過(guò)某個(gè)閾值的行為聚合為同一物品,經(jīng)過(guò)行為聚合后得到 用戶A在所述目標(biāo)系統(tǒng)模塊中對(duì)物品B的評(píng)分;
[0031] (7)情景聚合
[0032] 所述情景聚合單元對(duì)經(jīng)過(guò)行為聚合后的信息進(jìn)行情景聚合,即采用計(jì)算上下文余 弦相似度的方法計(jì)算用戶不同情景信息的相似度,選取相似度較高的情景信息進(jìn)行融合;
[0033] 采用計(jì)算上下文余弦相似度的方法的計(jì)算公式如式(I)所示:
【主權(quán)項(xiàng)】
1. 一種基于協(xié)作的推薦系統(tǒng),其特征在于,包括;邊緣系統(tǒng)模塊、協(xié)作中屯、系統(tǒng)模塊、 目標(biāo)系統(tǒng)模塊,所述邊緣系統(tǒng)模塊、所述協(xié)作中屯、系統(tǒng)模、所述目標(biāo)系統(tǒng)模塊依次連接; 所述邊緣系統(tǒng)模塊采集和存儲(chǔ)用戶信息并向所述協(xié)作中屯、系統(tǒng)模塊提供所需的特定 用戶信息;所述協(xié)作中屯、系統(tǒng)模塊響應(yīng)所述目標(biāo)系統(tǒng)模塊的協(xié)作請(qǐng)求,向所述邊緣系統(tǒng)模 塊