專利名稱:一種項目推薦方法及系統(tǒng)的制作方法
技術領域:
本申請涉及項目推薦技術,尤其涉及一種項目推薦方法及系統(tǒng)。
背景技術:
當用戶進入電子商務網(wǎng)站選擇圖書、視頻等產(chǎn)品時,面對的是海量的產(chǎn)品,僅僅依賴搜索與瀏覽,很難發(fā)現(xiàn)符合自己獨特興趣的產(chǎn)品。因此,進行產(chǎn)品的個性化推薦,能夠解決用戶的信息過載,為用戶提供符合其興趣的產(chǎn)品。個性化推薦研究的歷史根源可以追溯到認知科學、逼近論、信息抽取和預測論等領域的研究工作,同時與管理科學以及市場營銷中的客戶機會建模有關。但是,推薦系統(tǒng)作為一個獨立的研究領域出現(xiàn)還在于1990年代中期。從那時開始,推薦系統(tǒng)研究問題集中解
決顯式的依賴用戶打分結構的推薦方法。在這樣的背景下,推薦問題可以規(guī)約為為用戶未見項目預測打分的問題。這種估計通?;谟脩魧ζ渌椖康拇蚍趾推渌畔?。一旦對用戶未見項目打分做出預測,我們可以向用戶推薦得分高的項目。這里,所謂“項目”概指推薦系統(tǒng)所在的系統(tǒng)向用戶所推薦對象,如圖書、電影和旅館等。更為形式化地,推薦系統(tǒng)可以形式化地描述為(I)給定用戶集合U,要推薦的項目集合S ;(2)構建一個用戶對項目的打分函數(shù)f:UXS — R,R為一定范圍內(nèi)的非負整數(shù);(3)對任一個用戶u G U,從S中選擇打分函數(shù)值最高的項目Su,即為VueuA u = argmaL/(M,4。根據(jù)具體的推薦策略,推薦系統(tǒng)一般分為以下三類(I)基于內(nèi)容的推薦系統(tǒng)向用戶推薦與其過去選擇的項目相似的項目;(2)協(xié)同過濾推薦系統(tǒng)在基于用戶的協(xié)同過濾推薦系統(tǒng)中,向用戶推薦與其偏好相似的其他用戶選擇的項目;在基于項目的協(xié)同過濾推薦系統(tǒng)中,首先根據(jù)所有人的選擇情況(打分、是否購買等,而不是項目的內(nèi)容描述),計算項目之間的相似度;進一步地,根據(jù)項目之間的相似度,向一個用戶推薦的與其歷史選擇相近的項目。(3)混合型推薦系統(tǒng)混合上述兩種推薦方式的數(shù)據(jù)或策略,向用戶推薦項目的系統(tǒng)。不同方法適用于不同應用領域與數(shù)據(jù)集合,例如在圖書領域,圖書的推薦系統(tǒng)一般屬于基于項目的協(xié)同過濾推薦系統(tǒng)。具體的,如圖I所示,現(xiàn)有圖書推薦系統(tǒng)的處理流程一般包括以下步驟步驟101 :根據(jù)用戶的購買歷史記錄形成用戶-圖書打分矩陣;用戶-圖書打分矩陣中,行為用戶,列為圖書,元素為對應用戶對對應圖書的打分值,在實際應用中,所述元素值一般根據(jù)用戶是否購買了該圖書而相應設置為I或O。步驟102 :計算任意兩個圖書之間的余弦相關性;步驟103 :對每個圖書,選擇與該圖書余弦相關性最高的預設M個圖書作為該圖書的鄰居圖書。
步驟104 :根據(jù)用戶的購買圖書以及被購買圖書的鄰居圖書確定用戶的圖書候選集合,并確定圖書候選集合中每一圖書的推薦強度,將推薦強度最高的預設N個圖書作為該用戶的圖書推薦集合。雖然在實際應用中,圖書推薦系統(tǒng)是根據(jù)用戶的購買歷史確定用戶的最終圖書推薦集合,但是,所述最終圖書推薦集合中包含的圖書往往與用戶感興趣的圖書并不匹配,因此,用戶往往無法從推薦系統(tǒng)中獲取所需的圖書信息。這時,用戶仍然需要在電子商務圖書網(wǎng)站通過傳統(tǒng)的搜索和瀏覽等操作,最終自主確定感興趣的圖書,進而進行購買等后續(xù)操作。對于其他的項目推薦系統(tǒng),也存在與圖書推薦系統(tǒng)類似的推薦結果不準確的問題?;谝陨锨闆r,在不考慮電子商務網(wǎng)站建立項目推薦系統(tǒng)等成本的情況下,因項目推薦結果不準確,還將導致如下問題用戶終端與電子商務網(wǎng)站之間需要進行項目推薦數(shù)據(jù)請求和發(fā)送,而所述項目推薦數(shù)據(jù)對于大多數(shù)用戶來說并非有用的信息,因此用戶仍需按照自身的興趣通過原有的搜索和瀏覽等確定自己感興趣的項目,從而當用戶數(shù)量很大時,這種數(shù)據(jù)的傳輸必然浪費電子商務網(wǎng)站的數(shù)據(jù)傳輸帶寬,從而降低電子商務網(wǎng)站與各 個用戶終端之間的數(shù)據(jù)傳輸速度,進而降低了電子商務網(wǎng)站對于用戶終端的響應速度和效率。
發(fā)明內(nèi)容
有鑒于此,本申請要解決的技術問題是,提供一種項目推薦方法及系統(tǒng),能夠提高推薦結果的準確性,進而提高電子商務網(wǎng)站與用戶終端之間的數(shù)據(jù)傳輸速度。為此,本申請實施例采用如下技術方案本申請實施例提供一種項目推薦方法,包括獲取用戶的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括用戶以及項目之間的對應關系;根據(jù)所述歷史數(shù)據(jù)計算兩個項目之間的關聯(lián)檢索相關度;對于每一項目,分別將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個項目確定為該項目的關聯(lián)檢索相關項目;并且,根據(jù)用戶的歷史數(shù)據(jù)建立原始的用戶-項目打分矩陣;使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,形成計算用戶-項目打分矩陣;基于計算用戶-項目打分矩陣,確定用戶的項目推薦集合。本申請實施例還提供一種項目推薦系統(tǒng),包括獲取單元,用于獲取用戶的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括用戶以及項目之間的對應關系;計算單元,用于根據(jù)所述歷史數(shù)據(jù)計算任意兩個項目之間的關聯(lián)檢索相關度;對于每一項目,分別將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個項目確定為該項目的關聯(lián)檢索相關項目;建立單元,用于根據(jù)用戶的歷史數(shù)據(jù)建立原始的用戶-項目打分矩陣;磨平單元,用于使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,形成計算用戶-項目打分矩陣;推薦單元,用于基于計算用戶-項目打分矩陣,確定用戶的項目推薦集合。
對于上述技術方案的技術效果分析如下根據(jù)用戶的歷史數(shù)據(jù)計算任意兩個項目之間的關聯(lián)檢索相關度,并且,據(jù)此確定每個項目的關聯(lián)檢索相關項目;從而,在建立原始的用戶-項目打分矩陣后,使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,基于磨平后得到的用戶-項目打分矩陣確定用戶的項目推薦集合,從而使得一個項目的關聯(lián)檢索項目,可以跨用戶獲得,而后續(xù)的磨平方法使得計算項目之間相關度的矩陣稀疏性得以填充,提高了項目之間相關度計算的可靠性,而且,也使得現(xiàn)有技術中由于矩陣的數(shù)據(jù)稀疏性而不能計算的潛在相關項目之間可以建立相關性,從而在一定程度上解決了因為每個用戶直接關聯(lián)項目較少或者潛在關聯(lián)項目無法發(fā)生關聯(lián)所導致的推薦結果不準確的問題,提高了推薦系統(tǒng)對于項目推薦結果的準確性;進而,由于推薦結果準確性的提高,使得用戶無需如現(xiàn)有技術般過多的進行搜索和瀏覽操作,即可得到自己感興趣的項目的信息,從而減少了用戶所在用戶終端與電子商務網(wǎng)站之間由于搜索和瀏覽等項目信息查找操作對帶寬的占用,節(jié)省了帶寬,從而提高了電子商務網(wǎng)站與用戶終端之間的數(shù)據(jù)傳輸速度,提高了兩者之間的數(shù)據(jù)傳輸效率。
圖I為現(xiàn)有技術圖書推薦方法流程示意圖;圖2為本申請實施例項目推薦方法可以適用的應用環(huán)境示例;圖3為本申請實施例一種項目推薦方法流程示意圖;圖4為本申請實施例另一種項目推薦方法流程示意圖;圖4a為本申請實施例的一種用戶-項目二部圖結構示例;
圖5為本申請實施例一種項目推薦系統(tǒng)結構示意圖。
具體實施例方式一般電子商務網(wǎng)站所提供的產(chǎn)品數(shù)量都非常巨大,例如一個一般的電子商務圖書網(wǎng)站其圖書存儲量都在百萬級別,相對這一產(chǎn)品數(shù)量,每個用戶購買或者打分過的產(chǎn)品數(shù)量是非常小的,導致圖I所示推薦方法中用戶-項目打分矩陣中的數(shù)據(jù)過于稀疏,而數(shù)據(jù)稀疏性問題將導致項目與項目之間的相關度計算結果不準確,進一步地,導致項目推薦結果的不準確;而且,由于數(shù)據(jù)稀疏性問題,使得用戶-項目打分矩陣中許多項目之間因為沒有被同時購買或者打分情況,從而無法得到相關度,導致具有潛在相關性的項目被推薦機會的減少,整體上使得推薦系統(tǒng)的推薦結果對于項目的覆蓋度較低,從而最終也可能導致項目推薦結果的不準確?;谝陨戏治?,本申請實施例提供一種項目推薦方法及系統(tǒng),能夠提高推薦結果的準確性,進而提高電子商務網(wǎng)站與用戶終端之間的數(shù)據(jù)傳輸速度。為了使得后續(xù)對本申請實施例的推薦方法及系統(tǒng)的理解更為方便,首先介紹一種本申請實施例的推薦方法及系統(tǒng)可以適用的應用環(huán)境,仍以圖書推薦為例,如圖2所示,包括用戶終端210、Web服務器220、圖書交易數(shù)據(jù)庫服務器230、圖書推薦列表檢索服務器240以及推薦計算平臺250 ;其中,用戶終端210為用戶提供瀏覽器,以便用戶進行電子商務網(wǎng)站的瀏覽、搜索、購買等操作,用戶的購買信息通過用戶終端210和Web服務器220發(fā)送到圖書交易數(shù)據(jù)庫服務器230,由圖書交易數(shù)據(jù)庫服務器230進行存儲,并經(jīng)過預處理轉存入推薦計算平臺250。所述推薦計算平臺250可以由分布式硬件集群、Hadoop分布式操作環(huán)境和文件系統(tǒng)以及基于MapReduce的JAVA語言程序組成,推薦計算平臺250定期更新計算電子商務網(wǎng)站內(nèi)每個用戶的圖書產(chǎn)品推薦結果,將計算結果更新到圖書推薦列表檢索服務器240中。當用戶通過用戶終端210向Web服務器220發(fā)送包含圖書推薦功能的請求時,Web服務器220在接收到所述請求時,向圖書推薦列表檢索服務器240發(fā)送檢索用戶的圖書推薦結果的檢索請求,圖書推薦列表檢索服務器240接收該檢索請求,查找到用戶對應的圖書推薦結果,通過Web服務器220向用戶終端210進行反饋,以便用戶終端210將圖書推薦結果通過瀏覽器向用戶進行展現(xiàn)。而本申請實施例的所述產(chǎn)品推薦方法及系統(tǒng)既可以設置于所述推薦計算平臺250中,用于進行圖書產(chǎn)品推薦結果的確定。 當然,以上圖2所示的應用環(huán)境僅是本申請實施例項目推薦方法及系統(tǒng)的應用環(huán)境之一,本申請實施例的項目推薦方法及系統(tǒng)還可以適用于其他類似的項目推薦系統(tǒng)中,例如電影推薦系統(tǒng)、旅游推薦系統(tǒng)等等,只要存在用戶與項目之間的歷史關聯(lián)數(shù)據(jù),本申請實施例的項目推薦方法及系統(tǒng)即可以根據(jù)歷史關聯(lián)數(shù)據(jù)進行對應的項目推薦。以下,結合附圖詳細說明本申請實施例項目推薦方法及系統(tǒng)的實現(xiàn)。圖3為本申請實施例一種項目推薦方法流程示意圖,如圖3所示,該方法包括步驟301 :獲取用戶的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括用戶以及項目之間的對應關系;步驟302 :根據(jù)所述歷史數(shù)據(jù)計算任意兩個項目之間的關聯(lián)檢索相關度;對于每一項目,分別將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個項目確定為該項目的關聯(lián)檢索相關項目;步驟303 :根據(jù)用戶的歷史數(shù)據(jù)建立原始的用戶-項目打分矩陣;步驟304 :使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,形成計算用戶-項目打分矩陣;步驟305 :基于計算用戶-項目打分矩陣,確定用戶的項目推薦集合。其中,步驟302與步驟303之間的執(zhí)行順序并無固定的限制,可以在實際應用中自
主設置。圖3所示的項目推薦方法中,根據(jù)用戶的歷史數(shù)據(jù)計算任意兩個項目之間的關聯(lián)檢索相關度,并且,據(jù)此確定每個項目的關聯(lián)檢索相關項目;從而在建立原始的用戶-項目打分矩陣后,使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,基于磨平后得到的用戶-項目打分矩陣確定用戶的項目推薦集合,從而使得一個項目的關聯(lián)檢索項目,可以跨用戶獲得,而后續(xù)的磨平方法使得計算項目之間相關度的矩陣稀疏性得以填充,這提高了項目之間相關度計算的可靠性,而且,也使得現(xiàn)有技術中由于矩陣的數(shù)據(jù)稀疏性而不能計算的潛在相關項目之間可以建立相關性,從而在一定程度上解決了因為每個用戶直接關聯(lián)項目較少或者潛在關聯(lián)項目無法發(fā)生關聯(lián)所導致的推薦結果不準確的問題,提高了推薦系統(tǒng)對于項目推薦結果的準確性;進而,由于推薦結果準確性的提高,使得用戶無需如現(xiàn)有技術般過多的進行搜索和瀏覽操作,即可得到自己感興趣的項目的信息,從而減少了用戶所在用戶終端與電子商務網(wǎng)站之間由于搜索和瀏覽等項目信息查找操作對帶寬的占用,節(jié)省了帶寬,從而提高了電子商務網(wǎng)站與用戶終端之間的數(shù)據(jù)傳輸速度,提高了兩者之間的數(shù)據(jù)傳輸效率。在圖3的基礎上,通過圖4對本申請實施例的項目推薦方法進行更為詳細的說明,如圖4所示,該方法包括步驟401 :獲取用戶的歷史數(shù)據(jù);所述用戶的歷史數(shù)據(jù)可以包括用戶標識以及用戶標識對應的項目標識。具體的,在不同的應用環(huán)境下,所述用戶的歷史數(shù)據(jù)可能不同,例如,在圖I所示的應用環(huán)境下,所述歷史數(shù)據(jù)可以包括用戶標識以及與用戶標識對應的用戶所購買圖書的圖書標識;而在其他的項目推薦系統(tǒng)中,可能為用戶標識以及用戶標識對應的用戶感興趣項目的項目標識等。 步驟402 :根據(jù)用戶的歷史數(shù)據(jù)建立用戶-項目二部圖;如圖4a所示,所述用戶-項目二部圖依照用戶的歷史數(shù)據(jù)建立,具體的,可根據(jù)歷史數(shù)據(jù)中用戶標識與項目標識之間的對應關系建立,在建立所述二部圖時,將用戶和項目分別作為二部圖中的節(jié)點,在用戶和與該用戶具有對應關系的項目對應的節(jié)點之間建立直接通路,從而形成基于用戶和項目的_■部圖,_■部圖可以認為是一種拓撲圖,例如在圖4a中,上層節(jié)點pi p4為項目節(jié)點,下層節(jié)點Cl c3為用戶節(jié)點,用戶節(jié)點和項目節(jié)點之間的邊即表示在所述歷史數(shù)據(jù)中,用戶節(jié)點和項目節(jié)點之間具有對應關系。步驟403 :根據(jù)建立的所述用戶-項目二部圖,計算任意兩個項目之間的關聯(lián)檢索相關度。其中,在計算兩個項目之間的關聯(lián)檢索相關度時,可以計算兩個項目對應節(jié)點之間所有路徑的相關度之和,將計算得到的結果作為兩個項目之間的關聯(lián)檢索相關度。其中,兩個項目節(jié)點之間的每條路徑的相關度為am。其中,a為路徑長度影響因子,在實際應用中,a的取值為(0,1)的實數(shù),具體結合應用數(shù)據(jù)獲得,例如,可以設置a = 0.8;m為相應路徑長度,具體的,可以將二部圖中每一跳路徑的路徑長度設置為1,m的取值可以根據(jù)兩個項目節(jié)點之間的路徑經(jīng)過的跳數(shù)確定。在實際應用中,由于用戶-項目二部圖一般包含的用戶和項目很多,因此,在計算關聯(lián)檢索相關度時,計算兩個項目節(jié)點之間所有路徑的相關度之和時,計算量將非常巨大,影響系統(tǒng)處理效率,因此,可以在實際應用中設置兩個項目節(jié)點之間路徑的最大路徑長度,也即m的最大值,從而在計算時,僅計算路徑長度小于該最大路徑長度的兩個項目節(jié)點之間的路徑的相關度,進而加和得到兩個項目節(jié)點之間關聯(lián)檢索相關度。例如,可以設置最大路徑長度為6等,這里并不具體限定。步驟404 :對于每一項目,根據(jù)該項目與其他項目之間的關聯(lián)檢索相關度,將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個其他項目作為該項目的關聯(lián)檢索相關項目。 其中,所述預設數(shù)量可以在實際應用中自主取值,這里并不限定,例如可以取值為35、20等任意數(shù)值。步驟405 :根據(jù)用戶的歷史數(shù)據(jù)建立原始的用戶-項目打分矩陣。本步驟的建立方法可以為
預設用戶-項目矩陣的行為用戶,列為項目,元素取值根據(jù)歷史數(shù)據(jù)中用戶與項目之間是否存在對應關系確定,具體取值規(guī)則可以自主設定。例如,在本申請實施例的一種具體實現(xiàn)中當用戶與項目之間具有對應關系時,取值為I ;當用戶與項目之間沒有對應關系時,取值為O。其中,步驟402 404與步驟405之間的執(zhí)行順序并無固定的限制,可以在實際應用中自主設置。步驟406 :使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,形成計算用戶-項目打分矩陣。本步驟的實現(xiàn)可以包括當在原始的用戶-項目打分矩陣中用戶與項目之間具有對應關系時,則確定該項目的關聯(lián)檢索相關項目與該用戶之間也具有對應關系,相應修改原始的用戶-項目打分矩陣用戶與所述關聯(lián)檢索相關項目對應的元素值,這樣對整個原始的用戶-項目打分矩陣進行操作后獲得計算用戶-項目打分矩陣。在步驟405中具體的取值設置規(guī)則下,本步驟的實現(xiàn)可以為當在原始的用戶-項目打分矩陣中用戶與項目之間具有對應關系時,則將原始的用戶-項目打分矩陣該用戶與該項目的所述關聯(lián)檢索相關項目對應的元素值修改為1,這樣對整個原始的用戶-項目打分矩陣進行操作后獲得計算用戶-項目打分矩陣。步驟407 :基于計算用戶-項目打分矩陣,計算任意兩個項目之間的相關性。在實際應用中,一般可以選擇余弦相關性作為兩個項目之間相關性的表征,具體
的,兩個項目之間的的余弦相關性計算公式如下
權利要求
1.一種項目推薦方法,其特征在于,包括 獲取用戶的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括用戶以及項目之間的對應關系; 根據(jù)所述歷史數(shù)據(jù)計算兩個項目之間的關聯(lián)檢索相關度;對于每一項目,分別將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個項目確定為該項目的關聯(lián)檢索相關項目; 并且,根據(jù)用戶的歷史數(shù)據(jù)建立原始的用戶-項目打分矩陣; 使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,形成計算用戶-項目打分矩陣; 基于計算用戶-項目打分矩陣,確定用戶的項目推薦集合。
2.根據(jù)權利要求I所述的方法,其特征在于,所述根據(jù)所述歷史數(shù)據(jù)計算任意兩個項目之間的關聯(lián)檢索相關度包括 以歷史數(shù)據(jù)中的用戶以及項目作為節(jié)點,在具有對應關系的用戶與項目對應的節(jié)點之間建立直接通路,從而建立用戶-項目二部圖; 根據(jù)建立的所述用戶-項目二部圖計算任意兩個項目之間的關聯(lián)檢索相關度。
3.根據(jù)權利要求2所述的方法,其特征在于,所述計算任意兩個項目節(jié)點之間的關聯(lián)檢索相關度包括 計算所述兩個項目對應節(jié)點之間所有路徑的相關度之和,將計算得到的結果作為兩個項目節(jié)點之間的關聯(lián)檢索相關度; 其中,兩個項目節(jié)點之間每條路徑的相關度計算公式為am,其中,a為路徑長度影響因子,m為對應路徑的路徑長度。
4.根據(jù)權利要求I至3任一項所述的方法,其特征在于,所述使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣包括 遍歷整個原始用戶-項目打分矩陣,當在原始的用戶-項目打分矩陣中用戶與項目之間具有對應關系時,則確定該項目的關聯(lián)檢索相關項目與該用戶之間也具有對應關系,修改原始的用戶-項目打分矩陣中對應的元素值。
5.根據(jù)權利要求I至3任一項所述的方法,其特征在于,基于計算用戶-項目打分矩陣,確定用戶的項目推薦集合包括 基于計算用戶-項目打分矩陣,計算任意兩個項目之間的相關性; 對于每一項目,根據(jù)該項目與其他項目之間的相關性,確定預設第二數(shù)量個與該項目相關性最大的其他項目最為該項目的鄰居項目; 對于每一用戶,根據(jù)用戶與項目之間的對應關系,與用戶之間有對應關系的項目的鄰居項目,確定用戶的項目推薦集合。
6.根據(jù)權利要求5所述的方法,其特征在于,所述確定用戶的項目推薦集合包括 由與用戶之間有對應關系項目的鄰居項目構成用戶的項目候選集合;并且,剔除所述項目候選集合中包含的、原始的用戶-項目打分矩陣中與用戶中間具有對應關系的項目;根據(jù)與用戶之間有對應關系的項目與鄰居項目之間的相關性計算項目候選集合中各個項目的推薦強度; 選擇項目候選集合中推薦強度最大的預設第三數(shù)量個項目構成用戶的項目推薦集合。
7.一種項目推薦系統(tǒng),其特征在于,包括獲取單元,用于獲取用戶的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括用戶以及項目之間的對應關系; 計算單元,用于根據(jù)所述歷史數(shù)據(jù)計算任意兩個項目之間的關聯(lián)檢索相關度;對于每一項目,分別將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個項目確定為該項目的關聯(lián)檢索相關項目; 建立單元,用于根據(jù)用戶的歷史數(shù)據(jù)建立原始的用戶-項目打分矩陣; 磨平單元,用于使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,形成計算用戶-項目打分矩陣; 推薦單元,用于基于計算用戶-項目打分矩陣,確定用戶的項目推薦集合。
8.根據(jù)權利要求7所述的系統(tǒng),其特征在于,計算單元包括 建立子單元,用于以歷史數(shù)據(jù)中的用戶以及項目作為節(jié)點,具有對應關系的用戶與項目對應的節(jié)點之間建立直接通路,從而建立用戶-項目二部圖; 第一計算子單元,用于根據(jù)建立的所述用戶-項目二部圖計算任意兩個項目之間的關聯(lián)檢索相關度; 第一確定子單元,用于對于每一項目,分別將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個項目確定為該項目的關聯(lián)檢索相關項目。
9.根據(jù)權利要求8所述的系統(tǒng),其特征在于,計算子單元具體用于計算所述兩個項目對應節(jié)點之間所有路徑的相關度之和,將計算得到的結果作為兩個項目節(jié)點之間的關聯(lián)檢索相關度;其中,兩個項目節(jié)點之間每條路徑的相關度計算公式為am,其中,a為路徑長度影響因子,m為對應路徑的路徑長度。
10.根據(jù)權利要求7至9任一項所述的系統(tǒng),其特征在于,磨平單元具體用于遍歷整個原始用戶-項目打分矩陣,當在原始的用戶-項目打分矩陣中用戶與項目之間具有對應關系時,則確定該項目的關聯(lián)檢索相關項目與該用戶之間也具有對應關系,修改原始的用戶-項目打分矩陣中對應的元素值。
全文摘要
本申請公開了一種項目推薦方法及系統(tǒng),方法包括獲取用戶的歷史數(shù)據(jù),所述歷史數(shù)據(jù)包括用戶以及項目之間的對應關系;根據(jù)所述歷史數(shù)據(jù)計算任意兩個項目之間的關聯(lián)檢索相關度;對于每一項目,分別將與該項目之間的關聯(lián)檢索相關度最大的預設第一數(shù)量個項目確定為該項目的關聯(lián)檢索相關項目;并且,根據(jù)用戶的歷史數(shù)據(jù)建立原始的用戶-項目打分矩陣;使用每個項目的關聯(lián)檢索相關項目磨平原始的用戶-項目打分矩陣,形成計算用戶-項目打分矩陣;基于計算用戶-項目打分矩陣,確定用戶的項目推薦集合。所述方法及系統(tǒng)能夠提高推薦結果的準確性,進而提高電子商務網(wǎng)站與用戶終端之間的數(shù)據(jù)傳輸速度。
文檔編號G06F17/30GK102789462SQ20111013042
公開日2012年11月21日 申請日期2011年5月18日 優(yōu)先權日2011年5月18日
發(fā)明者張偉 申請人:阿里巴巴集團控股有限公司