亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種分布式個(gè)性化推薦方法及系統(tǒng)的制作方法

文檔序號(hào):6547672閱讀:166來源:國(guó)知局
一種分布式個(gè)性化推薦方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種分布式個(gè)性化推薦方法及系統(tǒng),其中,該方法包括:建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合;根據(jù)該集合計(jì)算所有用戶的所有項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù),并寫入預(yù)先構(gòu)建的項(xiàng)目對(duì)評(píng)分差表;其中,所述評(píng)分集合與項(xiàng)目對(duì)評(píng)分差表均采用Hbase表來存儲(chǔ);利用MapReduce映射化簡(jiǎn)模型將HDFS文件系統(tǒng)中存儲(chǔ)的用戶信息及其未評(píng)分項(xiàng)目的集合與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié);再將所述第一次聯(lián)結(jié)結(jié)果與所述評(píng)分集合進(jìn)行第二次聯(lián)結(jié),并結(jié)合預(yù)測(cè)算法計(jì)算出用戶未評(píng)分項(xiàng)目的預(yù)測(cè)評(píng)分值;根據(jù)所述預(yù)測(cè)評(píng)分值的大小向用戶進(jìn)行推薦。通過采用本發(fā)明公開的方法及系統(tǒng),節(jié)約了網(wǎng)絡(luò)傳輸資源和輸入輸出開銷,提高了聯(lián)結(jié)效率。
【專利說明】一種分布式個(gè)性化推薦方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及分布式計(jì)算【技術(shù)領(lǐng)域】,尤其涉及一種分布式個(gè)性化推薦方法及系統(tǒng)?!颈尘凹夹g(shù)】
[0002]個(gè)性化推薦系統(tǒng)是一種根據(jù)用戶的個(gè)人信息、興趣特點(diǎn)、購(gòu)買行為等,向用戶個(gè)性化推薦感興趣的信息或商品的系統(tǒng)。推薦系統(tǒng)有三個(gè)重要的模塊:用戶建模模塊、推薦對(duì)象建模模塊、推薦算法模塊。推薦系統(tǒng)把用戶模型中興趣需求信息和推薦對(duì)象模型中的特征信息匹配,同時(shí)使用相應(yīng)的推薦算法進(jìn)行計(jì)算篩選,找到用戶可能感興趣的推薦對(duì)象,然后推薦給用戶。
[0003]Hadoop是一個(gè)開源項(xiàng)目,是一種針對(duì)大數(shù)據(jù)處理和分析的開源分布式計(jì)算平臺(tái),是一個(gè)完整的分布式軟件架構(gòu)。Hadoop由HDFS (分布式文件系統(tǒng))、HBase (分布式開源數(shù)據(jù)庫(kù))、MapReduce (映射化簡(jiǎn)模型)、ZooKeeper (可靠性協(xié)調(diào)系統(tǒng))等核心部分組成,分別負(fù)責(zé)分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)系統(tǒng)、分布式并行計(jì)算模型和并發(fā)訪問控制。
[0004]其中,Hadoop為一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu)的名稱。用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序,并且充分利用集群高速運(yùn)算和存儲(chǔ)的能力。具有高擴(kuò)展性、高可靠性、高容錯(cuò)性、低成本等特點(diǎn)。
[0005]HDFS為Hadoop實(shí)現(xiàn)的一個(gè)分布式適合運(yùn)行在通用硬件上的文件系統(tǒng)(英文全稱,Hadoop Distributed File System,簡(jiǎn)稱HDFS)。HDFS具有高容錯(cuò)性,提供高吞吐量的數(shù)據(jù)訪問,適合那些有著超大規(guī)模數(shù)據(jù)集的應(yīng)用程序。
[0006]HBase為一個(gè)分布式的、面向列的開源數(shù)據(jù)庫(kù)。它不同于一般的關(guān)系數(shù)據(jù)庫(kù),是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫(kù)。具有高可靠性、高性能、面向列、可伸縮等特點(diǎn)。
[0007]MapReduce是谷歌提出的一個(gè)軟件架構(gòu),是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。軟件實(shí)現(xiàn)是指定一個(gè)Map (映射)函數(shù),用來把一組鍵值對(duì)映射成一組新的鍵值對(duì),指定并發(fā)的Reduce (化簡(jiǎn))函數(shù),用來保證所有映射的鍵值對(duì)中的每一個(gè)共孚相同的鍵組。
[0008]Zookeeper是Hadoop的子項(xiàng)目。是一個(gè)針對(duì)大型分布式系統(tǒng)的可靠協(xié)調(diào)系統(tǒng),提供的功能包括:配置維護(hù)、名字服務(wù)、分布式服務(wù)、組服務(wù)等。Zookeeper的目標(biāo)就是封裝好復(fù)雜易出錯(cuò)的的關(guān)鍵服務(wù),將簡(jiǎn)單易用的接口和性能高效、功能穩(wěn)定的系統(tǒng)提供給用戶。
[0009]當(dāng)前的推薦系統(tǒng)主要集中在單一節(jié)點(diǎn)上,通過顯式地收集用戶反饋或者或隱式地分析行為記錄,學(xué)習(xí)和跟蹤用戶的興趣偏好和行為模式,主動(dòng)向用戶推薦那些可能感興趣的商品。推薦算法是推薦系統(tǒng)的核心。常見推薦算法包括協(xié)同過濾推薦、基于內(nèi)容推薦、基于關(guān)聯(lián)規(guī)則推薦、基于效用推薦、基于知識(shí)推薦等。
[0010]在眾多協(xié)同過濾算法中,Slope One以其極易實(shí)現(xiàn)、預(yù)測(cè)高效、準(zhǔn)確度高等特點(diǎn)受到業(yè)界的青睞。Slope One算法是一系列應(yīng)用于系統(tǒng)過濾的算法的統(tǒng)稱,是一種系統(tǒng)過濾推薦的思想,是基于項(xiàng)目評(píng)價(jià)的系統(tǒng)過濾算法的最簡(jiǎn)潔形式。其本質(zhì)是用簡(jiǎn)單的線性關(guān)系來擬合復(fù)雜的相似度計(jì)算。從直觀上來看,共同出現(xiàn)次數(shù)更多的項(xiàng)目對(duì)對(duì)彼此評(píng)分的影響更大。因此有更通用的WSO(Weighted slope-one輕量級(jí)Slope one算法)方法對(duì)評(píng)分差進(jìn)行加權(quán)計(jì)算。
[0011]隨著用戶數(shù)據(jù)量的劇增,傳統(tǒng)基于單一節(jié)點(diǎn)的集中式推薦系統(tǒng)顯現(xiàn)出存儲(chǔ)能力不足和計(jì)算能力不足的弊端,不能保證推薦的實(shí)時(shí)性,推薦效果也不明顯。用戶數(shù)據(jù)量劇增,Slope One算法缺點(diǎn)展現(xiàn)出來:(I)原Slope One算法時(shí)間、空間復(fù)雜度過高,單機(jī)無法存儲(chǔ)中間文件;(2)計(jì)算代價(jià)過高,通常只能使用在小規(guī)模數(shù)據(jù)上。另一方面,在Slope One算法實(shí)現(xiàn)上,使用MapReduce在HDFS大規(guī)模數(shù)據(jù)集合上進(jìn)行多次聯(lián)結(jié)操作,這種多臺(tái)服務(wù)器的聯(lián)結(jié)包括Map側(cè)(Map-side)和Reduce側(cè)(Reduce_side)。Reduce側(cè)的聯(lián)結(jié)適用性高,但是開銷大,Map側(cè)聯(lián)結(jié)速度快,適用性低。

【發(fā)明內(nèi)容】

[0012]本發(fā)明的目的是提供一種分布式個(gè)性化推薦方法及系統(tǒng),節(jié)約了網(wǎng)絡(luò)傳輸資源和輸入輸出開銷,提高了聯(lián)結(jié)效率。
[0013]本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的:
[0014]—種分布式個(gè)性化推薦方法,該方法包括:
[0015]建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合;
[0016]根據(jù)該集合計(jì)算所有用戶的所有項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù),并寫入預(yù)先構(gòu)建的項(xiàng)目對(duì)評(píng)分差表;其中,所述評(píng)分集合與項(xiàng)目對(duì)評(píng)分差表均采用Hbase表來存儲(chǔ);
[0017]利用MapReduce映射化簡(jiǎn)模型將HDFS文件系統(tǒng)中存儲(chǔ)的用戶信息及其未評(píng)分項(xiàng)目的集合與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié),并將第一次聯(lián)結(jié)結(jié)果存入HDFS中;再將所述第一次聯(lián)結(jié)結(jié)果與所述評(píng)分集合進(jìn)行第二次聯(lián)結(jié),并結(jié)合預(yù)測(cè)算法計(jì)算出用戶未評(píng)分項(xiàng)目的預(yù)測(cè)評(píng)分值;
[0018]根據(jù)所述預(yù)測(cè)評(píng)分值的大小向用戶進(jìn)行推薦。
[0019]—種分布式個(gè)性化推薦系統(tǒng),該系統(tǒng)包括:
[0020]評(píng)分集合建立模塊,用于建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合;
[0021]項(xiàng)目評(píng)分差信息計(jì)算寫入模塊,用于根據(jù)該集合計(jì)算所有用戶的所有項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù),并寫入預(yù)先構(gòu)建的項(xiàng)目對(duì)評(píng)分差表;其中,所述評(píng)分集合與項(xiàng)目對(duì)評(píng)分差表均采用Hbase表來存儲(chǔ);
[0022]未評(píng)分項(xiàng)目預(yù)測(cè)評(píng)分模塊,用于利用MapReduce映射化簡(jiǎn)模型將HDFS文件系統(tǒng)中存儲(chǔ)的用戶信息及其未評(píng)分項(xiàng)目的集合與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié),并將第一次聯(lián)結(jié)結(jié)果存入HDFS中;再將所述第一次聯(lián)結(jié)結(jié)果與所述評(píng)分集合進(jìn)行第二次聯(lián)結(jié),并結(jié)合預(yù)測(cè)算法計(jì)算出用戶未評(píng)分項(xiàng)目的預(yù)測(cè)評(píng)分值;
[0023]推薦模塊,用于根據(jù)所述預(yù)測(cè)評(píng)分值的大小向用戶進(jìn)行推薦。
[0024]由上述本發(fā)明提供的技術(shù)方案可以看出,通過整合HBase、HDFS和MapReduce,實(shí)現(xiàn)了輕量級(jí)算法DWSO的分布式實(shí)現(xiàn),由于把聯(lián)結(jié)操作的一方設(shè)為HBase表,省略了傳統(tǒng)聯(lián)結(jié)過程中的Reduce操作的洗牌、排序階段,節(jié)約了網(wǎng)絡(luò)傳輸資源和輸入輸出開銷,提高了聯(lián)結(jié)效率;同時(shí),由于采用HBase存儲(chǔ)用戶數(shù)據(jù),本系統(tǒng)還提供實(shí)時(shí)交互和離線處理的功倉(cāng)泛。
【專利附圖】

【附圖說明】
[0025]為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他附圖。
[0026]圖1為本發(fā)明實(shí)施例一提供的一種分布式個(gè)性化推薦方法的流程圖;
[0027]圖2為本發(fā)明實(shí)施例一提供的一種聯(lián)結(jié)MapReduce、HDFS和HBase的示意圖;
[0028]圖3為本發(fā)明實(shí)施例一提供的一種應(yīng)用場(chǎng)景的示意圖;
[0029]圖4為本發(fā)明實(shí)施例二提供的一種分布式個(gè)性化推薦系統(tǒng)的示意圖。
【具體實(shí)施方式】
[0030]下面結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明的保護(hù)范圍。
[0031]實(shí)施例一
[0032]圖1為本發(fā)明實(shí)施例一提供的一種分布式個(gè)性化推薦方法的流程圖。如圖1所示,該方法主要包括如下步驟:
[0033]步驟11、建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合。
[0034]在此之前需獲取用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值,以及該用戶的未評(píng)分項(xiàng)目。
[0035]用戶通過瀏覽互聯(lián)網(wǎng)或使用客戶端產(chǎn)生各種信息,例如,用戶通過注冊(cè),會(huì)留下個(gè)人信息,包括性別,年齡,地區(qū),職業(yè),興趣等;用戶通過網(wǎng)購(gòu)會(huì)產(chǎn)生購(gòu)買商品的信息和對(duì)這些商品的評(píng)分信息;用戶收聽音樂會(huì)產(chǎn)生收聽的音樂以及對(duì)音樂的評(píng)分等。對(duì)于用戶的不同網(wǎng)絡(luò)行為,用戶會(huì)產(chǎn)生的信息類型也不同。
[0036]對(duì)獲取到的上述信息進(jìn)行分析后,可以建立一評(píng)分集合,以便后續(xù)隨時(shí)調(diào)用。該評(píng)分集合可以使用輔助HBase表:t_taste表來進(jìn)行存儲(chǔ)。所述t_taste表可如表1所示:
【權(quán)利要求】
1.一種分布式個(gè)性化推薦方法,其特征在于,該方法包括: 建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合; 根據(jù)該集合計(jì)算所有用戶的所有項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù),并寫入預(yù)先構(gòu)建的項(xiàng)目對(duì)評(píng)分差表;其中,所述評(píng)分集合與項(xiàng)目對(duì)評(píng)分差表均采用Hbase表來存儲(chǔ); 利用MapReduce映射化簡(jiǎn)模型將HDFS文件系統(tǒng)中存儲(chǔ)的用戶信息及其未評(píng)分項(xiàng)目的集合與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié),并將第一次聯(lián)結(jié)結(jié)果存入HDFS中;再將所述第一次聯(lián)結(jié)結(jié)果與所述評(píng)分集合進(jìn)行第二次聯(lián)結(jié),并結(jié)合預(yù)測(cè)算法計(jì)算出用戶未評(píng)分項(xiàng)目的預(yù)測(cè)評(píng)分值; 根據(jù)所述預(yù)測(cè)評(píng)分值的大小向用戶進(jìn)行推薦。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合之前包括: 獲取用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值,以及該用戶的未評(píng)分項(xiàng)目。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計(jì)算所有用戶的所有項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù)包括: 將所述評(píng)分集合中任一用戶的任意兩個(gè)已評(píng)分項(xiàng)目作為一個(gè)項(xiàng)目對(duì),并計(jì)算項(xiàng)目對(duì)的評(píng)分差; 聚合所有用戶所有項(xiàng)目對(duì)的評(píng)分差及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù),再計(jì)算項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述利用MapReduce映射化簡(jiǎn)模型將HDFS文件系統(tǒng)中存儲(chǔ)的用戶信息及其未評(píng)分項(xiàng)目的集合與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié),并將第一次聯(lián)結(jié)結(jié)果存入HDFS中;再將所述第一次聯(lián)結(jié)結(jié)果與所述評(píng)分集合進(jìn)行第二次聯(lián)結(jié)包括: 將每一用戶及其未評(píng)分項(xiàng)目作為一個(gè)子集,聚合所有用戶及其未評(píng)分項(xiàng)目; 將所有用戶及其未評(píng)分項(xiàng)目與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié)并將第一次聯(lián)結(jié)結(jié)果存入HDFS中;具體的:聯(lián)結(jié)時(shí)以子集為單位進(jìn)行聯(lián)結(jié),每一子集的聯(lián)結(jié)結(jié)果中包含該用戶信息、該用戶未評(píng)分項(xiàng)目、該用戶未評(píng)分項(xiàng)目與已評(píng)分項(xiàng)目的項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及其出現(xiàn)的總次數(shù); 將第一次的聯(lián)結(jié)結(jié)果與評(píng)分集合進(jìn)行第二次聯(lián)結(jié);具體的:聯(lián)結(jié)時(shí)以子集為單位進(jìn)行聯(lián)結(jié),將第一次聯(lián)結(jié)結(jié)果中的該用戶未評(píng)分項(xiàng)目與已評(píng)分項(xiàng)目的項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值和該用戶評(píng)分集合中該項(xiàng)目對(duì)對(duì)應(yīng)的已評(píng)分項(xiàng)目的評(píng)分值做減法運(yùn)算,獲得第二次聯(lián)結(jié)結(jié)果的每一子集獲得包含該用戶信息、該用戶未評(píng)分項(xiàng)目、減法運(yùn)算結(jié)果及對(duì)應(yīng)項(xiàng)目對(duì)出現(xiàn)總次數(shù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述結(jié)合預(yù)測(cè)算法計(jì)算出用戶未評(píng)分項(xiàng)目的預(yù)測(cè)評(píng)分值包括:
6.一種分布式個(gè)性化推薦系統(tǒng),其特征在于,該系統(tǒng)包括: 評(píng)分集合建立模塊,用于建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合; 項(xiàng)目評(píng)分差信息計(jì)算寫入模塊,用于根據(jù)該集合計(jì)算所有用戶的所有項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù),并寫入預(yù)先構(gòu)建的項(xiàng)目對(duì)評(píng)分差表;其中,所述評(píng)分集合與項(xiàng)目對(duì)評(píng)分差表均采用Hbase表來存儲(chǔ); 未評(píng)分項(xiàng)目預(yù)測(cè)評(píng)分模塊,用于利用MapReduce映射化簡(jiǎn)模型將HDFS文件系統(tǒng)中存儲(chǔ)的用戶信息及其未評(píng)分項(xiàng)目的集合與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié),并將第一次聯(lián)結(jié)結(jié)果存入HDFS中;再將所述第一次聯(lián)結(jié)結(jié)果與所述評(píng)分集合進(jìn)行第二次聯(lián)結(jié),并結(jié)合預(yù)測(cè)算法計(jì)算出用戶未評(píng)分項(xiàng)目的預(yù)測(cè)評(píng)分值; 推薦模塊,用于根據(jù)所述預(yù)測(cè)評(píng)分值的大小向用戶進(jìn)行推薦。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,該系統(tǒng)還包括: 信息獲取模塊, 用于在建立包含用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值的評(píng)分集合之前獲取用戶信息、該用戶評(píng)分項(xiàng)目及對(duì)應(yīng)評(píng)分值,以及該用戶的未評(píng)分項(xiàng)目。
8.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述項(xiàng)目評(píng)分差信息計(jì)算寫入模塊包括: 項(xiàng)目評(píng)分差信息計(jì)算模塊,用于將所述評(píng)分集合中任一用戶的任意兩個(gè)已評(píng)分項(xiàng)目作為一個(gè)項(xiàng)目對(duì),并計(jì)算項(xiàng)目對(duì)的評(píng)分差;聚合所有用戶所有項(xiàng)目對(duì)的評(píng)分差及同一項(xiàng)目對(duì)出現(xiàn)的總次數(shù),再計(jì)算項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值。
9.根據(jù)權(quán)利要求6或7所述的系統(tǒng),其特征在于,未評(píng)分項(xiàng)目預(yù)測(cè)評(píng)分模塊包括: 第一次聯(lián)結(jié)模塊,用于將每一用戶及其未評(píng)分項(xiàng)目作為一個(gè)子集,聚合所有用戶及其未評(píng)分項(xiàng)目;將所有用戶及其未評(píng)分項(xiàng)目與所述項(xiàng)目對(duì)評(píng)分差表進(jìn)行第一次聯(lián)結(jié)并將第一次聯(lián)結(jié)結(jié)果存入HDFS中;具體的:聯(lián)結(jié)時(shí)以子集為單位進(jìn)行聯(lián)結(jié),每一子集的聯(lián)結(jié)結(jié)果中包含該用戶信息、該用戶未評(píng)分項(xiàng)目、該用戶未評(píng)分項(xiàng)目與已評(píng)分項(xiàng)目的項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值及其出現(xiàn)的總次數(shù); 第二次聯(lián)結(jié)模塊,用于將第一次的聯(lián)結(jié)結(jié)果與評(píng)分集合進(jìn)行第二次聯(lián)結(jié);具體的:聯(lián)結(jié)時(shí)以子集為單位進(jìn)行聯(lián)結(jié),將第一次聯(lián)結(jié)結(jié)果中的該用戶未評(píng)分項(xiàng)目與已評(píng)分項(xiàng)目的項(xiàng)目對(duì)評(píng)分差的算術(shù)平均值和該用戶評(píng)分集合中該項(xiàng)目對(duì)對(duì)應(yīng)的已評(píng)分項(xiàng)目的評(píng)分值做減法運(yùn)算,獲得第二次聯(lián)結(jié)結(jié)果的每一子集獲得包含該用戶信息、該用戶未評(píng)分項(xiàng)目、減法運(yùn)算結(jié)果及對(duì)應(yīng)項(xiàng)目對(duì)出現(xiàn)總次數(shù)。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述未評(píng)分項(xiàng)目預(yù)測(cè)評(píng)分模塊還包括: 預(yù)測(cè)模塊,用于結(jié)合預(yù)測(cè)算法計(jì)算出用戶未評(píng)分項(xiàng)目的預(yù)測(cè)評(píng)分值包括:
【文檔編號(hào)】G06F17/30GK103995878SQ201410225857
【公開日】2014年8月20日 申請(qǐng)日期:2014年5月23日 優(yōu)先權(quán)日:2014年5月23日
【發(fā)明者】王雷, 況亞萍, 夏磊, 張成晨 申請(qǐng)人:中國(guó)科學(xué)技術(shù)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1