一種基于行為預(yù)測(cè)的推薦方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種基于行為預(yù)測(cè)的推薦方法和裝置。
【背景技術(shù)】
[0002] 近年來(lái),隨著計(jì)算機(jī)和網(wǎng)絡(luò)的普及,數(shù)據(jù)挖掘技術(shù)在各種計(jì)算機(jī)應(yīng)用系統(tǒng)中的作 用與日倶增。大數(shù)據(jù)的發(fā)展,使得一方面提高了電子網(wǎng)站收集和存儲(chǔ)海量數(shù)據(jù)的能力;另一 方面也造成了人們面對(duì)海量信息無(wú)所適從的局面。人們已經(jīng)注意到,對(duì)過(guò)去事務(wù)數(shù)據(jù)的分 析能提供關(guān)于客戶需求非常有價(jià)值的信息,從而能極大地改善商業(yè)決策的質(zhì)量。因而,在電 子系統(tǒng)運(yùn)行中捕獲和發(fā)現(xiàn)客戶行為模式并挖掘商務(wù)智能越來(lái)越成為人們關(guān)注的熱點(diǎn)。
[0003] 但是隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)急劇增長(zhǎng),信息過(guò)載現(xiàn)象越來(lái)越嚴(yán)峻,用戶想要 從海量信息中快速準(zhǔn)確地找到感興趣的信息變得越來(lái)越困難。已有的推薦算法大多從用戶 瀏覽商品、點(diǎn)擊商品和購(gòu)買記錄出發(fā),對(duì)歷史數(shù)據(jù)進(jìn)行分析進(jìn)而進(jìn)行推薦。但是這樣會(huì)帶來(lái) 一個(gè)問(wèn)題,那就是在網(wǎng)絡(luò)上銷售的商品種類繁多,商家呈現(xiàn)的都是商品光鮮亮麗的一面,實(shí) 際的商品質(zhì)量如何并不得而知。那么傳統(tǒng)的推薦方法很可能會(huì)推薦一些滿足用戶需求,但 質(zhì)量并不好的商品,一旦用戶購(gòu)買后發(fā)現(xiàn)質(zhì)量不好,就會(huì)極大地降低用戶對(duì)于推薦商品的 ig任度。
[0004] 基于現(xiàn)有技術(shù)的這一缺陷,在現(xiàn)有的電子領(lǐng)域希望收集更多的真實(shí)的用戶反饋。 但是,在現(xiàn)有的網(wǎng)站中,通常銷售成千上萬(wàn)的商品,作為電子商務(wù)網(wǎng)站的運(yùn)營(yíng)者而言不可能 試用所有的商品,或者說(shuō)即使試用了得到的也是小面積小樣本的反饋,因而越來(lái)越多的網(wǎng) 站都設(shè)置了客戶在購(gòu)買商品后給出評(píng)價(jià)的通道,并且為了使得更多地客戶在購(gòu)物后進(jìn)行評(píng) 價(jià)還設(shè)置了一些獎(jiǎng)勵(lì)方法。但是現(xiàn)實(shí)卻是并非所有用戶在購(gòu)買商品后會(huì)對(duì)商品進(jìn)行評(píng)價(jià)和 反饋。那么如何在非全樣本的用戶反饋的基礎(chǔ)上,實(shí)現(xiàn)準(zhǔn)確的推薦是亟待解決的一個(gè)問(wèn)題。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,本申請(qǐng)?zhí)峁┮环N基于行為預(yù)測(cè)的商品推薦方法,其特征在于,具體包 括: Stepl :收集用戶對(duì)商品的評(píng)分信息; Step2 :根據(jù)商品評(píng)分的評(píng)分方差,計(jì)算評(píng)分相似度; Step3 :融合評(píng)分項(xiàng)的相似度; Step4:根據(jù)融合的評(píng)分項(xiàng)相似度得到最近商品集,預(yù)測(cè)用戶對(duì)商品的評(píng)分,并根據(jù)評(píng) 分大小產(chǎn)生推薦商品。
[0006] 在本申請(qǐng)一優(yōu)選實(shí)施例中,在所述Step2中根據(jù)商品評(píng)分的評(píng)分方差計(jì)算評(píng)分項(xiàng) 的相似度得到最相似商品集。
[0007] 在本申請(qǐng)一優(yōu)選實(shí)施例中,在所述Step2中不同商品i,j評(píng)分之間的相似度為:
其中&^、是商品i和j的評(píng)分方差,評(píng)分方差表示了評(píng)分項(xiàng)之間方差差異的大 小。
[0008] 在本申請(qǐng)一優(yōu)選實(shí)施例中,其特征在于,所述Step3包括:將評(píng)分相似度和現(xiàn)有技 術(shù)中的計(jì)算得到的相似度線性融合得到評(píng)分項(xiàng)的相似度,其中所述現(xiàn)有技術(shù)的相似度計(jì)算 可以采用針對(duì)Pearson系數(shù)的MX改進(jìn)方案以下公式進(jìn)行計(jì)算:
其中,M和巧分別是對(duì)商品i和j評(píng)過(guò)分的用戶集合,浐為手動(dòng)可調(diào)參數(shù),具體取值由 數(shù)據(jù)集而定,(ij)為商品i和j的Pearson相關(guān)系數(shù),妒=5。
[0009] 在本申請(qǐng)一優(yōu)選實(shí)施例中,其特征在于,所述St印4包括: 若商品i的最近商品集為N⑴,則用戶u對(duì)商品i的預(yù)測(cè)評(píng)分Pu,,可以根據(jù)用戶u對(duì) 最近商品集N(i)中的評(píng)分得到,計(jì)算方法如下:
其中忽表不商品i與其最近相似商品j之間的相似度,式和&分別表不用戶對(duì) 商品i和j的平均評(píng)分; 并且根據(jù)計(jì)算得到的評(píng)分大小產(chǎn)生推薦商品。
[0010] 本申請(qǐng)還提供了一種基于行為預(yù)測(cè)的推薦裝置,包括: 評(píng)分收集模塊,收集用戶對(duì)商品的評(píng)分信息; 評(píng)分相似度計(jì)算模塊,根據(jù)商品評(píng)分的評(píng)分方差,計(jì)算評(píng)分相似度; 融合計(jì)算模塊,融合評(píng)分項(xiàng)的相似度; 推薦模塊,根據(jù)融合的評(píng)分項(xiàng)相似度得到最近商品集,預(yù)測(cè)用戶對(duì)商品的評(píng)分,并根據(jù) 評(píng)分大小產(chǎn)生推薦商品。
[0011] 在本申請(qǐng)一優(yōu)選實(shí)施例中,其特征在于,在所述評(píng)分相似度計(jì)算模塊中根據(jù)商品 評(píng)分的評(píng)分方差計(jì)算評(píng)分項(xiàng)的相似度得到最相似商品集。
[0012] 在本申請(qǐng)一優(yōu)選實(shí)施例中,其特征在于:在所述評(píng)分相似度計(jì)算模塊中不同商品 i,j評(píng)分之間的相似度為:
其中交是商品i和j的評(píng)分方差,評(píng)分方差表示了評(píng)分項(xiàng)之間方差差異的大 小。
[0013] 在本申請(qǐng)一優(yōu)選實(shí)施例中,其特征在于,所述融合計(jì)算模塊包括:將評(píng)分相似度和 現(xiàn)有技術(shù)中的計(jì)算得到的相似度線性融合得到評(píng)分項(xiàng)的相似度,其中所述現(xiàn)有技術(shù)的相似 度計(jì)算可以采用針對(duì)Pearson系數(shù)的MAX改進(jìn)方案以下公式進(jìn)行計(jì)算:
其中,M和巧分別是對(duì)商品i和j評(píng)過(guò)分的用戶集合,^為手動(dòng)可調(diào)參數(shù),具體取值由 數(shù)據(jù)集而定,(W)為商品i和j的Pearson相關(guān)系數(shù),f =5。
[0014] 在本申請(qǐng)一優(yōu)選實(shí)施例中,其特征在于,所述推薦模塊包括: 若商品i的最近商品集為N⑴,則用戶u對(duì)商品i的預(yù)測(cè)評(píng)分Pu,,可以根據(jù)用戶u對(duì) 最近商品集N(i)中的評(píng)分得到,計(jì)算方法如下:
其中;swii)表示商品i與其最近相似商品j之間的相似度,響和$分別表示用戶對(duì) 商品i和j的平均評(píng)分; 并且根據(jù)計(jì)算得到的評(píng)分大小產(chǎn)生推薦商品。
[0015]
【附圖說(shuō)明】
[0016] 為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本 申請(qǐng)中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,還可以根據(jù)這些附圖獲得其他 的附圖。
[0017] 圖1是本申請(qǐng)中基于行為預(yù)測(cè)推薦方法的流程圖; 圖2是本申請(qǐng)中基于行為預(yù)測(cè)推薦裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0018] 本發(fā)明提出了一種基于用戶行為預(yù)測(cè)的推薦方法,該方法解決了現(xiàn)有技術(shù)中存在 的用戶評(píng)價(jià)不全的問(wèn)題。本申請(qǐng)針對(duì)現(xiàn)實(shí)中面臨的用戶評(píng)價(jià)收集不全的問(wèn)題提出了將用于 行為預(yù)測(cè)融入推薦算法中,更加充分地利用了現(xiàn)有的用戶評(píng)分信息,極大地緩解了傳統(tǒng)推 薦算法的推薦不準(zhǔn)確的問(wèn)題。
[0019] 在預(yù)測(cè)客戶對(duì)商品評(píng)分時(shí),利用的是該客戶最相似用戶集中的評(píng)分信息。因此,在 預(yù)測(cè)未評(píng)分客戶對(duì)商品評(píng)分時(shí)需要獲得兩個(gè)信息:第一,是該用戶未評(píng)價(jià)商品的最相似商 品集;第二,最相似商品集中的用戶對(duì)該商品有過(guò)評(píng)分。
[0020] 本發(fā)明提出了一種基于用戶行為預(yù)測(cè)的推薦方法,其實(shí)現(xiàn)流程如圖1所示,包括: Stepl :收集用戶對(duì)商品的評(píng)分信息; Step2 :根據(jù)商品評(píng)分的評(píng)分方差,計(jì)算評(píng)分相似度; Step3 :融合評(píng)分項(xiàng)的相似度; Step4:根據(jù)融合的評(píng)分項(xiàng)相似度得到最近商品集,預(yù)測(cè)用戶對(duì)商品的評(píng)分,并根據(jù)評(píng) 分大小產(chǎn)生推薦商品。
[0021] 下面詳細(xì)介紹每一步的優(yōu)選實(shí)施方式。
[0022] St印1的優(yōu)選實(shí)施方式: 收集用戶對(duì)于商品的評(píng)分信息,并所有評(píng)分信息進(jìn)行存儲(chǔ)。這里對(duì)評(píng)分信息的收集和 存儲(chǔ)可以采用現(xiàn)有技術(shù)中本領(lǐng)域技術(shù)人員公知的技術(shù)手段,優(yōu)選地,可以采用矩陣的形式 存儲(chǔ)用戶評(píng)分信息。
[0023] 用戶對(duì)商品的評(píng)分矩陣可以如下表所示:
可以看出,用戶評(píng)分的缺失,可以是所有評(píng)分項(xiàng)全部缺失,也可以是部分評(píng)分項(xiàng)缺失。
[0024] St印2的優(yōu)選實(shí)施方式: 通過(guò)計(jì)算評(píng)分項(xiàng)的相似度得到最相似商品集。
[0025] 根據(jù)商品評(píng)分的評(píng)分方差,計(jì)算評(píng)分相似度。
[0026] 商品的評(píng)分方差越大表示用戶對(duì)該商品評(píng)分的相似度越小,評(píng)分方差越小表示用 戶對(duì)該商品評(píng)分的相似度越大。因此,不同商品i,j評(píng)分之間的相似度為:
其中錢是商品i和j的評(píng)分方差,評(píng)分方差適度表示了評(píng)分項(xiàng)之間方差差異的 大小。
[0027] 例如,評(píng)分項(xiàng) i、j、s 的方差分別是 I、1. 5 和 3,則M.Wicsdj') = 0.8,= 0. J ,方差差值越小,表示用戶對(duì)他們的評(píng)分項(xiàng)相似度越大。
[0028] St印3的優(yōu)選實(shí)施方式: 將評(píng)分相似度和現(xiàn)有技術(shù)中的計(jì)算得到的相似度線性融合得到評(píng)分項(xiàng)的相似度。
[0029] 優(yōu)