基于產(chǎn)品相似度的電子商務(wù)推薦系統(tǒng)及其方法
【專利摘要】本發(fā)明實(shí)施例公開了一種基于產(chǎn)品相似度的電子商務(wù)推薦系統(tǒng)及其方法。其中,通過分析電子商務(wù)購物網(wǎng)站日志信息并對(duì)日志進(jìn)行過濾統(tǒng)計(jì);從產(chǎn)品數(shù)據(jù)庫中,獲取產(chǎn)品熱門信息,并進(jìn)行權(quán)重定制;結(jié)合用戶搜索日志和產(chǎn)品熱門信息抽取出相應(yīng)的推薦元素,運(yùn)用基于產(chǎn)品相似度的協(xié)同過濾算法將這些元素建立相似產(chǎn)品群,并將所述相似產(chǎn)品數(shù)據(jù)傳入推薦元素redis中;推薦搜索引擎以http作為請(qǐng)求協(xié)議,根據(jù)不同的需求(強(qiáng)力推薦和瀏覽歷史推薦)支持兩種推薦功能,并根據(jù)用戶參數(shù)獲得對(duì)應(yīng)的推薦元素集合,擴(kuò)展搜索查詢條件進(jìn)行搜索;最后以Json數(shù)據(jù)格式返回推薦結(jié)果。根據(jù)本發(fā)明實(shí)施例,可以提高推薦的準(zhǔn)確性,實(shí)現(xiàn)對(duì)產(chǎn)品的精準(zhǔn)推薦,滿足用戶從龐大的產(chǎn)品中挑選個(gè)性化產(chǎn)品的需求。
【專利說明】基于產(chǎn)品相似度的電子商務(wù)推薦系統(tǒng)及其方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)應(yīng)用領(lǐng)域,特別是涉及基于產(chǎn)品相似度的電子商務(wù)推薦系統(tǒng)及其方法。
【背景技術(shù)】
[0002]傳統(tǒng)的協(xié)同過濾推薦系統(tǒng)首先搜尋一組與目標(biāo)用戶興趣相似的用戶,這些興趣相似的用戶常稱為目標(biāo)用戶的鄰居用戶。實(shí)現(xiàn)過程為通過余弦相似度算法計(jì)算目標(biāo)用戶和其他所有用戶的興趣相似度,具體算法為:
【權(quán)利要求】
1.一種基于產(chǎn)品相似度的電子商務(wù)推薦系統(tǒng),其特征在于,該系統(tǒng)包括: 用戶搜索日志分析模塊,用于針對(duì)每一個(gè)用戶,采用數(shù)據(jù)挖掘工具分析所述用戶的歷史搜索記錄,獲得所述用戶基于產(chǎn)品屬性的用戶行為統(tǒng)計(jì)得分; 產(chǎn)品屬性分析模塊,用于針對(duì)每一個(gè)用戶,按照公式1g2(因素l)*log2(因素2)*因素3,獲得各產(chǎn)品的產(chǎn)品屬性統(tǒng)計(jì)得分,其中,因素I為與產(chǎn)品的產(chǎn)品屬性組合方式對(duì)應(yīng)的優(yōu)先級(jí),因素2為基于產(chǎn)品屬性的用戶行為的統(tǒng)計(jì)得分,因素3為當(dāng)前時(shí)間與預(yù)設(shè)時(shí)間的差值; 用戶行為分析模塊,用于針對(duì)每一個(gè)用戶,根據(jù)基于產(chǎn)品屬性的用戶行為統(tǒng)計(jì)得分計(jì)算產(chǎn)品屬性組合方式相同的各產(chǎn)品之間的相似度,把相似度值大于預(yù)設(shè)閾值的產(chǎn)品合并為一個(gè)群組,建立相似產(chǎn)品群; 推薦元素集合模塊,用于針對(duì)每一個(gè)用戶,將用戶ID作為鍵,將各個(gè)產(chǎn)品屬性組合方式中的相似產(chǎn)品的信息作為值,并按照鍵值對(duì)的結(jié)構(gòu)存入緩存中,作為推薦引擎的推薦元素集合; 搜索推薦引擎模塊,用于獲取目標(biāo)推薦用戶的用戶ID,從推薦元素集合中提取出與該用戶ID對(duì)應(yīng)的各個(gè)產(chǎn)品屬性組合方式中的相似產(chǎn)品的信息,并從中選擇排序在前N位的相似產(chǎn)品的信息作為搜索條件進(jìn)行搜索,并將搜索到的結(jié)果推薦給目標(biāo)推薦用戶,N為任意設(shè)定的整數(shù)。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述用戶搜索日志分析模塊具體包括: 針對(duì)每一個(gè)用戶,從所述用戶的歷史搜索日志中提取出用戶身份標(biāo)識(shí)ID、用戶在搜索產(chǎn)品時(shí)選擇的產(chǎn)品屬性以及用戶在搜索到產(chǎn)品后對(duì)該產(chǎn)品的點(diǎn)擊次數(shù);其中,用戶在搜索產(chǎn)品時(shí)選擇的產(chǎn)品屬性包括用戶在搜索產(chǎn)品時(shí)選擇的分類、品牌和型號(hào),以及用戶在搜索產(chǎn)品時(shí)輸入的搜索關(guān)鍵詞中的任意一個(gè)或任意多個(gè)組合; 針對(duì)每一個(gè)用戶,將產(chǎn)品屬性組合方式以及產(chǎn)品屬性值都相同的產(chǎn)品的點(diǎn)擊次數(shù)進(jìn)行匯總,匯總后的點(diǎn)擊次數(shù)即為所述用戶基于產(chǎn)品屬性的用戶行為統(tǒng)計(jì)得分。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述產(chǎn)品屬性分析模塊還用于,當(dāng)不同產(chǎn)品的產(chǎn)品屬性統(tǒng)計(jì)得分相同時(shí),將公式1g2(因素l)*log2(因素2)*因素3修正為C+log2(因素l)*log2 (因素2)*因素3,C為任意設(shè)定的一個(gè)常數(shù),且,對(duì)于不同產(chǎn)品,C的取值不同。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述用戶行為分析模塊包括: 相似度計(jì)算子模塊,用于針對(duì)每一個(gè)用戶,按照公式
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述相似產(chǎn)品的信息包括產(chǎn)品的分類ID、品牌ID、型號(hào)ID以及用戶在搜索該產(chǎn)品時(shí)輸入的搜索關(guān)鍵詞中的任意一個(gè)或任意多個(gè)組合。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述推薦引擎模塊的推薦結(jié)果包括產(chǎn)品ID、產(chǎn)品標(biāo)題、產(chǎn)品圖片和推薦產(chǎn)品的個(gè)數(shù)。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述推薦引擎模塊的推薦模式包括強(qiáng)力推薦和瀏覽歷史推薦,其中,所述強(qiáng)力推薦通過用戶ID獲得產(chǎn)品的搜索關(guān)鍵詞,品牌ID,分類ID,型號(hào)ID中任意一個(gè)或者任意多個(gè)組合并作為搜索條件進(jìn)行搜索推薦,進(jìn)而得到產(chǎn)品ID集合,所述瀏覽歷史推薦直接通過用戶ID獲得是用戶瀏覽記錄的產(chǎn)品ID集合。
8.一種基于產(chǎn)品相似度的電子商務(wù)推薦系統(tǒng)方法,其特征在于,包括: A、針對(duì)每一個(gè)用戶,采用數(shù)據(jù)挖掘工具分析所述用戶的歷史搜索記錄,獲得所述用戶基于產(chǎn)品屬性的用戶行為統(tǒng)計(jì)得分; B、針對(duì)每一個(gè)用戶,按照公式1g2(因素l)*log2 (因素2)*因素3,獲得各產(chǎn)品的產(chǎn)品屬性統(tǒng)計(jì)得分,其中,因素I為與產(chǎn)品的產(chǎn)品屬性組合方式對(duì)應(yīng)的優(yōu)先級(jí),因素2為基于產(chǎn)品屬性的用戶行為的統(tǒng)計(jì)得分,因素3為當(dāng)前時(shí)間與預(yù)設(shè)時(shí)間的差值;C、針對(duì)每一個(gè)用戶,根據(jù)基于產(chǎn)品屬性的用戶行為統(tǒng)計(jì)得分計(jì)算產(chǎn)品屬性組合方式相同的各產(chǎn)品之間的相似度,把相似度值大于預(yù)設(shè)閾值的產(chǎn)品合并為一個(gè)群組,建立相似產(chǎn)品群; D、針對(duì)每一個(gè)用戶,將用戶ID作為鍵,將各個(gè)產(chǎn)品屬性組合方式中的相似產(chǎn)品的信息作為值,并按照鍵值對(duì)的結(jié)構(gòu)存入緩存中,作為推薦引擎的推薦元素集合; E、獲取目標(biāo)推薦用戶的用戶ID,從推薦元素集合中提取出與該用戶ID對(duì)應(yīng)的各個(gè)產(chǎn)品屬性組合方式中的相似產(chǎn)品的信息,并從中選擇排序在前N位的相似產(chǎn)品的信息作為搜索條件進(jìn)行搜索,并將搜索到的結(jié)果推薦給目標(biāo)推薦用戶,N為任意設(shè)定的整數(shù)。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述步驟E包括: El、在Iucene的基礎(chǔ)上進(jìn)行二次開發(fā),以http作為請(qǐng)求協(xié)議,設(shè)定推薦模式,所述推薦模式包括強(qiáng)力推薦和瀏覽歷史推薦; E2、根據(jù)獲取的用戶ID在推薦元素集合中得到推薦元素,并根據(jù)推薦模式指示值判斷返回的推薦模式,若推薦模式指示值為0,確定為強(qiáng)力推薦模式,則執(zhí)行步驟E3,若推薦模式指示值為1,確定為瀏覽歷史推薦模式,則執(zhí)行步驟E4,若推薦模式指示值為2,確定為強(qiáng)力推薦和瀏覽歷史推薦,則同時(shí)執(zhí)行步驟E3和E4 ; E3、創(chuàng)建一個(gè)強(qiáng)力推薦搜索對(duì)象,并且設(shè)定搜索請(qǐng)求參數(shù),所述搜索請(qǐng)求參數(shù)包括:用戶ID、搜索關(guān)鍵詞、請(qǐng)求推薦個(gè)數(shù)、品牌ID、分類ID和型號(hào)ID,然后執(zhí)行步驟E5 ; E4、創(chuàng)建一個(gè)瀏覽歷史推薦搜索對(duì)象,并且設(shè)定搜索請(qǐng)求參數(shù),所述搜索請(qǐng)求參數(shù)包括:用戶ID和請(qǐng)求推薦個(gè)數(shù),然后執(zhí)行步驟E5 ; E5、根據(jù)用戶ID,判斷用戶是否輸入的查詢?cè)~,若是,則執(zhí)行步驟E6,若否,則執(zhí)行步驟E7 ; E6、通過分詞器對(duì)查詢?cè)~進(jìn)行預(yù)處理,并將預(yù)處理后的查詢?cè)~也作為一個(gè)搜索請(qǐng)求參數(shù)與步驟E3中的其它搜索請(qǐng)求參數(shù)一起,傳入強(qiáng)力推薦的搜索方法進(jìn)行搜索,然后執(zhí)行步驟E8 ; E7、根據(jù)用戶ID獲得產(chǎn)品ID列表,并將得到產(chǎn)品ID和請(qǐng)求推薦個(gè)數(shù),傳入瀏覽歷史推薦的搜索方法進(jìn)行搜索,然后執(zhí)行步驟ES ; ES、從數(shù)據(jù)庫中提取搜索結(jié)果所指示的產(chǎn)品的產(chǎn)品信息,并建立索引文件。
10.根據(jù)權(quán)利要求9所述產(chǎn)品相似度的電子商務(wù)推薦系統(tǒng)方法,其特征在于,在步驟E6之前還包括: E60、當(dāng)用戶輸入的查詢?cè)~為空或者都是空格時(shí),直接返回空;當(dāng)用戶輸入的查詢?cè)~中包含有空格,將空格兩端的字符串用AN D進(jìn)行連接;當(dāng)用戶輸入的查詢?cè)~中含有非法字符時(shí),將查詢?cè)~中的非法字符去掉。
【文檔編號(hào)】G06F17/30GK103942712SQ201410196044
【公開日】2014年7月23日 申請(qǐng)日期:2014年5月9日 優(yōu)先權(quán)日:2014年5月9日
【發(fā)明者】王清霞, 張海旭, 楊威, 田列, 王振 申請(qǐng)人:北京聯(lián)時(shí)空網(wǎng)絡(luò)通信設(shè)備有限公司