亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

快速的負(fù)序列挖掘模式在客戶購買行為分析中的應(yīng)用

文檔序號(hào):8259941閱讀:879來源:國(guó)知局
快速的負(fù)序列挖掘模式在客戶購買行為分析中的應(yīng)用【
技術(shù)領(lǐng)域
】[0001]本發(fā)明涉及快速的負(fù)序列挖掘模式在客戶購買行為分析中的應(yīng)用,屬于負(fù)序列模式的應(yīng)用
技術(shù)領(lǐng)域
。【
背景技術(shù)
】[0002]隨著互聯(lián)網(wǎng)高潮來臨,使得網(wǎng)絡(luò)購物的用戶規(guī)模不斷上升。對(duì)消費(fèi)者來說,網(wǎng)絡(luò)購物已經(jīng)成為一種全新的購物體驗(yàn),并逐步成為生活中不可或缺的一部分?;ヂ?lián)網(wǎng)提供了一個(gè)新的交互的購物渠道,消費(fèi)者獲得巨大的優(yōu)勢(shì):豐富的商品信息,克服地理與時(shí)間的障礙,獲得有價(jià)格競(jìng)爭(zhēng)力的商品,產(chǎn)品的個(gè)性化、定制化,更多的商品選擇,更大的購物便利等。近年來,網(wǎng)絡(luò)購物呈爆發(fā)式增長(zhǎng),每年都以幾何數(shù)級(jí)增長(zhǎng),與此同時(shí)很多大型的電子商務(wù)網(wǎng)站,如Amazon、阿里巴巴旗下的淘寶和天貓商城、京東等都積累了大量的客戶交易數(shù)據(jù)。如何充分利用這些數(shù)據(jù)對(duì)客戶購買行為進(jìn)行有效的分析、組織利用,如何了解到客戶盡可能多的愛好和價(jià)值取向,以優(yōu)化網(wǎng)站設(shè)計(jì),為客戶提供個(gè)性化服務(wù),成為電子商務(wù)發(fā)展迫切要解決的問題。[0003]與傳統(tǒng)的經(jīng)營(yíng)方式相比,網(wǎng)絡(luò)購物的產(chǎn)品信息量大,數(shù)量、種類豐富,選擇范圍廣。在傳統(tǒng)購物環(huán)境下,消費(fèi)者獲取商品信息的來源主要靠生活積累,搜集過程較長(zhǎng),得到的信息比較片面。在網(wǎng)絡(luò)購物環(huán)境下,消費(fèi)者就可以集中時(shí)間搜集、查找大量的有關(guān)商品的信息。網(wǎng)上商品種類豐富,有些商品消費(fèi)者想要購買而傳統(tǒng)商鋪不容易找到,就可以通過網(wǎng)絡(luò)商店方便的查詢購買,補(bǔ)充了傳統(tǒng)商店某些產(chǎn)品的短缺。但是目前的電子商務(wù)商家通常不能直觀的去了解客戶,獲取的相關(guān)的數(shù)據(jù)有限(比如用戶的注冊(cè)信息,購買記錄等)。通過對(duì)大量的客戶購買記錄進(jìn)行分析和挖掘,發(fā)現(xiàn)客戶的頻繁訪問序列模式,針對(duì)不同的客戶屬性和網(wǎng)上購物步驟,采用不同的商品推薦形式,適時(shí)的向客戶推薦恰當(dāng)?shù)纳唐?,并?yōu)化電子商務(wù)網(wǎng)站商品的擺放位置,可以有效的增加客戶的交易機(jī)會(huì),將網(wǎng)站瀏覽者轉(zhuǎn)變?yōu)橘徺I者,提高交叉銷售能力,提高客戶的忠誠度,以及提高購物網(wǎng)站的服務(wù)質(zhì)量和經(jīng)濟(jì)效益。[0004]序列模式分析所要解決的問題是客戶在完成一次交易之后,在以后的特定時(shí)間內(nèi),還會(huì)購買什么商品,是發(fā)現(xiàn)交易之間關(guān)系規(guī)律的過程,使得售貨方能夠根據(jù)當(dāng)前的商品買賣情況來預(yù)測(cè)以后的商品買賣情況,從而能夠更好的安排商品的擺放。它的主要目的是研宄商品購買的先后關(guān)系,找出其中的規(guī)律,即不僅需要知道商品是否被購買,而且需要確定該商品與其它商品購買的先后順序,例如,在線購買DVD的一個(gè)典型的順序是購買"星球大戰(zhàn)",之后很有可能繼續(xù)購買"帝國(guó)反擊戰(zhàn)",再是購買"杰達(dá)武士歸來"。因此序列模式能夠發(fā)現(xiàn)數(shù)據(jù)庫中某一段時(shí)間內(nèi)的一個(gè)頻繁序列,即在這個(gè)時(shí)間段內(nèi)哪些商品會(huì)被客戶購買的比較多,多或少的標(biāo)準(zhǔn)是由最小支持度來決定的。每個(gè)序列是按照交易的時(shí)間排列的一組集合,可以設(shè)置最小支持度來挖掘滿足不同頻繁程度的序列。但在應(yīng)用序列模式分析客戶購買行為,解決個(gè)性化商品推薦問題時(shí),他們僅考慮了已發(fā)生的事件,也稱為正序列模式(PositiveSequentialPattern,PSP)挖掘。[0005]與傳統(tǒng)的正序列模式(PositiveSequentialPattern,PSP)不同,負(fù)序列模式(NegativeSequentialPattern,NSP)挖掘不僅考慮了已經(jīng)發(fā)生的事件,還關(guān)注于未發(fā)生事件,它能夠更深入地分析和理解數(shù)據(jù)中的潛在含義,從而挖掘出容易被人們忽略但是非常有價(jià)值的信息。例如:a代表面包,b代表咖啡,c代表茶,d代表糖,〈ab^cd〉表示一個(gè)客戶購買序列模式,該模式說明在某一段時(shí)間內(nèi),該客戶在購買了商品a、b后,在沒有購買商品c的情況下,購買了商品d。如今負(fù)序列模式的價(jià)值越來越被人們認(rèn)可,在深入理解和處理許多商業(yè)應(yīng)用方面,如對(duì)客戶購買行為分析方面,它更有一種不可替代的作用。[0006]目前,關(guān)于負(fù)序列模式挖掘算法的研宄成果較少,如,NSPM,PNSP,Neg-GSP,e-NSP等等。但是目前大多數(shù)的負(fù)序列挖掘算法的效率都很低,有很多困難擺在挖掘負(fù)模式面前,因?yàn)樨?fù)模式不符合Apriori規(guī)則,因此不能用傳統(tǒng)的剪枝方法減少負(fù)候選序列的生成,所以大部分算法的負(fù)候選序列非常龐大,如PNSP和Neg-GSP。并且在計(jì)算負(fù)候選序列的支持度時(shí)往往需要重復(fù)掃描數(shù)據(jù)庫,這就帶來了極大的時(shí)空消耗,使得挖掘出負(fù)序列模式更為困難,因此我們就需要一個(gè)高效快速的負(fù)序列挖掘算法來解決目前的問題。目前e-NSP是較為高效的負(fù)序列挖掘算法,但是我們發(fā)現(xiàn)e-NSP中很大一部分的時(shí)間是消耗在了計(jì)算客戶ID的并集上面,為了更快提高挖掘負(fù)序列的效率,我們提出了一種更快的負(fù)模式算法,名為f-NSP。將f-NSP算法應(yīng)用到客戶購買行為分析中,可以更快的找出商品交易間的負(fù)序列關(guān)系,從而給售貨方提供更好的銷售策略。[0007]以電子商務(wù)平臺(tái)中的網(wǎng)站用戶購買訂單數(shù)據(jù)為挖掘的數(shù)據(jù)源。[0008]以5個(gè)客戶在2個(gè)月內(nèi)的交易為例,如表1是由客戶ID和交易時(shí)間為關(guān)鍵字所排序的事務(wù)數(shù)據(jù)庫。一個(gè)事務(wù)數(shù)據(jù)庫,一個(gè)事務(wù)代表一筆交易,一個(gè)單項(xiàng)代表交易的商品,單項(xiàng)屬性中的字母記錄的是商品ID。[0009]表1事務(wù)數(shù)據(jù)庫[0010]【主權(quán)項(xiàng)】1.一種快速的負(fù)序列挖掘模式在客戶購買行為分析中的應(yīng)用,包括步驟如下:(1)對(duì)負(fù)包含的定義約束1,元素內(nèi)部不允許有負(fù)項(xiàng);約束2,不存在連續(xù)2個(gè)或2個(gè)以上的負(fù)元素;約束3,本應(yīng)用挖掘的負(fù)序列其正偶序列是頻繁的;定義一個(gè)負(fù)侯選序列ns=〈a-bc_d>:MPS(ns)是指一個(gè)由客戶購買的商品組成的負(fù)序列ns的最大正子序列,其由ns中包含的所有正元素按照原順序組成;正偶P(ns),是指將一個(gè)由客戶購買的商品組成的負(fù)序列ns中的負(fù)元素全部轉(zhuǎn)化為對(duì)應(yīng)的正元素;l-negMSns:負(fù)序列ns的子序列,并且該子序列是由MPS(ns)以及一個(gè)負(fù)元素組成;l-negMSSns:包含負(fù)序列ns的所有序列的集合;p(l-negMS):序列1-negMS中的正元素不變,將負(fù)元素轉(zhuǎn)換為相應(yīng)的正元素;對(duì)于一個(gè)數(shù)據(jù)序列ds和一個(gè)大小為m并且含有n個(gè)負(fù)元素的序列ns,滿足所述的三個(gè)約束,且滿足以下條件,則ds包含ns:MPS(ns)eds;每一個(gè)1-negMS滿足/)(丨-wg/V/5");(2)利用f-NSP算法的步驟如下:首先,用正序列模式挖掘算法GSP挖掘得到所有的正序列模式,即在某一段時(shí)間內(nèi),客戶購買量大的商品,并且對(duì)每一個(gè)頻繁正序列都使用高效的位圖存儲(chǔ)結(jié)構(gòu)來保存包含其的數(shù)據(jù)序列;然后,基于所述正序列模式生成相應(yīng)的負(fù)侯選序列(negativesequentialcandidates,NSC);對(duì)所述位圖進(jìn)行與、或、異或計(jì)算負(fù)候選支持度;再從所述負(fù)侯選序列里篩選出符合最小支持度要求的負(fù)序列模式,再用現(xiàn)有適當(dāng)?shù)暮Y選方法將能用于決策的序列模式篩選出來,利用所述用于決策的序列模式對(duì)客戶的購買行為進(jìn)行分析;商家根據(jù)分析結(jié)果針對(duì)客戶提供個(gè)性化服務(wù),根據(jù)客戶購買習(xí)慣安排商品的推薦順序和頻率;(3)E-msNSP負(fù)侯選序列的生成改變正序列模式中任意不相鄰元素為負(fù)元素;(4)位圖存儲(chǔ)結(jié)構(gòu)e-NSP算法的傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)是使用hashtable,用來存儲(chǔ)挖掘出來的頻繁正序列模式,值對(duì)應(yīng)著包含此頻繁模式的數(shù)據(jù)序列的sid,將所述頻繁模式的數(shù)據(jù)序列的sid轉(zhuǎn)化為位圖格式存儲(chǔ),將在計(jì)算支持度上更快的計(jì)算sid集合的并集和異或運(yùn)算;表3.f-NSP數(shù)據(jù)結(jié)構(gòu)_(5)計(jì)算負(fù)侯選序列的支持度大小為m并且含有n個(gè)負(fù)元素的序列ns,對(duì)于'Vl-negMSiel-negMSl(1彡i彡n),在序列數(shù)據(jù)庫D中ns的支持度sup(ns)是:若ns的大小為1,并且它只有1個(gè)負(fù)元素,則它的支持度為:sup(ns)=|D|-sup(p(ns))(i)若ns只包含一個(gè)負(fù)項(xiàng),則序列ns的支持度是:sup(ns)=sup(MPS(ns))_sup(p(ns))(ii)其余的,ns的支持度為:sup(ns)=OBiBUlPS(ns))?-negMS(iii)其中,I是位圖的或運(yùn)算符號(hào),?是位圖的異或運(yùn)算符號(hào);(6)算法偽代碼所述f-NSP算法是基于正序列模式來挖掘負(fù)序列模式,算法f-NSP包括步驟如下:其中,輸入:D:客戶購買序列數(shù)據(jù)庫;min_sup最小項(xiàng)支持度;輸出:NSP:用于分析客戶購買行為的序列模式的集合;所述步驟(1)是用GSP等正序列挖掘算法從序列數(shù)據(jù)庫中挖掘出所有的正序列模式;所有的正侯選序列以及它的支持度和sid的位圖都被存儲(chǔ)到哈希表PSPHash;所述步驟(4)是對(duì)于每一個(gè)正序列模式,通過負(fù)侯選序列的生成方法來生成負(fù)侯選序列NSC;步驟(5)至步驟(17),通過公式(i)-(iii)計(jì)算出NSC中的每一個(gè)nsc的支持度;步驟(18)至步驟(19)然后判斷出哪些是負(fù)序列模式NSP;步驟(6)至步驟(9),通過公式(i)和公式(ii)計(jì)算出只含有一個(gè)負(fù)元素的nsc的支持度,對(duì)于包含多于一個(gè)負(fù)元素的nsc的支持度,通過公式(iii)計(jì)算出如步驟(9)至步驟(17);如果nsc.support〉=min_sup(nsc)那么nsc被加入到NSP中,如步驟(19)至步驟(19);返回結(jié)果,如步驟(22),再用適當(dāng)?shù)暮Y選方法將能用于決策的序列模式篩選出來,利用這些篩選后的序列模式來分析客戶的購買行為。【專利摘要】本發(fā)明提供一種快速的負(fù)序列挖掘模式在客戶購買行為分析中的應(yīng)用。本發(fā)明提出一個(gè)名為f-NSP的快速算法來高效的挖掘負(fù)序列模式,所述算法的主要思想是首先通過正序列模式挖掘算法得到正序列模式,然后對(duì)每一個(gè)頻繁正序列都使用高效的位圖存儲(chǔ)結(jié)構(gòu)來保存包含其的數(shù)據(jù)序列;之后使用與e-NSP同樣的生成負(fù)候選序列方法來生成負(fù)候選;最后,依托公式對(duì)數(shù)據(jù)位圖進(jìn)行與、或、異或操作快速的計(jì)算負(fù)候選支持度,挖掘出滿足最小支持度的負(fù)序列模式,而無需再次掃描數(shù)據(jù)庫。利用這些篩選后的序列模式來分析客戶的購買行為,使得售貨方能夠根據(jù)當(dāng)前的商品買賣情況來預(yù)測(cè)以后的商品買賣情況,從而能夠更好的安排商品的擺放,提高商品銷售量。【IPC分類】G06Q30-02,G06F17-30【公開號(hào)】CN104574153【申請(qǐng)?zhí)枴緾N201510026575【發(fā)明人】董祥軍,宮永順【申請(qǐng)人】齊魯工業(yè)大學(xué)【公開日】2015年4月29日【申請(qǐng)日】2015年1月19日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1