亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于消費者行為數(shù)據(jù)分析和分類技術(shù)的在線廣告分類推送方法及其系統(tǒng)的制作方法_2

文檔序號:9304978閱讀:來源:國知局
廣告分類推送系統(tǒng),包括數(shù)據(jù)采 集模塊、數(shù)據(jù)分析模塊和在線推送模塊;
[0074] 所述的數(shù)據(jù)采集模塊用于完成消費者行為數(shù)據(jù)的收集、清洗工作;
[0075] 所述的數(shù)據(jù)分析模塊用于完成這種消費者行為分析和分類技術(shù)的具體實現(xiàn),應(yīng)用 TMCBD主題模型分析消費者在不同商品類別和不同時間段標(biāo)簽上的購買興趣分布,然后根 據(jù)消費者的這些興趣分布,將消費者進(jìn)行有效分類,最終為每位消費者產(chǎn)生兩種類型的類 別標(biāo)簽,分別為按消費行為產(chǎn)生的早晚和按消費行為面向的對象這兩種角度進(jìn)行分類;
[0076] 所述的在線推送模塊用于完成向每位消費者推送最適合的廣告,以期購買概率最 大化,針對每位消費者,根據(jù)其身份ID查找他或者她的類別標(biāo)簽,根據(jù)這個類別標(biāo)簽尋找 top-3最為匹配的廣告并適時地推送;
[0077] 數(shù)據(jù)采集模塊與數(shù)據(jù)分析模塊相連,數(shù)據(jù)采集模塊將數(shù)據(jù)發(fā)送給數(shù)據(jù)分析模塊; 數(shù)據(jù)分析模塊與在線推送模塊相連,數(shù)據(jù)分析模塊將數(shù)據(jù)發(fā)送給在線推送模塊,在線推送 模塊完成在線廣告推送工作。
[0078] 有益效果
[0079] 本發(fā)明的基于消費者行為數(shù)據(jù)分析和分類技術(shù)的在線廣告分類推送方法及其系 統(tǒng),與現(xiàn)有技術(shù)相比通過收集各種移動終端上消費者的行為數(shù)據(jù),分析和建模消費者的行 為,挖掘不同消費者的消費習(xí)慣,實現(xiàn)消費者有效分類,從而指導(dǎo)商家完成對已有客戶的粘 性加固、對潛在客戶的精準(zhǔn)營銷和廣告推送。
[0080] 通過數(shù)據(jù)收集和預(yù)處理步驟,收集了各種移動終端上的消費者行為數(shù)據(jù),并將這 些來源不同的數(shù)據(jù)通過消費者身份匹配、數(shù)據(jù)清洗、時間片劃分等操作實現(xiàn)了有效融合,為 繼續(xù)分析和建模提供了數(shù)據(jù)支持。通過針對消費者的行為數(shù)據(jù)進(jìn)行建模步驟,分析了消費 者和商品類別、消費者和購買時間段以及商品類別和商品間的聯(lián)系,提供了一種面向消費 者行為數(shù)據(jù)的新的主題模型TMCBD ;另外,考慮消費者行為數(shù)據(jù)的不斷增加,在TMCBD后添 加了商品類別更新和消費者預(yù)測步驟,實現(xiàn)了模型的實時迭代更新。在針對消費者進(jìn)行有 效分類步驟中,同時采用了聚類和分類技術(shù),提供了一種兩層分類方法,從不同角度將消費 者進(jìn)行了劃分。具體而言,首先利用聚類分析得到一種消費者劃分,然后將其看作訓(xùn)練數(shù)據(jù) 利用分類技術(shù)學(xué)習(xí)出類別識別器,最后利用該識別器提取新增消費者的類別標(biāo)簽。
[0081]本發(fā)明可以指導(dǎo)商家對目標(biāo)客戶(包括已有客戶與潛在客戶)進(jìn)行精準(zhǔn)營銷和廣 告推送,同時消費者也可以更為快速地獲取到感興趣商品的各種信息,從而更為方便地購 買到自己需求的商品,實現(xiàn)商家與客戶雙贏局面。
【附圖說明】
[0082] 圖1為本發(fā)明的方法流程圖;
[0083] 圖2為本發(fā)明中TMCBD主題模型生成過程概率圖;
[0084] 圖3為本發(fā)明的系統(tǒng)結(jié)構(gòu)圖。
【具體實施方式】
[0085] 為使對本發(fā)明的結(jié)構(gòu)特征及所達(dá)成的功效有更進(jìn)一步的了解與認(rèn)識,用以較佳的 實施例及附圖配合詳細(xì)的說明,說明如下:
[0086] 如圖1所示,本發(fā)明所述的一種基于消費者行為數(shù)據(jù)分析和分類技術(shù)的在線廣告 分類推送方法,包括以下步驟:
[0087]第一步,數(shù)據(jù)收集和預(yù)處理。從在線移動終端上收集消費者的行為數(shù)據(jù)并建立數(shù) 據(jù)池,對數(shù)據(jù)池中的數(shù)據(jù)進(jìn)行預(yù)處理操作,為后續(xù)數(shù)據(jù)分析和建模提供數(shù)據(jù)支持。其包括以 下步驟:
[0088] (1)收集數(shù)據(jù),從在線移動終端上收集消費者的行為數(shù)據(jù),并將消費者所對應(yīng)的 行為數(shù)據(jù)建立數(shù)據(jù)池。從智能手機(jī)、P0S機(jī)等移動終端收集消費者的行為數(shù)據(jù),主要包括 GPS(地理位置信息)、購物清單(商品名、價格、銷售數(shù)量、銷售時間和店鋪名等)以及上 網(wǎng)痕跡(網(wǎng)址、停留時間、點擊頻數(shù)等)。即從消費者的智能手機(jī)和平板電腦上獲取到網(wǎng)上 購物記錄以及地理位置信息(GPS),從POS機(jī)上獲取到消費者的刷卡記錄等。根據(jù)收集到 的各種消費者行為數(shù)據(jù),建立消費者基本信息表以及消費者購物清單表等表格。消費者基 本信息表包含字段有消費者姓名(consumerName)、消費者手機(jī)編號(phonelD)、消費者電 話(phoneNu-mber)、消費者銀行卡(cardID)等。該表中的記錄存在字段缺失或者兩條記 錄實際上對應(yīng)相同的消費者。消費者購物清單表包含字段有消費者(consumer)、商品名稱 (productName)、商品價格(productPrice)、購買數(shù)量(quantity)、購買時間(time)以及店 鋪名稱(shopName)等。
[0089] (2)推送對象身份匹配。由于數(shù)據(jù)來源不同,且同一消費者在不同設(shè)備上可能有不 同的身份,因此需要對這些數(shù)據(jù)進(jìn)行消費者身份匹配,使得同一消費者的消費數(shù)據(jù)對應(yīng)唯 一的身份標(biāo)識。通過數(shù)據(jù)池中的消費者基本信息表,對消費者的身份進(jìn)行了逐級匹配,為具 有多重身份的消費者賦予唯一身份標(biāo)識。
[0090] 基于原始數(shù)據(jù)池中的數(shù)據(jù)來源不同,同時消費者在不同設(shè)備上可能有不同的身 份,所以往往實際上是同一消費者的行為數(shù)據(jù)卻被記錄成了屬于不同的消費者。為此,首 先需要對這些數(shù)據(jù)進(jìn)行消費者身份匹配操作。匹配方法則是依據(jù)原始數(shù)據(jù)池中的消費者基 本信息表,假設(shè)同一消費者持有唯一手機(jī)和電話號碼且每張銀行卡只屬于一個消費者,那 么匹配時先根據(jù)消費者身份證號;若身份證號為空,再根據(jù)消費者電話號碼或者手機(jī)編號; 若這些字段也缺失,最后根據(jù)銀行卡號。匹配過程中,如果發(fā)現(xiàn)兩條消費者記錄實際上對應(yīng) 相同的消費者,則將這兩條記錄合并成一條,并到消費者購物清單表中修改相應(yīng)的記錄。
[0091] (3)數(shù)據(jù)清洗,刪除數(shù)據(jù)池中購買商品總數(shù)和購買次數(shù)均較低的消費者及其對應(yīng) 的行為數(shù)據(jù)。在對調(diào)整后的原始數(shù)據(jù)池中的數(shù)據(jù)做統(tǒng)計分析后,可以發(fā)現(xiàn)其中一些消費者 的行為數(shù)據(jù)非常稀疏,購買商品總數(shù)(productsNu-m)和購買次數(shù)(frequency)都很低。事 實上,較少的消費行為數(shù)據(jù)往往無法反映消費者的真實行為習(xí)慣,甚至?xí)φ麄€分析和建 模產(chǎn)生負(fù)面影響。為了避免這一問題,需要對這些數(shù)據(jù)進(jìn)行清洗工作,即刪除上述兩個指標(biāo) 值都低于閾值的消費者及其行為數(shù)據(jù),即口1'0(111(^8燦1]1<11且;^6911611〇7<11。閾值大小 取決于具體數(shù)據(jù),可以根據(jù)后續(xù)分析效果作適當(dāng)調(diào)整。
[0092] (4)劃分時間片,將一天二十四小時劃分成七個時間段,并將消費者購買的商品配 以相應(yīng)的時間段標(biāo)簽??紤]不同消費者在一天內(nèi)不同時間段上的消費行為可能存在差異, 為了分析和挖掘出這種差異,需要將連續(xù)的購買時間進(jìn)行離散化,即首先將一天二十四小 時劃分成若干時間段,然后將數(shù)據(jù)池中的具體購買時間替換成時間段標(biāo)簽。劃分詳情可見 表1。
[0093] 表1時間片劃分表
[0094]

[0095] 第二步,針對消費者的行為數(shù)據(jù)進(jìn)行建模。建立一種面向消費者行為數(shù)據(jù)的主題 模型,挖掘出消費者與在線廣告類別或購買時間段等購買行為之間的聯(lián)系。其包括以下步 驟:
[0096] (1)行為數(shù)據(jù)的轉(zhuǎn)換,將數(shù)據(jù)池中的消費者購物清單中的用戶ID、數(shù)據(jù)元素、時間 段標(biāo)簽組合成行為數(shù)據(jù)結(jié)構(gòu),行為數(shù)據(jù)結(jié)構(gòu)如下所示:
[0097]〈用戶ID,〈購買商品,時間段標(biāo)簽》。
[0098] 用戶ID標(biāo)識消費者身份,〈購買商品,時間段標(biāo)簽〉表示該消費者的購物清單,包 括購買商品的名稱以及對應(yīng)的時間段。將消費者購物清單數(shù)據(jù)表示成如表2所示的結(jié)構(gòu), 若同一商品的購買數(shù)量大于1,實際購買數(shù)量是多大就對應(yīng)多少條這樣的記錄。
[0099] 表格2消費者購物清單數(shù)據(jù)表
[0100]
[0101] (2)主題模型的建立與分析,建立面向消費者行為數(shù)據(jù)的TMCBD主題模型。主題 模型(topicmodel)是繼向量空間模型(vectorspacemodel,簡稱VSM)后又一種經(jīng)典的 文本建模與表示的工具,它將人類思考和寫文章的行為看作是在玩一種文本生成游戲,認(rèn) 為文本是重復(fù)通過"以一定概率得到某個主題(topic),再從這個主題中以一定概率得到某 個詞"這樣一個過程生成的。最為人熟知的主題模型包括PLSA、LDA以及基于LDA的各種 變體。多數(shù)的主題模型都基于詞袋模型(bagofwords),認(rèn)為文本是由詞構(gòu)成的序列且詞 與詞之間互相獨立。借用主題模型思想,本發(fā)明將消費者及其購買的商品當(dāng)作文本,每個商 品相當(dāng)于文本中的詞,商品的購買數(shù)量即是詞頻。在這里,主題具有了更實際的物理意義, 即表示商品類別。值得一提的是,商品與商品間的獨立性較之文本中詞間的關(guān)系更符合主 題模型的假設(shè)。另外,將商品的購買時間考慮進(jìn)模型中,即數(shù)據(jù)中的TimeLabel。為此,本發(fā) 明面向消費者行為數(shù)據(jù)提供了一種新的主題模型TopicModelforCon-sumers'Behavior Data(簡稱TMCBD),自動學(xué)習(xí)不同商品類別在商品上的分布情況以及不同消費者在不同時 間段內(nèi)對不同商品類別的購買興趣分布情況。
[0102] 建立TMCBD主題模型其包括以下步驟:
[0103]A、設(shè)定模型參數(shù),
[0104]a、定義消費者行為數(shù)據(jù)庫W。
[0105]W={ConShopListpConShopList2,? ??,ConShopListJ,
[0106]W為消費者行為數(shù)據(jù)庫,ConShopListm表示第m個消費者的購物清單詳情,M表示 消費者的個數(shù);
[0107]ConShopListm= {〈product,timeLabel> "〈product,timeLabel>2,…,〈product, timeLabel>Nm}
[0108],〈product,timeLabel〉。表示第m個消息者購買第n個商品及其購買時間,Nm表 示第m個消費者購買商品的總數(shù)量。
[0109] 消費者行為數(shù)據(jù)庫W的生成過程可以使現(xiàn)有技術(shù)中的內(nèi)容,也可以使用以下步 驟,如圖2所示,
[0110]Z1,假設(shè)現(xiàn)有消費者行為數(shù)據(jù)中只涉及K個商品類別,則《 = 每個商品類別可以表示成商品上的多項式分布。
[0111] Z2,定義消費興趣。由于每個消費者在不同時間段上的消費興趣可能發(fā)生變化,假 設(shè)第m個消費者在第h個時間段上的消費興趣為emwh取
當(dāng)前第2頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
<samp id="c7gl4"><nobr id="c7gl4"><optgroup id="c7gl4"></optgroup></nobr></samp>