一種多維度復(fù)雜條件廣告索引方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及廣告索引方法,進(jìn)一步的說,是涉及一種多維度復(fù)雜條件廣告索引方法。
【背景技術(shù)】
[0002]現(xiàn)代互聯(lián)網(wǎng)廣告投放系統(tǒng)的一個(gè)重要特征是精準(zhǔn)。當(dāng)一次用戶訪問(pv)到來,廣告系統(tǒng)需要根據(jù)這次訪問帶來的信息(如地域,跳轉(zhuǎn)頁面等)以及自身系統(tǒng)積累的用戶信息(如該用戶cookie對應(yīng)的興趣點(diǎn),關(guān)鍵字等)匹配各個(gè)廣告主的投放需求。比如說,某個(gè)廣告主A希望投放自己的廣告給上海的對汽車感興趣的用戶,當(dāng)廣告系統(tǒng)接受到一個(gè)某汽車網(wǎng)站的來自上海用戶的廣告投放需求時(shí),廣告系統(tǒng)應(yīng)當(dāng)為廣告主A對該次投放進(jìn)行競價(jià),否則廣告系統(tǒng)應(yīng)當(dāng)放棄這次競價(jià)。因此廣告系統(tǒng)的一個(gè)核心功能是根據(jù)到達(dá)的海量訪問實(shí)時(shí)匹配廣告主的多維度復(fù)雜廣告定向條件。
[0003]在很多的廣告檢索系統(tǒng)中,單維度上的廣告匹配觸發(fā)由索引模塊(index模塊)完成。而由于多維度定向條件下廣告觸發(fā)結(jié)果集合的實(shí)時(shí)歸并邏輯較復(fù)雜,對性能要求較高,且常常與業(yè)務(wù)耦合較緊,因此,該部分邏輯通常被同業(yè)務(wù)邏輯一同實(shí)現(xiàn)。
[0004]例如,一個(gè)用戶訪問的屬性為(上海用戶,汽車網(wǎng)站),該用戶的興趣點(diǎn)為(教育,醫(yī)療),某個(gè)廣告主A希望投放廣告給來自上海的汽車網(wǎng)站的,并且興趣為教育或醫(yī)療的用戶訪問,在多數(shù)現(xiàn)有的廣告系統(tǒng)中的通常做法為:
(I)給用戶打上興趣點(diǎn)定向的標(biāo)簽tagl, tag2...tagN, tag分類通常由離線挖掘模塊完成。
[0005](2)在索引模塊找出對汽車感興趣的廣告主adl,找出對上海用戶感興趣的廣告主ad2,對教育并且醫(yī)療感興趣的廣告主ad3,對tagm感興趣的廣告主adtaglm
(3)在業(yè)務(wù)邏輯模塊計(jì)算adl and ad2 and (tagl or tag2…or tagN) (and表不計(jì)算集合的交集,or表示計(jì)算集合的并集)
這種做法有以下幾個(gè)弱點(diǎn):
(I)由于業(yè)務(wù)邏輯時(shí)常會(huì)變化,這種架構(gòu)方式會(huì)導(dǎo)致廣告觸發(fā)結(jié)果集合的實(shí)時(shí)歸并邏輯隨著業(yè)務(wù)邏輯經(jīng)常變動(dòng),造成相對較大的開發(fā)代價(jià)。比如說,目前的標(biāo)簽之間只支持求或操作,而某廣告主希望投放的興趣點(diǎn)人群為“教育并且醫(yī)療”,則我們需要在業(yè)務(wù)邏輯模塊及離線挖掘模塊中定制該邏輯,需要額外開發(fā)、測試、運(yùn)維代價(jià),無法做到自動(dòng)化反應(yīng)廣告主用戶定向需求。
[0006](2)由于廣告觸發(fā)集合的實(shí)時(shí)歸并邏輯放在業(yè)務(wù)邏輯中實(shí)現(xiàn),難以對其進(jìn)行有針對性的優(yōu)化。
[0007]有鑒于此,本發(fā)明提供了一種多維度復(fù)雜條件廣告索引方法。
【發(fā)明內(nèi)容】
[0008]本發(fā)明提供了一種多維度復(fù)雜條件廣告索引方法,克服了現(xiàn)有技術(shù)的困難,將廣告檢索結(jié)果集合歸并過程納入索引模塊,極大的減小業(yè)務(wù)模塊的檢索相關(guān)邏輯復(fù)雜度,減小業(yè)務(wù)邏輯變更帶來的開發(fā)代價(jià),通過版本庫管理實(shí)現(xiàn)索引模塊讀寫分離,保證模塊在頻繁修改索引情況下依然能夠低延遲響應(yīng)高并發(fā)請求。
[0009]本發(fā)明采用了如下技術(shù)方案:
本發(fā)明提供了一種多維度復(fù)雜條件廣告索引方法,至少包括以下步驟:
步驟(I)、定義固定維度屬性交并邏輯;
步驟(2)、將用戶訪問屬性分為固定維度屬性和不定維度屬性;
步驟(3)、通過業(yè)務(wù)數(shù)據(jù)庫和檢索模塊的數(shù)據(jù)通道近實(shí)時(shí)獲取廣告主定制的不定維度屬性觸發(fā)結(jié)果交并邏輯;
步驟(4)、建立各維度屬性觸發(fā)結(jié)果集合歸并樹;
步驟(5)、根據(jù)各個(gè)維度屬性觸發(fā)候選廣告集合;
步驟(6)、將候選廣告集合掛載在歸并樹的相應(yīng)節(jié)點(diǎn)上;以及步驟(7)、根據(jù)歸并樹歸并方法,獲得的最終廣告集合。
[0010]由于使用了以上技術(shù),本發(fā)明的多維度復(fù)雜條件廣告索引方法將廣告檢索結(jié)果集合歸并過程納入索引模塊,極大的減小業(yè)務(wù)模塊的檢索相關(guān)邏輯復(fù)雜度,減小業(yè)務(wù)邏輯變更帶來的開發(fā)代價(jià),通過版本庫管理實(shí)現(xiàn)索引模塊讀寫分離,保證模塊在頻繁修改索引情況下依然能夠低延遲響應(yīng)高并發(fā)請求。
[0011]
【附圖說明】
[0012]圖1為本發(fā)明的多維度復(fù)雜條件廣告索引方法的流程圖。
[0013]
【具體實(shí)施方式】
[0014]下面通過圖1來介紹本發(fā)明的具體實(shí)施例。
[0015]第一實(shí)施例
如圖1所示,本發(fā)明是為了克服廣告檢索系統(tǒng)上述弱點(diǎn)實(shí)現(xiàn)的高性能多維度復(fù)雜條件廣告索引方法,至少包括以下步驟:
步驟(I)、定義固定維度屬性交并邏輯;
步驟(2)、將用戶訪問屬性分為固定維度屬性和不定維度屬性;
步驟(3)、通過業(yè)務(wù)數(shù)據(jù)庫和檢索模塊的數(shù)據(jù)通道近實(shí)時(shí)獲取廣告主定制的不定維度屬性觸發(fā)結(jié)果交并邏輯;
步驟(4)、建立各維度屬性觸發(fā)結(jié)果集合歸并樹;
步驟(5)、根據(jù)各個(gè)維度屬性觸發(fā)候選廣告集合;
步驟(6)、將候選廣告集合掛載在歸并樹的相應(yīng)節(jié)點(diǎn)上;以及步驟(7)、根據(jù)歸并樹歸并方法,獲得的最終廣告集合。
[0016]具體的說,當(dāng)一個(gè)用戶訪問到達(dá)檢索模塊,用戶訪問屬性被分為固定維度屬性和不定維度屬性,兩種維度屬性結(jié)果交集為最終應(yīng)當(dāng)給用戶展示的廣告集合。本發(fā)明從架構(gòu)上將候選集合觸發(fā)、歸并過程從業(yè)務(wù)模塊剝離,在配置文件中定義固定維度屬性交并邏輯,通過業(yè)務(wù)數(shù)據(jù)庫和檢索模塊的數(shù)據(jù)通道近實(shí)時(shí)獲取廣告主定制的不定維度屬性觸發(fā)結(jié)果交并邏輯,通過這些信息,在內(nèi)存中建立各維度觸發(fā)結(jié)果集合歸并樹。
[0017]從總體結(jié)構(gòu)上,本發(fā)明分成indexer與merger兩個(gè)子模塊。Indexer子模塊負(fù)責(zé)廣告定向信息的存儲(chǔ)與檢索,merge子模塊負(fù)責(zé)近實(shí)時(shí)的匹配流量屬性與動(dòng)態(tài)更新的廣告主匹配條件。系統(tǒng)結(jié)構(gòu)變?yōu)橄聢D所示:
當(dāng)一個(gè)用戶訪問到來,處理流程如下:
(I)在indexer模塊根據(jù)各個(gè)維度屬性觸發(fā)候選廣告集合,后在merger模塊將候選廣告集合掛載在歸并樹的相應(yīng)節(jié)點(diǎn)上,歸并樹是一種快速進(jìn)行集合計(jì)算的數(shù)據(jù)結(jié)構(gòu)。
[0018](2)調(diào)用merger模塊的歸并樹歸并方法,獲得的最終廣告集合。
[0019]本發(fā)明為了克服廣告檢索系統(tǒng)上述弱點(diǎn)實(shí)現(xiàn)的高性能多維度復(fù)雜條件廣告索引系統(tǒng),它有以下功能:
(1)近實(shí)時(shí)的存儲(chǔ)\查找檢索系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù);
(2)在多維度上近實(shí)時(shí)的匹配流量屬性與動(dòng)態(tài)更新的廣告主匹配條件。
[0020]如此的設(shè)計(jì)徹底將索引存儲(chǔ)\檢索\觸發(fā)從業(yè)務(wù)邏輯中抽取出來,大大減小業(yè)務(wù)模塊的復(fù)雜度,方便對索引模塊進(jìn)行有針對性的優(yōu)化,以適應(yīng)廣告系統(tǒng)的海量檢索請求。
[0021]綜上可知,本發(fā)明的多維度復(fù)雜條件廣告索引方法將廣告檢索結(jié)果集合歸并過程納入索引模塊,極大的減小業(yè)務(wù)模塊的檢索相關(guān)邏輯復(fù)雜度,減小業(yè)務(wù)邏輯變更帶來的開發(fā)代價(jià),通過版本庫管理實(shí)現(xiàn)索引模塊讀寫分離,保證模塊在頻繁修改索引情況下依然能夠低延遲響應(yīng)高并發(fā)請求。
[0022]以上的實(shí)施例僅用于說明本發(fā)明的技術(shù)思想及特點(diǎn),其目的在于使本領(lǐng)域內(nèi)的技術(shù)人員能夠了解本發(fā)明的內(nèi)容并據(jù)以實(shí)施,不能僅以本實(shí)施例來限定本發(fā)明的專利范圍,即凡依本發(fā)明所揭示的精神所作的同等變化或修飾,仍落在本發(fā)明的專利范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種多維度復(fù)雜條件廣告索引方法,其特征在于,至少包括以下步驟: 步驟(I)、定義固定維度屬性交并邏輯; 步驟(2)、將用戶訪問屬性分為固定維度屬性和不定維度屬性; 步驟(3)、通過業(yè)務(wù)數(shù)據(jù)庫和檢索模塊的數(shù)據(jù)通道近實(shí)時(shí)獲取廣告主定制的不定維度屬性觸發(fā)結(jié)果交并邏輯; 步驟(4)、建立各維度屬性觸發(fā)結(jié)果集合歸并樹; 步驟(5)、根據(jù)各個(gè)維度屬性觸發(fā)候選廣告集合; 步驟(6)、將候選廣告集合掛載在歸并樹的相應(yīng)節(jié)點(diǎn)上;以及 步驟(7)、根據(jù)歸并樹歸并方法,獲得的最終廣告集合。
【專利摘要】本發(fā)明揭示了一種多維度復(fù)雜條件廣告索引方法,至少包括以下步驟:定義固定維度屬性交并邏輯;將用戶訪問屬性分為固定維度屬性和不定維度屬性;通過業(yè)務(wù)數(shù)據(jù)庫和檢索模塊的數(shù)據(jù)通道近實(shí)時(shí)獲取廣告主定制的不定維度屬性觸發(fā)結(jié)果交并邏輯;建立各維度屬性觸發(fā)結(jié)果集合歸并樹;根據(jù)各個(gè)維度屬性觸發(fā)候選廣告集合;將候選廣告集合掛載在歸并樹的相應(yīng)節(jié)點(diǎn)上;根據(jù)歸并樹歸并方法,獲得的最終廣告集合,本發(fā)明將廣告檢索結(jié)果集合歸并過程納入索引模塊,極大的減小業(yè)務(wù)模塊的檢索相關(guān)邏輯復(fù)雜度,減小業(yè)務(wù)邏輯變更帶來的開發(fā)代價(jià),通過版本庫管理實(shí)現(xiàn)索引模塊讀寫分離,保證模塊在頻繁修改索引情況下依然能夠低延遲響應(yīng)高并發(fā)請求。
【IPC分類】G06F17/30, G06Q30/02
【公開號】CN104899755
【申請?zhí)枴緾N201410077747
【發(fā)明人】湯奇峰, 許 鵬
【申請人】晶贊廣告(上海)有限公司
【公開日】2015年9月9日
【申請日】2014年3月5日