亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

目標(biāo)用戶定向方法及裝置與流程

文檔序號(hào):12916271閱讀:460來(lái)源:國(guó)知局
目標(biāo)用戶定向方法及裝置與流程

本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種目標(biāo)用戶定向方法及裝置。



背景技術(shù):

廣告等待投放信息在投放時(shí),為了實(shí)現(xiàn)精準(zhǔn)投放,可能需要進(jìn)行用戶定向,找出會(huì)觀看該投放信息或基于該投放信息執(zhí)行某一操作的用戶;一方面能夠?qū)崿F(xiàn)精準(zhǔn)投放,另一方面能夠減少對(duì)該投放信息不感興趣的用戶的信息騷擾。

在現(xiàn)有技術(shù)中進(jìn)行用戶定向時(shí),通常采用的方式是:根據(jù)種子用戶的屬性特征得到一個(gè)分類模型。在進(jìn)行用戶定向,利用該分類模型計(jì)算備選用戶與種子用戶之間的相似性,選擇出與種子用戶相似性高的用戶,作為所述待投放信息的投放對(duì)象,進(jìn)而實(shí)現(xiàn)了用戶定向。但是,具體實(shí)踐時(shí)發(fā)現(xiàn),利用這種目標(biāo)用戶定向方法確定的投放對(duì)象,依然不能有效的實(shí)現(xiàn)用戶轉(zhuǎn)換,定向的精確度依然沒有達(dá)到預(yù)期的效果。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明實(shí)施例期望提供的目標(biāo)用戶定向方法及裝置,能夠提升待投放信息的目標(biāo)用戶的精確度。

為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:

本發(fā)明實(shí)施例第一方面提供一種目標(biāo)用戶定向方法,包括:

利用相似模型,確定備選用戶與種子用戶之間的相似度;

利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的 目標(biāo)用戶。

基于上述方案,所述根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶,包括:

利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分;

選擇出所述定向評(píng)分滿足預(yù)設(shè)定向條件的所述備選用戶,作為所述目標(biāo)用戶。

基于上述方案,所述利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分,包括:

確定所述相似度的第一權(quán)值及所述概率對(duì)應(yīng)的第二權(quán)值;

利用所述相似度、所述第一權(quán)值、所述概率、所述第二權(quán)值及所述預(yù)設(shè)函數(shù)關(guān)系,計(jì)算所述定向評(píng)分。

基于上述方案,在確定所述相似度之前,所述方法還包括:

提取作為第一正例用戶的所述種子用戶的用戶特征,作為訓(xùn)練所述相似模型的正例特征;

提取第一負(fù)例用戶的用戶特征,作為訓(xùn)練所述相似模型的負(fù)例特征;

利用所述正例特征和所述負(fù)例特征進(jìn)行模型訓(xùn)練,得到所述相似模型。

基于上述方案,在確定所述概率之前,所述方法還包括:

根據(jù)已投放信息的投放數(shù)據(jù),提取對(duì)所述已投放信息執(zhí)行了所述轉(zhuǎn)化操作的用戶作為第二正例用戶;

從已投放信息的投放數(shù)據(jù),提取所述已投放信息未執(zhí)行所述轉(zhuǎn)化操作的用戶作為第二負(fù)例用戶;

利用所述已投放信息的信息特征、所述第二正例用戶和所述第二負(fù)例用戶的用戶特征作進(jìn)行模型訓(xùn)練,得到所述轉(zhuǎn)化預(yù)測(cè)模型。

基于上述方案,所述方法還包括:

利用所述相似模型輸出確定所述相似度的核心特征;其中,所述核心特征為所述種子用戶之間的相同特征或相似特征。

基于上述方案,所述利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率,包括:

提取所述待投放信息的信息特征;

提取所述備選用戶的用戶特征;

將所述待投放信息的信息特征和所述備選用戶的用戶特征,輸入所述轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)得到所述概率。

本發(fā)明實(shí)施例第二方面提供一種目標(biāo)用戶定向裝置,包括:

確定單元,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

基于上述方案,所述選擇單元,具體用于利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分;選擇出所述定向評(píng)分滿足預(yù)設(shè)定向條件的所述備選用戶,作為所述目標(biāo)用戶。

基于上述方案,所述選擇單元,具體用于確定所述相似度的第一權(quán)值及所述概率對(duì)應(yīng)的第二權(quán)值;利用所述相似度、所述第一權(quán)值、所述概率、所述第二權(quán)值及所述預(yù)設(shè)函數(shù)關(guān)系,計(jì)算所述定向評(píng)分。

基于上述方案,所述裝置還包括:

第一訓(xùn)練單元,用于在確定所述相似度之前,

提取作為第一正例用戶的所述種子用戶的用戶特征,作為訓(xùn)練所述相似模型的正例特征;提取第一負(fù)例用戶的用戶特征,作為訓(xùn)練所述相似模型的負(fù)例特征;利用所述正例特征和所述負(fù)例特征進(jìn)行模型訓(xùn)練,得到所述相似模型。

基于上述方案,所述裝置還包括:

第二訓(xùn)練單元,用于在確定所述概率之前,根據(jù)已投放信息的投放數(shù)據(jù),提取對(duì)所述已投放信息執(zhí)行了所述轉(zhuǎn)化操作的用戶作為第二正例用戶;從已投放信息的投放數(shù)據(jù),提取所述已投放信息未執(zhí)行所述轉(zhuǎn)化操作的用戶作為第二 負(fù)例用戶;利用所述已投放信息的信息特征、所述第二正例用戶和所述第二負(fù)例用戶的用戶特征作進(jìn)行模型訓(xùn)練,得到所述轉(zhuǎn)化預(yù)測(cè)模型。

基于上述方案,所述裝置還包括:

輸出單元,用于利用所述相似模型輸出確定所述相似度的核心特征;其中,所述核心特征為所述種子用戶之間的相同特征或相似特征。

基于上述方案,所述預(yù)測(cè)單元,具體用于提取所述待投放信息的信息特征;提取所述備選用戶的用戶特征;將所述待投放信息的信息特征和所述備選用戶的用戶特征,輸入所述轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)得到所述概率。

本發(fā)明實(shí)施例提供的目標(biāo)用戶定向方法及裝置,在為待投放信息確定目標(biāo)用戶時(shí),會(huì)結(jié)合備選用戶與種子用戶的相似度和利用轉(zhuǎn)化預(yù)測(cè)模型預(yù)測(cè)出備選用戶對(duì)所述待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率,至少?gòu)倪@兩維度從眾多的備選用戶中選擇出作為所述待投放信息的投放對(duì)象的目標(biāo)用戶,相對(duì)于僅僅選擇出與種子用戶相似的用戶作為目標(biāo)用戶,因?yàn)橐肓宿D(zhuǎn)化預(yù)測(cè)模型估算的概率,提升了目標(biāo)用戶的精確度,此外信息投放后的被執(zhí)行所述預(yù)定轉(zhuǎn)化操作的概率提升,提升了投放效果。

附圖說(shuō)明

圖1為本發(fā)明實(shí)施例提供的一種目標(biāo)用戶定向方法的流程示意圖;

圖2為本發(fā)明實(shí)施例提供的一種目標(biāo)用戶定向裝置的結(jié)構(gòu)示意圖;

圖3為本發(fā)明實(shí)施例提供的一種廣告發(fā)布系統(tǒng)架構(gòu)的結(jié)構(gòu)示意圖;

圖4為本發(fā)明實(shí)施例提供相似模型的訓(xùn)練流程示意圖;

圖5為本發(fā)明實(shí)施例提供的點(diǎn)擊預(yù)測(cè)模型的訓(xùn)練流程示意圖;

圖6為本發(fā)明實(shí)施例提供的定向評(píng)分的計(jì)算流程示意圖;

圖7為本發(fā)明實(shí)施例提供的一種目標(biāo)定向裝置。

具體實(shí)施方式

以下結(jié)合說(shuō)明書附圖及具體實(shí)施例對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)闡 述。

實(shí)施例一:

如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,包括:

步驟s110:利用相似模型,確定備選用戶與種子用戶之間的相似度;

步驟s120:利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

步驟s130:根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

本實(shí)施例中所述步驟s110利用相似模型,確定備選用戶與種子用戶之間的相似度,這里的相似度可以用0到1的取值來(lái)表示,或用百分比來(lái)表示。在本實(shí)施例中所述種子用戶可為所述待投放信息提供的對(duì)所述待投放信息的信息標(biāo)的物感興趣的用戶,或已經(jīng)使用該標(biāo)的物的用戶。例如,所述待投放信息為某品牌手機(jī)的廣告,所述種子用戶可為購(gòu)買了該品牌手機(jī)的用戶。該品牌的手機(jī)即為所述廣告的信息標(biāo)的物,廣告的信息標(biāo)的物,又可稱為廣告標(biāo)的物。例如,所述待投放信息第一次投放,待投放信息中的信息標(biāo)的物也沒有上市,則此時(shí),所述種子用戶可為與所述待投放信息滿足預(yù)設(shè)相似度的已投放信息的種子用戶。再以手機(jī)為例,待投放信息的信息標(biāo)的物為手機(jī)a,手機(jī)a的特性與已投放信息的信息標(biāo)的物手機(jī)b非常相似,這個(gè)時(shí)候顯然已投放信息的種子用戶可能大部分也將是待投放信息的種子用戶。當(dāng)然,種子用戶的定義和提供方式有多種,不局限于上述方式。

在步驟s120中將會(huì)利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)備選用戶執(zhí)行轉(zhuǎn)化操作的概率。在本實(shí)施例中所述轉(zhuǎn)化預(yù)測(cè)模型,可為能夠用于預(yù)測(cè)某一個(gè)用戶執(zhí)行對(duì)應(yīng)的轉(zhuǎn)化操作的模型。

所述轉(zhuǎn)化操作可包括點(diǎn)擊操作,關(guān)注操作、購(gòu)買操作等轉(zhuǎn)化行為對(duì)應(yīng)的操作。例如,所述待投放信息為一個(gè)廣告,將該廣告推送到用戶的社交應(yīng)用界面之后,用戶是可以看到該廣告,其中有一部分用戶可能對(duì)該廣告感興趣,可能會(huì)通過(guò)點(diǎn)擊該廣告,進(jìn)入該廣告的詳細(xì)頁(yè)面。該廣告的詳細(xì)頁(yè)面可包括該廣告 的廣告標(biāo)的物的詳細(xì)接收。例如,所述廣告為汽車廣告,若客戶端檢測(cè)到點(diǎn)擊汽車廣告的操作之后,會(huì)顯示該汽車廣告的詳細(xì)頁(yè)面,該詳細(xì)頁(yè)面內(nèi)可能包括該汽車的性能參數(shù)、價(jià)格以及購(gòu)買渠道等購(gòu)買參數(shù)等。本實(shí)施例中點(diǎn)擊汽車廣告的點(diǎn)擊操作即為本實(shí)施例所述的轉(zhuǎn)換操作的一種。在步驟s120中可以利用點(diǎn)擊預(yù)測(cè)模型,來(lái)預(yù)測(cè)備選用戶對(duì)所述待投放信息執(zhí)行所述轉(zhuǎn)換操作的概率。

在步驟s130中將會(huì)結(jié)合相似度和概率,至少這兩個(gè)維度的信息,從備選用戶中選擇出所述待投放信息的目標(biāo)用戶,完成對(duì)所述待投放信息的投放對(duì)象的定位。

在本實(shí)施例中所述待投放信息可為各種待曝光或待公布的各種信息,可包括廣告、公告以及通知等信息。例如,有些公告并非需要針對(duì)所有人,可能僅需針對(duì)一部分人,在公布所述公告時(shí),可以重點(diǎn)向部分人推薦。例如,“取消小學(xué)生學(xué)分”這一公告,在向所有人公布的同時(shí),為了重點(diǎn)告知小學(xué)生的父母,可以通過(guò)向小學(xué)生父母的通信賬號(hào),再次進(jìn)行重點(diǎn)展示,以防止部分父母不知道的情況下依然忍受對(duì)學(xué)校的亂收費(fèi)現(xiàn)象。顯然該公告也可以利用步驟s110可尋找出與小學(xué)生父母年齡相仿的人群,再通過(guò)點(diǎn)擊率預(yù)測(cè),可結(jié)合兩者,選擇出有孩子的人群。

總之,本實(shí)施例提供的目標(biāo)用戶定位方法,將結(jié)合種子用戶的用戶特征的相似度計(jì)算和轉(zhuǎn)化預(yù)測(cè)模型的概率預(yù)測(cè)這兩個(gè)維度篩選出所述待投放信息的目標(biāo)用戶,具有定位精確度高的特點(diǎn),能夠顯著提升已投放信息的概率。

本實(shí)施例所述的用戶特征可包括人口屬性特征、設(shè)備屬性特征和興趣屬性特征。所述人口屬性特征通常可包括用戶的性別、年齡、所在地以及職業(yè)等用戶屬性特征。所述設(shè)備屬性特征可包括用戶使用的設(shè)備類型、設(shè)備品牌以及通信運(yùn)營(yíng)商等屬性。所述興趣屬性特征可包括:用戶興趣標(biāo)簽、用戶行為偏向、網(wǎng)頁(yè)和/或應(yīng)用瀏覽行為特征、游戲偏好特征等能夠表征用戶興趣或偏好的特征。

實(shí)施例二:

如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,包括:

步驟s110:利用相似模型,確定備選用戶與種子用戶之間的相似度;

步驟s120:利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

步驟s130:根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述步驟s130可包括:

利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分;

選擇出所述定向評(píng)分滿足預(yù)設(shè)定向條件的所述備選用戶,作為所述目標(biāo)用戶。

在本實(shí)施例中所述相似度可為取值為0到1之間的數(shù)值,所述概率也為取值0到1之間的數(shù)值,將所述相似度和所述概率作為所述預(yù)設(shè)函數(shù)關(guān)系式的因變量進(jìn)行計(jì)算,得到的函數(shù)值極為所述定向評(píng)分。

例如,直接將所述相似度和所述概率進(jìn)行加權(quán)運(yùn)算,則得到了所述定向評(píng)分。最后根據(jù)所述定向評(píng)分,可以選擇出定向評(píng)分大于預(yù)設(shè)值的備選用戶作為所述目標(biāo)用戶?;蛘?,選取所述定向評(píng)分最大的前m位備選用戶作為所述目標(biāo)用戶。

顯然利用這種方法選擇出的目標(biāo)用戶,一方面使得目標(biāo)用戶與種子用戶足夠相似,故仔細(xì)閱讀所述待投放信息或執(zhí)行對(duì)應(yīng)轉(zhuǎn)化操作的概率大,另一方面,通過(guò)轉(zhuǎn)化預(yù)測(cè)模型預(yù)測(cè)得到執(zhí)行對(duì)應(yīng)轉(zhuǎn)化操作的概率,再次保證了選擇出的目標(biāo)用戶有較高的概率是對(duì)所述待投放信息執(zhí)行所述轉(zhuǎn)化操作;顯然實(shí)現(xiàn)了目標(biāo)用戶精準(zhǔn)定向,同時(shí)能夠提升待投放信息向用戶投放的概率。

實(shí)施例三:

如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,包括:

步驟s110:利用相似模型,確定備選用戶與種子用戶之間的相似度;

步驟s120:利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

步驟s130:根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述步驟s130可包括:

利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分;

選擇出所述定向評(píng)分滿足預(yù)設(shè)定向條件的所述備選用戶,作為所述目標(biāo)用戶。

所述利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分,包括:

確定所述相似度的第一權(quán)值及所述概率對(duì)應(yīng)的第二權(quán)值;

利用所述相似度、所述第一權(quán)值、所述概率、所述第二權(quán)值及所述預(yù)設(shè)函數(shù)關(guān)系,計(jì)算所述定向評(píng)分。

在本實(shí)施例中在進(jìn)行所述定向評(píng)分的確定時(shí),分別確定出相似度和概率對(duì)應(yīng)的權(quán)值。在本發(fā)明實(shí)施例中所述相似度對(duì)應(yīng)的權(quán)值為第一權(quán)值;所述概率對(duì)應(yīng)的權(quán)值為第二權(quán)值。

在進(jìn)行所述第一權(quán)值和所述第二權(quán)值確定時(shí),可以根據(jù)所述待投放信息得到屬性信息來(lái)確定。例如,根據(jù)所述待投放信息的目標(biāo)屬性來(lái)確定所述第一權(quán)值和所述第二權(quán)值;例如,所述待投放信息為提升品牌指明度的廣告,則目標(biāo)屬性對(duì)轉(zhuǎn)發(fā)率或點(diǎn)評(píng)率,對(duì)點(diǎn)擊率要求沒有那么高,若此時(shí)所述轉(zhuǎn)化預(yù)測(cè)模型,則計(jì)算所述定向評(píng)分時(shí),點(diǎn)擊概率的權(quán)值可以相對(duì)較小。若所述轉(zhuǎn)化預(yù)測(cè)模型為轉(zhuǎn)發(fā)預(yù)測(cè)模型或點(diǎn)評(píng)預(yù)測(cè)模型,得到的轉(zhuǎn)發(fā)概率和點(diǎn)評(píng)概率,可以將所述轉(zhuǎn)發(fā)概率和點(diǎn)評(píng)概率對(duì)應(yīng)的第二權(quán)值設(shè)置的較大。

值得注意的在本發(fā)明實(shí)施例中所述轉(zhuǎn)化預(yù)測(cè)模型可包括多個(gè)預(yù)測(cè)不同轉(zhuǎn)化操作的概率的獨(dú)立模型,所述轉(zhuǎn)化預(yù)測(cè)模型可為一個(gè),該轉(zhuǎn)化預(yù)測(cè)模型可為能夠同時(shí)對(duì)一個(gè)或一個(gè)以上的轉(zhuǎn)化操作的概率的聯(lián)合模型。

在計(jì)算所述定向評(píng)分,可以綜合上述轉(zhuǎn)化預(yù)測(cè)模型得到的一個(gè)或多個(gè)概率進(jìn)行計(jì)算。

在確定所述第一權(quán)值和所述第二權(quán)值時(shí),可以根據(jù)待投放信息的信息屬性,所述信息屬性可包括待投放信息的類型、所述待投放信息的投放目標(biāo)等屬性信息來(lái)確定。在具體的實(shí)現(xiàn)過(guò)程中,也可以直接基于所述待投放信息的信息提供者或發(fā)布者提供的用戶指示,確定所述第一權(quán)值和所述第二權(quán)值??傊?,確定所述第一權(quán)值和所述第二權(quán)值的方法有多種,不局限于上述任意一種。

例如,在步驟s130中可以根據(jù)如下函數(shù)關(guān)系計(jì)算所述定向評(píng)分:

p=p1*a+p2*b

所述p為定向評(píng)分;所述p1為備選用戶與種子用戶的相似度;所述a為所述第一權(quán)值;所述p2為所述概率;所述b為所述第二權(quán)值。

以上僅是一個(gè)所述預(yù)設(shè)函數(shù)關(guān)系求解所述定向評(píng)分的一個(gè)示例,具體實(shí)現(xiàn)時(shí)不局限于上述函數(shù)關(guān)系。

在步驟s130中可以將所述p進(jìn)行排序,選擇排序靠前的若干個(gè)備選用戶確定所述待投放信息投放的目標(biāo)用戶。

在本實(shí)施例中在前述實(shí)施例的基礎(chǔ)上,引入了第一權(quán)值和第二權(quán)值,可以靈活的調(diào)整所述函數(shù)關(guān)系式,這樣可以靈活的調(diào)整篩選出的目標(biāo)用戶在相似度和執(zhí)行轉(zhuǎn)化操作的概率上的偏向性,以滿足不同的待投放信息的投放特點(diǎn)。

實(shí)施例四:

如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,包括:

步驟s110:利用相似模型,確定備選用戶與種子用戶之間的相似度;

步驟s120:利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

步驟s130:根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

在確定所述相似度之前,所述方法還包括:

提取作為第一正例用戶的所述種子用戶的用戶特征,作為訓(xùn)練所述相似模型的正例特征;

提取第一負(fù)例用戶的用戶特征,作為訓(xùn)練所述相似模型的負(fù)例特征;

利用所述正例特征和所述負(fù)例特征進(jìn)行模型訓(xùn)練,得到所述相似模型。

在本實(shí)施例中所述種子用戶作為訓(xùn)練所述相似模型第一正例用戶;提取種子用戶的用戶特征;同時(shí)還將提取第一負(fù)例用戶的用戶特征,作為所述負(fù)例特征。所述第一負(fù)例用戶可為除所述種子用戶以外的其他任何用戶;當(dāng)然也可以是篩選出來(lái)的與所述種子用戶差異較大的用戶。

利用所述正例特征和所述負(fù)例特征訓(xùn)練神經(jīng)網(wǎng)絡(luò)或?qū)W習(xí)機(jī)等各種待訓(xùn)練模型,得到所述相似模型。所述相似模型可以用于選擇出與所述種子用戶相似度該的備選用戶。在本實(shí)施例中所述相似模型可用于輸出備選用戶與種子用戶的相似度。

在本實(shí)施例中所述種子用戶可為所述待投放信息的信息提供者提供的用戶,也可以是為存儲(chǔ)在數(shù)據(jù)庫(kù)中已經(jīng)觀看了所述待投放信息滿足預(yù)設(shè)相似度的信息的種子用戶。這樣訓(xùn)練出的相似模型,可以用于選擇出與種子用戶很相似的備選用戶作為待投放信息的目標(biāo)用戶,這些用戶與種子用戶的相似性,會(huì)較大的概率閱讀待投放信息或執(zhí)行對(duì)應(yīng)的轉(zhuǎn)化操作。

實(shí)施例五:

如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,包括:

步驟s110:利用相似模型,確定備選用戶與種子用戶之間的相似度;

步驟s120:利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

步驟s130:根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

在確定所述概率之前,所述方法還包括:

根據(jù)已投放信息的投放數(shù)據(jù),提取對(duì)所述已投放信息執(zhí)行了所述轉(zhuǎn)化操作的用戶作為第二正例用戶;

從已投放信息的投放數(shù)據(jù),提取所述已投放信息未執(zhí)行所述轉(zhuǎn)化操作的用戶作為第二負(fù)例用戶;

利用所述已投放信息的信息特征、所述第二正例用戶和所述第二負(fù)例用戶 的用戶特征作進(jìn)行模型訓(xùn)練,得到所述轉(zhuǎn)化預(yù)測(cè)模型。

在本實(shí)施例中利用對(duì)已投放信息執(zhí)行了所述轉(zhuǎn)化操作的用戶作為第二正例用戶,將對(duì)已投放信息未執(zhí)行所述轉(zhuǎn)化操作的用戶作為第二負(fù)例用戶。在進(jìn)行轉(zhuǎn)化預(yù)測(cè)模型,提取所述第二正例用戶的用戶特征作為正例特征;提取第二負(fù)例用戶的用戶特征作為負(fù)例特征;并結(jié)合已投放信息的信息特征,能夠訓(xùn)練出確定每一個(gè)備選用戶對(duì)待投放信息的執(zhí)行對(duì)應(yīng)的轉(zhuǎn)換操作的概率。

具體地如,所述根據(jù)已投放信息的投放數(shù)據(jù),提取對(duì)所述已投放信息執(zhí)行了所述轉(zhuǎn)化操作的用戶作為第二正例用戶,包括:根據(jù)所述已投放信息的投放數(shù)據(jù),提取接受所述已投放信息的顯示且對(duì)所述已投放信息執(zhí)行了預(yù)定操作的用戶作為所述第二正例用戶;所述從已投放信息的投放數(shù)據(jù),提取所述已投放信息未執(zhí)行所述轉(zhuǎn)化操作的用戶作為第二負(fù)例用戶,包括:提取接受所述已投放信息的顯示且未對(duì)所述已投放信息執(zhí)行了預(yù)定操作的用戶作為所述第二負(fù)例用戶。

例如在微信等社交賬號(hào)中推送所述待投放信息,例如,在用戶b和用戶c的微信朋友微信圈顯示了該信息b的摘要信息或簡(jiǎn)要信息,若用戶點(diǎn)擊了信息b的摘要信息或簡(jiǎn)要信息,進(jìn)入了信息b的詳細(xì)信息頁(yè),則可將用戶b作為所述第二正例用戶。若用戶c沒有點(diǎn)擊所述信息b的摘要信息或簡(jiǎn)要信息,進(jìn)入到信息b的詳細(xì)信息頁(yè),則可將所述用戶c視為第二負(fù)例用戶。總之,本實(shí)施例提供了一種訓(xùn)練所述轉(zhuǎn)化預(yù)測(cè)模型的方法,具有實(shí)現(xiàn)簡(jiǎn)單及預(yù)測(cè)精度高的特點(diǎn)。

實(shí)施例六:

如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,包括:

步驟s110:利用相似模型,確定備選用戶與種子用戶之間的相似度;

步驟s120:利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

步驟s130:根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述方法還包括:

利用所述相似模型輸出確定所述相似度的核心特征;其中,所述核心特征為所述種子用戶之間的相同特征或相似特征。

在本實(shí)施例中所述相似模型將會(huì)輸出確定所述相似度的核心特征。所述核心特征通常可能是種子用戶之間的相同特征或相似特征。例如,種子用戶的年齡都在23至27歲之間,年齡為23至27歲這一特征即為所述核心特征。

例如,通常種子用戶會(huì)有部分用戶特征的相似度很高,例如,地域都在上?;蛏虾V苓厖^(qū)域等,這些用戶特征可能是區(qū)分備選用戶是否為該待投放信息的目標(biāo)用戶的主要特征,在本實(shí)施例中可以通過(guò)各個(gè)用戶特征的信息增益率的計(jì)算,確定出所述強(qiáng)區(qū)分度特征,方便待投放信息的信息提供者或發(fā)布者查看。

以下可為所述增益信息率igr的計(jì)算公式:

其中,所述h(c|xi)表示第x用戶的用戶特征c取值為xi的信息熵;所述h(xi)表示所有用戶的用戶特征為xi的信息熵的信息上;所述h(c)表示所有用戶的用戶特征c的信息熵。根據(jù)igr可選擇出所述強(qiáng)區(qū)分度特征。具體地如,選擇igr大于指定閾值的用戶特征作為所述強(qiáng)區(qū)分特征輸出,或選擇igr排序在前n位的用戶特征作為強(qiáng)區(qū)分度的核心特征輸出。

采用本實(shí)施例所述的方法,能夠方便用戶和工作人員,確定簡(jiǎn)便的知道當(dāng)前計(jì)算相似度,以區(qū)分與種子用戶是否滿足預(yù)定相似度的備選用戶的高區(qū)分度特征。

實(shí)施例七:

如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,包括:

步驟s110:利用相似模型,確定備選用戶與種子用戶之間的相似度;

步驟s120:利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

步驟s130:根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述步驟s120可包括:

提取所述待投放信息的信息特征;

提取所述備選用戶的用戶特征;

將所述待投放信息的信息特征和所述備選用戶的用戶特征,輸入所述轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)得到所述概率。

本實(shí)施例為在前述任意一個(gè)實(shí)施例基礎(chǔ)上的進(jìn)一步改進(jìn),在不沖突的情況下可以與前述實(shí)施例中任意提供的技術(shù)方案結(jié)合使用,形成新的技術(shù)方案。例如在本實(shí)施例中所述定向評(píng)分的確定可以參見實(shí)施例二或?qū)嵤├?;所述相似模型和轉(zhuǎn)化預(yù)測(cè)模型的確定可以參見實(shí)施例四或?qū)嵤├宓龋辉俦热缢龊诵奶卣鞯妮敵隹梢詤⒁妼?shí)施例六。

在本實(shí)施例的步驟s120將待投放信息的信息特征和備選用戶的用戶特征輸入到所述轉(zhuǎn)化預(yù)測(cè)模型中,則可以估算出每一個(gè)備選用戶對(duì)所述待投放信息執(zhí)行對(duì)應(yīng)的轉(zhuǎn)化操作的概率。例如,所述信息a為待投放信息,用戶a和用戶b均為所述被選用用戶。在進(jìn)行所述概率的預(yù)測(cè)時(shí),提取所述信息a的信息特征及所述用戶a和所述用戶b的用戶特征作為轉(zhuǎn)化預(yù)測(cè)模型的輸入,所述轉(zhuǎn)化預(yù)測(cè)模型經(jīng)過(guò)信息處理之后,可以輸出用戶a和用戶b對(duì)所述信息a執(zhí)行點(diǎn)擊等轉(zhuǎn)化操作的概率。

顯然,這樣可以簡(jiǎn)便的預(yù)測(cè)出每一個(gè)備選用戶對(duì)所述待投放信息執(zhí)行所述預(yù)定轉(zhuǎn)化操作的概率。這樣在步驟s130中結(jié)合相似度和概率確定的目標(biāo)用戶,至少?gòu)膬蓚€(gè)維度上確保了目標(biāo)用戶有非常大的概率對(duì)所述待投放信息執(zhí)行所述預(yù)定轉(zhuǎn)化操作。

實(shí)施例八:

如圖2所示,本實(shí)施例提供一種目標(biāo)用戶定向裝置,包括:

確定單元110,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元120,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元130,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

本實(shí)施例提供的所述目標(biāo)用戶定向裝置可為應(yīng)用于各種電子設(shè)備中的裝置,例如應(yīng)用于各種待投放信息目標(biāo)用戶確定的服務(wù)器或服務(wù)平臺(tái)中。

所述確定單元110、預(yù)測(cè)單元120及選擇單元130都可對(duì)應(yīng)于處理器或處理電路。所述處理器可包括中央處理器、微處理器、數(shù)字信號(hào)處理器或可編程陣列等。所述處理電路可包括專用集成電路等。

所述處理器或處理電路可與存儲(chǔ)介質(zhì)通過(guò)iis等設(shè)備內(nèi)部的通信接口連接,可通過(guò)讀取存儲(chǔ)在所述存儲(chǔ)介質(zhì)上的可執(zhí)行代碼或通過(guò)電路自身的信號(hào)的處理,實(shí)現(xiàn)上述確定單元110、預(yù)測(cè)單元120及所述選擇單元130的功能。

本實(shí)施例提供的目標(biāo)用戶定向裝置,能夠從相似度和執(zhí)行預(yù)定轉(zhuǎn)化操作的概率,這兩個(gè)維度來(lái)從備選用戶中選擇出待投放信息投放的目標(biāo)用戶,這樣確定的目標(biāo)用戶,具有目標(biāo)用戶定位精確度高及信息投放后具有預(yù)定轉(zhuǎn)換操作的轉(zhuǎn)化概率高的特點(diǎn)。

實(shí)施例九:

如圖2所示,本實(shí)施例提供一種目標(biāo)用戶定向裝置,包括:

確定單元110,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元120,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元130,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述選擇單元130,具體用于利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分;選擇出所述定向評(píng)分滿足預(yù)設(shè)定向條件的所述備選用戶,作為所述目標(biāo)用戶。

在本實(shí)施中所述定向評(píng)分的確定是基于預(yù)設(shè)函數(shù)關(guān)系計(jì)算得到的。所述概率和所述相似度分別作為所述預(yù)設(shè)函數(shù)關(guān)系的因變量輸入,利用函數(shù)關(guān)系的計(jì)算得到所述定向評(píng)分。再選擇出定向評(píng)分滿足預(yù)設(shè)條件的別選用戶作為所述目標(biāo)用戶。在本實(shí)施例中所述選擇單元130的具體結(jié)構(gòu)可包括計(jì)算器或計(jì)算功能的處理器。所述選擇單元130還可對(duì)應(yīng)于比較器或具有比較排序功能的處理器等,通過(guò)比較排序等,選擇出定向評(píng)分滿足所述預(yù)設(shè)定向條件的備選用戶,作為目標(biāo)用戶。例如,若定向評(píng)分越高表明該用戶與種子用戶的相似度越高,對(duì)待投放信息執(zhí)行所述預(yù)定轉(zhuǎn)化操作的概率越高,則可以通過(guò)排序選擇出排序靠前的備選用戶作為所述目標(biāo)用戶,或?qū)⒍ㄏ蛟u(píng)分大于預(yù)設(shè)閾值的備選用戶作為所述目標(biāo)用戶。

本實(shí)施例所述的目標(biāo)用戶定向裝置,是在前一實(shí)施例的基礎(chǔ)上,具體限定了確定目標(biāo)用戶的選擇單元130的結(jié)構(gòu),具有選擇出的目標(biāo)用戶精確度高及信息投放后的預(yù)定轉(zhuǎn)化操作概率高的特點(diǎn)。

實(shí)施例十:

如圖2所示,本實(shí)施例提供一種目標(biāo)用戶定向裝置,包括:

確定單元110,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元120,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元130,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述選擇單元130,具體用于利用所述相似度、所述概率及預(yù)設(shè)函數(shù)關(guān)系、計(jì)算所述備選用戶的定向評(píng)分;選擇出所述定向評(píng)分滿足預(yù)設(shè)定向條件的所述備選用戶,作為所述目標(biāo)用戶。

所述選擇單元130,具體用于確定所述相似度的第一權(quán)值及所述概率對(duì)應(yīng)的第二權(quán)值;利用所述相似度、所述第一權(quán)值、所述概率、所述第二權(quán)值及所述預(yù)設(shè)函數(shù)關(guān)系,計(jì)算所述定向評(píng)分。

在本實(shí)施例中為了能夠靈活的調(diào)整相似度和執(zhí)行預(yù)定轉(zhuǎn)化操作的概率對(duì)定向評(píng)分的影響度,在本實(shí)施例中引入了第一權(quán)值和第二權(quán)值;通常第一權(quán)值比第二權(quán)值大,則相似度比概率對(duì)定向評(píng)分的影響度越大,若第二權(quán)值比第一權(quán)值大,則概率比相似度對(duì)定向評(píng)分的影響度大。在確定所述第一權(quán)值和所述第二權(quán)值時(shí)可以根據(jù)所述待投放信息的信息屬性來(lái)確定,也可以直接根據(jù)用戶指示來(lái)確定??傊诒緦?shí)施例中通過(guò)所述第一權(quán)值和所述第二權(quán)值的引入,能夠靈活的調(diào)整所述相似度和所述概率這兩個(gè)維度對(duì)定向評(píng)分的影響度,從而簡(jiǎn)便的選擇出所述待投放信息最適合的目標(biāo)用戶。

實(shí)施例十一:

如圖2所示,本實(shí)施例提供一種目標(biāo)用戶定向裝置,包括:

確定單元110,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元120,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元130,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述裝置還包括:

第一訓(xùn)練單元,用于在確定所述相似度之前,提取作為第一正例用戶的所述種子用戶的用戶特征,作為訓(xùn)練所述相似模型的正例特征;提取第一負(fù)例用戶的用戶特征,作為訓(xùn)練所述相似模型的負(fù)例特征;利用所述正例特征和所述負(fù)例特征進(jìn)行模型訓(xùn)練,得到所述相似模型。

在本實(shí)施例中第一訓(xùn)練單元可對(duì)應(yīng)于處理器或處理電路,能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò)或?qū)W習(xí)機(jī),獲得所述相似模型。在本實(shí)施例中會(huì)提取種子用戶的用戶特征作為正例特征,可將第一種子用戶以外的其他用戶視為負(fù)例用戶,提取負(fù)例特征。

在本實(shí)施例中所述第一訓(xùn)練單元這樣訓(xùn)練得到的相似模型,能夠精確的確定出備選用戶與種子用戶的相似度。

實(shí)施例十二:

如圖2所示,本實(shí)施例提供一種目標(biāo)用戶定向裝置,包括:

確定單元110,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元120,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元130,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述裝置還包括:

第二訓(xùn)練單元,用于在確定所述概率之前,根據(jù)已投放信息的投放數(shù)據(jù),提取對(duì)所述已投放信息執(zhí)行了所述轉(zhuǎn)化操作的用戶作為第二正例用戶;從已投放信息的投放數(shù)據(jù),提取所述已投放信息未執(zhí)行所述轉(zhuǎn)化操作的用戶作為第二負(fù)例用戶;利用所述已投放信息的信息特征、所述第二正例用戶和所述第二負(fù)例用戶的用戶特征作進(jìn)行模型訓(xùn)練,得到所述轉(zhuǎn)化預(yù)測(cè)模型。

在本實(shí)施例中第二訓(xùn)練單元同樣可對(duì)應(yīng)于處理器或處理電路;所述處理器或處理電路的相關(guān)描述可以參見前述實(shí)施例,在此就不重復(fù)了。但是本實(shí)施例與所述第二訓(xùn)練單元對(duì)應(yīng)的處理器或處理電路是用于訓(xùn)練所述轉(zhuǎn)化預(yù)測(cè)模型。采用所述第二訓(xùn)練單元得到的轉(zhuǎn)化預(yù)測(cè)模型,能夠精確的預(yù)測(cè)出備選用戶對(duì)所述待投放信息執(zhí)行所述預(yù)定轉(zhuǎn)化操作的概率。

實(shí)施例十三:

如圖2所示,本實(shí)施例提供一種目標(biāo)用戶定向裝置,包括:

確定單元110,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元120,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元130,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述裝置還包括:

輸出單元,用于利用所述相似模型輸出確定所述相似度的核心特征;其中,所述核心特征為所述種子用戶之間的相同特征或相似特征。

本實(shí)施例所述的輸出單元可對(duì)應(yīng)于各種輸出結(jié)構(gòu),例如可對(duì)應(yīng)于各種類型的顯示屏。所述顯示屏可包括液晶顯示屏、投影顯示屏、電子墨水顯示屏或有機(jī)發(fā)光二極管oled顯示屏等。所述輸出單元采用顯示輸出所述核心特征,便于待投放信息的提供者或發(fā)布者確定哪些用戶特征是區(qū)分備選用戶中目標(biāo)用戶和非目標(biāo)用戶的強(qiáng)區(qū)分度特征。

實(shí)施例十四:

如圖2所示,本實(shí)施例提供一種目標(biāo)用戶定向裝置,包括:

確定單元110,用于利用相似模型,確定備選用戶與種子用戶之間的相似度;

預(yù)測(cè)單元120,用于利用轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)所述備選用戶對(duì)待投放信息執(zhí)行預(yù)定轉(zhuǎn)化操作的概率;

選擇單元130,用于根據(jù)所述相似度和所述概率,從所述被選用戶中選擇出所述待投放信息的目標(biāo)用戶。

所述預(yù)測(cè)單元120,具體用于提取所述待投放信息的信息特征;提取所述備選用戶的用戶特征;將所述待投放信息的信息特征和所述備選用戶的用戶特征,輸入所述轉(zhuǎn)化預(yù)測(cè)模型,預(yù)測(cè)得到所述概率。

在本實(shí)施例中所述預(yù)測(cè)單元120將提取待投放信息的信息特征及備選用戶的用戶特征,作為轉(zhuǎn)化預(yù)測(cè)模型的輸入?yún)?shù),所述輸入?yún)?shù)經(jīng)過(guò)所述轉(zhuǎn)化預(yù)測(cè)模型的處理,將輸出各個(gè)備選用戶對(duì)所述待投放信息執(zhí)行所述預(yù)定轉(zhuǎn)化操作的概率,具有實(shí)現(xiàn)簡(jiǎn)便的特點(diǎn)。

以下結(jié)合上述任意實(shí)施例提供幾個(gè)具體示例:

示例一:

如圖3所示,本示例提供一種廣告發(fā)布系統(tǒng)架構(gòu),包括數(shù)據(jù)輸入、數(shù)據(jù)處理及數(shù)據(jù)應(yīng)用三部分。在圖3所示的系統(tǒng)中以騰訊的廣告發(fā)布系統(tǒng)為例進(jìn)行說(shuō)明。

在數(shù)據(jù)輸出部分,將網(wǎng)絡(luò)媒體事業(yè)群(onlinemediagroup,omg)的數(shù)據(jù)、廣告專區(qū)、其他系統(tǒng)數(shù)據(jù)及公司外部數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換/整理,將轉(zhuǎn)換/整理或的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)存儲(chǔ)平臺(tái)。例如所述omg數(shù)據(jù)和廣告專區(qū)數(shù)據(jù)均為系統(tǒng)a的數(shù)據(jù),所述其他系統(tǒng)數(shù)據(jù)即為所述系統(tǒng)a以外的其他系統(tǒng)的數(shù)據(jù)。若所述系統(tǒng)a為騰訊系統(tǒng),則所述其他系統(tǒng)數(shù)據(jù)為騰訊系統(tǒng)以外的其他系統(tǒng)產(chǎn)生的數(shù)據(jù)。

在數(shù)據(jù)處理階段,首先進(jìn)行多來(lái)源數(shù)據(jù)整合,其次利用標(biāo)簽庫(kù)中的標(biāo)簽進(jìn)行標(biāo)簽數(shù)據(jù)挖掘,例如,給不同年級(jí)的用戶貼上與年級(jí)相關(guān)的標(biāo)簽。將標(biāo)簽化的數(shù)據(jù)輸出到用戶管理平臺(tái)。數(shù)據(jù)管理平臺(tái)對(duì)標(biāo)簽化的數(shù)據(jù),進(jìn)行再次的數(shù)據(jù)分析,獲得分析報(bào)告。

在數(shù)據(jù)應(yīng)用階段,用戶管理平臺(tái)對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行聚合/抽取,得到包括多個(gè)用戶的用戶特征的用戶包。為了確保數(shù)據(jù)的真實(shí)性,可以將用戶包中的數(shù)據(jù)輸入到第三方調(diào)研驗(yàn)證。所述用戶包還可用于進(jìn)行相似人群擴(kuò)散。在本示例中進(jìn)行相似用戶擴(kuò)散,可包括選擇出與種子用戶相似的相似用戶。這里的相似用戶即為前述目標(biāo)用戶。

利用所述用戶包進(jìn)行千次曝光成本(costperthousandimpressions,cpm)售賣,提供數(shù)據(jù)管理平臺(tái)(datamanagementplatform,dmp)的數(shù)據(jù)服務(wù)。

cpm投放引擎向利用相似人群擴(kuò)散得到的用戶包內(nèi)的用戶投放數(shù)據(jù)。

廣告交易平臺(tái)(advertisementexchangeplatform,adx)提供基于所述用戶包進(jìn)行廣告交易。

用于為第三方dsp/dmp提供用戶包,所述dsp對(duì)應(yīng)的中文為需求方平臺(tái),為demandserverplatform的縮寫。

用于外部廣告投放提供用戶包。

dmp的核心在于中間的用戶管理平臺(tái)上。對(duì)于品牌廣告,廣告主會(huì)在用戶管理平臺(tái)上進(jìn)行人群的提取、畫像分析,用戶庫(kù)存的計(jì)算和詢量以及用戶的相似擴(kuò)散。這里的用戶的相似擴(kuò)散即可為上述目標(biāo)用戶的定向。

本示例中目標(biāo)用戶的定向主要由三部分組成:

第一步:相似模型的訓(xùn)練;

第二步:點(diǎn)擊預(yù)測(cè)模型的訓(xùn)練;

第三步:利用相似模型和點(diǎn)擊預(yù)測(cè)模型篩選出目標(biāo)用戶,實(shí)現(xiàn)在種子用戶基礎(chǔ)上的相似用戶的擴(kuò)散。

用戶在dmp平臺(tái)上上傳種子用戶后,確定對(duì)種子用戶進(jìn)行擴(kuò)散并接收用戶輸入的擴(kuò)散規(guī)模以及將要投放的廣告,訓(xùn)練得到相似模型,并利用相似模型和點(diǎn)擊預(yù)測(cè)模型,對(duì)每一個(gè)備選用戶進(jìn)行定向評(píng)分。最后按照定向評(píng)分的分?jǐn)?shù)的高低給出符合用戶指定規(guī)模的人群;同時(shí)也會(huì)輸出種子用戶的核心特征進(jìn)行可視化展示。

在本示例中將要投放的廣告即為即為前述的待投放信息。所述擴(kuò)散規(guī)??砂ㄐ枰x擇的目標(biāo)用戶的數(shù)量。所述點(diǎn)擊預(yù)測(cè)模型即為前述轉(zhuǎn)化預(yù)測(cè)模型的一種。

示例二:

如圖4所示,本示例在前一示例的基礎(chǔ)上提供一個(gè)相似模型訓(xùn)練方法,包括:

大盤用戶屬性生成:這里的大盤用戶即為上述第二負(fù)例用戶;所述大盤用戶屬性生成包括獲取包括多個(gè)數(shù)據(jù)源用戶提供的用戶的各種用戶數(shù)據(jù)。

大盤用戶屬性數(shù)據(jù):在大盤用戶屬性生成之后,即獲得所述用戶數(shù)據(jù)之后提取大盤用戶屬性數(shù)據(jù),例如,表征一個(gè)用戶人口屬性、設(shè)備屬性和興趣屬性的各種數(shù)據(jù)。

數(shù)據(jù)標(biāo)注:將種子用戶和大盤用戶屬性數(shù)據(jù),分別進(jìn)行數(shù)據(jù)標(biāo)注。這里的數(shù)據(jù)標(biāo)注,形成屬性日志。例如,將某些大盤用戶為負(fù)例用戶,將種子用戶標(biāo)注為正例用戶。此處的種子用戶為前述實(shí)施例中的第一正例用戶,所述大盤用戶可為所述第一負(fù)例用戶。

特征抽取:包括分別抽取正例用戶和負(fù)例用戶的用戶特征,形成訓(xùn)練樣本。

模型訓(xùn)練:利用訓(xùn)練樣本進(jìn)行模型訓(xùn)練得到所述相似模型。

具體地如,圖4中,將種子用戶和大盤屬性數(shù)據(jù)進(jìn)行聯(lián)合后,將種子用 戶標(biāo)注為正例用戶,然后對(duì)不在種子用戶中的潛在用戶進(jìn)行抽樣后得到負(fù)例用戶。完成正例用戶和負(fù)例用戶的標(biāo)注后,再進(jìn)行特征抽取和模型訓(xùn)練。模型的特征輸入包括正哦里用戶的人口屬性(性別,年齡,地域,職業(yè)等),設(shè)備屬性(使用的設(shè)備機(jī)型,品牌,運(yùn)營(yíng)商等)和興趣屬性(各個(gè)媒體上的瀏覽行為特征,游戲的偏好等等)。模型的訓(xùn)練主要是在spark訓(xùn)練上搭建的邏輯回歸訓(xùn)練算法框架進(jìn)行,訓(xùn)練得到的相似模型作為文件保存下來(lái)用于后面進(jìn)行相似度的計(jì)算,訓(xùn)練算法能自動(dòng)的過(guò)濾掉比較弱的特征,很好的規(guī)避了不重要的特征帶來(lái)的預(yù)測(cè)的準(zhǔn)確性。

示例三:

如圖5所示,本示例在前一示例的基礎(chǔ)上提供一個(gè)點(diǎn)擊預(yù)測(cè)模型訓(xùn)練方法,包括:

訓(xùn)練數(shù)據(jù)準(zhǔn)備階段:獲取廣告曝光數(shù)據(jù)、廣告點(diǎn)擊數(shù)據(jù)、用戶需求方平臺(tái)(demand-sideplatform,dsp)數(shù)據(jù)及廣告訂單數(shù)據(jù)。這里的廣告訂單數(shù)據(jù)可包括前述已投放數(shù)據(jù)的信息特征。這里的廣告曝光數(shù)據(jù)可包括所述已投放廣告的顯示數(shù)據(jù)。所述廣告點(diǎn)擊數(shù)據(jù)可包括已投放廣告的被點(diǎn)擊的次數(shù)、頻次及點(diǎn)擊者等各種數(shù)據(jù)。

特征提?。禾崛∮脩籼卣骱托畔⑻卣鳌?/p>

模型訓(xùn)練:利用提取的用戶特征和信息特征進(jìn)行模型訓(xùn)練得到所述點(diǎn)擊預(yù)測(cè)模型。

示例四:

如圖6所示,本示例在前一示例的基礎(chǔ)上提供一個(gè)計(jì)算定向評(píng)分的方法,包括:

備選用戶特征及廣告特征:將這些特征輸入到訓(xùn)練模型和點(diǎn)擊預(yù)測(cè)模型中;具體如,將備選用戶特征輸入到相似模型,將備選用戶特征及廣告特征輸入到點(diǎn)擊預(yù)測(cè)模型。

計(jì)算相似度:利用相似模型計(jì)算備選用戶與種子用戶的相似度p(mu,u)。

計(jì)算點(diǎn)擊率:利用點(diǎn)擊預(yù)測(cè)模型預(yù)估各備選用戶點(diǎn)擊該廣告特征對(duì)應(yīng)廣告的點(diǎn)擊率p(mu,u,a)。這里的點(diǎn)擊率即為前述執(zhí)行預(yù)定轉(zhuǎn)化操作的概率的一種。

計(jì)算定向評(píng)分:基于p(mu,u)及p(mu,u,a)確定p(u)。

示例五:

本示例基于示例一提供的系統(tǒng)架構(gòu),提供一種目標(biāo)用戶定向的結(jié)果輸出方法,包括:

目標(biāo)用戶的輸出包括兩個(gè)部分:模型透明化信息和用戶的定向評(píng)分。

模型透明化信息包括揭示種子人群的具有較高區(qū)分度的核心特征。核心特征的確定方法主要是計(jì)算相似性擴(kuò)散模型的訓(xùn)練數(shù)據(jù)的各個(gè)用戶屬性的信息增益率igr。假設(shè)分類用戶特征為c,用戶特征向量為x,h為信息熵。

用戶定向評(píng)分的輸入為相似模型輸出的相似度mu,點(diǎn)擊預(yù)測(cè)模型輸出的概率mc,預(yù)測(cè)的輸入包括大盤用戶u和將要投放的廣告a。大盤每個(gè)用戶ui的計(jì)算公式如下:p(ui)=α*p(u,ui)+β*p(mc,ui,a)

其中,α和β分別代表相似度和點(diǎn)擊率的權(quán)重,可以根據(jù)業(yè)務(wù)場(chǎng)景進(jìn)行響應(yīng)調(diào)整;所述i為用戶特征x的第i個(gè)特征值。p(u,ui)和p(mc,ui,a)都是0至1之間的實(shí)數(shù),分別代表用戶是相似度和點(diǎn)擊廣告的概率。例如,用戶特征x為年齡特征。所述第i個(gè)特征值可對(duì)應(yīng)于年齡為20至30歲這一特征值。

示例六:

如圖7所示,本示例提供一種目標(biāo)用戶定向裝置,包括:處理器220、存儲(chǔ)介質(zhì)240以及至少一個(gè)外部通信接口210;所述處理器220、存儲(chǔ)介質(zhì)240以及外部通信接口210均通過(guò)總線230連接。所述處理器220可為微處理器、中央處理器、數(shù)字信號(hào)處理器、應(yīng)用處理器或可編程邏輯陣列等具有處理功能的電子元器件。所述存儲(chǔ)介質(zhì)240上存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令;所述處理器220執(zhí)行所述 存儲(chǔ)介質(zhì)240中存儲(chǔ)的所述計(jì)算機(jī)可執(zhí)行指令可實(shí)現(xiàn)前述實(shí)施例一至實(shí)施例七任意技術(shù)方案提供的所述目標(biāo)用戶定西方法,例如,如圖1所示的方法。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。以上所描述的設(shè)備實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,如:多個(gè)單元或組件可以結(jié)合,或可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過(guò)一些接口,設(shè)備或單元的間接耦合或通信連接,可以是電性的、機(jī)械的或其它形式的。

上述作為分離部件說(shuō)明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元,即可以位于一個(gè)地方,也可以分布到多個(gè)網(wǎng)絡(luò)單元上;可以根據(jù)實(shí)際的需要選擇其中的部分或全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。

另外,在本發(fā)明各實(shí)施例中的各功能單元可以全部集成在一個(gè)處理模塊中,也可以是各單元分別單獨(dú)作為一個(gè)單元,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中;上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。

本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:移動(dòng)存儲(chǔ)設(shè)備、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1