亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種擴散種子用戶的方法及裝置的制造方法

文檔序號:10570545閱讀:464來源:國知局
一種擴散種子用戶的方法及裝置的制造方法
【專利摘要】本發(fā)明涉及一種擴散種子用戶的方法及裝置,其中所述方法包括:根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信息構(gòu)造出負樣本點;根據(jù)所述正樣本點和所述負樣本點來訓練擴散模型;以及根據(jù)所述全量用戶的屬性信息,按照所述擴散模型,從所述全量用戶中提取擴散用戶。根據(jù)本發(fā)明實施例的擴散種子用戶的方法及裝置能夠提高種子用戶的擴散精度,使得擴散用戶與種子用戶人群特征類似。
【專利說明】
_種擴散種子用戶的方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)大數(shù)據(jù)處理領(lǐng)域,尤其涉及一種擴散種子用戶的方法及裝置。
【背景技術(shù)】
[0002] 網(wǎng)絡(luò)平臺在推出新產(chǎn)品時,往往需要精準定位有效用戶,從而帶來推廣成本降低 和效率提升。一般會利用小流量產(chǎn)生少量種子人群,通過分析種子人群的靜態(tài)和行為特征, 從而指導更大規(guī)模的投放。種子用戶的選取對于新產(chǎn)品的運營和投放至關(guān)重要,而種子用 戶覆蓋的特征越全面,則越有利于新產(chǎn)品的推廣。
[0003] 然而,在新產(chǎn)品推出初期,獲取種子人群的窗口時間是有限的,收集到的種子人群 也是有限的,所以,往往在獲取了一定數(shù)目的種子用戶之后,對種子用戶進行擴散,以得到 更多的種子用戶。
[0004] 目前對種子用戶進行擴散的常用方法是:首先提取種子用戶的主要特征、例如用 戶年齡、性別、職業(yè)、教育水平和興趣愛好等,然后根據(jù)所提取的種子用戶的主要特征,利用 特征距離相似性來獲取與種子用戶相像的用戶,將這些用戶作為擴散用戶。
[0005] 這種利用特征相似性進行種子用戶擴散的方法在提取種子用戶的哪些特征、選取 多少數(shù)量的特征等方面,沒有較為系統(tǒng)的策略,全站用戶趨同性的行為對于相似性計算干 擾非常大,所以實施起來通常需要人工干預,有可能導致獲取到的擴散用戶并不能起到類 似于種子用戶的作用,另外,這種方法也不利于對種子用戶擴散的規(guī)模進行控制。

【發(fā)明內(nèi)容】

[0006] 技術(shù)問題
[0007] 有鑒于此,本發(fā)明要解決的技術(shù)問題是,如何提高種子用戶的擴散精度。
[0008] 解決方案
[0009] 為了解決上述技術(shù)問題,根據(jù)本發(fā)明的一個方面,提供了一種擴散種子用戶的方 法,包括:根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信息構(gòu)造出負樣本點;根 據(jù)所述正樣本點和所述負樣本點來訓練擴散模型;以及根據(jù)所述全量用戶的屬性信息,按 照所述擴散模型,從所述全量用戶中提取擴散用戶。
[0010] 對于上述方法,在一種可能的實現(xiàn)方式中,所述正樣本點為預定時間段內(nèi)參與所 述網(wǎng)絡(luò)平臺推出的產(chǎn)品的種子用戶。
[0011] 對于上述方法,在一種可能的實現(xiàn)方式中,所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:廣告、 多媒體資源、話題和應(yīng)用軟件中的至少一個;以及參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:向好 友分享、轉(zhuǎn)發(fā)、評論以及向所述網(wǎng)絡(luò)平臺反饋所述產(chǎn)品中的至少一個。
[0012] 對于上述方法,在一種可能的實現(xiàn)方式中,所述負樣本點為不會參與所述網(wǎng)絡(luò)平 臺推出的產(chǎn)品的用戶,構(gòu)造出所述負樣本點包括:從所述全量用戶中排除屬性信息與所述 正樣本點的屬性信息相同或相近的用戶,以得到所述負樣本點。
[0013] 對于上述方法,在一種可能的實現(xiàn)方式中,所述擴散模型為如下函數(shù):f(Xl)=p(yi =1IX1,0);其中,X1是對所述全量用戶中的第i個用戶的屬性信息進行量化后的數(shù)值,f( xl) 用于表示所述第i個用戶為所述擴散用戶的概率,9是所述屬性信息的權(quán)重,yi = l表示所述 第i個用戶為所述擴散用戶;從所述全量用戶中提取擴散用戶包括:將所述全量用戶的屬性 信息輸入所述擴散模型,將輸出大于設(shè)定閾值的用戶確定為所述擴散用戶。
[0014] 對于上述方法,在一種可能的實現(xiàn)方式中,所述屬性信息包括:靜態(tài)屬性和動態(tài)屬 性;根據(jù)所述全量用戶在所述網(wǎng)絡(luò)平臺上注冊的信息數(shù)據(jù),來提取所述全量用戶的靜態(tài)屬 性,所述靜態(tài)屬性包括:年齡、性別、職業(yè)、教育水平和興趣愛好中的至少一個;以及根據(jù)所 述全量用戶在所述網(wǎng)絡(luò)平臺上進行的行為數(shù)據(jù),來提取所述全量用戶的動態(tài)屬性,所述動 態(tài)屬性包括:興趣愛好、最常關(guān)注和活躍度中的至少一個。
[0015] 為了解決上述技術(shù)問題,根據(jù)本發(fā)明的又一個方面,提供了一種擴散種子用戶的 裝置,包括:樣本構(gòu)建模塊,用于根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信 息構(gòu)造出負樣本點;模型構(gòu)建模塊,與所述樣本構(gòu)建模塊連接,用于根據(jù)所述正樣本點和所 述負樣本點來訓練擴散模型;以及擴散模塊,與所述模型構(gòu)建模塊連接,用于根據(jù)所述全量 用戶的屬性信息,按照所述擴散模型,從所述全量用戶中提取擴散用戶。
[0016] 對于上述裝置,在一種可能的實現(xiàn)方式中,所述正樣本點為預定時間段內(nèi)參與所 述網(wǎng)絡(luò)平臺推出的產(chǎn)品的種子用戶。
[0017] 對于上述裝置,在一種可能的實現(xiàn)方式中,所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:廣告、 多媒體資源、話題和應(yīng)用軟件中的至少一個;以及參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:向好 友分享、轉(zhuǎn)發(fā)、評論以及向所述網(wǎng)絡(luò)平臺反饋所述產(chǎn)品中的至少一個。
[0018] 對于上述裝置,在一種可能的實現(xiàn)方式中,所述負樣本點為不會參與所述網(wǎng)絡(luò)平 臺推出的產(chǎn)品的用戶,所述樣本構(gòu)建模塊具體用于:從所述全量用戶中排除屬性信息與所 述正樣本點的屬性信息相同或相近的用戶,以得到所述負樣本點。
[0019] 對于上述裝置,在一種可能的實現(xiàn)方式中,所述擴散模型為如下函數(shù):f(Xl)=p(yi =1IX1,0);其中,X1是對所述全量用戶中的第i個用戶的屬性信息進行量化后的數(shù)值,f( xl) 用于表示所述第i個用戶為所述擴散用戶的概率,0是所述屬性信息的權(quán)重,yi = l表示所述 第i個用戶為所述擴散用戶;所述擴散模塊具體用于:將所述全量用戶的屬性信息輸入所述 擴散模型,將輸出大于設(shè)定閾值的用戶確定為所述擴散用戶。
[0020] 有益效果
[0021]通過根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信息,構(gòu)造出負樣本 點,然后根據(jù)所述正樣本點和所述負樣本點來訓練擴散模型,從而根據(jù)所述全量用戶的屬 性信息,按照所述擴散模型,能夠從所述全量用戶中提取擴散用戶。根據(jù)本發(fā)明實施例的擴 散種子用戶的方法及裝置能夠提高種子用戶的擴散精度,使得擴散用戶與種子用戶人群特 征特征類似。
[0022] 根據(jù)下面參考附圖對示例性實施例的詳細說明,本發(fā)明的其它特征及方面將變得 清楚。
【附圖說明】
[0023] 包含在說明書中并且構(gòu)成說明書的一部分的附圖與說明書一起示出了本發(fā)明的 示例性實施例、特征和方面,并且用于解釋本發(fā)明的原理。
[0024] 圖1示出根據(jù)本發(fā)明一實施例的擴散種子用戶的方法的流程圖;
[0025] 圖2示出根據(jù)本發(fā)明另一實施例的擴散種子用戶的方法的流程圖;
[0026] 圖3示出根據(jù)本發(fā)明又一實施例的擴散種子用戶的方法的流程圖;
[0027] 圖4示出根據(jù)本發(fā)明一實施例的擴散種子用戶的裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0028] 以下將參考附圖詳細說明本發(fā)明的各種示例性實施例、特征和方面。附圖中相同 的附圖標記表示功能相同或相似的元件。盡管在附圖中示出了實施例的各種方面,但是除 非特別指出,不必按比例繪制附圖。
[0029] 在這里專用的詞"示例性"意為"用作例子、實施例或說明性"。這里作為"示例性" 所說明的任何實施例不必解釋為優(yōu)于或好于其它實施例。
[0030] 另外,為了更好的說明本發(fā)明,在下文的【具體實施方式】中給出了眾多的具體細節(jié)。 本領(lǐng)域技術(shù)人員應(yīng)當理解,沒有某些具體細節(jié),本發(fā)明同樣可以實施。在一些實例中,對于 本領(lǐng)域技術(shù)人員熟知的方法、手段、元件和電路未作詳細描述,以便于凸顯本發(fā)明的主旨。
[0031] 實施例1
[0032] 圖1示出根據(jù)本發(fā)明一實施例的擴散種子用戶的方法的流程圖。如圖1所示,該方 法主要包括:
[0033] 步驟S100、根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信息,構(gòu)造出 負樣本點;其中,網(wǎng)絡(luò)平臺可以是互聯(lián)網(wǎng)網(wǎng)站或者應(yīng)用軟件,全量用戶可以包括在該網(wǎng)絡(luò)平 臺上注冊的所有用戶和訪問過該網(wǎng)絡(luò)平臺的所有用戶。
[0034] 企業(yè)或者個人在推出新產(chǎn)品時,往往借助網(wǎng)絡(luò)平臺發(fā)布,通過種子用戶試用并向 網(wǎng)絡(luò)平臺反饋關(guān)于新產(chǎn)品的意見或建議,使得企業(yè)或個人對該新產(chǎn)品進行改進,以使得新 產(chǎn)品能夠盡可能快地被推廣和使用。由此可見,種子用戶對于新產(chǎn)品的運營和投放至關(guān)重 要。
[0035] 在一種可能的實現(xiàn)方式中,所述正樣本點為預定時間段內(nèi)參與所述網(wǎng)絡(luò)平臺推出 的產(chǎn)品的種子用戶。所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:廣告、多媒體資源、話題和應(yīng)用軟件中 的至少一個。參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:向好友分享、轉(zhuǎn)發(fā)、評論以及向所述網(wǎng)絡(luò) 平臺反饋所述產(chǎn)品中的至少一個。可以通過以下方法來選擇種子用戶,例如,網(wǎng)絡(luò)平臺新發(fā) 布了一則廣告,統(tǒng)計一天內(nèi)對該廣告進行了評論或者轉(zhuǎn)發(fā)的用戶,將這些用戶作為種子用 戶。一般情況下,若某用戶僅瀏覽了該廣告,而并未進行其它行為,則該用戶并不是種子用 戶。當然,預定時間段不限于上述的一天,可以根據(jù)獲取的種子用戶的數(shù)量靈活增加或減小 預定時間段。
[0036] 步驟S200、根據(jù)所述正樣本點和所述負樣本點來訓練擴散模型;所述負樣本點為 不會參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品的用戶。這樣,通過參與了網(wǎng)絡(luò)平臺推出的產(chǎn)品的用戶 和不會參與網(wǎng)絡(luò)平臺推出的產(chǎn)品的用戶來確定擴散模型,能夠使得確定出的擴散模型更精 確。
[0037] 步驟S300、根據(jù)所述全量用戶的屬性信息,按照所述擴散模型,從所述全量用戶中 提取擴散用戶。其中,擴散用戶為有可能會參與網(wǎng)絡(luò)平臺推出的產(chǎn)品的用戶,擴散用戶參與 網(wǎng)絡(luò)平臺推出的產(chǎn)品的可能性越大,則種子用戶的擴散精度越高,種子用戶的擴散也越成 功。
[0038] 在一種可能的實現(xiàn)方式中,所述擴散模型為如下函數(shù):以11)=1)(71 = 1|11,0);其 中,Xl是對所述全量用戶中的第i個用戶的屬性信息進行量化后的數(shù)值,f( Xl)用于表示所述 第i個用戶為所述擴散用戶的概率,9是所述屬性信息的權(quán)重,yi = l表示所述第i個用戶為 所述擴散用戶。P(yi = l|Xl,9)所表示的是如下含義,即在對所述全量用戶中的第i個用戶的 屬性信息進行量化后的數(shù)值為^、并且所述第i個用戶的各個屬性信息的權(quán)重為9的情況 下,該第i個用戶為擴散用戶的概率。其中,若第i個用戶的屬性信息有N個,則 XdP0分別都 具有N個分量。步驟S300具體可以為:將所述全量用戶的屬性信息輸入所述擴散模型,將輸 出大于設(shè)定閾值的用戶確定為所述擴散用戶。該設(shè)定閾值越高,則提取出的擴散用戶參與 網(wǎng)絡(luò)平臺推出的產(chǎn)品的可能性越大,但是所能夠提取出的擴散用戶的數(shù)量可能越小,因此 可以根據(jù)實際需要靈活設(shè)置閾值,從而能夠?qū)崿F(xiàn)對擴散用戶規(guī)模的控制。
[0039] 在一種可能的實現(xiàn)方式中,所述屬性信息可以包括靜態(tài)屬性和動態(tài)屬性。所述靜 態(tài)屬性包括:年齡、性別、職業(yè)、教育水平和興趣愛好中的至少一個,可以根據(jù)全量用戶在網(wǎng) 絡(luò)平臺上注冊的信息數(shù)據(jù),來提取全量用戶的靜態(tài)屬性;動態(tài)屬性包括:興趣愛好、最常關(guān) 注和活躍度中的至少一個,可以根據(jù)全量用戶在網(wǎng)絡(luò)平臺上進行的行為數(shù)據(jù),來提取全量 用戶的動態(tài)屬性。其中,全量用戶在網(wǎng)絡(luò)平臺上進行的行為數(shù)據(jù)可以包括其訪問和訂閱的 網(wǎng)絡(luò)平臺所提供的內(nèi)容、以及其在網(wǎng)絡(luò)平臺上發(fā)布的內(nèi)容等,可以據(jù)此獲取全量用戶的興 趣愛好和最常關(guān)注等屬性,另外,全量用戶在網(wǎng)絡(luò)平臺上進行的行為數(shù)據(jù)還可以包括其登 錄網(wǎng)絡(luò)平臺的頻率、以及其參與網(wǎng)絡(luò)平臺提供的內(nèi)容的頻率等,可以據(jù)此獲取全量用戶的 活躍度。
[0040] 需要說明的是,由于興趣愛好有可能會隨著時間而改變,用戶在網(wǎng)絡(luò)平臺上注冊 的興趣愛好與根據(jù)其在網(wǎng)絡(luò)平臺上進行的行為數(shù)據(jù)所提取出的興趣愛好有可能不同,例如 用戶在注冊時填寫的興趣愛好是體育,但是其經(jīng)常瀏覽與電子產(chǎn)品有關(guān)的內(nèi)容而認為其興 趣愛好可能是電子產(chǎn)品,因此可以將興趣愛好既作為靜態(tài)屬性又作為動態(tài)屬性同時提取。
[0041] 另外,上述的擴散模型中的變量Xl可以是一個N行1列的向量,每行包括屬性信息 的一個特征,例如年齡、興趣愛好、最常關(guān)注等。權(quán)重9也可以是一個N行1列的向量,各行分 別對應(yīng)屬性信息的各個特征的權(quán)重。將正樣本點的輸出f( Xl)設(shè)置為最大值,將負樣本點的 輸出f(Xl)設(shè)置為最小值,通過正樣本點和負樣本點的屬性信息對擴散模型進行訓練,最終 得到較為精確的權(quán)重9。
[0042]以分類器logistic Regression為例,可以通過如下步驟來構(gòu)造擴散模型:步驟 (1)、首先構(gòu)造損失函數(shù):1〇%(〇) = 1].>',1<^(1(')) + (卜-)/',)丨(^〇-1(')),其中,11表示全量用 戶的數(shù)目,f(Xl)是前面所述的用于表示第i個用戶為所述擴散用戶的概率;步驟(2)、采用 梯度下降的方式進行優(yōu)化,常見的方法有g(shù)radient descent/L-BFGS等,通過優(yōu)化可以得出 9參數(shù),從而最終得到擴散模型:/(』?)= -如在上述步驟S300中所述地,可以通過調(diào) 1 + e 節(jié)設(shè)定閾值來對擴散用戶的規(guī)模進行控制,將設(shè)定閾值調(diào)節(jié)得越大,則擴散的標準越嚴格, 反之則表示擴散的標準越松散。
[0043]需要說明的是,上述的擴散模型僅為示例,還可以采用其它常用的訓練方法來構(gòu) 造擴散模型,所得到的擴散模型f(x)將根據(jù)訓練用的分類器的不同而不同。
[0044] 這樣,通過根據(jù)正樣本點和負樣本點來生成擴散模型,并利用全量用戶的屬性信 息,根據(jù)該擴散模型從全量用戶中提取出擴散用戶,根據(jù)本發(fā)明上述實施例的擴散種子用 戶的方法能夠提高種子用戶的擴散精度,使得擴散用戶與種子用戶人群特征類似。
[0045] 實施例2
[0046] 圖2示出根據(jù)本發(fā)明另一實施例的擴散種子用戶的方法的流程圖。圖2中標號與圖 1相同的組件具有相同的功能,為簡明起見,省略對這些組件的詳細說明。
[0047] 由于很難直接定位到不符合預期的用戶群、也即不會參與網(wǎng)絡(luò)平臺推出的產(chǎn)品的 用戶,所以不容易直接找出負樣本點。本實施例利用一種組合方法從全量用戶中挑選出不 符合種子用戶特征的用戶群,并將其標記為負樣本點。具體地,如圖2所示,圖1所示的構(gòu)造 出負樣本點的步驟S100可以包括:
[0048]步驟S110、從全量用戶中排除屬性信息與所述正樣本點的屬性信息相同或相近的 用戶,以得到候選用戶;其中,與所述正樣本點的屬性信息相同或相近的用戶可以是如下用 戶:與表示正樣本點的種子用戶在內(nèi)容上喜好相同的用戶、與種子用戶在訂閱行為上相似 的用戶、以及與種子用戶主要特征相似的用戶。
[0049] 具體地,如圖3所示,可以通過以下步驟挑選出要從全量用戶中過濾的用戶:
[0050] 3.1、通過用戶訪問的內(nèi)容的數(shù)據(jù),找到與種子用戶在內(nèi)容上喜好相同的用戶,并 標記為內(nèi)容過濾用戶;
[0051] 3.2、通過用戶的訂閱數(shù)據(jù),找到與種子用戶在訂閱行為上相似的用戶,并標記為 訂閱過濾用戶;
[0052] 3.3、通過計算特征信息熵的方法,選取種子用戶信息熵突出的特征,通過這些特 征挑選出與種子用戶主要特征相似的用戶,將其標記為特征過濾用戶。具體地,首先對全量 用戶進行聚合投影,可以得出標簽i的人數(shù)<4,在全量用戶中所占的比例為j4d,接下來對 種子用戶進行投影,可以得出種子用戶中標簽i的人數(shù)c:以及比例i^ d,那么可以將標簽i 的特征熵(類似FOIL信息熵增益)定義為:e:Led =c_t|>gP_i -_l〇gP:ut;),通過這個值的大小 來確定主要特征。一般選取該值較大的一些特征作為主要特征,主要特征可以包括在前述 的用戶屬性信息中。
[0053]然后,從全量用戶中排除已經(jīng)標記的內(nèi)容過濾用戶、訂閱過濾用戶、特征過濾用戶 以及種子用戶,從剩下的用戶中采用隨機策略生成負樣本點。即步驟S120、從所述候選用戶 (即上述的剩下的用戶)中,抽取出預定數(shù)量的用戶作為所述負樣本點。由于候選用戶的數(shù) 量較多,而往往不需要那么多的負樣本點,因此,從候選用戶中抽取根據(jù)實際需要數(shù)量的負 樣本點。
[0054]當然,根據(jù)實際應(yīng)用場景,也可以從所述全量用戶中排除屬性信息與所述正樣本 點的屬性信息相同或相近的用戶,將剩下的用戶均作為負樣本點。
[0055]在一種可能的實現(xiàn)方式中,可以根據(jù)已經(jīng)產(chǎn)生的正樣本點和負樣本點,采用線性 分類器進行訓練,生成最終的擴散模型,從而將用于擴散種子用戶的擴散模型轉(zhuǎn)化為較為 簡單的分類模型,同時利用本實例所述的組合方法生成用于確定分類模型的負樣本點,從 而能夠在擴散過程中不需要關(guān)注特征選取,能夠有效利用全部特征的信息。另外,利用擴散 模型對全量用戶進行分類,可以通過調(diào)節(jié)模型的閾值大小來靈活控制擴散用戶的數(shù)量。
[0056] 根據(jù)本發(fā)明上述實施例的擴散種子用戶的方法能夠提高種子用戶的擴散精度,使 得擴散用戶與種子用戶人群特征類似,并能夠?qū)崿F(xiàn)對擴散用戶規(guī)模的控制。從而通過種子 用戶和擴散用戶的傳播和反饋,提高了網(wǎng)絡(luò)平臺投放產(chǎn)品的精度,帶來產(chǎn)品運行和投放效 率的提升。
[0057] 實施例3
[0058]圖4示出根據(jù)本發(fā)明一實施例的擴散種子用戶的裝置400的結(jié)構(gòu)示意圖。如圖4所 示,該裝置主要包括:樣本構(gòu)建模塊410、模型構(gòu)建模塊420和擴散模塊430。其中,樣本構(gòu)建 模塊410用于根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信息構(gòu)造出負樣本 點;模型構(gòu)建模塊420與樣本構(gòu)建模塊410連接,用于根據(jù)所述正樣本點和所述負樣本點來 訓練擴散模型;擴散模塊430與模型構(gòu)建模塊420連接,用于根據(jù)所述全量用戶的屬性信息, 按照所述擴散模型,從所述全量用戶中提取擴散用戶。
[0059] 在一種可能的實現(xiàn)方式中,所述正樣本點為預定時間段內(nèi)參與所述網(wǎng)絡(luò)平臺推出 的產(chǎn)品的種子用戶。所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:廣告、多媒體資源、話題和應(yīng)用軟件中 的至少一個;參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:向好友分享、轉(zhuǎn)發(fā)、評論以及向所述網(wǎng)絡(luò) 平臺反饋所述產(chǎn)品中的至少一個。
[0060] 在一種可能的實現(xiàn)方式中,所述負樣本點為不會參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品的 用戶,樣本構(gòu)建模塊410具體用于:從所述全量用戶中排除屬性信息與所述正樣本點的屬性 信息相同或相近的用戶,以得到所述負樣本點。
[0061] 在一種可能的實現(xiàn)方式中,所述擴散模型為如下函數(shù):以11)=1)(71 = 1|11,0);其 中,Xl是對所述全量用戶中的第i個用戶的屬性信息進行量化后的數(shù)值,f( Xl)用于表示所述 第i個用戶為所述擴散用戶的概率,9是所述屬性信息的權(quán)重,yi = l表示所述第i個用戶為 所述擴散用戶;擴散模塊430具體用于:將所述全量用戶的屬性信息輸入所述擴散模型,將 輸出大于設(shè)定閾值的用戶確定為所述擴散用戶。
[0062]根據(jù)本實施例的樣本構(gòu)建模塊410、模型構(gòu)建模塊420和擴散模塊430的具體實現(xiàn) 機理可以參考實施例1和2中對步驟S110至步驟S130的描述,并且根據(jù)本實施例的擴散種子 用戶的裝置400能夠?qū)崿F(xiàn)與實施例1和2所述方法相同的有益效果。即夠提高種子用戶的擴 散精度,使得擴散用戶與種子用戶人群特征類似,并能夠?qū)崿F(xiàn)對擴散用戶規(guī)模的控制。從而 通過種子用戶和擴散用戶的傳播和反饋,提高了網(wǎng)絡(luò)平臺投放產(chǎn)品的精度,帶來產(chǎn)品運行 和投放效率的提升。
[0063]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。
【主權(quán)項】
1. 一種擴散種子用戶的方法,其特征在于,包括: 根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信息構(gòu)造出負樣本點; 根據(jù)所述正樣本點和所述負樣本點來訓練擴散模型;以及 根據(jù)所述全量用戶的屬性信息,按照所述擴散模型,從所述全量用戶中提取擴散用戶。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述正樣本點為預定時間段內(nèi)參與所述網(wǎng) 絡(luò)平臺推出的產(chǎn)品的種子用戶。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于, 所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:廣告、多媒體資源、話題和應(yīng)用軟件中的至少一個;以 及 參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:向好友分享、轉(zhuǎn)發(fā)、評論以及向所述網(wǎng)絡(luò)平臺反饋 所述產(chǎn)品中的至少一個。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述負樣本點為不會參與所述網(wǎng)絡(luò)平臺推 出的產(chǎn)品的用戶,構(gòu)造出所述負樣本點包括: 從所述全量用戶中排除屬性信息與所述正樣本點的屬性信息相同或相近的用戶,以得 到所述負樣本點。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述擴散模型為如下函數(shù):f (Xi )= p (yi = 1 Χι,θ);其中,X1是對所述全量用戶中的第i個用戶的屬性信息進行量化后的數(shù)值,以^)用 于表示所述第i個用戶為所述擴散用戶的概率,Θ是所述屬性信息的權(quán)重,yi = l表示所述第 i個用戶為所述擴散用戶;從所述全量用戶中提取擴散用戶包括:將所述全量用戶的屬性信 息輸入所述擴散模型,將輸出大于設(shè)定閾值的用戶確定為所述擴散用戶。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述屬性信息包括:靜態(tài)屬性和動態(tài)屬性; 根據(jù)所述全量用戶在所述網(wǎng)絡(luò)平臺上注冊的信息數(shù)據(jù),來提取所述全量用戶的靜態(tài)屬性, 所述靜態(tài)屬性包括:年齡、性別、職業(yè)、教育水平和興趣愛好中的至少一個;以及 根據(jù)所述全量用戶在所述網(wǎng)絡(luò)平臺上進行的行為數(shù)據(jù),來提取所述全量用戶的動態(tài)屬 性,所述動態(tài)屬性包括:興趣愛好、最常關(guān)注和活躍度中的至少一個。7. -種擴散種子用戶的裝置,其特征在于,包括: 樣本構(gòu)建模塊,用于根據(jù)網(wǎng)絡(luò)平臺中全量用戶的屬性信息和正樣本點的屬性信息構(gòu)造 出負樣本點; 模型構(gòu)建模塊,與所述樣本構(gòu)建模塊連接,用于根據(jù)所述正樣本點和所述負樣本點來 訓練擴散模型;以及 擴散模塊,與所述模型構(gòu)建模塊連接,用于根據(jù)所述全量用戶的屬性信息,按照所述擴 散模型,從所述全量用戶中提取擴散用戶。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述正樣本點為預定時間段內(nèi)參與所述網(wǎng) 絡(luò)平臺推出的產(chǎn)品的種子用戶。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于, 所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:廣告、多媒體資源、話題和應(yīng)用軟件中的至少一個;以 及 參與所述網(wǎng)絡(luò)平臺推出的產(chǎn)品包括:向好友分享、轉(zhuǎn)發(fā)、評論以及向所述網(wǎng)絡(luò)平臺反饋 所述產(chǎn)品中的至少一個。10. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述負樣本點為不會參與所述網(wǎng)絡(luò)平臺 推出的產(chǎn)品的用戶,所述樣本構(gòu)建模塊具體用于: 從所述全量用戶中排除屬性信息與所述正樣本點的屬性信息相同或相近的用戶,以得 到所述負樣本點。11. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述擴散模型為如下函數(shù):f(Xl)=p(yi = 1|Χ1,Θ);其中,Xl是對所述全量用戶中的第i個用戶的屬性信息進行量化后的數(shù)值,以^)用 于表示所述第i個用戶為所述擴散用戶的概率,Θ是所述屬性信息的權(quán)重, yi = l表示所述第 i個用戶為所述擴散用戶;所述擴散模塊具體用于:將所述全量用戶的屬性信息輸入所述擴 散模型,將輸出大于設(shè)定閾值的用戶確定為所述擴散用戶。
【文檔編號】G06Q30/02GK105931079SQ201610282514
【公開日】2016年9月7日
【申請日】2016年4月29日
【發(fā)明人】汪飛, 王必堯, 尹玉宗, 姚鍵, 潘柏宇, 王冀
【申請人】合網(wǎng)絡(luò)技術(shù)(北京)有限公司, 合一網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1