亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種獲取完整用戶畫像的方法及裝置的制造方法

文檔序號(hào):8430762閱讀:367來(lái)源:國(guó)知局
一種獲取完整用戶畫像的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息處理領(lǐng)域,具體涉及一種獲取完整用戶畫像的方法及裝置。
【背景技術(shù)】
[0002] 用戶標(biāo)簽在實(shí)際應(yīng)用中起著重要作用。例如,知道標(biāo)簽包括用戶的興趣和經(jīng)常去 的場(chǎng)所就能做出精準(zhǔn)的營(yíng)銷,同時(shí)可以給用戶帶來(lái)更好的服務(wù)體驗(yàn)。通常,用戶的標(biāo)簽可以 用一個(gè)矩陣rMXN表不,其中1 <m<M表不用戶索引,即一共有M個(gè)用戶,而1 <n<N表 示用戶標(biāo)簽索引,即每個(gè)用戶一共有N個(gè)標(biāo)簽。通常,觀測(cè)到的用戶標(biāo)簽都是殘缺的,即存 在未知的標(biāo)簽的值,用"?"符號(hào)表示。當(dāng)存在大量用戶數(shù)目和標(biāo)簽數(shù)目時(shí),矩陣rMXN可能會(huì) 異常稀疏,矩陣中充滿了大量的〇元素,該〇元素即代表未知標(biāo)簽,稱之為殘缺的用戶畫像 矩陣。
[0003] 為了能夠獲得每一個(gè)用戶的標(biāo)簽信息,目前采用矩陣分解的方法,根據(jù)殘缺的用 戶畫像矩陣,預(yù)測(cè)得完整的用戶畫像矩陣。該方法的具體包括:
[0004] 步驟一:輸入殘缺畫像矩陣rMXN,并隨機(jī)初始化用戶參數(shù)矩陣P和標(biāo)簽參數(shù)矩陣 Q〇
[0005] 步驟二:計(jì)算矩陣rMXN中非零元素的畫像誤差em,n,計(jì)算公式為:
[_6]一叫 [pjq#
[0007] 步驟三:根據(jù)畫像誤差更新參數(shù)P和Q,計(jì)算公式為:
[0008] knqn_XppJ,qn=qn+Y (、nPn]-入Qqn)。
[0009] 其中,Y是學(xué)習(xí)效率,一般設(shè)置為Y=〇. 001。
[0010] 步驟四:重復(fù)步驟二和步驟三直到矩陣rMXN中所有非零元素掃描一遍,稱之為一 次循環(huán)。
[0011] 步驟五:重復(fù)步驟四1 <t<T循環(huán)直至用戶參數(shù)矩陣P和標(biāo)簽參數(shù)矩陣Q以及 畫像誤差大致穩(wěn)定在一個(gè)狀態(tài),即重復(fù)步驟四直至畫像誤差收斂。
[0012] 步驟六:輸出完整用戶畫像矩陣rMxW =rt/,A +/3/(?。
[0013] 但是,在實(shí)施該方法中發(fā)現(xiàn):每次循環(huán)需要掃描輸入矩陣rMXN中的所有非零元素, 每個(gè)非零元素需要計(jì)算所有用戶類別上的畫像誤差,而且達(dá)到畫像誤差收斂需要的循環(huán)次 數(shù)多,因此該方法的運(yùn)算量大,非常耗時(shí)。

【發(fā)明內(nèi)容】

[0014] 本發(fā)明的目的在于一種獲取完整用戶畫像的方法及裝置,所述方法是根據(jù)第一部 分用戶的畫像誤差,更新用戶參數(shù)矩陣和標(biāo)簽參數(shù)矩陣,從而能夠減少運(yùn)算量。
[0015] 本發(fā)明第一方面提供的一種獲取完整用戶畫像的方法,包括:
[0016] 獲取殘缺的用戶畫像矩陣,以及隨機(jī)生成初始的用戶參數(shù)矩陣P和標(biāo)簽參數(shù)矩陣 Q;其中,所述殘缺的用戶畫像矩陣、所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q對(duì)應(yīng)相同的 多個(gè)用戶,所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q為所述殘缺的用戶畫像矩陣的分解 矩陣;
[0017] 根據(jù)所述殘缺的用戶畫像矩陣,R次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩 陣Q,R為使得第一畫像誤差收斂所需的更新次數(shù);所述第一畫像誤差為所述殘缺的用戶畫 像矩陣中非零元素與對(duì)應(yīng)的第一預(yù)測(cè)值之間的差值,所述第一預(yù)測(cè)值為所述用戶參數(shù)矩陣 P與所述標(biāo)簽參數(shù)矩陣Q的合并矩陣的元素;
[0018] 其中,第1次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,1大于或等于1且 小于或等于R,包括:
[0019] 當(dāng)r=l時(shí),根據(jù)所述殘缺的用戶畫像矩陣,隨機(jī)生成的初始的用戶參數(shù)矩陣P和標(biāo) 簽參數(shù)矩陣Q,計(jì)算所述殘缺的用戶畫像矩陣中非零元素的第一畫像誤差;根據(jù)所述第一 畫像誤差,更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q;
[0020] 當(dāng)1大于或等于2時(shí),所述第r次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣 Q,包括:
[0021] 根據(jù)所述殘缺的用戶畫像矩陣、所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,計(jì)算 所述多個(gè)用戶中的第一部分用戶的第一畫像誤差;所述第一部分用戶的第一變化差值大于 第一剩余用戶的第一變化差值,所述第一剩余用戶為所述多個(gè)用戶中的除所述第一部分用 戶之外的用戶;
[0022] 當(dāng)r等于2時(shí),所述第一變化差值為根據(jù)第r-1次更新得到的所述用戶參數(shù)矩陣 P和所述標(biāo)簽參數(shù)矩陣Q獲得的第一預(yù)測(cè)值與根據(jù)隨機(jī)生成的初始的所述用戶參數(shù)矩陣P 和所述標(biāo)簽參數(shù)矩陣Q獲得的第一預(yù)測(cè)值之間的差值;
[0023] 當(dāng)r大于2時(shí),所述第一變化差值為根據(jù)第r-1次更新得到的所述用戶參數(shù)矩陣 P和所述標(biāo)簽參數(shù)矩陣Q獲得的第一預(yù)測(cè)值與根據(jù)第r-2次更新得到的所述用戶參數(shù)矩陣 P和所述標(biāo)簽參數(shù)矩陣Q獲得的第一預(yù)測(cè)值之間的差值;
[0024] 根據(jù)所述第一部分用戶的第一畫像誤差,更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參 數(shù)矩陣Q;
[0025] 在第R次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q之后,根據(jù)所述殘缺的 用戶畫像矩陣,以及第R次更新的所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,獲取完整的 用戶畫像矩陣。
[0026] 結(jié)合本發(fā)明第一方面,在第一方面的第一種可能實(shí)現(xiàn)方式中,所述第r次更新所 述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,r大于或等于1且小于或等于R,包括:
[0027] 在根據(jù)所述殘缺的用戶畫像矩陣、所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,計(jì) 算所述多個(gè)用戶中的第一部分用戶的第一畫像誤差之前,計(jì)算所述多個(gè)用戶的變化差值, 并將所述多個(gè)用戶的變化差值進(jìn)行排序,選擇預(yù)定比例的用戶作為所述第一部分用戶,所 述預(yù)定比例的用戶的變化差值都大于所述多個(gè)用戶中未被選擇的用戶的變化差值。
[0028] 結(jié)合本發(fā)明第一方面或第一方面的第一種可能實(shí)現(xiàn)方式,在第一方面的第二種可 能實(shí)現(xiàn)方式中,在第R次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q之后,所述方法還 包括:
[0029] 將所述用戶參數(shù)矩陣P進(jìn)行S次深度分解,并獲得S個(gè)層次深度的用戶參數(shù)矩陣 和標(biāo)簽參數(shù)矩陣;所述S次為設(shè)定的次數(shù);
[0030] 其中,第W次深度分解所述用戶參數(shù)矩陣P,w大于或等于1且小于或等于S,包括:
[0031] 隨機(jī)生成用戶參數(shù)矩陣Pw和標(biāo)簽參數(shù)矩陣Qw ;其中,所述用戶參數(shù)矩陣Pw、所述標(biāo) 簽參數(shù)矩陣Qw與所述用戶參數(shù)矩陣P對(duì)應(yīng)相同的多個(gè)用戶;用戶參數(shù)矩陣Pw和標(biāo)簽參數(shù)矩 陣Qw為所述用戶參數(shù)矩陣P的分解矩陣;
[0032] 根據(jù)所述用戶參數(shù)矩陣P,Y次更新所述用戶參數(shù)矩陣Pw和所述標(biāo)簽參數(shù)矩陣Qw, Y為使得第二畫像誤差收斂所需的更新次數(shù);所述第二畫像誤差為所述用戶參數(shù)矩陣P中 非零元素與對(duì)應(yīng)的第二預(yù)測(cè)值之間的差值,所述第二預(yù)測(cè)值為所述用戶參數(shù)矩陣Pw與所述 標(biāo)簽參數(shù)矩陣Qw的合并矩陣的元素;
[0033] 其中,第y次更新所述用戶參數(shù)矩陣Pw和所述標(biāo)簽參數(shù)矩陣Qw,y大于或等于1且 小于或等于Y,包括:
[0034] 當(dāng)y=l時(shí),根據(jù)所述用戶參數(shù)矩陣P,隨機(jī)生成初始的用戶參數(shù)矩陣?¥和標(biāo)簽參數(shù) 矩陣Qw,計(jì)算所述殘缺的用戶畫像矩陣中非零元素的第二畫像誤差;
[0035] 根據(jù)所述第二畫像誤差,更新所述用戶參數(shù)矩陣Pw和所述標(biāo)簽參數(shù)矩陣Qw;
[0036] 當(dāng)y大于或等于2時(shí),根據(jù)所述用戶參數(shù)矩陣P、所述用戶參數(shù)矩陣Pw和所述標(biāo)簽 參數(shù)矩陣Qw,計(jì)算所述多個(gè)用戶中的第二部分用戶的第二畫像誤差;所述第二部分用戶的 第二變化差值大于第二剩余用戶的第二變化差值,所述第二剩余用戶為所述多個(gè)用戶中的 除所述第二部分用戶之外的用戶;
[0037] 當(dāng)y等于2時(shí),所述第二變化差值為根據(jù)第y-1次更新得到的用戶參數(shù)矩陣?¥和 標(biāo)簽參數(shù)矩陣Qw獲得的第二預(yù)測(cè)值與根據(jù)隨機(jī)生成的初始的用戶參數(shù)矩陣P和標(biāo)簽參數(shù) 矩陣Qw獲得的第二預(yù)測(cè)值之間的差值;
[0038] 當(dāng)y大于2時(shí),所述第二變化差值為根據(jù)第y-1次更新得到的用戶參數(shù)矩陣P和 標(biāo)簽參數(shù)矩陣Qw獲得的第二預(yù)測(cè)值與根據(jù)第y-2次更新得到的用戶參數(shù)矩陣Pw和標(biāo)簽參 數(shù)矩陣Qw獲得的第二預(yù)測(cè)值之間的差值;
[0039] 根據(jù)所述第二部分用戶非零元素的第二畫像誤差,更新所述用戶參數(shù)矩陣Pw和所 述標(biāo)簽參數(shù)矩陣Qw;
[0040] 將Y次更新得到的所述用戶參數(shù)矩陣Pw和所述標(biāo)簽參數(shù)矩陣Qw作為第w層次深 度的用戶參數(shù)矩陣Pw和標(biāo)簽參數(shù)矩陣Qw;
[0041] 當(dāng)所述w小于所述S時(shí),將Y次更新得到的所述用戶參數(shù)矩陣Pw作為第w+1次所 要深度分解的用戶參數(shù)矩陣P;
[0042] 所述根據(jù)所述殘缺的用戶畫像矩陣,以及第R次更新的所述用戶參數(shù)矩陣P和所 述標(biāo)簽參數(shù)矩陣Q,獲取完整的用戶畫像矩陣,包括:
[0043] 在將所述用戶參數(shù)矩陣P進(jìn)行S次深度分解,并獲得S個(gè)層次深度的用戶參數(shù)矩 陣和標(biāo)簽參數(shù)矩陣之后,根據(jù)所述殘缺的用戶畫像矩陣,第R次更新的所述用戶參數(shù)矩陣P 和所述標(biāo)簽參數(shù)矩陣Q,以及獲得的S個(gè)層次深度的用戶參數(shù)矩陣和標(biāo)簽參數(shù)矩陣,獲取完 整的用戶畫像矩陣。
[0044] 本發(fā)明第二方面提供一種信息處理裝置,包括:
[0045] 輸入模塊,用于獲取殘缺的用戶畫像矩陣,以及隨機(jī)生成所述殘缺的用戶畫像矩 陣的用戶參數(shù)矩陣P和標(biāo)簽參數(shù)矩陣Q;其中,所述殘缺的用戶畫像矩陣、所述用戶參數(shù)矩 陣P和所述標(biāo)簽參數(shù)矩陣Q對(duì)應(yīng)相同的多個(gè)用戶;
[0046] 矩陣分解模塊,用于:在所述輸入模塊獲取殘缺的用戶畫像矩陣,以及隨機(jī)生成所 述殘缺的用戶畫像矩陣的用戶參數(shù)矩陣P和標(biāo)簽參數(shù)矩陣Q之后,根據(jù)所述殘缺的用戶畫 像矩陣,R次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,R為使得第一畫像誤差收斂 所需的更新次數(shù);所述第一畫像誤差為所述殘缺的用戶畫像矩陣中非零元素與對(duì)應(yīng)的第一 預(yù)測(cè)值之間的差值,所述第一預(yù)測(cè)值為所述用戶參數(shù)矩陣P與所述標(biāo)簽參數(shù)矩陣Q的合并 矩陣的元素;
[0047] 其中,第1次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,1大于或等于1且 小于或等于R,包括:
[0048] 當(dāng)r=l時(shí),所述第r次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,包括:根 據(jù)所述殘缺的用戶畫像矩陣,隨機(jī)生成的初始的用戶參數(shù)矩陣P和標(biāo)簽參數(shù)矩陣Q,計(jì)算所 述殘缺的用戶畫像矩陣中非零元素的第一畫像誤差;根據(jù)所述第一畫像誤差,更新所述用 戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q;
[0049] 當(dāng)1大于或等于2時(shí),所述第r次更新所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣 Q,包括:
[0050] 根據(jù)所述殘缺的用戶畫像矩陣、所述用戶參數(shù)矩陣P和所述標(biāo)簽參數(shù)矩陣Q,計(jì)算 所述多個(gè)用戶中的第一部分用戶的第一畫像誤差;所述第一部分用戶的第一變化差值大于 第一剩余用戶的第一變化差值,所述第一剩余用戶為所述多個(gè)用戶中的除所述第
當(dāng)前第1頁(yè)1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1