亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

  • <form id="nic7d"><dl id="nic7d"><s id="nic7d"></s></dl></form>

    一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法

    文檔序號(hào):10535691閱讀:268來源:國(guó)知局
    一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法
    【專利摘要】本發(fā)明公開了一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,包括如下步驟:首先將游戲原始運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MIML的形式,生成MIML訓(xùn)練數(shù)據(jù)集合;然后根據(jù)訓(xùn)練數(shù)據(jù)集合訓(xùn)練推薦模型;將測(cè)試用戶數(shù)據(jù)轉(zhuǎn)化為MIML的形式,用得到的推薦模型進(jìn)行預(yù)測(cè),輸出相關(guān)的標(biāo)記排序作為推薦結(jié)果。本發(fā)明提出的方法有效利用了玩家行為數(shù)據(jù)中的大量事件上下文、玩家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件,推薦的結(jié)果更加準(zhǔn)確。
    【專利說明】
    一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法
    技術(shù)領(lǐng)域
    [0001] 本發(fā)明涉及手機(jī)游戲道具推薦方法,特別涉及一種基于多示例多標(biāo)記學(xué)習(xí)的游戲 道具推薦機(jī)制。
    【背景技術(shù)】
    [0002] 隨著移動(dòng)計(jì)算設(shè)備和移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,手機(jī)游戲成為了人們?nèi)粘I钪械?一項(xiàng)重要的娛樂活動(dòng)。在游戲中銷售虛擬道具是手機(jī)游戲提供商獲得收益的主要途徑。設(shè) 計(jì)良好的道具推薦裝置能夠通過為用戶提供個(gè)性化的道具推薦,增加用戶的游戲道具購(gòu)買 從而提高游戲營(yíng)收。游戲道具推薦成功的關(guān)鍵在于,充分利用游戲運(yùn)營(yíng)數(shù)據(jù),從中挖掘出精 準(zhǔn)的用戶與游戲道具的喜好關(guān)聯(lián)。目前的推薦裝置主要利用用戶日志數(shù)據(jù)轉(zhuǎn)化成的用戶_ 物品矩陣來進(jìn)行推薦。矩陣中的值表示用戶對(duì)于物品的喜好程度,基于"相似的用戶喜愛相 似的物品"這一假設(shè)來給用戶提供推薦。但是手機(jī)游戲運(yùn)營(yíng)數(shù)據(jù)中有很多信息無法通過用 戶-物品矩陣來表示,卻同樣包含了豐富的用戶與游戲道具的關(guān)聯(lián)信息,目前的推薦方法難 以有效地對(duì)這些信息加以利用。這些信息主要包括:玩家行為數(shù)據(jù)中的大量事件上下文、玩 家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件。游戲設(shè)計(jì)師的經(jīng)驗(yàn)告訴我們,這些信息與 預(yù)測(cè)玩家對(duì)于游戲道具的購(gòu)買息息相關(guān),若能夠有效地利用這些信息,游戲道具推薦的結(jié) 果能夠更加準(zhǔn)確。因此,一種能夠針對(duì)游戲運(yùn)營(yíng)數(shù)據(jù)特性的道具推薦方法亟待提出。

    【發(fā)明內(nèi)容】

    [0003] 發(fā)明目的:針對(duì)目前的推薦方法難以有效地對(duì)所有的有用信息加以利用的問題, 本發(fā)明提出一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,有效利用了玩家行為數(shù) 據(jù)中的大量事件上下文、玩家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件。
    [0004] 技術(shù)方案:本發(fā)明提出一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,包 括如下步驟:
    [0005] (1)將游戲原始運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MIML的形式,生成MIML訓(xùn)練數(shù)據(jù)集合,具體過程 為:
    [0006] (1.1)將游戲原始運(yùn)營(yíng)數(shù)據(jù)按照N位用戶分為N組數(shù)據(jù);
    [0007] (1.2)用每組數(shù)據(jù)中的用戶購(gòu)買記錄數(shù)據(jù)來給用戶進(jìn)行標(biāo)記,有過購(gòu)買記錄的道 具標(biāo)記為1,沒有購(gòu)買記錄的道具標(biāo)記為〇;
    [0008] (1.3)對(duì)于每組數(shù)據(jù)中的所有事件,每個(gè)事件都通過一個(gè)向量來描述,作為描述該 用戶的示例;
    [0009] (1.4)將每組示例與其對(duì)應(yīng)的標(biāo)記組合在一起,得到MML形式的訓(xùn)練數(shù)據(jù)。
    [0010] (2)根據(jù)訓(xùn)練數(shù)據(jù)集合訓(xùn)練推薦模型,訓(xùn)練模型可以表示為:
    [0011] 其具體的訓(xùn)練過程為:
    [0012] (2.1)初始化推薦模型,包括對(duì)模型參數(shù)W和V賦初值,保證它們每一列的均值為0, 且標(biāo)準(zhǔn)差為1/力,其中W是一個(gè)LX 100大小的矩陣,而V是一個(gè)dX 100大小的矩陣,d表示用 戶行為的示例維度,L表示可供購(gòu)買的游戲道具總數(shù),所述推薦模型依據(jù)公式1確定,向用戶 Xi推薦使得最大化的道具y:
    [0013] fy(xi)=ffyVTxi (1)
    [0014] 其中,Wy表示W(wǎng)的第y行,fy(Xl)表示用戶示例Xl與標(biāo)記y的相關(guān)程度;
    [0015] (2.2)從訓(xùn)練數(shù)據(jù)集合中隨機(jī)采樣一位用戶X,從該用戶感興趣的道具集合Y中隨 機(jī)選擇一個(gè)標(biāo)記y,并為y從集合X中選出代表示例x,具體過程為:
    [0016] (2.2.1)在訓(xùn)練用戶數(shù)據(jù)集合中隨機(jī)抽取一位用戶X,其共包含n個(gè)示例{X1,…, x n},該用戶感興趣的道具標(biāo)記集合Y共包含m個(gè)標(biāo)記{yi,…,ym};
    [0017] (2.2.2)從Y中隨機(jī)抽取一個(gè)標(biāo)記y;
    [0018] (2.2.3)初始化變量i,令i = 1,開始對(duì)X中的示例計(jì)數(shù);
    [0019] (2.2.4)根據(jù)公式1對(duì)示例11計(jì)算其與標(biāo)記7的相關(guān)程度以義 1);
    [0020] (2.2.5)計(jì)算i = i+l,判斷i是否大于n,如果大于則X中的示例已經(jīng)遍歷完,跳向步 驟2.2.6,否則返回步驟2.2.4;
    [0021 ] (2.2.6)比較所有計(jì)算出來的f y (Xi)值,選擇值最大的示例作為代表示例。
    [0022] (2.3)從用戶X不感興趣的道具標(biāo)記集合r中一個(gè)一個(gè)地隨機(jī)采樣標(biāo)記,直到遇到 一個(gè)排在y前面的不感興趣的道具標(biāo)記心并為其確定代表示例S,具體過程為:
    [0023] (2.3.1)根據(jù)公式1計(jì)算示例1與標(biāo)記7的相關(guān)程度心&);
    [0024] (2 ? 3 ? 2)初始化指示變量,令Q = 0,i = 1;
    [0025] (2 ? 3 ? 3)用戶不感興趣的道具標(biāo)記集合P共包含t個(gè)標(biāo)記{沉,…,執(zhí)},為癘計(jì)算 4(A)值,比較兩個(gè)標(biāo)記y和運(yùn)的順序,若知(七)€///(?~將Q賦值為i,表示在第i次采樣找到 了一個(gè)違反順序的不感興趣的道具標(biāo)記,將找到的不感興趣的道具標(biāo)記及其代表示例分別 記錄為S和S,并結(jié)束,否則進(jìn)入步驟2.3.4,其中%為涵的代表示例;
    [0026] (2.3.4)計(jì)算i = i+l,判斷i是否大于t,若是,則結(jié)束,否則返回步驟2.3.3。
    [0027] (2.4)通過梯度下降法更新模型,其目標(biāo)損失函數(shù)為:
    [0031] X:是第i個(gè)用戶的多示例表示,是第i個(gè)用戶是否擁有道具j的標(biāo)記指示,fdXO 表示用戶i與標(biāo)記的yij相關(guān)程度,R(Xi,yij)是每個(gè)標(biāo)記的錯(cuò)排損失,errrank(Xi,yij)是對(duì)于 某一樣本在某個(gè)標(biāo)記上的錯(cuò)排損失,整體目標(biāo)損失函數(shù)f是訓(xùn)練集上的整體錯(cuò)排損失; [0032] 其具體過程為:
    [0033] (2.4.1)判斷是否采樣到了違反順序的標(biāo)記,若是,則進(jìn)入步驟2.4.2,否則結(jié)束;
    [0034] (2.4.2)根據(jù)指示變量Q的值估計(jì)感興趣的道具標(biāo)記y的排名r,具體計(jì)算公式如 下:

    [0036] 其中,t為y中標(biāo)記的個(gè)數(shù),卜」符號(hào)表示向下取整;
    [0037] (2 ? 4 ? 3)模型變量W是一個(gè)矩陣參數(shù),其第y行表示為向量a,第f行記錄為向量b,分 別按照式(4)更新W的第y行,按式(5)更新W的第則于,并按式(6)更新V:
    [0041 ]其中,y為隨機(jī)梯度下降算法的步長(zhǎng)。
    [0042] (2.5)判斷是否達(dá)到要求,若是,則結(jié)束訓(xùn)練過程,返回步驟2.2。
    [0043] (3)將測(cè)試用戶數(shù)據(jù)轉(zhuǎn)化為MIML的形式,用步驟2得到的推薦模型進(jìn)行預(yù)測(cè),輸出 相關(guān)的標(biāo)記排序作為推薦結(jié)果。
    [0044] 當(dāng)要為某位用戶進(jìn)行游戲道具推薦時(shí)只需忽略其對(duì)應(yīng)的標(biāo)記,就可得到MML形式 的測(cè)試數(shù)據(jù)。
    [0045] 有益效果:本發(fā)明提出的方法有效利用了玩家行為數(shù)據(jù)中的大量事件上下文、玩 家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件,推薦的結(jié)果更加準(zhǔn)確。
    【附圖說明】
    [0046] 圖1是本發(fā)明的手機(jī)游戲道具推薦方法的工作流程圖;
    [0047] 圖2是本發(fā)明的將游戲運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MIML形式的流程圖;
    [0048] 圖3是本發(fā)明的采樣用戶及確定其感興趣的道具標(biāo)記及確定其代表示例的流程 圖;
    [0049] 圖4是本發(fā)明的采樣不感興趣的道具標(biāo)記及確定其代表示例的流程圖;
    [0050] 圖5是本發(fā)明的訓(xùn)練推薦模型的流程圖;
    [0051 ]圖6是本發(fā)明的更新推薦模型的流程圖。
    【具體實(shí)施方式】
    [0052]下面將結(jié)合附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚完整地描述。
    [0053]本發(fā)明基于機(jī)器學(xué)習(xí)中的多示例多標(biāo)記學(xué)習(xí)(簡(jiǎn)稱MML)框架,把游戲運(yùn)營(yíng)數(shù)據(jù)中 的每一條日志事件當(dāng)作一個(gè)示例,先用一個(gè)用戶擁有的所有示例來描述該用戶,再?gòu)倪@些 示例中選擇一個(gè)當(dāng)前模型最認(rèn)可的代表示例來表示該用戶,從而能夠充分利用游戲運(yùn)營(yíng)數(shù) 據(jù)中的信息。用戶的所有標(biāo)記表示該用戶對(duì)于所有游戲道具的購(gòu)買情況,購(gòu)買(有購(gòu)買興 趣)為1,沒有購(gòu)買(無購(gòu)買興趣)為0。在推薦模型的訓(xùn)練過程中,本發(fā)明利用隨機(jī)梯度下降 算法進(jìn)行在線學(xué)習(xí),在保證了推薦模型訓(xùn)練效率的同時(shí)也能夠利用更多的訓(xùn)練樣本。模型 訓(xùn)練主要基于以下的思想:對(duì)于任意一位用戶,推薦模型應(yīng)該將該用戶感興趣的道具標(biāo)記 排在不感興趣的道具標(biāo)記之前,如果這樣一種順序違反了,就利用梯度下降方法對(duì)模型做 出相應(yīng)調(diào)整,并且相關(guān)標(biāo)記被排到越靠后,模型受到的懲罰就越大。本發(fā)明迭代訓(xùn)練推薦模 型,在訓(xùn)練的每一輪,隨機(jī)采樣一位用戶,一個(gè)他感興趣的道具標(biāo)記和一個(gè)他不感興趣的道 具標(biāo)記,如果當(dāng)前模型把感興趣的道具標(biāo)記排在不感興趣的道具標(biāo)記之前,則不更新模型, 否則對(duì)模型參數(shù)進(jìn)行梯度下降,使得感興趣的道具標(biāo)記排序提前,而不感興趣的道具標(biāo)記 排序則會(huì)退后。訓(xùn)練結(jié)束后,推薦模型將在整個(gè)游戲運(yùn)營(yíng)數(shù)據(jù)上將游戲道具對(duì)應(yīng)的標(biāo)記按 照用戶的興趣程度由強(qiáng)到弱排序。此時(shí)只要給推薦模型輸入描述一位用戶的多個(gè)示例,它 就能為該用戶輸出一個(gè)個(gè)性化的道具推薦列表。
    [0054]圖1所示為基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法的具體過程,包括以 下一系列步驟:(1)將游戲運(yùn)營(yíng)數(shù)據(jù)的日志信息轉(zhuǎn)化為MML形式,以一條日志事件為一個(gè)示 例,用一個(gè)用戶擁有的所有示例來描述該用戶,用所有標(biāo)記表示該用戶對(duì)于所有游戲道具 的購(gòu)買情況;(2)從數(shù)據(jù)集合中隨機(jī)選擇一位用戶以及一個(gè)該用戶感興趣的道具標(biāo)記,并確 定該標(biāo)記的代表示例;(3)通過隨機(jī)采樣獲得一個(gè)排在已選標(biāo)記前面的用戶不感興趣的道 具標(biāo)記,并確定該標(biāo)記的代表示例;(4)針對(duì)該用戶,感興趣的道具標(biāo)記以及不感興趣的道 具標(biāo)記構(gòu)成的三元組進(jìn)行梯度下降更新模型;(5)返回(2)或結(jié)束并輸出推薦模型。
    [0055]圖2所示為圖1中生成MML輸入表示特征的具體過程。首先將游戲原始運(yùn)營(yíng)數(shù)據(jù)按 照N位用戶分為N組數(shù)據(jù)。接著,用每組數(shù)據(jù)中的用戶購(gòu)買記錄數(shù)據(jù)來給該用戶進(jìn)行標(biāo)記,有 過購(gòu)買記錄的道具標(biāo)記為1,沒有購(gòu)買記錄的道具標(biāo)記為0。而每組數(shù)據(jù)中的所有事件,每個(gè) 事件都通過一個(gè)向量來描述,作為描述該用戶的示例。將每組示例與其對(duì)應(yīng)的標(biāo)記組合在 一起,便得到了MML形式的訓(xùn)練數(shù)據(jù)。當(dāng)要為某位用戶進(jìn)行游戲道具推薦時(shí),只需忽略其對(duì) 應(yīng)的標(biāo)記,就可得到MML形式的測(cè)試數(shù)據(jù)。
    [0056]圖3所示為圖1中游戲道具推薦模型訓(xùn)練的具體過程。由步驟1開始,步驟2對(duì)推薦 模型進(jìn)行初始化,主要包括對(duì)兩個(gè)矩陣W和V賦初值。假設(shè)描述用戶行為的示例維度為d,總 共有L個(gè)可供購(gòu)買的游戲道具,則W是一個(gè)LX 100大小的矩陣,而V是一個(gè)dX 100大小的矩 陣。這里的數(shù)值100可以根據(jù)用戶需要換成其它值,通常選擇較大的值會(huì)提高推薦的準(zhǔn)確 度,而較小的值則會(huì)加快速度。W和V被賦予隨機(jī)值并保證它們每一列的均值為0,且標(biāo)準(zhǔn)差 為1//5。步驟3從訓(xùn)練數(shù)據(jù)集合中隨機(jī)采樣一位用戶X,假設(shè)其感興趣的道具標(biāo)記集合為Y, 不感興趣的道具標(biāo)記集合為Y:。裝置從Y中隨機(jī)選擇一個(gè)標(biāo)記,假設(shè)為y,并為y從集合X中選 出代表示例x,具體過程見圖4。步驟4從本用戶不感興趣的道具標(biāo)記集合f中一個(gè)一個(gè)的隨 機(jī)采樣標(biāo)記,直到遇到一個(gè)被排在y前面的不感興趣的道具標(biāo)記辦并為其確定代表示例免, 具體過程見圖5。步驟5進(jìn)行梯度下降更新模型,具體過程見圖6。步驟6判斷模型是否達(dá)到要 求,是則結(jié)束訓(xùn)練過程,否則回到步驟3。這里判斷模型是否達(dá)到標(biāo)準(zhǔn)可以采用機(jī)器學(xué)習(xí)或 模式識(shí)別教科書中常用的方法,比如迭代輪數(shù)達(dá)到用戶指定的次數(shù)。
    [0057]圖4所示為圖3中步驟3的具體過程。步驟40為開始動(dòng)作。步驟41中,在訓(xùn)練用戶數(shù) 據(jù)集合中隨機(jī)抽取一位用戶X,假設(shè)其共包含n個(gè)示例{X1,…,Xn},用戶感興趣的道具標(biāo)記集 合Y共包含m個(gè)標(biāo)記{yi,…,y m}。步驟42從Y中隨機(jī)抽取一個(gè)標(biāo)記y。步驟43初始i為1,開始對(duì)X 中的示例計(jì)數(shù)。步驟44判斷i是否大于n,如果大于則X中的示例已經(jīng)遍歷完,跳向步驟47,否 則進(jìn)入下一步驟45中。步驟45對(duì)示例xi計(jì)算下式所示的值:
    [0058] fy(xi) =ffyVTXi (1)
    [0059]其中,Wy表示W(wǎng)的第y行,fy(Xl)可以理解為示例^與標(biāo)記y的相關(guān)程度。步驟46將計(jì) 數(shù)i加1,再返回步驟44。步驟47比較所有計(jì)算出來的fy(Xl)值,并選擇值最大的示例作為代 表示例,假設(shè)為X,相應(yīng)的fy(x)可以理解為這位用戶與道具標(biāo)記y的相關(guān)程度。整個(gè)過程結(jié) 束于步驟48。
    [0060] 圖5所示為圖3中步驟4的具體過程。假設(shè)用戶不感興趣的道具標(biāo)記集合歹共包含t 個(gè)標(biāo)記{奶,…,級(jí)丨。步驟50為起始動(dòng)作。步驟51按照式(1)為標(biāo)記y計(jì)算值f y(x),這里我們假 設(shè)x是y的代表示例。步驟52初始化i為1,開始計(jì)數(shù),并引入一個(gè)指示變量Q,初始化為0。步驟 53判斷是否t個(gè)不相關(guān)標(biāo)記都已遍歷完,若i>t則跳到步驟58結(jié)束,否則進(jìn)入下一步。步驟 54按照式(1)為標(biāo)記級(jí)計(jì)算/&.(為),這里我們假設(shè)西為:運(yùn)的代表示例。步驟55比較兩個(gè)標(biāo)記y 和訪的順序,如果./k (而)$九(4,則進(jìn)入步驟56,將計(jì)數(shù)i加一并返回步驟54;如果不感興趣 的道具標(biāo)記級(jí)排在了感興趣的道具標(biāo)記y的前面,即允(.V; >九(/),則跳到步驟57,將Q賦值 為i,表示在第i次采樣找到了一個(gè)違反順序的不感興趣的道具標(biāo)記,并將找到的不感興趣 的道具標(biāo)記及其代表示例分別記錄為⑤和*,然后進(jìn)入步驟58結(jié)束。
    [0061] 圖6所示為圖3中通過梯度下降更新模型的具體過程。步驟60為起始動(dòng)作。步驟61 判斷在步驟4中是否采樣到了違反順序的標(biāo)記,也就是Q是否大于0。如果Q = 0,表示沒有采 樣到違反順序的標(biāo)記,直接進(jìn)入步驟65結(jié)束,否則進(jìn)入步驟62,根據(jù)Q值來估計(jì)感興趣的道 具標(biāo)記y的排名r,具體計(jì)算公式如下:
    [0063]其中,t為F中標(biāo)記的個(gè)數(shù)小」符號(hào)表示向下取整。步驟63將模型變量W的第y行記錄 為a,第#行記錄為b。步驟64分別按照式(4)更新W的第y行,按式(5)更新W的第射于,并按式 (6)更新V。
    [0067]其中,y為隨機(jī)梯度下降算法的步長(zhǎng),其取值可以按照機(jī)器學(xué)習(xí)或模式識(shí)別教科 書中常用的方法設(shè)置。更新完模型變量之后,整個(gè)過程結(jié)束于步驟65。
    【主權(quán)項(xiàng)】
    1. 一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,其特征在于,包括如下步驟: (1) 將游戲原始運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MML的形式,生成MML訓(xùn)練數(shù)據(jù)集合; (2) 根據(jù)訓(xùn)練數(shù)據(jù)集合訓(xùn)練推薦模型; (3) 將測(cè)試用戶數(shù)據(jù)轉(zhuǎn)化為MIML的形式,用步驟2得到的推薦模型進(jìn)行預(yù)測(cè),輸出相關(guān) 的標(biāo)記排序作為推薦結(jié)果。2. 根據(jù)權(quán)利要求1所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,其特征在 于,所述步驟1生成MML訓(xùn)練數(shù)據(jù)集合的具體過程為: (1.1) 將游戲原始運(yùn)營(yíng)數(shù)據(jù)按照N位用戶分為N組數(shù)據(jù); (1.2) 用每組數(shù)據(jù)中的用戶購(gòu)買記錄數(shù)據(jù)來給用戶進(jìn)行標(biāo)記,有過購(gòu)買記錄的道具標(biāo) 記為1,沒有購(gòu)買記錄的道具標(biāo)記為0; (1.3) 對(duì)于每組數(shù)據(jù)中的所有事件,每個(gè)事件都通過一個(gè)向量來描述,作為描述該用戶 的示例; (1.4) 將每組示例與其對(duì)應(yīng)的標(biāo)記組合在一起,得到MML形式的訓(xùn)練數(shù)據(jù)。3. 根據(jù)權(quán)利要求1所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,其特征在 于,所述步驟2生成訓(xùn)練推薦模型的具體過程為: (2.1) 初始化推薦模型,包括對(duì)模型參數(shù)W和V賦初值,保證它們每一列的均值為0,且標(biāo) 準(zhǔn)差為1/vQ,其中W是一個(gè)LX 100大小的矩陣,而V是一個(gè)dX 100大小的矩陣,d表示用戶行 為的示例維度,L表示可供購(gòu)買的游戲道具總數(shù),所述推薦模型依據(jù)公式1確定,向用戶乂^隹 薦使得m'g my以&)最大化的道具y: fy (Xi) =WyV1Xi (1) 其中,Wy表示W(wǎng)的第y行,fy(Xl)表示用戶示例X1與標(biāo)記y的相關(guān)程度; (2.2) 從訓(xùn)練數(shù)據(jù)集合中隨機(jī)采樣一位用戶X,從該用戶感興趣的道具集合Y中隨機(jī)選 擇一個(gè)標(biāo)記y,并為y從集合X中選出代表示例X; (2.3) 從用戶X不感興趣的道具標(biāo)記集合?中一個(gè)一個(gè)地隨機(jī)采樣標(biāo)記,直到遇到一個(gè) 排在y前面的不感興趣的道具標(biāo)記如并為其確定代表示例 (2.4) 通過梯度下降法更新模型,其目標(biāo)損失函數(shù): 其MX1是第i個(gè)用戶的多示例表示,yu是第i個(gè)用戶是否擁有道具j的標(biāo)記指示,^"^表示 用戶i與標(biāo)記的yij相關(guān)程度,R(Xi,yij)是每個(gè)標(biāo)記的錯(cuò)排損失,errrank(Xi,yij)是對(duì)于某一 樣本在某個(gè)標(biāo)記上的錯(cuò)排損失,整體目標(biāo)損失函數(shù)P是訓(xùn)練集上的整體錯(cuò)排損失; (2.5) 判斷是否達(dá)到要求,若是,則結(jié)束訓(xùn)練過程,返回步驟2.2。4. 根據(jù)權(quán)利要求3所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,其特征在 于,所述步驟2.2的具體過程為: (2.2.1)在訓(xùn)練用戶數(shù)據(jù)集合中隨機(jī)抽取一位用戶X,其共包含η個(gè)示例Ix1,…,χη},該 用戶感興趣的道具標(biāo)記集合Y共包含m個(gè)標(biāo)記{yi,…,ym}; (2.2.2) 從Y中隨機(jī)抽取一個(gè)標(biāo)記y; (2.2.3) 初始化變量i,令i = 1,開始對(duì)X中的示例計(jì)數(shù); (2.2.4) 根據(jù)公式1對(duì)示例X1計(jì)算其與標(biāo)記y的相關(guān)程度fy(Xl); (2.2.5) 計(jì)算i = i + l,判斷i是否大于n,如果大于則X中的示例已經(jīng)遍歷完,跳向步驟 2.2.6,否則返回步驟2.2.4; (2.2.6) 比較所有計(jì)算出來的fy (Xi)值,選擇值最大的示例作為代表示例。5. 根據(jù)權(quán)利要求3所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,其特征在 于,所述步驟2.3的具體過程為: (2.3.1) 根據(jù)公式1計(jì)算示例X與標(biāo)記y的相關(guān)程度fy(x); (2.3.2) 初始化指示變量,令9=0,1 = 1; (2.3.3) 用戶不感興趣的道具標(biāo)記集合f共包含共包含t個(gè)標(biāo)記{也,…,訪:h為紐計(jì)算 Λ,(Λ)值,比較兩個(gè)標(biāo)記y和&的順序,若·feiA) S八心'),將Q賦值為i,表示在第i次采樣找到 了一個(gè)違反順序的不感興趣的道具標(biāo)記,將找到的不感興趣的道具標(biāo)記及其代表示例分別 記錄為?7和力,并結(jié)束,否則進(jìn)入步驟2.3.4,其中而為猛:的代表示例; (2.3.4) 計(jì)算i = i+l,判斷i是否大于t,若是,則結(jié)束,否則返回步驟2.3.3。6. 根據(jù)權(quán)利要求3所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法,其特征在 于,所述步驟2.4的具體過程為: (2.4.1) 判斷是否采樣到了違反順序的標(biāo)記,若是,則進(jìn)入步驟2.4.2,否則結(jié)束; (2.4.2) 根據(jù)指示奪量Q的倌估計(jì)感興趣的道具標(biāo)記y的排名r,具體計(jì)算公式如下:(3) 其中,tSr中標(biāo)記的個(gè)數(shù)士」符號(hào)表示向下取整; (2.4.3) 模型變量W是一個(gè)矩陣參數(shù),其第y行表示為向量a,第對(duì)于記錄為向量b,分別按 照式(3)更新W的第y行,按式(4)更新W的第f行,并按式(5)更新V:其中,γ為隨機(jī)梯度下降算法的步長(zhǎng)。 (4) (5) (6)
    【文檔編號(hào)】G06Q30/06GK105894350SQ201610188765
    【公開日】2016年8月24日
    【申請(qǐng)日】2016年3月29日
    【發(fā)明人】周志華, 唐俊, 詹德川
    【申請(qǐng)人】南京大學(xué)
    網(wǎng)友詢問留言 已有0條留言
    • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
    1