一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法

文檔序號(hào)：10535691閱讀：268來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法
【專利摘要】本發(fā)明公開了一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，包括如下步驟：首先將游戲原始運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MIML的形式，生成MIML訓(xùn)練數(shù)據(jù)集合；然后根據(jù)訓(xùn)練數(shù)據(jù)集合訓(xùn)練推薦模型；將測(cè)試用戶數(shù)據(jù)轉(zhuǎn)化為MIML的形式，用得到的推薦模型進(jìn)行預(yù)測(cè)，輸出相關(guān)的標(biāo)記排序作為推薦結(jié)果。本發(fā)明提出的方法有效利用了玩家行為數(shù)據(jù)中的大量事件上下文、玩家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件，推薦的結(jié)果更加準(zhǔn)確。
【專利說明】
一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及手機(jī)游戲道具推薦方法，特別涉及一種基于多示例多標(biāo)記學(xué)習(xí)的游戲道具推薦機(jī)制。
【背景技術(shù)】
[0002] 隨著移動(dòng)計(jì)算設(shè)備和移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展，手機(jī)游戲成為了人們?nèi)粘Ｉ钪械?一項(xiàng)重要的娛樂活動(dòng)。在游戲中銷售虛擬道具是手機(jī)游戲提供商獲得收益的主要途徑。設(shè) 計(jì)良好的道具推薦裝置能夠通過為用戶提供個(gè)性化的道具推薦，增加用戶的游戲道具購(gòu)買從而提高游戲營(yíng)收。游戲道具推薦成功的關(guān)鍵在于，充分利用游戲運(yùn)營(yíng)數(shù)據(jù)，從中挖掘出精準(zhǔn)的用戶與游戲道具的喜好關(guān)聯(lián)。目前的推薦裝置主要利用用戶日志數(shù)據(jù)轉(zhuǎn)化成的用戶_ 物品矩陣來進(jìn)行推薦。矩陣中的值表示用戶對(duì)于物品的喜好程度，基于"相似的用戶喜愛相似的物品"這一假設(shè)來給用戶提供推薦。但是手機(jī)游戲運(yùn)營(yíng)數(shù)據(jù)中有很多信息無法通過用戶-物品矩陣來表示，卻同樣包含了豐富的用戶與游戲道具的關(guān)聯(lián)信息，目前的推薦方法難以有效地對(duì)這些信息加以利用。這些信息主要包括:玩家行為數(shù)據(jù)中的大量事件上下文、玩家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件。游戲設(shè)計(jì)師的經(jīng)驗(yàn)告訴我們，這些信息與預(yù)測(cè)玩家對(duì)于游戲道具的購(gòu)買息息相關(guān)，若能夠有效地利用這些信息，游戲道具推薦的結(jié) 果能夠更加準(zhǔn)確。因此，一種能夠針對(duì)游戲運(yùn)營(yíng)數(shù)據(jù)特性的道具推薦方法亟待提出。

【發(fā)明內(nèi)容】
：
[0003] 發(fā)明目的：針對(duì)目前的推薦方法難以有效地對(duì)所有的有用信息加以利用的問題，本發(fā)明提出一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，有效利用了玩家行為數(shù) 據(jù)中的大量事件上下文、玩家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件。
[0004] 技術(shù)方案:本發(fā)明提出一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，包括如下步驟：
[0005] (1)將游戲原始運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MIML的形式，生成MIML訓(xùn)練數(shù)據(jù)集合，具體過程為：
[0006] (1.1)將游戲原始運(yùn)營(yíng)數(shù)據(jù)按照N位用戶分為N組數(shù)據(jù)；
[0007] (1.2)用每組數(shù)據(jù)中的用戶購(gòu)買記錄數(shù)據(jù)來給用戶進(jìn)行標(biāo)記，有過購(gòu)買記錄的道具標(biāo)記為1，沒有購(gòu)買記錄的道具標(biāo)記為〇;
[0008] (1.3)對(duì)于每組數(shù)據(jù)中的所有事件，每個(gè)事件都通過一個(gè)向量來描述，作為描述該用戶的示例；
[0009] (1.4)將每組示例與其對(duì)應(yīng)的標(biāo)記組合在一起，得到MML形式的訓(xùn)練數(shù)據(jù)。
[0010] (2)根據(jù)訓(xùn)練數(shù)據(jù)集合訓(xùn)練推薦模型，訓(xùn)練模型可以表示為：
[0011] 其具體的訓(xùn)練過程為：
[0012] (2.1)初始化推薦模型，包括對(duì)模型參數(shù)W和V賦初值，保證它們每一列的均值為0，且標(biāo)準(zhǔn)差為1/力，其中W是一個(gè)LX 100大小的矩陣，而V是一個(gè)dX 100大小的矩陣，d表示用戶行為的示例維度，L表示可供購(gòu)買的游戲道具總數(shù)，所述推薦模型依據(jù)公式1確定，向用戶 Xi推薦使得最大化的道具y:
[0013] fy(xi)=ffyVTxi (1)
[0014] 其中，Wy表示W(wǎng)的第y行，fy(Xl)表示用戶示例Xl與標(biāo)記y的相關(guān)程度；
[0015] (2.2)從訓(xùn)練數(shù)據(jù)集合中隨機(jī)采樣一位用戶X，從該用戶感興趣的道具集合Y中隨機(jī)選擇一個(gè)標(biāo)記y，并為y從集合X中選出代表示例x，具體過程為：
[0016] (2.2.1)在訓(xùn)練用戶數(shù)據(jù)集合中隨機(jī)抽取一位用戶X，其共包含n個(gè)示例{X1，…， x n}，該用戶感興趣的道具標(biāo)記集合Y共包含m個(gè)標(biāo)記{yi，…，ym};
[0017] (2.2.2)從Y中隨機(jī)抽取一個(gè)標(biāo)記y;
[0018] (2.2.3)初始化變量i，令i = 1，開始對(duì)X中的示例計(jì)數(shù)；
[0019] (2.2.4)根據(jù)公式1對(duì)示例11計(jì)算其與標(biāo)記7的相關(guān)程度以義 1);
[0020] (2.2.5)計(jì)算i = i+l，判斷i是否大于n，如果大于則X中的示例已經(jīng)遍歷完，跳向步驟2.2.6，否則返回步驟2.2.4;
[0021 ] (2.2.6)比較所有計(jì)算出來的f y (Xi)值，選擇值最大的示例作為代表示例。
[0022] (2.3)從用戶X不感興趣的道具標(biāo)記集合r中一個(gè)一個(gè)地隨機(jī)采樣標(biāo)記，直到遇到一個(gè)排在y前面的不感興趣的道具標(biāo)記心并為其確定代表示例S，具體過程為：
[0023] (2.3.1)根據(jù)公式1計(jì)算示例1與標(biāo)記7的相關(guān)程度心&);
[0024] (2 ? 3 ? 2)初始化指示變量，令Q = 0，i = 1;
[0025] (2 ? 3 ? 3)用戶不感興趣的道具標(biāo)記集合P共包含t個(gè)標(biāo)記{沉,…，執(zhí)}，為癘計(jì)算 4(A)值，比較兩個(gè)標(biāo)記y和運(yùn)的順序，若知(七）€///(?~將Q賦值為i，表示在第i次采樣找到了一個(gè)違反順序的不感興趣的道具標(biāo)記，將找到的不感興趣的道具標(biāo)記及其代表示例分別記錄為S和S，并結(jié)束，否則進(jìn)入步驟2.3.4，其中％為涵的代表示例；
[0026] (2.3.4)計(jì)算i = i+l，判斷i是否大于t，若是，則結(jié)束，否則返回步驟2.3.3。
[0027] (2.4)通過梯度下降法更新模型，其目標(biāo)損失函數(shù)為：
[0031] X:是第i個(gè)用戶的多示例表示，是第i個(gè)用戶是否擁有道具j的標(biāo)記指示，fdXO 表示用戶i與標(biāo)記的yij相關(guān)程度，R(Xi，yij)是每個(gè)標(biāo)記的錯(cuò)排損失，errrank(Xi，yij)是對(duì)于某一樣本在某個(gè)標(biāo)記上的錯(cuò)排損失，整體目標(biāo)損失函數(shù)f是訓(xùn)練集上的整體錯(cuò)排損失； [0032] 其具體過程為：
[0033] (2.4.1)判斷是否采樣到了違反順序的標(biāo)記，若是，則進(jìn)入步驟2.4.2,否則結(jié)束；
[0034] (2.4.2)根據(jù)指示變量Q的值估計(jì)感興趣的道具標(biāo)記y的排名r，具體計(jì)算公式如下：
㈧
[0036] 其中，t為y中標(biāo)記的個(gè)數(shù)，卜」符號(hào)表示向下取整；
[0037] (2 ? 4 ? 3)模型變量W是一個(gè)矩陣參數(shù)，其第y行表示為向量a，第f行記錄為向量b，分別按照式(4)更新W的第y行，按式(5)更新W的第則于，并按式(6)更新V:
[0041 ]其中，y為隨機(jī)梯度下降算法的步長(zhǎng)。
[0042] (2.5)判斷是否達(dá)到要求，若是，則結(jié)束訓(xùn)練過程，返回步驟2.2。
[0043] (3)將測(cè)試用戶數(shù)據(jù)轉(zhuǎn)化為MIML的形式，用步驟2得到的推薦模型進(jìn)行預(yù)測(cè)，輸出相關(guān)的標(biāo)記排序作為推薦結(jié)果。
[0044] 當(dāng)要為某位用戶進(jìn)行游戲道具推薦時(shí)只需忽略其對(duì)應(yīng)的標(biāo)記，就可得到MML形式的測(cè)試數(shù)據(jù)。
[0045] 有益效果:本發(fā)明提出的方法有效利用了玩家行為數(shù)據(jù)中的大量事件上下文、玩家行為數(shù)據(jù)中與道具購(gòu)買并不直接相關(guān)的事件，推薦的結(jié)果更加準(zhǔn)確。
【附圖說明】
[0046] 圖1是本發(fā)明的手機(jī)游戲道具推薦方法的工作流程圖；
[0047] 圖2是本發(fā)明的將游戲運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MIML形式的流程圖；
[0048] 圖3是本發(fā)明的采樣用戶及確定其感興趣的道具標(biāo)記及確定其代表示例的流程圖；
[0049] 圖4是本發(fā)明的采樣不感興趣的道具標(biāo)記及確定其代表示例的流程圖；
[0050] 圖5是本發(fā)明的訓(xùn)練推薦模型的流程圖；
[0051 ]圖6是本發(fā)明的更新推薦模型的流程圖。
【具體實(shí)施方式】
[0052]下面將結(jié)合附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚完整地描述。
[0053]本發(fā)明基于機(jī)器學(xué)習(xí)中的多示例多標(biāo)記學(xué)習(xí)（簡(jiǎn)稱MML)框架，把游戲運(yùn)營(yíng)數(shù)據(jù)中的每一條日志事件當(dāng)作一個(gè)示例，先用一個(gè)用戶擁有的所有示例來描述該用戶，再?gòu)倪@些示例中選擇一個(gè)當(dāng)前模型最認(rèn)可的代表示例來表示該用戶，從而能夠充分利用游戲運(yùn)營(yíng)數(shù) 據(jù)中的信息。用戶的所有標(biāo)記表示該用戶對(duì)于所有游戲道具的購(gòu)買情況，購(gòu)買（有購(gòu)買興趣)為1，沒有購(gòu)買(無購(gòu)買興趣)為0。在推薦模型的訓(xùn)練過程中，本發(fā)明利用隨機(jī)梯度下降算法進(jìn)行在線學(xué)習(xí)，在保證了推薦模型訓(xùn)練效率的同時(shí)也能夠利用更多的訓(xùn)練樣本。模型訓(xùn)練主要基于以下的思想：對(duì)于任意一位用戶，推薦模型應(yīng)該將該用戶感興趣的道具標(biāo)記排在不感興趣的道具標(biāo)記之前，如果這樣一種順序違反了，就利用梯度下降方法對(duì)模型做出相應(yīng)調(diào)整，并且相關(guān)標(biāo)記被排到越靠后，模型受到的懲罰就越大。本發(fā)明迭代訓(xùn)練推薦模型，在訓(xùn)練的每一輪，隨機(jī)采樣一位用戶，一個(gè)他感興趣的道具標(biāo)記和一個(gè)他不感興趣的道具標(biāo)記，如果當(dāng)前模型把感興趣的道具標(biāo)記排在不感興趣的道具標(biāo)記之前，則不更新模型，否則對(duì)模型參數(shù)進(jìn)行梯度下降，使得感興趣的道具標(biāo)記排序提前，而不感興趣的道具標(biāo)記排序則會(huì)退后。訓(xùn)練結(jié)束后，推薦模型將在整個(gè)游戲運(yùn)營(yíng)數(shù)據(jù)上將游戲道具對(duì)應(yīng)的標(biāo)記按照用戶的興趣程度由強(qiáng)到弱排序。此時(shí)只要給推薦模型輸入描述一位用戶的多個(gè)示例，它就能為該用戶輸出一個(gè)個(gè)性化的道具推薦列表。
[0054]圖1所示為基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法的具體過程，包括以下一系列步驟：（1)將游戲運(yùn)營(yíng)數(shù)據(jù)的日志信息轉(zhuǎn)化為MML形式，以一條日志事件為一個(gè)示例，用一個(gè)用戶擁有的所有示例來描述該用戶，用所有標(biāo)記表示該用戶對(duì)于所有游戲道具的購(gòu)買情況；（2)從數(shù)據(jù)集合中隨機(jī)選擇一位用戶以及一個(gè)該用戶感興趣的道具標(biāo)記，并確定該標(biāo)記的代表示例；（3)通過隨機(jī)采樣獲得一個(gè)排在已選標(biāo)記前面的用戶不感興趣的道具標(biāo)記，并確定該標(biāo)記的代表示例；（4)針對(duì)該用戶，感興趣的道具標(biāo)記以及不感興趣的道具標(biāo)記構(gòu)成的三元組進(jìn)行梯度下降更新模型；（5)返回（2)或結(jié)束并輸出推薦模型。
[0055]圖2所示為圖1中生成MML輸入表示特征的具體過程。首先將游戲原始運(yùn)營(yíng)數(shù)據(jù)按照N位用戶分為N組數(shù)據(jù)。接著，用每組數(shù)據(jù)中的用戶購(gòu)買記錄數(shù)據(jù)來給該用戶進(jìn)行標(biāo)記，有過購(gòu)買記錄的道具標(biāo)記為1，沒有購(gòu)買記錄的道具標(biāo)記為0。而每組數(shù)據(jù)中的所有事件，每個(gè) 事件都通過一個(gè)向量來描述，作為描述該用戶的示例。將每組示例與其對(duì)應(yīng)的標(biāo)記組合在一起，便得到了MML形式的訓(xùn)練數(shù)據(jù)。當(dāng)要為某位用戶進(jìn)行游戲道具推薦時(shí)，只需忽略其對(duì) 應(yīng)的標(biāo)記，就可得到MML形式的測(cè)試數(shù)據(jù)。
[0056]圖3所示為圖1中游戲道具推薦模型訓(xùn)練的具體過程。由步驟1開始，步驟2對(duì)推薦模型進(jìn)行初始化，主要包括對(duì)兩個(gè)矩陣W和V賦初值。假設(shè)描述用戶行為的示例維度為d，總共有L個(gè)可供購(gòu)買的游戲道具，則W是一個(gè)LX 100大小的矩陣，而V是一個(gè)dX 100大小的矩陣。這里的數(shù)值100可以根據(jù)用戶需要換成其它值，通常選擇較大的值會(huì)提高推薦的準(zhǔn)確度，而較小的值則會(huì)加快速度。W和V被賦予隨機(jī)值并保證它們每一列的均值為0,且標(biāo)準(zhǔn)差為1//5。步驟3從訓(xùn)練數(shù)據(jù)集合中隨機(jī)采樣一位用戶X，假設(shè)其感興趣的道具標(biāo)記集合為Y，不感興趣的道具標(biāo)記集合為Y:。裝置從Y中隨機(jī)選擇一個(gè)標(biāo)記，假設(shè)為y，并為y從集合X中選出代表示例x，具體過程見圖4。步驟4從本用戶不感興趣的道具標(biāo)記集合f中一個(gè)一個(gè)的隨機(jī)采樣標(biāo)記，直到遇到一個(gè)被排在y前面的不感興趣的道具標(biāo)記辦并為其確定代表示例免，具體過程見圖5。步驟5進(jìn)行梯度下降更新模型，具體過程見圖6。步驟6判斷模型是否達(dá)到要求，是則結(jié)束訓(xùn)練過程，否則回到步驟3。這里判斷模型是否達(dá)到標(biāo)準(zhǔn)可以采用機(jī)器學(xué)習(xí)或模式識(shí)別教科書中常用的方法，比如迭代輪數(shù)達(dá)到用戶指定的次數(shù)。
[0057]圖4所示為圖3中步驟3的具體過程。步驟40為開始動(dòng)作。步驟41中，在訓(xùn)練用戶數(shù) 據(jù)集合中隨機(jī)抽取一位用戶X，假設(shè)其共包含n個(gè)示例{X1，…，Xn}，用戶感興趣的道具標(biāo)記集合Y共包含m個(gè)標(biāo)記{yi，…，y m}。步驟42從Y中隨機(jī)抽取一個(gè)標(biāo)記y。步驟43初始i為1，開始對(duì)X 中的示例計(jì)數(shù)。步驟44判斷i是否大于n，如果大于則X中的示例已經(jīng)遍歷完，跳向步驟47,否則進(jìn)入下一步驟45中。步驟45對(duì)示例xi計(jì)算下式所示的值：
[0058] fy(xi) =ffyVTXi (1)
[0059]其中，Wy表示W(wǎng)的第y行，fy(Xl)可以理解為示例^與標(biāo)記y的相關(guān)程度。步驟46將計(jì) 數(shù)i加1，再返回步驟44。步驟47比較所有計(jì)算出來的fy(Xl)值，并選擇值最大的示例作為代表示例，假設(shè)為X，相應(yīng)的fy(x)可以理解為這位用戶與道具標(biāo)記y的相關(guān)程度。整個(gè)過程結(jié) 束于步驟48。
[0060] 圖5所示為圖3中步驟4的具體過程。假設(shè)用戶不感興趣的道具標(biāo)記集合歹共包含t 個(gè)標(biāo)記{奶，…，級(jí)丨。步驟50為起始動(dòng)作。步驟51按照式（1)為標(biāo)記y計(jì)算值f y(x)，這里我們假設(shè)x是y的代表示例。步驟52初始化i為1，開始計(jì)數(shù)，并引入一個(gè)指示變量Q，初始化為0。步驟 53判斷是否t個(gè)不相關(guān)標(biāo)記都已遍歷完，若i>t則跳到步驟58結(jié)束，否則進(jìn)入下一步。步驟 54按照式（1)為標(biāo)記級(jí)計(jì)算/&.(為)，這里我們假設(shè)西為:運(yùn)的代表示例。步驟55比較兩個(gè)標(biāo)記y 和訪的順序，如果./k (而）$九(4,則進(jìn)入步驟56，將計(jì)數(shù)i加一并返回步驟54;如果不感興趣的道具標(biāo)記級(jí)排在了感興趣的道具標(biāo)記y的前面，即允(.V; >九(/)，則跳到步驟57，將Q賦值為i，表示在第i次采樣找到了一個(gè)違反順序的不感興趣的道具標(biāo)記，并將找到的不感興趣的道具標(biāo)記及其代表示例分別記錄為⑤和*，然后進(jìn)入步驟58結(jié)束。
[0061] 圖6所示為圖3中通過梯度下降更新模型的具體過程。步驟60為起始動(dòng)作。步驟61 判斷在步驟4中是否采樣到了違反順序的標(biāo)記，也就是Q是否大于0。如果Q = 0,表示沒有采樣到違反順序的標(biāo)記，直接進(jìn)入步驟65結(jié)束，否則進(jìn)入步驟62，根據(jù)Q值來估計(jì)感興趣的道具標(biāo)記y的排名r，具體計(jì)算公式如下：
[0063]其中，t為F中標(biāo)記的個(gè)數(shù)小」符號(hào)表示向下取整。步驟63將模型變量W的第y行記錄為a，第#行記錄為b。步驟64分別按照式(4)更新W的第y行，按式(5)更新W的第射于，并按式 (6)更新V。
[0067]其中，y為隨機(jī)梯度下降算法的步長(zhǎng)，其取值可以按照機(jī)器學(xué)習(xí)或模式識(shí)別教科書中常用的方法設(shè)置。更新完模型變量之后，整個(gè)過程結(jié)束于步驟65。
【主權(quán)項(xiàng)】
1. 一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，其特征在于，包括如下步驟： (1) 將游戲原始運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化為MML的形式，生成MML訓(xùn)練數(shù)據(jù)集合； (2) 根據(jù)訓(xùn)練數(shù)據(jù)集合訓(xùn)練推薦模型； (3) 將測(cè)試用戶數(shù)據(jù)轉(zhuǎn)化為MIML的形式，用步驟2得到的推薦模型進(jìn)行預(yù)測(cè)，輸出相關(guān) 的標(biāo)記排序作為推薦結(jié)果。2. 根據(jù)權(quán)利要求1所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，其特征在于，所述步驟1生成MML訓(xùn)練數(shù)據(jù)集合的具體過程為： (1.1) 將游戲原始運(yùn)營(yíng)數(shù)據(jù)按照N位用戶分為N組數(shù)據(jù)； (1.2) 用每組數(shù)據(jù)中的用戶購(gòu)買記錄數(shù)據(jù)來給用戶進(jìn)行標(biāo)記，有過購(gòu)買記錄的道具標(biāo) 記為1，沒有購(gòu)買記錄的道具標(biāo)記為0; (1.3) 對(duì)于每組數(shù)據(jù)中的所有事件，每個(gè)事件都通過一個(gè)向量來描述，作為描述該用戶的示例； (1.4) 將每組示例與其對(duì)應(yīng)的標(biāo)記組合在一起，得到MML形式的訓(xùn)練數(shù)據(jù)。3. 根據(jù)權(quán)利要求1所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，其特征在于，所述步驟2生成訓(xùn)練推薦模型的具體過程為： (2.1) 初始化推薦模型，包括對(duì)模型參數(shù)W和V賦初值，保證它們每一列的均值為0，且標(biāo) 準(zhǔn)差為1/vQ，其中W是一個(gè)LX 100大小的矩陣，而V是一個(gè)dX 100大小的矩陣，d表示用戶行為的示例維度，L表示可供購(gòu)買的游戲道具總數(shù)，所述推薦模型依據(jù)公式1確定，向用戶乂^隹薦使得m'g my以&)最大化的道具y: fy (Xi) =WyV1Xi (1) 其中，Wy表示W(wǎng)的第y行，fy(Xl)表示用戶示例X1與標(biāo)記y的相關(guān)程度； (2.2) 從訓(xùn)練數(shù)據(jù)集合中隨機(jī)采樣一位用戶X，從該用戶感興趣的道具集合Y中隨機(jī)選擇一個(gè)標(biāo)記y，并為y從集合X中選出代表示例X; (2.3) 從用戶X不感興趣的道具標(biāo)記集合?中一個(gè)一個(gè)地隨機(jī)采樣標(biāo)記，直到遇到一個(gè) 排在y前面的不感興趣的道具標(biāo)記如并為其確定代表示例 (2.4) 通過梯度下降法更新模型，其目標(biāo)損失函數(shù)：其MX1是第i個(gè)用戶的多示例表示，yu是第i個(gè)用戶是否擁有道具j的標(biāo)記指示，^"^表示用戶i與標(biāo)記的yij相關(guān)程度，R(Xi，yij)是每個(gè)標(biāo)記的錯(cuò)排損失，errrank(Xi，yij)是對(duì)于某一樣本在某個(gè)標(biāo)記上的錯(cuò)排損失，整體目標(biāo)損失函數(shù)P是訓(xùn)練集上的整體錯(cuò)排損失； (2.5) 判斷是否達(dá)到要求，若是，則結(jié)束訓(xùn)練過程，返回步驟2.2。4. 根據(jù)權(quán)利要求3所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，其特征在于，所述步驟2.2的具體過程為： (2.2.1)在訓(xùn)練用戶數(shù)據(jù)集合中隨機(jī)抽取一位用戶X，其共包含η個(gè)示例Ix1，…，χη}，該用戶感興趣的道具標(biāo)記集合Y共包含m個(gè)標(biāo)記{yi，…，ym}; (2.2.2) 從Y中隨機(jī)抽取一個(gè)標(biāo)記y; (2.2.3) 初始化變量i，令i = 1，開始對(duì)X中的示例計(jì)數(shù)； (2.2.4) 根據(jù)公式1對(duì)示例X1計(jì)算其與標(biāo)記y的相關(guān)程度fy(Xl); (2.2.5) 計(jì)算i = i + l，判斷i是否大于n，如果大于則X中的示例已經(jīng)遍歷完，跳向步驟 2.2.6,否則返回步驟2.2.4; (2.2.6) 比較所有計(jì)算出來的fy (Xi)值，選擇值最大的示例作為代表示例。5. 根據(jù)權(quán)利要求3所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，其特征在于，所述步驟2.3的具體過程為： (2.3.1) 根據(jù)公式1計(jì)算示例X與標(biāo)記y的相關(guān)程度fy(x); (2.3.2) 初始化指示變量，令9=0，1 = 1; (2.3.3) 用戶不感興趣的道具標(biāo)記集合f共包含共包含t個(gè)標(biāo)記{也,…，訪:h為紐計(jì)算 Λ,(Λ)值，比較兩個(gè)標(biāo)記y和&的順序，若·feiA) S八心')，將Q賦值為i，表示在第i次采樣找到了一個(gè)違反順序的不感興趣的道具標(biāo)記，將找到的不感興趣的道具標(biāo)記及其代表示例分別記錄為?7和力，并結(jié)束，否則進(jìn)入步驟2.3.4，其中而為猛:的代表示例； (2.3.4) 計(jì)算i = i+l，判斷i是否大于t，若是，則結(jié)束，否則返回步驟2.3.3。6. 根據(jù)權(quán)利要求3所述的基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法，其特征在于，所述步驟2.4的具體過程為： (2.4.1) 判斷是否采樣到了違反順序的標(biāo)記，若是，則進(jìn)入步驟2.4.2，否則結(jié)束； (2.4.2) 根據(jù)指示奪量Q的倌估計(jì)感興趣的道具標(biāo)記y的排名r，具體計(jì)算公式如下：(3) 其中，tSr中標(biāo)記的個(gè)數(shù)士」符號(hào)表示向下取整； (2.4.3) 模型變量W是一個(gè)矩陣參數(shù)，其第y行表示為向量a，第對(duì)于記錄為向量b，分別按照式(3)更新W的第y行，按式(4)更新W的第f行，并按式(5)更新V:其中，γ為隨機(jī)梯度下降算法的步長(zhǎng)。 (4) (5) (6)
【文檔編號(hào)】G06Q30/06GK105894350SQ201610188765
【公開日】2016年8月24日
【申請(qǐng)日】2016年3月29日
【發(fā)明人】周志華, 唐俊, 詹德川
【申請(qǐng)人】南京大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：周志華;唐俊;詹德川;
技術(shù)所有人：南京大學(xué);
我是此專利的發(fā)明人

上一篇：一種無樁式公共自行車租借系統(tǒng)的制作方法
上一篇：集成電路設(shè)計(jì)程序代碼交易的方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于多示例多標(biāo)記學(xué)習(xí)的手機(jī)游戲道具推薦方法