亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于收聽(tīng)上下文的音樂(lè)推薦方法

文檔序號(hào):9839621閱讀:697來(lái)源:國(guó)知局
一種基于收聽(tīng)上下文的音樂(lè)推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘與推薦系統(tǒng)領(lǐng)域,主要涉及一種基于收聽(tīng)上下文的音樂(lè)推薦 方法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)應(yīng)用的發(fā)展,推薦系統(tǒng)也越來(lái)越受到大家的關(guān)注,并且在工業(yè)界以及 學(xué)術(shù)界都取得了巨大的成功。傳統(tǒng)單一維度的推薦系統(tǒng)已經(jīng)不能滿足用戶個(gè)性化的需求, 而上下文相關(guān)的推薦系統(tǒng)不僅能夠較好的幫助用戶解決信息過(guò)載的問(wèn)題,而且能夠更加充 分的挖掘用戶的隨時(shí)間、環(huán)境等上下文而變化的特定需求。然而在基于上下文推薦系統(tǒng)的 設(shè)計(jì)中,對(duì)用戶上下文(尤其是情感上下文)的提取、建模以及與推薦系統(tǒng)的結(jié)合的策略較 少且不夠成熟,因此已有推薦系統(tǒng)算法沒(méi)有結(jié)合收聽(tīng)上下文信息。但是在很多場(chǎng)景下,用戶 的收聽(tīng)上下文往往會(huì)主導(dǎo)用戶的需求,例如用戶的全局偏好包括搖滾樂(lè)和純音樂(lè),但是用 戶在晚上休息的時(shí)候,會(huì)更喜歡后者。

【發(fā)明內(nèi)容】

[0003] 針對(duì)傳統(tǒng)音樂(lè)推薦系統(tǒng)的缺點(diǎn),本發(fā)明提出了一種在音樂(lè)推薦算法中加入用戶收 聽(tīng)上下文的方法,具體包括如下的內(nèi)容:
[0004] 一種基于收聽(tīng)上下文的音樂(lè)推薦方法,包括以下步驟:
[0005] S1基于神經(jīng)語(yǔ)言模型的音樂(lè)特征的提??;
[0006] S2用戶收聽(tīng)上下文的提取和建模;
[0007] S3基于用戶收聽(tīng)上下文的音樂(lè)推薦。
[0008] 進(jìn)一步的,步驟S1包括:
[0009] S10獲取用戶的完整音樂(lè)收聽(tīng)序列,包括音樂(lè)ID、播放時(shí)間、播放設(shè)備;
[0010] S11根據(jù)播放時(shí)間和播放設(shè)備,對(duì)用戶的完整音樂(lè)收聽(tīng)序列進(jìn)行分組,得到子序 列;
[0011] S12利用神經(jīng)語(yǔ)言模型處理所有用戶的完整音樂(lè)收聽(tīng)序列,得到每首音樂(lè)的粗粒 度的特征向量,利用神經(jīng)語(yǔ)言模型處理所有用戶的子序列,得到每首音樂(lè)的細(xì)粒度的特征 向量,其中,具有相似收聽(tīng)上下文的音樂(lè)具有相似的特征向量。
[0012] 優(yōu)選的,步驟S12中,根據(jù)對(duì)效率和準(zhǔn)確度的要求指定特征向量的維度,以得到推 薦結(jié)果更準(zhǔn)確的高維度特征向量,或者計(jì)算效率更高的低維度特征向量。
[0013] 進(jìn)一步的,步驟S2包括:
[0014] S20把用戶的完整音樂(lè)收聽(tīng)序列中的所有音樂(lè)的粗粒度特征向量進(jìn)行平均,得到 用戶的全局興趣向量;
[0015] S21把用戶的最近的音樂(lè)收聽(tīng)子序列中的所有音樂(lè)的細(xì)粒度特征向量進(jìn)行平均, 得到用戶的收聽(tīng)上下文興趣向量。
[0016] 進(jìn)一步的,步驟S3包括:
[0017] S30根據(jù)用戶的全局興趣向量和完整音樂(lè)收聽(tīng)序列計(jì)算用戶之間的相似度,其計(jì) 算公式為:
[0018]
[0019] 其中,u表示目標(biāo)用戶,v表示數(shù)據(jù)庫(kù)中的另外一個(gè)用戶;
[0020] Mu表示用戶u所收聽(tīng)的音樂(lè)集合,Μ v表示用戶v所收聽(tīng)的音樂(lè)集合;
[0021] 多^表示用戶u的全局興趣向量,表示用戶ν的全局興趣向量;
[0022] COS(g,]5p是再和巧的余弦相似度;λ和Θ是權(quán)重系數(shù);
[0023] S31計(jì)算目標(biāo)用戶u對(duì)音樂(lè)m的興趣,計(jì)算公式如下:
[0024]
[0025] 其中,u表示目標(biāo)用戶;
[0026] Uu,k表示與u最相似的k個(gè)用戶的集合,Um表示收聽(tīng)過(guò)音樂(lè)m的用戶集合;
[0027] #^_表示用戶u的收聽(tīng)上下文興趣向量,交:21'表示音樂(lè)m的細(xì)粒度特征向量;
[0028] COS(冗,)是冗和5廣''的余弦相似度;ω和#是權(quán)重系數(shù);
[0029] S32利用步驟S31中的計(jì)算結(jié)果對(duì)所有音樂(lè)進(jìn)行排序,把前Ν個(gè)推薦給目標(biāo)用戶 Uo
[0030] 本發(fā)明有益的效果是:首次利用神經(jīng)語(yǔ)言模型(Skip-gram)從用戶的完整收聽(tīng) 序列和子序列中獲取音樂(lè)的不同粒度的特征,分別表示為粗粒度特征向量和細(xì)粒度特征向 量,為音樂(lè)特征提取困難的問(wèn)題提供了一種可靠的解決方法;根據(jù)用戶的完整收聽(tīng)序列和 最近收聽(tīng)子序列中的音樂(lè)的特征向量獲取用戶的全局興趣和收聽(tīng)上下文興趣,為用戶的收 聽(tīng)上下文的提取和建模困難的問(wèn)題提供了一種可行的思路;提出了一種能夠綜合考慮用 戶全局興趣和收聽(tīng)上下文興趣的推薦方法,能夠使得推薦的音樂(lè)更符合目標(biāo)用戶當(dāng)前的偏 好,從而減少用戶的搜索成本并提高用戶的滿意度。
【附圖說(shuō)明】
[0031] 圖1為本發(fā)明的基于收聽(tīng)上下文的音樂(lè)推薦方法的推薦系統(tǒng)架構(gòu)示意圖;
[0032] 圖2為本發(fā)明的基于收聽(tīng)上下文的音樂(lè)推薦方法的用戶音樂(lè)偏好預(yù)測(cè)流程示意 圖。
【具體實(shí)施方式】
[0033] 為了進(jìn)一步理解本發(fā)明,下面結(jié)合實(shí)施例對(duì)本發(fā)明優(yōu)選實(shí)施方案進(jìn)行描述,但是 應(yīng)當(dāng)理解,這些描述只是為進(jìn)一步說(shuō)明本發(fā)明的特征和優(yōu)點(diǎn),而不是對(duì)本發(fā)明權(quán)利要求的 限制。
[0034] 在本發(fā)明的一個(gè)實(shí)施例中,基于收聽(tīng)上下文的音樂(lè)推薦方法,包括以下步驟:
[0035] S1基于神經(jīng)語(yǔ)言模型的音樂(lè)特征的提取;
[0036] S2用戶收聽(tīng)上下文的提取和建模;
[0037] S3基于用戶收聽(tīng)上下文的音樂(lè)推薦。
[0038] 具體的,本實(shí)施例的推薦方法包括以下步驟:
[0039] 獲取用戶的完整的音樂(lè)收聽(tīng)序列,收聽(tīng)序列中的每條記錄包括音樂(lè)ID、播放時(shí)間、 播放設(shè)備。
[0040] 根據(jù)播放時(shí)間和播放設(shè)備,對(duì)用戶的完整收聽(tīng)序列進(jìn)行分組,得到子序列,播放時(shí) 間靠近且播放設(shè)備相同的記錄會(huì)分到同一個(gè)子序列里面,而播放時(shí)間間隔過(guò)長(zhǎng)或者播放設(shè) 備不同的記錄會(huì)分到不同的子序列里面。
[0041] 利用神經(jīng)語(yǔ)言模型(skip-gram)分別處理所有用戶的完整收聽(tīng)序列和子序列,將 每首音樂(lè)表示為粗粒度特征向量和細(xì)粒度特征向量,其中,具有相似收聽(tīng)上下文(在序列 中的前面和后面的音樂(lè))的音樂(lè)具有相似的特征向量。優(yōu)選的,此處可根據(jù)對(duì)效率和準(zhǔn)確 度的要求指定向量的維度,從而獲得合適的特征向量(利用高維度特征向量的推薦結(jié)果更 準(zhǔn)確,而低維度特征向量的計(jì)算效率更高)。
[0042] 把用戶的完整的音樂(lè)收聽(tīng)序列中的所有音樂(lè)的粗粒度特征向量進(jìn)行平均,得到用 戶的全局興趣向量;把用戶的最近的音樂(lè)收聽(tīng)序列中的所有音樂(lè)的細(xì)粒度特征向量進(jìn)行平 均,得到用戶的收聽(tīng)上下文興趣向量。
[0043] 根據(jù)用戶的全局興趣和完整收聽(tīng)序列計(jì)算用戶之間的相似度,其計(jì)算公式為:
[0044]
其中,
[0045] #u是
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1