一種基于多用戶的視頻推薦方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及推薦技術(shù)領(lǐng)域,尤其涉及一種基于多用戶的視頻推薦方法及裝置。
【背景技術(shù)】
[0002] 隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時代走入了信息過載的時 代,推薦系統(tǒng)應(yīng)運而生。推薦系統(tǒng)或基于視頻內(nèi)容,或基于用戶歷史行為記錄,向用戶找到 其已知范圍之外的感興趣的視頻,拓展其觀影體驗。
[0003] 現(xiàn)有的推薦系統(tǒng)通常都是針對單設(shè)備單用戶來進行推薦,而在單設(shè)備中還可能會 涉及多用戶。以電視為例,在一個家庭中,通常會有多個用戶觀看電視,在每個時間段的觀 看興趣點是不同的,每個成員會按照自己的興趣主動選擇相關(guān)視頻進行觀看,從而導(dǎo)致在 電視上獲取的歷史記錄是多個隱含用戶的興趣疊加。例如:一個家庭由四口人組成,分別為 父親、母親、奶奶和孩子。父親喜歡動作片,母親喜歡愛情片,奶奶喜歡京劇戲曲,孩子喜歡 動畫片。同一家庭的四個成員共享一臺電視,在推薦系統(tǒng)的歷史記錄中標記為同一個用戶, 那么,推薦系統(tǒng)會同時推薦動作片、愛情片、京劇戲曲、動畫片等相似視頻,這樣就會導(dǎo)致對 每個家庭成員推薦的結(jié)果都摻雜了大量的無用視頻,造成不能針對每個家庭成員的興趣和 愛好進行推薦,推薦準確度不高,用戶體驗差。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的實施例提供一種基于多用戶的視頻推薦方法,能夠針對多用戶中每個用 戶需求和興趣,為其推薦喜歡的視頻,提高推薦的準確性。
[0005] 為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案:
[0006] 本發(fā)明實施例提供一種基于多用戶的視頻推薦方法,包括以下步驟:
[0007] 根據(jù)視頻信息及預(yù)設(shè)用戶操作類型權(quán)重,計算任意兩視頻之間的相似度,所述視 頻信息包括用戶對視頻歷史操作信息;
[0008] 根據(jù)所述任意兩視頻之間的相似度,對所述視頻進行聚類,得到多個興趣點;
[0009] 根據(jù)所述用戶對視頻歷史操作信息,統(tǒng)計每個用戶的歷史操作視頻在劃分時間段 所屬的興趣點;
[0010] 根據(jù)所述興趣點分布,為每個用戶生成推薦列表。
[0011] 本發(fā)明實施例還提供了一種基于多用戶的視頻推薦裝置,包括:
[0012] 相似度計算模塊,用于根據(jù)視頻信息及預(yù)設(shè)用戶操作類型權(quán)重,計算任意兩視頻 之間的相似度,所述視頻信息包括用戶對視頻歷史操作信息;
[0013] 聚類模塊,用于根據(jù)所述任意兩視頻之間的相似度,對所述視頻進行聚類,得到多 個興趣點;
[0014] 統(tǒng)計模塊,用于根據(jù)所述用戶對視頻歷史操作信息,統(tǒng)計每個用戶的歷史操作視 頻在劃分時間段所屬的興趣點;
[0015] 推薦模塊,用于根據(jù)所述興趣點分布,為每個用戶生成推薦列表。
[0016] 本發(fā)明實施例所提供的基于多用戶的視頻推薦方法及裝置,根據(jù)視頻信息及預(yù)設(shè) 用戶操作類型權(quán)重,計算任意兩視頻之間的相似度,再根據(jù)任意兩視頻之間的相似度,對所 述視頻進行聚類,可以獲得多個興趣點,每個興趣點代表一個聚類簇,相似度高的視頻可以 被聚類在一起,形成一個聚類簇,表征用戶的喜好,根據(jù)每個用戶的歷史操作信息,可以對 每個用戶歷史操作信息中操作視頻的時間點和操作視頻所屬的時間段和興趣點進行統(tǒng)計, 這樣就了解了每個用戶在各個時間段的喜好,那么就可以根據(jù)每個用戶在各個時間段的興 趣點分布情況進行興趣點中視頻的選取,進而根據(jù)選取的視頻生成推薦列表為用戶進行推 薦。因為該方法可以針對每個用戶的歷史操作記錄對每個用戶在各個時間段的喜好情況進 行了解,進而針對每個用戶在各個不同時間段的興趣和愛好生成其喜歡的視頻的推薦列表 進行推薦,所以滿足了多用戶對于推薦的需求,提高了對于多用戶推薦的準確性,對于多用 戶來說用戶體驗更好。并且,由于用戶操作類型權(quán)重反映了用戶對視頻的喜好度,用戶對視 頻歷史操作是視頻在實際應(yīng)用場景中場景特性的直接體現(xiàn),因此得到的任意兩視頻之間的 相似度為基于用戶操作行為的視頻間的相似度,反映視頻在具體場景中的相關(guān)度,從而為 后續(xù)推薦提供了結(jié)合用戶行為和應(yīng)用場景的視頻間的關(guān)聯(lián)性數(shù)據(jù)。這樣聚類后就可以把因 為用戶行為在實際應(yīng)用場景中關(guān)聯(lián)的視頻挖掘出來,形成一個聚類簇。另一方面,根據(jù)任意 兩視頻之間的相似度,對所述視頻進行聚類,在對每個用戶在每個時間段的操作視頻情況 進行統(tǒng)計的時候,范圍限定到聚類后生成的興趣點中的視頻,大大減少了計算量,提高了推 薦效率。
【附圖說明】
[0017] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0018] 圖1為本發(fā)明實施例提供的一種基于多用戶的視頻推薦方法的方法流程圖;
[0019] 圖2為本發(fā)明實施例提供的一種基于多用戶的視頻推薦裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0020] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0021] 本發(fā)明實施例提供一種基于多用戶的視頻推薦方法,如圖1所示,該方法包括:
[0022] 101、基于多用戶的視頻推薦裝置根據(jù)視頻信息及預(yù)設(shè)用戶操作類型權(quán)重,計算任 意兩視頻之間的相似度。
[0023] 其中,所述視頻信息包括用戶對視頻歷史操作信息。
[0024] 本發(fā)明實施例中的基于多用戶的視頻推薦裝置可以為管理所有終端設(shè)備的服務(wù) 器,也可以為某一終端設(shè)備,該終端設(shè)備可以是智能電視或便攜式、袖珍式或手持式的電子 設(shè)備,例如,智能手機、平板電腦以及個人數(shù)字助理等。
[0025] 本發(fā)明實施例中的視頻信息包括用戶標識、視頻標識和用戶對視頻歷史操作信 息。
[0026] 其中,上述的用戶標識可以為該用戶的登陸賬號或者其他可唯一表示該用戶的標 識,本實施例中采用ul、u2、u3......un形式表示不同用戶的標識;視頻標識可以為該視頻的 名稱或視頻的ID或其他可唯一表示該視頻的標識,本實施例中采用vl、v2、v3、......、vm表 示不同視頻的標識。
[0027] 示例性的,獲取多用戶的視頻推薦裝置會獲取預(yù)定時間范圍內(nèi)所有用戶對視頻的 操作數(shù)據(jù),然后,對這個用戶的操作數(shù)據(jù)進行預(yù)處理,提取出用戶對視頻所執(zhí)行的特定用戶 操作的數(shù)據(jù),然后將用戶對視頻所執(zhí)行的特定用戶操作的數(shù)據(jù)作為用戶對視頻的歷史操作 信息。其中,本發(fā)明實施例中用戶對視頻的歷史操作信息包括:用戶標識、用戶標識對視頻 標識操作行為,用戶標識對視頻標識操作時間。例如,對于視頻來說,該特定用戶操作類型 包括:點擊、收藏、購買等。需要說明的是,上述的具體用戶操作類型僅僅是一種示例,僅僅 是將可以代表用戶喜好的用戶操作類型篩選出來,然后,為其賦不同的權(quán)重來表示不同的 用戶對不同的視頻的喜好度。例如,{:點擊1、收藏2、購買3}。
[0028] 優(yōu)選的,在步驟101中,可以設(shè)置一個更新周期,更新周期的長短可以根據(jù)視頻數(shù) 據(jù)的數(shù)據(jù)庫更新情況進行設(shè)定,例如,可以設(shè)為一個月,一周或一天,本發(fā)明對此不進行限 制,在每個更新周期內(nèi)獲取所述每個更新周期內(nèi)的視頻數(shù)據(jù)的屬性信息并進行更新。本實 施例下述各步驟均以當前周期為例進行說明。
[0029] 具體地,根據(jù)所述視頻信息及預(yù)設(shè)用戶操作類型權(quán)重,生成用戶-視頻矩陣,對所 述用戶-視頻矩陣進行UV分解,獲得每個視頻的特征向量,根據(jù)相似度計算公式獲得任意 兩視頻之間的相似度。
[0030]其中,相似度計算公式為pvl為視頻^的 特征向量,Pv2為視頻V2的特征向量。
[0031] 示例性的,根據(jù)視頻信息,可以生成多個用戶操作類型行為集合,每個用戶操 作行為集合的格式為{用戶標識:視頻標識,用戶操作,時間},如用戶1在2015年10 月1號18:02:46點擊觀看了視頻1,則生成的集合為{用戶1,視頻1,類型:點擊,時間 20151001-18:02:46}。
[0032] 示例性的,用戶操作類型可以為:點擊、收藏、購買,權(quán)重可以設(shè)置為{點擊1、收藏 2、購買3}。
[0033] 具體地,統(tǒng)計每個用戶對每個視頻操作類型及操作次數(shù),每個用戶對每個視頻操 作類型次數(shù)乘以預(yù)設(shè)的對應(yīng)操作類型權(quán)重,求和并歸一化處理得到用戶-視頻矩陣。
[0034]具體地,根據(jù)生成的多個用戶操作行為集合和預(yù)設(shè)的用戶操作類型權(quán)重,生成矩 陣R。
[0035]上述的用戶操作類型的權(quán)重用于表示用戶對視頻喜好度,矩陣R的行和列分別表 示用戶標識和視頻標識,矩陣R的元素1^表示用戶i對視頻j的喜好度。具體的,該矩陣 R的元素可以為用戶i在預(yù)定時間內(nèi)對視頻j執(zhí)行的所有次用戶操作類型權(quán)重累加值, ie1,2,......,n;je1,2,......,m;上述的n為用戶個數(shù),上述的m為記錄中n個用戶所觀 看的不重復(fù)的視頻總和。
[0036] 具體地,根據(jù)生成的多個用戶操作行為集合和預(yù)設(shè)的用戶操作類型權(quán)重,按照用 戶操作類型,生成每種操作類型對應(yīng)的矩陣S,再將每種操作類型對應(yīng)的矩陣S加和得到矩 陣R。
[0037] 具體地,對矩陣R進