一種視頻聚類推薦方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于視頻聚類領(lǐng)域,尤其涉及一種視頻聚類推薦方法和裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)資源的不斷豐富,人們在查看多媒體資源,比如觀看視頻,或者播放音 樂文件時,需要在海量的多媒體資源中進(jìn)行文件的查找,需要花費較多的時間獲取用戶喜 歡的多媒體數(shù)據(jù)。
[0003] 為提高用戶獲取喜歡的多媒體文件,比如視頻數(shù)據(jù)等,現(xiàn)有的視頻推薦方法一般 基于聚類技術(shù)和協(xié)同過濾推薦算法一起,通過聚類技術(shù),將搜索目標(biāo)對象最近鄰居的范圍 縮小到與目標(biāo)對象相似性程度最高的幾個聚類,可以有效的減少計算量,提高實時響應(yīng)能 力。
[0004] 現(xiàn)有的K-means等分割聚類算法,需要進(jìn)行多次迭代運算,計算效率比較低,并且 容易受到異常值的影響,導(dǎo)致聚類結(jié)果質(zhì)量不高。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種視頻聚類推薦方法,以解決現(xiàn)有的分割聚類算法,需 要進(jìn)行多次迭代運算,計算效率比較低,并且容易受到異常值的影響,導(dǎo)致聚類結(jié)果質(zhì)量不 高的問題。
[0006] 第一方面,本發(fā)明實施例提供了一種視頻聚類推薦方法,所述方法包括:
[0007] 根據(jù)所有用戶對視頻的評分?jǐn)?shù)目,對視頻進(jìn)行排序得到視頻集巧、 Cl......C? ) ,η為視頻個數(shù);
[0008] 按照視頻的評分?jǐn)?shù)目,從高到低依次計算每個視頻cf與評分?jǐn)?shù)目比?0較高的視 頻,或者由評分?jǐn)?shù)目比?η較高的視頻構(gòu)成視頻集合類,進(jìn)行集合差異度計算;
[0009] 獲取所計算的集合差異度最小值,如果所述集合差異度最小值小于預(yù)設(shè)的閾值, 則將所述集合差異度最小值對應(yīng)的評分?jǐn)?shù)目比Cf較高的視頻,或者由評分?jǐn)?shù)目比cf較高 的視頻構(gòu)成的視頻集合類,與視頻C?合并為一個視頻集合類,其中,〇〈i〈n+l。
[0010] 結(jié)合第一方面,在第一方面的第一種可能實現(xiàn)方式中,按照視頻的評分?jǐn)?shù)目,從高 到低依次計算每個視頻?°與評分?jǐn)?shù)目比cf較高的視頻,或者由評分?jǐn)?shù)目比cf較高的視頻 構(gòu)成視頻集合類,進(jìn)行集合差異度計算步驟包括:
[0011] 計算視頻g與視頻??的集合差異度SFD(C2e);
[0012] 當(dāng)所述集合差異度SFD(C;\Ct)小于預(yù)設(shè)的閾值時,則將視頻與視頻Cf合并 為視頻集合類烊,當(dāng)所述集合差異度SFD((6f:,cf)大于預(yù)設(shè)的閾值時,則將視頻cf與視頻 cf分別生成新的視頻集合類^與勻:
[0013] 對于視頻@ (〇<j<n):,將其與比C;1的評分?jǐn)?shù)目較多的視頻構(gòu)成的視頻集合類 進(jìn)行集合差異度計算。
[0014] 結(jié)合第一方面,在第一方面的第二種可能實現(xiàn)方式中,計算所述集合差異度的公 式為:
[0015]
,其中K為用戶對視頻集N中的評論個數(shù)由多到少所選擇的 用戶數(shù),所述I為視頻所屬的類別數(shù),所述G為比較的兩個視頻的共有的視頻類別數(shù)。
[0016] 結(jié)合第一方面,在第一方面的第三種可能實現(xiàn)方式中,在獲取所計算的集合差異 度最小值后,所述方法還包括:
[0017] 如果所述集合差異度最小值大于預(yù)設(shè)的閾值,則將所述視頻G生成新的視頻集合 類唸。
[0018] 結(jié)合第一方面,在第一方面的第四種可能實現(xiàn)方式中,在得到視頻集合類后,所述 方法還包括:
[0019] 接收用戶輸入的目標(biāo)視頻,查找目標(biāo)視頻所屬的視頻集合類;
[0020] 查找所述視頻集合類中,沒有被所述用戶評分的新視頻集合,在所述新視頻集合 中根據(jù)相似性計算公式得到最近鄰視頻集合;
[0021] 根據(jù)用戶輸入的視頻評分矩陣R與所述最近鄰視頻集合中的每個視頻,計算所述 最近鄰視頻集合中的每個視頻的預(yù)測評分,根據(jù)所述預(yù)設(shè)評分推薦一個或者多個視頻。
[0022] 結(jié)合第一方面的第四種可能實現(xiàn)方式,在第一方面的第五種可能實現(xiàn)方式中,
[0023] 結(jié)合第一方面的第四種可能實現(xiàn)方式,在第一方面的第五種可能實現(xiàn)方式中,所 述查找所述視頻集合類中,沒有被所述用戶評分的新視頻集合,在所述新視頻集合中根據(jù) 相似性計算公式得到最近鄰視頻集合步驟包括:
[0024] 統(tǒng)計用戶u在所述視頻集合類中已評分的視頻集合Iu,所述視頻集合類為P,則沒 有被所述用戶評分的新抑頗隹合為Τ' = P-T,
[0025] 根據(jù)公式
「計算目標(biāo)視頻i與所述新視頻集合中 的每個視頻j的相似度,根據(jù)所述相似度選擇預(yù)定個數(shù)視頻作為所述目標(biāo)視頻的最近鄰視 頻集合,其中U為用戶集合。
[0026] 結(jié)合第一方面的第四種可能實現(xiàn)方式,在第一方面的第六種可能實現(xiàn)方式中,所 述根據(jù)用戶輸入的視頻評分矩陣R與所述最近鄰視頻集合中的每個視頻,計算所述最近鄰 視頻集合中的每個視頻的預(yù)測評分步驟包括:
[0027] 根據(jù)公式
計算所述最近鄰視頻集合中的每個視頻的預(yù) 測評分,其中sim(i,j)為目標(biāo)視頻i與所述新視頻集合中的每個視頻j的相似度,RUi]為用 戶輸入的視頻的評分矩陣中用戶對視頻j的評分?jǐn)?shù)據(jù)。
[0028] 第二方面,本發(fā)明實施例提供了一種視頻聚類推薦裝置,所述裝置包括:
[0029] 排序單元,用于根據(jù)所有用戶對視頻的評分?jǐn)?shù)目,對視頻進(jìn)行排序得到視頻集 N(Cf、0…·C),11為視頻個數(shù);
[0030] 差異度計算單元,用于按照視頻的評分?jǐn)?shù)目,從高到低依次計算每個視頻Cf與評 分?jǐn)?shù)目比Cf較高的視頻,或者由評分?jǐn)?shù)目比< 較高的視頻構(gòu)成視頻集合類,進(jìn)行集合差異 度計算;
[0031] 視頻集合類生成單元,用于獲取所計算的集合差異度最小值,如果所述集合差異 度最小值小于預(yù)設(shè)的閾值,則將所述集合差異度最小值對應(yīng)的評分?jǐn)?shù)目比?°較高的視頻, 或者由評分?jǐn)?shù)目比c?較高的視頻構(gòu)成的視頻集合類,與視頻c?合并為一個視頻集合類,其 中,0〈i〈n+l。
[0032] 結(jié)合第二方面,在第二方面的第一種可能實現(xiàn)方式中,所述差異度計算單元包 括:
[0033] 第一計算子單元,用于計算視頻0與視頻Cf的集合差異度SFD(Ctg);
[0034] 比較子單元,用于當(dāng)所述集合差異度SFDicfXt)小于預(yù)設(shè)的閾值時,則將視頻 C20與視頻01()合并為視頻集合類(: 11,當(dāng)所述集合差異度證0(0;3〇大于預(yù)設(shè)的閾值時,則 將視頻《與視頻ef分別生成新的視頻集合類炫與0;
[0035] 第二計算子單元,用于對于視頻< (0<j<n).,將其與比eg的評分?jǐn)?shù)目較多的視 頻構(gòu)成的視頻集合類進(jìn)行集合差異度計算。
[0036] 結(jié)合第二方面,在第二方面的第二種可能實現(xiàn)方式中,所述裝置還包括:
[0037] 視頻集合類查找單元,用于接收用戶輸入的目標(biāo)視頻,查找目標(biāo)視頻所屬的視頻 集合類;
[0038] 最近鄰視頻集合計算單元,用于查找所述視頻集合類中,沒有被所述用戶評分的 新視頻集合,在所述新視頻集合中根據(jù)相似性計算公式得到最近鄰視頻集合;
[0039] 預(yù)測推薦單元,用于根據(jù)用戶輸入的視頻評分矩陣R與所述最近鄰視頻集合中的 每個視頻,計算所述最近鄰視頻集合中的每個視頻的預(yù)測評分,根據(jù)所述預(yù)設(shè)評分推薦一 個或者多個視頻。
[0040] 在本發(fā)明中,根據(jù)用戶對視頻的評分?jǐn)?shù)目,選擇將評分?jǐn)?shù)目較少的視頻,與評分?jǐn)?shù) 目相對較多的視頻,或者與視頻集合類進(jìn)行集合差異度計算,所述視頻集合類由評分?jǐn)?shù)目 相對較多的視頻構(gòu)成,當(dāng)所述差異度計算的最小值小于