視頻匹配方法和裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及計算機網(wǎng)絡技術領域,特別是涉及一種視頻匹配方法和裝置。
【背景技術】
[0002]隨著互聯(lián)網(wǎng)技術的迅速發(fā)展,網(wǎng)絡上的視頻資源越來越豐富,人們隨時可以通過網(wǎng)絡向服務器發(fā)出請求以瀏覽視頻。但隨著服務器存儲的視頻越來越多,如何有效地組織視頻資源越來越成為一個重要的問題。例如,在一些場景中,用戶向視頻網(wǎng)站服務器請求點播一個視頻,服務器如何快速向用戶推薦相似的視頻,或者服務器如何根據(jù)用戶已經(jīng)瀏覽過的視頻,向用戶推薦相似的視頻,服務器匹配相似視頻功能的快速與否,關系到視頻網(wǎng)站服務器是否能夠吸引用戶和提高用戶體驗。而目前一些視頻匹配方法,通常會有匹配不準確,處理較慢的技術問題。
【發(fā)明內(nèi)容】
[0003]基于此,有必要提供一種視頻匹配方法和裝置,能夠根據(jù)輸入的待匹配視頻,與預存視頻進行匹配得到與其相似的視頻,提高準確度和速度。
[0004]一種視頻匹配方法,包括:
[0005]獲取待匹配視頻的第一描述性元數(shù)據(jù);
[0006]確定所述第一描述性元數(shù)據(jù)中所包含的獨立分詞,并計算各獨立分詞對應的第一權重因子;
[0007]將所述第一描述性元數(shù)據(jù)中的獨立分詞,與預存視頻的第二描述性元數(shù)據(jù)中的獨立分詞,進行近義詞分析,并根據(jù)所述第一權重因子及所述第二描述性元數(shù)據(jù)中獨立分詞對應的第二權重因子,確定所述待匹配視頻與所述預存視頻的匹配度;
[0008]輸出匹配度最高的預設數(shù)目的預存視頻作為結果。
[0009]在一個實施例中,在獲取待匹配視頻的第一描述性元數(shù)據(jù)的步驟之前,所述方法還包括:
[0010]預先確定所述預存視頻的第二描述性元數(shù)據(jù)中所包含的獨立分詞,并計算各獨立分詞對應的第二權重因子,并存儲所述獨立分詞和所述第二權重因子。
[0011]在一個實施例中,所述確定所述第一描述性元數(shù)據(jù)中所包含的獨立分詞,并計算各獨立分詞對應的第一權重因子的步驟,包括:
[0012]對所述第一描述性元數(shù)據(jù)中的各元數(shù)據(jù)項進行分詞處理,得到元數(shù)據(jù)項分詞;
[0013]合并所有所述元數(shù)據(jù)項中的相同分詞,得到所述獨立分詞;
[0014]根據(jù)各所述獨立分詞對應的元數(shù)據(jù)項分詞的預設權重,計算各所述獨立分詞對應的第一權重因子;
[0015]所述確定所述第二描述性元數(shù)據(jù)中所包含的獨立分詞,并計算各獨立分詞對應的第二權重因子的步驟,包括:
[0016]對所述第二描述性元數(shù)據(jù)中的各元數(shù)據(jù)項進行分詞處理,得到元數(shù)據(jù)項分詞;
[0017]合并所有所述元數(shù)據(jù)項中的相同分詞,得到所述獨立分詞;
[0018]根據(jù)各所述獨立分詞對應的元數(shù)據(jù)項分詞的預設權重,計算各所述獨立分詞對應的第二權重因子。
[0019]在一個實施例中,在所述對所述第一描述性元數(shù)據(jù)中的各元數(shù)據(jù)項進行分詞處理,得到元數(shù)據(jù)項分詞的步驟,以及所述對所述第二描述性元數(shù)據(jù)中的各元數(shù)據(jù)項進行分詞處理,得到元數(shù)據(jù)項分詞的步驟中,包括:
[0020]去除元數(shù)據(jù)項分詞中的無語義分詞。
[0021 ] 在一個實施例中,所述方法還包括:
[0022]根據(jù)UNICODE編碼對所述第一描述性元數(shù)據(jù)中所包含的獨立分詞進行排序;以及
[0023]根據(jù)UNICODE編碼對所述第二描述性元數(shù)據(jù)中所包含的獨立分詞進行排序。
[0024]一種視頻匹配裝置,包括:
[0025]輸入模塊,用于獲取待匹配視頻的第一描述性元數(shù)據(jù);
[0026]分析模塊,用于確定所述第一描述性元數(shù)據(jù)中所包含的獨立分詞,并計算各獨立分詞對應的第一權重因子;
[0027]存儲模塊,用于存儲預存視頻的第二描述性元數(shù)據(jù)中的獨立分詞及對應的第二權重因子;
[0028]匹配模塊,用于將所述第一描述性元數(shù)據(jù)中的獨立分詞,與預存視頻的第二描述性元數(shù)據(jù)中的獨立分詞,進行近義詞分析,并根據(jù)所述第一權重因子及所述第二描述性元數(shù)據(jù)中獨立分詞對應的第二權重因子,確定所述待匹配視頻與所述預存視頻的匹配度;
[0029]輸出模塊,用于輸出匹配度最高的預設數(shù)目的預存視頻作為結果。
[0030]在一個實施例中,所述分析模塊,還用于預先確定所述預存視頻的第二描述性元數(shù)據(jù)中所包含的獨立分詞,并計算各獨立分詞對應的第二權重因子。
[0031]在一個實施例中,所述分析模塊,用于對所述第一描述性元數(shù)據(jù)中的各元數(shù)據(jù)項進行分詞處理,得到元數(shù)據(jù)項分詞;以及合并所有所述元數(shù)據(jù)項中的相同分詞,得到所述獨立分詞;以及根據(jù)各所述獨立分詞對應的元數(shù)據(jù)項分詞的預設權重,計算各所述獨立分詞對應的第一權重因子;
[0032]所述分析模塊,還用于對所述第二描述性元數(shù)據(jù)中的各元數(shù)據(jù)項進行分詞處理,得到元數(shù)據(jù)項分詞;以及合并所有所述元數(shù)據(jù)項中的相同分詞,得到所述獨立分詞;以及根據(jù)各所述獨立分詞對應的元數(shù)據(jù)項分詞的預設權重,計算各所述獨立分詞對應的第二權重因子。
[0033]在一個實施例中,所述分析模塊,還用于去除元數(shù)據(jù)項分詞中的無語義分詞。
[0034]在一個實施例中,所述分析模塊,還用于根據(jù)UNICODE編碼對所述第一描述性兀數(shù)據(jù)中所包含的獨立分詞進行排序;以及根據(jù)UNICODE編碼對所述第二描述性元數(shù)據(jù)中所包含的獨立分詞進行排序。
[0035]上述視頻匹配方法和裝置,獲取待匹配視頻的第一描述性元數(shù)據(jù),確定其中包含的獨立分詞,并計算各獨立分詞的第一權重因子。再將第一描述性元數(shù)據(jù)中的獨立分詞與預存視頻的獨立分詞,進行近義詞分析,確定匹配度,將匹配度最高的預設數(shù)目的預存視頻輸出作為結果,由此能夠根據(jù)輸入的待匹配視頻,與預存視頻進行匹配得到與其相似的視頻,提高準確度和速度。
【附圖說明】
[0036]圖1為一個實施例中的視頻匹配方法的流程示意圖;
[0037]圖2為一個實施例中的視頻匹配裝置的結構示意圖。
【具體實施方式】
[0038]為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0039]參見圖1,在一個實施例中,提供了一種視頻匹配方法。該方法可以但不限于應用與視頻點播服務器中,在用戶點播一視頻或者用戶瀏覽一視頻后,該視頻點播服務器可以基于該方法將點播的視頻與預存的視頻進行匹配,得到相似的若干視頻,并推薦給用戶。該視頻匹配方法包括:
[0040]步驟101,獲取待匹配視頻的第一描述性元數(shù)據(jù)。
[0041]具體的,在本實施例中,描述性元數(shù)據(jù)是指對視頻進行描述的信息,例如影片名稱、導演名稱、演員信息等等。一些視頻如影片的描述性元數(shù)據(jù)可以預先由制作方進行制作,而一些視頻的描述性元數(shù)據(jù)需要人工標注,從而建立視頻與描述性元數(shù)據(jù)的映射關系。在視頻點播服務器確定用戶點播的視頻后,將該視頻作為待匹配視頻,并根據(jù)映射關系獲取對應的第一描述性元數(shù)據(jù)。
[0042]步驟102,確定第一描述性元數(shù)據(jù)中所包含的獨立分詞,并計算各獨立分詞對應的第一權重因子。
[0043]具體的,視頻點播服務器獲取第一描述性元數(shù)據(jù)后,按下列方式進行處理:
[0044](a)對第一描述性元數(shù)據(jù)中的各元數(shù)據(jù)項進行分詞處理,得到元數(shù)據(jù)項分詞。
[0045]將描述性元數(shù)據(jù)中數(shù)據(jù)劃分為不同的元數(shù)據(jù)項,例如可以包括標題、關鍵詞、摘要、分類等。其中,標題可以是影片名稱、視頻名稱等,關鍵詞可以但不限于導演、演員等信息,摘要可以包含影片內(nèi)容介紹的關鍵詞語,分類提供影片的類別等。將各元數(shù)據(jù)項進行分詞可以依照語言來分類處理。如果是英文信息,由于英文單詞之間有自然的分隔符(空格),可以依照分隔符對元數(shù)據(jù)項進行分詞。而如果是中文信息,還需要進行語義分析,從而根據(jù)語義進行分詞處理,這里的語義可以參照傳統(tǒng)技術,在此并不限定。由此,對各元數(shù)據(jù)項進行分詞處理后,可以得到標題分詞{X1、X2......},摘要分詞{Y1、Y2......}等。
[0046]以視頻《瘋狂原始人》為例,假設其第一描述性元數(shù)據(jù)僅包括標題和摘要。其中標題為:瘋狂原始人,摘要為:原始人克魯?shù)乱患伊谠诶习值谋幼o下生活。則進行分詞處理后,標題分詞包括{瘋狂、原始人},摘要分詞包括{原始人、克魯?shù)?、一家、六、口、在、老爸、的、庇護、下、生活}。
[0047]可選的,在本實施例中,可以進一步去除元數(shù)據(jù)項分詞中的無語義分詞,從而能夠減少處理的數(shù)據(jù)量,提高處理速度。例如在《瘋狂原始人》的例子中,可以去除"在"、"的"等分詞。
[0048](b)合并所有元數(shù)據(jù)項中的相同分詞,得到獨立分詞。
[0049]具體的,對所有元數(shù)據(jù)項中的相同分詞合并為一個獨立分詞。
[0050]以上述《瘋狂原始人》為例,標題分詞"原始人"和摘要分詞"原始人"合并為一獨立分詞。標題分詞"瘋狂"可以作為一獨立分詞......
[0051](c)根據(jù)各獨立分詞對應的元數(shù)據(jù)項分詞的預設權重,計算各所述獨立分詞對應的第一權重因子。
[0052]在本實施例中,根據(jù)不同元數(shù)據(jù)項的相對重要性的經(jīng)驗值,為不同類型的元數(shù)據(jù)項分詞定義一預設權重。將獨立分詞對應的各元數(shù)據(jù)項分詞的預設權重累加作為權重。再根據(jù)獨立分詞的權重與所有獨立分詞總權重的比例,確定獨立分詞對應的第一權重因子。
[0053]同樣以上述《瘋狂原始人》為例,標題分詞和摘要分詞的預設權重可以分別設為70和30,總計為100。則合并分詞后,獨立分詞"原始人"的權重為100 (70+30),獨立分詞"
瘋狂"的權重為70......依次類推,將各獨立分詞的權重累加得到總權重為470(這里以未去除無語義分詞為例)。根據(jù)獨立分詞"瘋狂"的權重占總權重的比例,將該獨立分詞的權重轉換到100范圍內(nèi)為對應的第一權重因子14.9。
[0054]步驟1