視頻搜索結(jié)果的處理方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種視頻搜索結(jié)果的處理方法及裝置,其中方法包括:從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻;對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包;接收用戶通過客戶端發(fā)送的搜索查詢詞,當所述搜索查詢詞命中所述一個或多個系列視頻包時,按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁返回給客戶端顯示。根據(jù)該方案可以將密切關(guān)聯(lián)的一系列視頻在同一系列視頻包內(nèi)按順序排列展示給用戶,用戶可以方便的在該系列視頻包內(nèi)查找所需要的視頻,該方案提供的搜索方式更加便捷和直觀。
【專利說明】視頻搜索結(jié)果的處理方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,具體涉及一種視頻搜索結(jié)果的處理方法及裝置。
【背景技術(shù)】
[0002]搜索技術(shù)是當今被應(yīng)用最多的互聯(lián)網(wǎng)應(yīng)用之一,搜索引擎允許用戶通過查詢詞檢索整個互聯(lián)網(wǎng)上的豐富數(shù)據(jù)。而視頻搜索則是一種垂直搜索引擎,能夠為用戶提供純粹的視頻結(jié)果,可以使有視頻需求的用戶獲得更好的滿足。
[0003]互聯(lián)網(wǎng)現(xiàn)存在視頻資源可以根據(jù)其是否屬于某個序列組而分為兩類:一類是與其他視頻沒有直接關(guān)聯(lián)的單視頻,如《歡度中秋游樂園》是一個用戶上傳的單視頻,與其他視頻并無關(guān)聯(lián);一類是與其他視頻存在密切關(guān)聯(lián)的一系列視頻,如《php視頻教程54》則是“php視頻教程”系列視頻中的第54部,與其他的視頻存在承前啟后的作用,一個用戶很可能希望按照該系列視頻的集數(shù)順序觀看視頻。而現(xiàn)有的視頻搜索引擎不能將一系列關(guān)聯(lián)視頻按順序排列展示給用戶,用戶需要進一步的在若干個雜亂無章的視頻中自行查找所需要的視頻,這種搜索方式不夠簡單直觀。
【發(fā)明內(nèi)容】
[0004]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的視頻搜索結(jié)果的處理裝置和相應(yīng)的處理方法。
[0005]根據(jù)本發(fā)明的一個方面,提供了一種視頻搜索結(jié)果的處理方法,包括:從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻;對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包;接收用戶通過客戶端發(fā)送的搜索查詢詞,當所述搜索查詢詞命中所述一個或多個系列視頻包時,按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁返回給客戶端顯示。
[0006]可選地,所述從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻包括:若所述視頻索引庫中當前視頻的視頻信息中含有預(yù)設(shè)的特征字符集中的任一特征字符,則將該當前視頻提取出作為所述系列類視頻。
[0007]可選地,所述特征字符集包含視頻劇集數(shù)字、視頻劇集日期和視頻劇集字符中的一項或多項。
[0008]可選地,所述對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包包括:
[0009]查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表,將該系列類視頻列表中的所有系列類視頻與當前系列類視頻整合在一起得到一個系列視頻包,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題確定該系列視頻包的名稱;
[0010]根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題的特征字符對這些系列類視頻進行排重處理,按照所述特征字符對排重處理后的系列類視頻進行排序處理。
[0011]可選地,所述查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表進一步包括:通過計算兩個系列類視頻的視頻標題中相同字符數(shù)與總字符數(shù)均值的比值得到兩個系列類視頻的視頻信息相似度,與當前系列類視頻的視頻信息相似度大于預(yù)定值的所有系列類視頻形成所述系列類視頻列表。
[0012]可選地,所述按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁包括:根據(jù)匹配度級別由高至低的順序?qū)σ粋€或多個系列視頻包進行排名,按照排名先后將一個或多個系列視頻包整合到搜索結(jié)果頁。
[0013]可選地,所述方法還包括:當所述搜索查詢詞命中一個或多個視頻時,按照匹配度級別一并將命中的一個或多個視頻整合到所述搜索結(jié)果頁,其中所述一個或多個視頻的匹配度級別低于所述一個或多個系列視頻包的匹配度級別。
[0014]根據(jù)本發(fā)明的另一方面,提供了一種視頻搜索結(jié)果的處理裝置,包括:視頻索引庫,適于存儲多個視頻;提取模塊,適于從所述視頻索引庫中提取出一個或多個系列類視頻;生成模塊,適于對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包;處理模塊,適于接收用戶通過客戶端發(fā)送的搜索查詢詞,當所述搜索查詢詞命中所述一個或多個系列視頻包時,按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁;發(fā)送模塊,適于將所述搜索結(jié)果頁返回給客戶端顯示。
[0015]可選地,所述提取模塊具體適于:若所述視頻索引庫中當前視頻的視頻信息中含有預(yù)設(shè)的特征字符集中的任一特征字符,則將該當前視頻提取出作為所述系列類視頻。
[0016]可選地,所述裝置還包括:特征字符集存儲模塊,適于存儲視頻劇集數(shù)字、視頻劇集日期和視頻劇集字符中的一項或多項。
[0017]可選地,所述生成模塊包括:
[0018]查找單元,適于查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表,將該系列類視頻列表中的所有系列類視頻與當前系列類視頻整合在一起得到一個系列視頻包,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題確定該系列視頻包的名稱;
[0019]排重單元,適于根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題的特征字符對這些系列類視頻進行排重處理;
[0020]排序單元,適于按照所述特征字符對排重處理后的系列類視頻進行排序處理。
[0021]可選地,所述查找單元具體適于:通過計算兩個系列類視頻的視頻標題中相同字符數(shù)與總字符數(shù)均值的比值得到兩個系列類視頻的視頻信息相似度,與當前系列類視頻的視頻信息相似度大于預(yù)定值的所有系列類視頻形成所述系列類視頻列表。
[0022]可選地,所述處理模塊具體適于:根據(jù)匹配度級別由高至低的順序?qū)σ粋€或多個系列視頻包進行排名,按照排名先后將一個或多個系列視頻包整合到搜索結(jié)果頁。
[0023]可選地,所述處理模塊還適于:當所述搜索查詢詞命中一個或多個視頻時,按照匹配度級別一并將命中的一個或多個視頻整合到所述搜索結(jié)果頁,其中所述一個或多個視頻的匹配度級別低于所述一個或多個系列視頻包的匹配度級別。
[0024]根據(jù)本發(fā)明的視頻搜索結(jié)果的處理方法及裝置,通過從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻,并對系列類視頻進行整合排序,生成一個或多個系列視頻包,在接收到用戶通過客戶端發(fā)送的搜索查詢詞之后,如果搜索查詢詞命中一個或多個系列視頻包,則按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁返回給客戶端顯示。根據(jù)該方案可以將密切關(guān)聯(lián)的一系列視頻在同一系列視頻包內(nèi)按順序排列展示給用戶,用戶可以方便的在該系列視頻包內(nèi)查找所需要的視頻,該方案提供的搜索方式更加便捷和直觀。
[0025]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】
【附圖說明】
[0026]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0027]圖1示出了根據(jù)本發(fā)明一個實施例的視頻搜索結(jié)果的處理方法的流程圖;
[0028]圖2示出了根據(jù)本發(fā)明另一個實施例的視頻搜索結(jié)果的處理方法的流程圖;
[0029]圖3示出了根據(jù)本發(fā)明一個實施例的視頻搜索結(jié)果的處理裝置的結(jié)構(gòu)示意圖;
[0030]圖4示出了根據(jù)本發(fā)明一個實施例的搜索結(jié)果頁面的展示圖;
[0031]圖5示出了根據(jù)本發(fā)明一個實施例的點擊系列視頻包后的搜索結(jié)果頁面的展示圖。
【具體實施方式】
[0032]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
[0033]圖1示出了根據(jù)本發(fā)明一個實施例的視頻搜索結(jié)果的處理方法的流程圖。如圖1所示,該方法包括如下步驟:
[0034]步驟S101,從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻。
[0035]搜索引擎預(yù)先通過爬蟲技術(shù)抓取目標視頻站的視頻相關(guān)信息,該視頻相關(guān)信息包括視頻標題、視頻簡介信息、播放時長等基本信息。然后,搜索引擎根據(jù)抓取到的信息建立視頻索引庫。
[0036]步驟S102,對系列類視頻分別進行整合排序,生成一個或多個系列視頻包。
[0037]搜索引擎根據(jù)視頻相關(guān)信息對系列類視頻進行整合排序,該整合排序具體為:將密切關(guān)聯(lián)的多個系列類視頻整合到同一個系列視頻包內(nèi),然后對同一個系列視頻包內(nèi)的多個系列類視頻進行排序。
[0038]步驟S103,接收用戶通過客戶端發(fā)送的搜索查詢詞,當搜索查詢詞命中一個或多個系列視頻包時,按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁返回給客戶端顯示。
[0039]根據(jù)本發(fā)明上述實施例提供的方法,通過從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻,并對系列類視頻進行整合排序,生成一個或多個系列視頻包,在接收到用戶通過客戶端發(fā)送的搜索查詢詞之后,如搜索查詢詞命中一個或多個系列視頻包,則按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁返回給客戶端顯示。根據(jù)該方法可以將密切關(guān)聯(lián)的一系列視頻在同一系列視頻包內(nèi)按順序排列展示給用戶,用戶可以方便的在該系列視頻包內(nèi)查找所需要的視頻,該方法提供的搜索方式更加便捷和直觀。
[0040]圖2示出了根據(jù)本發(fā)明另一個實施例的視頻搜索結(jié)果的處理方法的流程圖。如圖2所示,該方法包括如下步驟:
[0041]步驟S201,從預(yù)設(shè)的視頻索引庫中提取出含有預(yù)設(shè)的特征字符集中的任一特征字符的一個或多個系列類視頻。
[0042]搜索引擎預(yù)先通過爬蟲技術(shù)抓取目標視頻站的視頻相關(guān)信息,該視頻相關(guān)信息包括視頻標題、視頻簡介信息、播放時長等基本信息。然后,搜索引擎根據(jù)抓取到的信息建立視頻索引庫。
[0043]在預(yù)先建立了視頻索引庫之后,搜索引擎在視頻索引庫中查詢目標視頻,提取出一個或多個系列類視頻。系列類視頻的視頻標題中一般具有視頻劇集數(shù)字(1、01、十五)、視頻劇集日期(20130802、2012年9月15日)、劇集字符(上、中、下、第一集、第12集)等特征信息,這些特征信息使得系列類視頻區(qū)分于其他單視頻。因此本發(fā)明利用該特點預(yù)先建立了特征字符集,特征字符集包含但不限于視頻劇集數(shù)字、視頻劇集日期和視頻劇集字符等特征字符。如果視頻索引庫中當前視頻的視頻標題中含有該特征字符集中的任一特征字符,則將該當前視頻提取出作為系列類視頻。如《php視頻教程01》、《中秋賞月(上)》、《國醫(yī)講堂20130915》均會被識別為系列類視頻。
[0044]本發(fā)明不僅限于根據(jù)視頻標題中所包含的特征字符來識別系列類視頻,還可以根據(jù)視頻的其它相關(guān)信息來識別系列類視頻,例如可以通過分析視頻簡介信息來識別系列類視頻,密切關(guān)聯(lián)的多個系列類視頻的視頻簡介信息可能包含大部分重復(fù)的內(nèi)容。
[0045]步驟S202,查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表,將該系列類視頻列表中的所有系列類視頻與當前系列類視頻整合在一起得到一個系列視頻包,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題確定該系列視頻包的名稱。
[0046]具體地,以步驟S201中已判斷為系列類視頻的視頻標題作為出發(fā)點,尋找其所屬系列的其它系列類視頻,首先查找到與該系列類視頻的視頻標題具有較高相似度的視頻列表,具體地,通過計算兩個視頻的視頻標題中相同字符數(shù)與總字符數(shù)均值的比值得到兩個視頻的視頻信息相似度,當視頻信息相似度大于預(yù)先設(shè)定的閾值時,判定這兩個視頻屬于同一個系列,由此可得到該系列類視頻的一系列相關(guān)視頻,用該視頻系列的標題重合部分作為該系列的名稱。舉例來說,對于兩個系列類視頻《Php視頻教程1:集合的建立方法》和((Php視頻教程2:php編碼案例》,這兩個視頻的視頻標題中相同字符為“php視頻教程”,相同字符數(shù)為7,字符數(shù)均值為兩個視頻總的字符數(shù)的二分之一,即為16,則這兩個視頻的視頻信息相似度為7/16,大于預(yù)設(shè)閾值0.4,因此可判定這兩個視頻屬于同一個系列。根據(jù)該方法,得到同屬一個視頻系列的標題列表為《php視頻教程1:集合的建立方法》、《php視頻教程2:php編碼案例》、((php視頻教程3:ci框架教學》,其中各標題的重合部分為“php視頻教程”,則該視頻系列的名稱為“Php視頻教程”。
[0047]可選地,也可以以判斷為系列類視頻的視頻簡介信息作為出發(fā)點,尋找其所屬系列的其它系列類視頻。具體地,根據(jù)視頻簡介信息的重復(fù)性查找具有較高相似度的視頻列表,將視頻列表中的系列類視頻整合在一起得到系列視頻包。[0048]步驟S203,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題的特征字符對這些系列類視頻進行排重處理,按照特征字符對排重處理后的系列類視頻進行排序處理。
[0049]排重處理主要是根據(jù)視頻標題中特征字符對系列視頻包內(nèi)相同視頻進行處理。在步驟S202之后,若查找到一系列視頻,如《php視頻教程01》、((php視頻教程I》、((php視頻教程第一集》,根據(jù)特征字符可以判定這些視頻為同一個視頻,對它們進行排重處理,只保留一個視頻如《Php視頻教程I》。依此方法對系列視頻包內(nèi)所有視頻進行排重處理。
[0050]在對系列視頻列表內(nèi)所有視頻進行排重處理之后,按照特征字符對視頻進行排序,使視頻以“ 1-N”或“上中下”的方式進行順序排列。
[0051]步驟S204,接收用戶通過客戶端發(fā)送的搜索查詢詞,當搜索查詢詞命中一個或多個系列視頻包時,根據(jù)匹配度級別由高至低的順序?qū)σ粋€或多個系列視頻包進行排名,按照排名先后將一個或多個系列視頻包整合到搜索結(jié)果頁。
[0052]用戶在客戶端輸入搜索查詢詞之后,客戶端將搜索查詢詞發(fā)送給搜索引擎,搜索引擎查找與搜索查詢詞相關(guān)的視頻,當搜索查詢詞命中一個或多個系列視頻包時,即搜索查詢詞與一個或多個系列視頻包相匹配,則根據(jù)匹配度級別由高至低的順序?qū)σ粋€或多個系列視頻包進行排名,按照排名先后將一個或多個系列視頻包整合到搜索結(jié)果頁。
[0053]可選地,當搜索查詢詞命中一個或多個單視頻時,即搜索查詢詞不僅與一個或多個系列視頻包匹配,還與一個或多個單視頻匹配,則按照匹配度級別一并將命中的一個或多個單視頻整合到搜索結(jié)果頁,其中一個或多個單視頻的匹配度級別低于一個或多個系列視頻包的匹配度級別。
[0054]例如,用戶在客戶端中輸入“php教程”,搜索引擎查找到與“php教程”匹配的一個系列視頻包:“視頻集=PhplOO視頻教程(100個)”,以及多個單視頻:“后盾PHP教程第一部javascript特效”、“后盾PHP視頻教程javascript視頻”、“php視頻教程PHP基礎(chǔ)語法自學PHP”等。將這些結(jié)果整合到搜索結(jié)果頁,得到搜索結(jié)果頁的展示如圖4所示,但不限于該展示方式。當用戶點擊“視頻集=PhplOO視頻教程(100個)”之后,其展示頁面如圖5所示。其中,“視頻集:PhplOO視頻教程(100個)”的匹配度級別最高,因而排在最前面;后面的多個單視頻也是按照匹配度級別由高至低的順序而排位的。
[0055]根據(jù)本發(fā)明上述實施例提供的方法,通過從預(yù)設(shè)的視頻索引庫中提取出含有預(yù)設(shè)的特征字符集中的任一特征字符的一個或多個系列類視頻,根據(jù)系列類視頻的視頻信息相似度,將視頻信息相似度大于預(yù)定值的系列類視頻整合在一起得到一個系列視頻包,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題確定該系列視頻包的名稱,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題的特征字符對這些系列類視頻進行排重處理,按照特征字符對排重處理后的系列類視頻進行排序處理,用戶通過搜索引擎查找相關(guān)視頻,當搜索查詢詞命中一個或多個系列視頻包時,根據(jù)匹配度級別由高至低的順序?qū)σ粋€或多個系列視頻包進行排名,按照排名先后將一個或多個系列視頻包整合到搜索結(jié)果頁。根據(jù)該方法可以將密切關(guān)聯(lián)的一系列視頻在同一系列視頻包內(nèi)按順序排列展示給用戶,用戶可以方便的在該系列視頻包內(nèi)查找所需要的視頻,該方法提供的搜索方式更加便捷和直觀。根據(jù)該方法可以提高系列視頻查找的準確性,并能保證系列視頻列表內(nèi)的視頻沒有重復(fù),從而方便用戶觀看。
[0056]圖3示出了根據(jù)本發(fā)明一個實施例的視頻搜索結(jié)果的處理裝置的結(jié)構(gòu)示意圖。如圖3所示,該處理裝置包括:視頻索引庫301、提取模塊302、生成模塊303、處理模塊304、發(fā)送模塊305。
[0057]視頻索引庫301,適于存儲多個視頻。搜索引擎預(yù)先通過爬蟲技術(shù)抓取目標視頻站的視頻相關(guān)信息,該視頻相關(guān)信息包括視頻標題、視頻簡介信息、播放時長等基本信息。然后,搜索引擎根據(jù)抓取到的信息建立視頻索引庫。
[0058]提取模塊302,適于從視頻索引庫301中提取出一個或多個系列類視頻。
[0059]在預(yù)先建立了視頻索引庫301之后,提取模塊302在視頻索引庫中查詢目標視頻,提取出一個或多個系列類視頻。系列類視頻的視頻標題中一般具有視頻劇集數(shù)字(1、01、十五)、視頻劇集日期(20130802、2012年9月15日)、劇集字符(上、中、下、第一集、第12集)等特征信息,這些特征信息使得系列類視頻區(qū)分于其他單視頻。因此本發(fā)明利用該特點預(yù)先建立了特征字符集,將特征字符集存入特征字符集存儲模塊306,特征字符集包含但不限于視頻劇集數(shù)字、視頻劇集日期和視頻劇集字符等特征字符。如果視頻索引庫301中當前視頻的視頻標題中含有該特征字符集中的任一特征字符,則將該當前視頻提取出作為系列類視頻。如《php視頻教程01》、《中秋賞月(上)》、《國醫(yī)講堂20130915》均會被識別為系列類視頻。提取模塊302可以根據(jù)視頻標題中所包含的特征字符來識別系列類視頻,還可以根據(jù)視頻的其它相關(guān)信息來識別系列類視頻,例如可以通過分析視頻簡介信息來識別系列類視頻,密切關(guān)聯(lián)的多個系列類視頻的視頻簡介信息可能包含大部分重復(fù)的內(nèi)容。
[0060]生成模塊303,適于對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包。
[0061]生成模塊303具體包括查找單元307、排重單元308、排序單元309。
[0062]查找單元307,適于查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表,將該系列類視頻列表中的所有系列類視頻與當前系列類視頻整合在一起得到一個系列視頻包,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題確定該系列視頻包的名稱。
[0063]具體地,以提取模塊302中已判斷為系列類視頻的的視頻標題作為出發(fā)點,尋找其所屬系列的其它系列類視頻,首先查找到與該系列類視頻的視頻標題具有較高相似度的視頻列表,具體地,通過計算兩個視頻的視頻標題中相同字符數(shù)與總字符數(shù)均值的比值得到兩個視頻的視頻信息相似度,當視頻信息相似度大于預(yù)先設(shè)定的閾值時,判定這兩個視頻屬于同一個系列,由此可得到該系列類視頻的一系列相關(guān)視頻,用該視頻系列的標題重合部分作為該系列的名稱。舉例來說,對于兩個系列類視頻《php視頻教程1:集合的建立方法》和《php視頻教程2:php編碼案例》,這兩個視頻的視頻標題中相同字符為“php視頻教程”,相同字符數(shù)為7,字符數(shù)均值為兩個視頻總的字符數(shù)的二分之一,即為16,則這兩個視頻的視頻信息相似度為7/16,大于預(yù)設(shè)閾值0.4,因此可判定這兩個視頻屬于同一個系列。根據(jù)該方法,得到同屬一個視頻系列的標題列表為《Php視頻教程1:集合的建立方法》、《php視頻教程2:php編碼案例》、《php視頻教程3:ci框架教學》,其中各標題的重合部分為“php視頻教程”,則該視頻系列的名稱為“php視頻教程”。
[0064]可選地,也可以以判斷為系列類視頻的視頻簡介信息作為出發(fā)點,尋找其所屬系列的其它系列類視頻。具體地,根據(jù)視頻簡介信息的重復(fù)性查找具有較高相似度的視頻列表,將視頻列表中的系列類視頻整合在一起得到系列視頻包。[0065]排重單元308,適于根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題的特征字符對這些系列類視頻進行排重處理。
[0066]排重處理主要是根據(jù)視頻標題中特征字符對系列視頻包內(nèi)相同視頻進行處理。若查找單元307查找到一系列視頻,如《php視頻教程01》、((php視頻教程I》、((php視頻教程第一集》,根據(jù)特征字符可以判定這些視頻為同一個視頻,對它們進行排重處理,只保留一個視頻如《php視頻教程I》。依此方法對系列視頻列包內(nèi)所有視頻進行排重處理。
[0067]排序單元309,適于按照所述特征字符對排重處理后的系列類視頻進行排序處理。
[0068]在對系列視頻列表內(nèi)所有視頻進行排重處理之后,按照特征字符對視頻進行排序,使視頻以“ 1-N”或“上中下”的方式進行順序排列。
[0069]處理模塊304,適于接收用戶通過客戶端發(fā)送的搜索查詢詞,當所述搜索查詢詞命中所述一個或多個系列視頻包時,按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁。
[0070]用戶在客戶端輸入搜索查詢詞之后,客戶端將搜索查詢詞發(fā)送給搜索引擎,處理模塊304查找與搜索查詢詞相關(guān)的視頻,當搜索查詢詞命中一個或多個系列視頻包時,即搜索查詢詞與一個或多個系列視頻包相匹配,則根據(jù)匹配度級別由高至低的順序?qū)σ粋€或多個系列視頻包進行排名,按照排名先后將一個或多個系列視頻包整合到搜索結(jié)果頁。
[0071]可選地,當搜索查詢詞命中一個或多個單視頻時,即搜索查詢詞不僅與一個或多個系列視頻包匹配,還與一個或多個單視頻匹配,則按照匹配度級別一并將命中的一個或多個單視頻整合到搜索結(jié)果頁,其中一個或多個單視頻的匹配度級別低于一個或多個系列視頻包的匹配度級別。
[0072]例如,用戶在客戶端中輸入“php教程”,搜索引擎查找到與“php教程”匹配的一個系列視頻包:“視頻集=PhplOO視頻教程(100個)”,以及多個單視頻:“后盾PHP教程第一部javascript特效”、“后盾PHP視頻教程javascript視頻”、“php視頻教程PHP基礎(chǔ)語法自學PHP”等。處理模塊304將這些結(jié)果整合到搜索結(jié)果頁,得到搜索結(jié)果頁的展示如圖4所示,但不限于該展示方式。當用戶點擊“視頻集=PhplOO視頻教程(100個)”之后,其展示頁面如圖5所示。其中,“視頻集:phpl00視頻教程(100個)”的匹配度級別最高,因而排在最前面;后面的多個單視頻也是按照匹配度級別由高至低的順序而排位的。
[0073]發(fā)送模塊305,適于將所述搜索結(jié)果頁返回給客戶端顯示。
[0074]根據(jù)本發(fā)明上述實施例提供的裝置,通過從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻,并對系列類視頻進行整合排序,生成一個或多個系列視頻包,在接收到用戶通過客戶端發(fā)送的搜索查詢詞之后,如搜索查詢詞命中一個或多個系列視頻包,則按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁返回給客戶端顯示。根據(jù)該裝置可以將密切關(guān)聯(lián)的一系列視頻在同一系列視頻包內(nèi)按順序排列展示給用戶,用戶可以方便的在該系列視頻包內(nèi)查找所需要的視頻,該方法提供的搜索方式更加便捷和直觀。
[0075]在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。[0076]在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0077]類似地,應(yīng)當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權(quán)利要求書由此明確地并入該【具體實施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
[0078]本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0079]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
[0080]本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的視頻搜索結(jié)果的處理設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0081]應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種視頻搜索結(jié)果的處理方法,包括: 從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻; 對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包; 接收用戶通過客戶端發(fā)送 的搜索查詢詞,當所述搜索查詢詞命中所述一個或多個系列視頻包時,按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁返回給客戶端顯示。
2.根據(jù)權(quán)利要求1所述的方法,所述從預(yù)設(shè)的視頻索引庫中提取出一個或多個系列類視頻包括: 若所述視頻索引庫中當前視頻的視頻信息中含有預(yù)設(shè)的特征字符集中的任一特征字符,則將該當前視頻提取出作為所述系列類視頻。
3.根據(jù)權(quán)利要求1或2所述的方法,所述特征字符集包含視頻劇集數(shù)字、視頻劇集日期和視頻劇集字符中的一項或多項。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,所述對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包包括: 查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表,將該系列類視頻列表中的所有系列類視頻與當前系列類視頻整合在一起得到一個系列視頻包,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題確定該系列視頻包的名稱; 根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題的特征字符對這些系列類視頻進行排重處理,按照所述特征字符對排重處理后的系列類視頻進行排序處理。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,所述查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表進一步包括: 通過計算兩個系列類視頻的視頻標題中相同字符數(shù)與總字符數(shù)均值的比值得到兩個系列類視頻的視頻信息相似度,與當前系列類視頻的視頻信息相似度大于預(yù)定值的所有系列類視頻形成所述系列類視頻列表。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,所述按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁包括:根據(jù)匹配度級別由高至低的順序?qū)σ粋€或多個系列視頻包進行排名,按照排名先后將一個或多個系列視頻包整合到搜索結(jié)果頁。
7.根據(jù)權(quán)利要求1-6任一項所述的方法,還包括:當所述搜索查詢詞命中一個或多個視頻時,按照匹配度級別一并將命中的一個或多個視頻整合到所述搜索結(jié)果頁,其中所述一個或多個視頻的匹配度級別低于所述一個或多個系列視頻包的匹配度級別。
8.一種視頻搜索結(jié)果的處理裝置,包括: 視頻索引庫,適于存儲多個視頻; 提取模塊,適于從所述視頻索引庫中提取出一個或多個系列類視頻; 生成模塊,適于對所述系列類視頻分別進行整合排序,生成一個或多個系列視頻包; 處理模塊,適于接收用戶通過客戶端發(fā)送的搜索查詢詞,當所述搜索查詢詞命中所述一個或多個系列視頻包時,按照匹配度級別將命中的一個或多個系列視頻包整合到搜索結(jié)果頁; 發(fā)送模塊,適于將所述搜索結(jié)果頁返回給客戶端顯示。
9.根據(jù)權(quán)利要求8所述的裝置,所述提取模塊具體適于:若所述視頻索引庫中當前視頻的視頻信息中含有預(yù)設(shè)的特征字符集中的任一特征字符,則將該當前視頻提取出作為所述系列類視頻。
10.根據(jù)權(quán)利要求8或9所述的裝置,所述生成模塊包括: 查找單元,適于查找到與當前系列類視頻的視頻信息相似度大于預(yù)定值的系列類視頻列表,將該系列類視頻列表中的所有系列類視頻與當前系列類視頻整合在一起得到一個系列視頻包,根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題確定該系列視頻包的名稱; 排重單元,適于根據(jù)該系列視頻包內(nèi)所有系列類視頻的視頻標題的特征字符對這些系列類視頻進行排重處理; 排序單元,適于按照所述特征字符對排重處理后的系列類視頻進行排序處理。
【文檔編號】G06F17/30GK103559286SQ201310553384
【公開日】2014年2月5日 申請日期:2013年11月8日 優(yōu)先權(quán)日:2013年11月8日
【發(fā)明者】崔代超 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司