多媒體資源糾錯(cuò)檢索方法、多媒體資源服務(wù)器及系統(tǒng)的制作方法
【專利摘要】本申請(qǐng)公開了多媒體資源糾錯(cuò)檢索方法、服務(wù)器及系統(tǒng),其中,所述方法包括:對(duì)關(guān)鍵詞進(jìn)行切分處理以獲得兩個(gè)關(guān)鍵詞字段;分別根據(jù)關(guān)鍵詞字段在資源索引名稱庫(kù)中匹配,對(duì)每個(gè)關(guān)鍵詞字段,獲取匹配的資源索引名稱;對(duì)關(guān)鍵詞與匹配的資源索引名稱進(jìn)行相似度分析,選定相似度最高的資源索引名稱作為目標(biāo)資源索引名稱;根據(jù)目標(biāo)資源索引名稱,結(jié)合資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源的關(guān)聯(lián)關(guān)系,獲取與目標(biāo)資源索引名稱對(duì)應(yīng)的多媒體資源。通過獲取與關(guān)鍵詞部分匹配的資源索引名稱,在部分匹配的資源索引名稱中獲取與關(guān)鍵詞相似度最高的資源索引名稱,進(jìn)而獲取關(guān)聯(lián)的多媒體資源,用戶即使出現(xiàn)輸入錯(cuò)誤,也能夠檢索到關(guān)聯(lián)的多媒體資源。
【專利說明】多媒體資源糾錯(cuò)檢索方法、多媒體資源服務(wù)器及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及檢索【技術(shù)領(lǐng)域】,具體涉及一種多媒體資源糾錯(cuò)檢索方法、多媒體資源服務(wù)器及系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的普及和發(fā)展,用戶越來越多的在互聯(lián)網(wǎng)上檢索自己喜愛的音樂或視頻等多媒體資源。例如,在影視類網(wǎng)站上,用戶可以在檢索框中輸入要檢索的節(jié)目名稱或者演員姓名等對(duì)自己想觀看的視頻資源進(jìn)行檢索,在很多情況下,用戶可能不能完整而準(zhǔn)確的記住視頻資源的名稱,或者因?yàn)檎`操作而輸入了錯(cuò)誤的視頻資源名稱,這時(shí)影視類網(wǎng)站往往無(wú)法準(zhǔn)確匹配到適合的視頻資源提供給用戶觀看。類似的,在用戶在音樂網(wǎng)站上,對(duì)某一首歌進(jìn)行檢索時(shí),也可能由于無(wú)法輸入該首歌完整而準(zhǔn)確的歌曲名稱,導(dǎo)致無(wú)法準(zhǔn)確匹配到適合的歌曲提供給用戶收聽。
[0003]在實(shí)際應(yīng)用中,用戶輸入的資源索引名稱,可以稱之為一組文字?jǐn)?shù)據(jù),該文字可以包括漢字、數(shù)字、字母等類型,或者其組合,通??梢远x當(dāng)一位文字?jǐn)?shù)據(jù)錯(cuò)誤輸入或漏輸入、多輸入時(shí),稱為編輯距離為1,在二位文字?jǐn)?shù)據(jù)錯(cuò)誤輸入或漏輸入時(shí),稱為編輯距離為2,以此類推,統(tǒng)計(jì)表明,編輯距離為I的情形占文字?jǐn)?shù)據(jù)錯(cuò)誤輸入或漏輸入的95%以上的比例。
[0004]目前,在現(xiàn)有技術(shù)的音樂或影視類網(wǎng)站上,都存在由于用戶輸入了錯(cuò)誤或不完整的資源索引名稱而無(wú)法匹配到合適的多媒體資源的問題,導(dǎo)致服務(wù)器對(duì)該類多媒體資源進(jìn)行檢索的成功率低。
【發(fā)明內(nèi)容】
[0005]本申請(qǐng)所要解決的技術(shù)問題在于提供多媒體資源糾錯(cuò)檢索方法、多媒體資源服務(wù)器及系統(tǒng),將關(guān)鍵詞進(jìn)行切分得到兩個(gè)以上的關(guān)鍵詞字段,根據(jù)關(guān)鍵詞字段與資源索引名稱進(jìn)行匹配,通過對(duì)匹配的資源索引名稱和關(guān)鍵詞進(jìn)行相似度分析,獲取與所述關(guān)鍵詞相似度最高的資源索引名稱,作為用戶真正想輸入的目標(biāo)資源索引名稱,根據(jù)該目標(biāo)資源索引名稱獲取關(guān)聯(lián)的多媒體資源,能夠極大地提高用戶檢索的成功率,并大大提高服務(wù)器的資源糾錯(cuò)檢索速度。
[0006]為了解決上述問題,本申請(qǐng)揭示了多媒體資源糾錯(cuò)檢索方法,包括:對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段;分別根據(jù)所述至少兩個(gè)關(guān)鍵詞字段在資源索引名稱庫(kù)中進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱;對(duì)所述關(guān)鍵詞與所述匹配的資源索引名稱進(jìn)行相似度分析,選定與所述關(guān)鍵詞相似度最高的資源索引名稱作為目標(biāo)資源索引名稱;根據(jù)所述目標(biāo)資源索引名稱,結(jié)合所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,獲取與所述目標(biāo)資源索引名稱對(duì)應(yīng)的多媒體資源。
[0007]進(jìn)一步地,所述對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段的操作,具體包括:對(duì)所述關(guān)鍵詞采用折半方式進(jìn)行切分處理以獲得兩個(gè)關(guān)鍵詞字段。
[0008]進(jìn)一步地,所述資源索引名稱庫(kù)為預(yù)先配置,其中保存有資源索引名稱以及每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系;配置所述資源索引名稱庫(kù)時(shí),對(duì)在預(yù)設(shè)時(shí)間段內(nèi)接收到的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),獲取在所述預(yù)設(shè)時(shí)間段內(nèi)接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞,將所述接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞作為資源索引名稱保存在所述資源索引名稱庫(kù)中。
[0009]進(jìn)一步地,所述方法還包括:根據(jù)所述資源索引名稱庫(kù)中的每個(gè)資源索引名稱的歷史接收次數(shù)以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取每個(gè)資源索引名稱的權(quán)重值;在獲取的與所述關(guān)鍵詞相似度最高的資源索引名稱為兩個(gè)以上時(shí),選定其中與所述關(guān)鍵詞相似度最高且權(quán)重值最高的資源索引名稱作為目標(biāo)資源索引名稱。
[0010]進(jìn)一步地,所述方法還包括:向客戶端發(fā)送與所述關(guān)鍵詞對(duì)應(yīng)的多媒體資源和所述多媒體資源的描述信息,并通過所述客戶端展現(xiàn)所述多媒體資源和所述多媒體資源的描述信息;或向客戶端發(fā)送與所述關(guān)鍵詞對(duì)應(yīng)的多媒體資源,并通過所述客戶端展現(xiàn)所述多媒體資源;或向客戶端發(fā)送與所述關(guān)鍵詞對(duì)應(yīng)的多媒體資源的描述信息,并通過所述客戶端展現(xiàn)所述描述信息。
[0011]為了解決上述問題,本申請(qǐng)還揭示了多媒體資源服務(wù)器,包括:資源索引名稱庫(kù),用于保存資源索引名稱以及每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系;切分模塊,用于對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段;匹配模塊,用于分別根據(jù)所述至少兩個(gè)關(guān)鍵詞字段在所述資源索引名稱庫(kù)中進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱;相似度分析模塊,用于對(duì)所述關(guān)鍵詞與所述匹配的資源索引名稱進(jìn)行相似度分析,選定與所述關(guān)鍵詞相似度最高的資源索引名稱作為目標(biāo)資源索引名稱;資源獲取模塊,用于根據(jù)所述目標(biāo)資源索引名稱,結(jié)合所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,獲取與所述目標(biāo)資源索引名稱對(duì)應(yīng)的多媒體資源。
[0012]進(jìn)一步地,所述切分模塊,具體用于對(duì)所述關(guān)鍵詞采用折半方式進(jìn)行切分處理以獲得兩個(gè)關(guān)鍵詞字段。
[0013]進(jìn)一步地,所述裝置還包括:配置模塊,用于預(yù)先配置所述資源索引名稱庫(kù),對(duì)在預(yù)設(shè)時(shí)間段內(nèi)接收到的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),獲取在所述預(yù)設(shè)時(shí)間段內(nèi)接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞,將所述接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞作為資源索引名稱保存在所述資源索引名稱庫(kù)中;關(guān)聯(lián)關(guān)系建立模塊,用于建立所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,并將所述關(guān)聯(lián)關(guān)系保存在所述資源索引名稱庫(kù)中。
[0014]進(jìn)一步地,所述裝置還包括:加權(quán)處理模塊;所述加權(quán)處理模塊,用于根據(jù)所述資源索引名稱庫(kù)中的每個(gè)資源索引名稱的歷史接收次數(shù)以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取每個(gè)資源索引名稱的權(quán)重值,將每個(gè)資源索引名稱的權(quán)重值對(duì)應(yīng)保存在所述資源索引名稱庫(kù)中;所述資源索引名稱庫(kù),還用于保存每個(gè)資源索引名稱的權(quán)重值;所述相似度分析模塊,用于在獲取的與所述關(guān)鍵詞相似度最高的資源索引名稱為兩個(gè)以上時(shí),選定其中與所述關(guān)鍵詞相似度最高且權(quán)重值最高的資源索引名稱作為目標(biāo)資源索引名稱。
[0015]為了解決上述問題,本申請(qǐng)還揭示了多媒體資源糾錯(cuò)檢索系統(tǒng),包括:若干客戶端以及多媒體資源服務(wù)器,其中,所述多媒體資源服務(wù)器,包括前述的多媒體資源服務(wù)器;所述客戶端,用于獲取輸入的關(guān)鍵詞并發(fā)送至所述多媒體資源服務(wù)器,并接收所述多媒體資源服務(wù)器發(fā)來的與所述關(guān)鍵詞關(guān)聯(lián)的多媒體資源和/或多媒體資源的描述信息并展現(xiàn)。
[0016]與現(xiàn)有技術(shù)相比,本申請(qǐng)可以獲得包括以下技術(shù)效果:
[0017]I)通過在用戶輸入的關(guān)鍵詞無(wú)法與資源索引名稱完全匹配的情況下,對(duì)關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段,根據(jù)上述的關(guān)鍵詞字段在資源索引名稱庫(kù)中進(jìn)行匹配,即獲取與關(guān)鍵詞部分匹配的資源索引名稱,該獲取到的資源索引名稱可能包括多個(gè),則進(jìn)一步的進(jìn)行相似度分析,獲取與關(guān)鍵詞相似度最聞的資源索引名稱,進(jìn)而獲取關(guān)聯(lián)的多媒體資源,能夠使得用戶即使出現(xiàn)輸入錯(cuò)誤,也能夠檢索到關(guān)聯(lián)的多媒體資源,能夠極大地提高用戶檢索的成功率,并大大提高服務(wù)器的資源糾錯(cuò)檢索速度。
[0018]2)本申請(qǐng)進(jìn)一步的,獲取所述關(guān)鍵詞的歷史接收次數(shù),根據(jù)所述關(guān)鍵詞的歷史接收次數(shù),以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取所述資源索引名稱的權(quán)重值,上述的加權(quán)處理時(shí)可以側(cè)重考慮預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)。使得即使獲取的與所述關(guān)鍵詞相似度最高的資源索引名稱為兩個(gè)以上,也能夠根據(jù)權(quán)重值,側(cè)重選擇最近的一段時(shí)間內(nèi)接收次數(shù)更多的資源索引名稱,進(jìn)一步提高檢索多媒體資源的成功率。
[0019]當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品必不一定需要同時(shí)達(dá)到以上所述的所有技術(shù)效果。
【專利附圖】
【附圖說明】
[0020]此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
[0021]圖1是本申請(qǐng)實(shí)施例的方法流程圖;
[0022]圖2是本申請(qǐng)實(shí)施例的裝置結(jié)構(gòu)圖一;
[0023]圖3是本申請(qǐng)實(shí)施例的裝置結(jié)構(gòu)圖二 ;
[0024]圖4是本申請(qǐng)實(shí)施例的系統(tǒng)架構(gòu)圖。
【具體實(shí)施方式】
[0025]以下將配合附圖及實(shí)施例來詳細(xì)說明本申請(qǐng)的實(shí)施方式,藉此對(duì)本申請(qǐng)如何應(yīng)用技術(shù)手段來解決技術(shù)問題并達(dá)成技術(shù)功效的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。
[0026]如在說明書及權(quán)利要求當(dāng)中使用了某些詞匯來指稱特定組件。本領(lǐng)域技術(shù)人員應(yīng)可理解,硬件制造商可能會(huì)用不同名詞來稱呼同一個(gè)組件。本說明書及權(quán)利要求并不以名稱的差異來作為區(qū)分組件的方式,而是以組件在功能上的差異來作為區(qū)分的準(zhǔn)則。如在通篇說明書及權(quán)利要求當(dāng)中所提及的“包含”為一開放式用語(yǔ),故應(yīng)解釋成“包含但不限定于”?!按笾隆笔侵冈诳山邮盏恼`差范圍內(nèi),本領(lǐng)域技術(shù)人員能夠在一定誤差范圍內(nèi)解決所述技術(shù)問題,基本達(dá)到所述技術(shù)效果。此外,“耦接”一詞在此包含任何直接及間接的電性耦接手段。因此,若文中描述一第一裝置耦接于一第二裝置,則代表所述第一裝置可直接電性耦接于所述第二裝置,或通過其他裝置或耦接手段間接地電性耦接至所述第二裝置。說明書后續(xù)描述為實(shí)施本申請(qǐng)的較佳實(shí)施方式,然所述描述乃以說明本申請(qǐng)的一般原則為目的,并非用以限定本申請(qǐng)的范圍。本申請(qǐng)的保護(hù)范圍當(dāng)視所附權(quán)利要求所界定者為準(zhǔn)。
[0027]本申請(qǐng)的豐要思想
[0028]通過分析,用戶在進(jìn)行多媒體資源檢索時(shí)輸入的關(guān)鍵詞,可能是關(guān)鍵詞的一部分文字輸入發(fā)生錯(cuò)誤,此時(shí)在關(guān)鍵詞和資源索引名稱未能夠完全匹配一致時(shí),將關(guān)鍵詞進(jìn)行切分,得到兩個(gè)以上的關(guān)鍵詞字段,根據(jù)關(guān)鍵詞字段與資源索引名稱進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱,有可能有的關(guān)鍵詞字段獲取不到任何相匹配的資源索引名稱,有的關(guān)鍵詞字段獲取到一個(gè)或多個(gè)相匹配的資源索引名稱,將這些匹配到的資源索引名稱匯總,此時(shí)匯總得到的資源索引名稱與用戶輸入的關(guān)鍵詞部分匹配,可以認(rèn)為上述方式查找到的資源索引名稱中必然存在用戶真正想輸入的資源索引名稱。在此情形下,通過對(duì)上述匯總的資源索引名稱和關(guān)鍵詞進(jìn)行相似度分析,獲取與所述關(guān)鍵詞相似度最高的資源索引名稱,作為用戶真正想輸入的目標(biāo)資源索引名稱,根據(jù)該目標(biāo)資源索引名稱獲取關(guān)聯(lián)的多媒體資源,能夠極大地提高用戶檢索的成功率,并大大提高服務(wù)器的資源糾錯(cuò)檢索速度。
[0029]在此基礎(chǔ)上,可以統(tǒng)計(jì)關(guān)鍵詞的歷史接收次數(shù),根據(jù)所述關(guān)鍵詞的歷史接收次數(shù),以及在預(yù)設(shè)時(shí)間段(本申請(qǐng)中所述預(yù)設(shè)時(shí)間段一般是距當(dāng)前時(shí)刻較近的一段時(shí)間內(nèi))內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取每個(gè)資源索引名稱的權(quán)重值。上述權(quán)重值的加權(quán)處理更側(cè)重于對(duì)預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)給予更高的加權(quán),使得若通過上述方式獲取的相似度最高的資源索引名稱即使仍有兩個(gè)以上,則也可以根據(jù)權(quán)重值的大小,選擇最近一段時(shí)間內(nèi)經(jīng)常接收到的資源索引名稱來獲取結(jié)果,進(jìn)一步提高多媒體資源檢索的成功率。
[0030]本串請(qǐng)的應(yīng)用場(chǎng)景
[0031]在用戶通過Web瀏覽器,或音樂播放器進(jìn)行歌曲檢索時(shí),用戶可以在搜索框內(nèi)輸入關(guān)鍵詞進(jìn)行檢索,該關(guān)鍵詞可以是歌曲名稱或演唱者、演唱樂隊(duì)的名稱等資源索引名稱,后臺(tái)服務(wù)器在接收到上述Web瀏覽器或音樂播放器發(fā)送過來的關(guān)鍵詞進(jìn)行多媒體資源檢索時(shí),可以適用于本申請(qǐng)的方案;
[0032]在用戶通過Web瀏覽器,或視頻播放器進(jìn)行視頻資源檢索時(shí),上述視頻資源可以包括電視劇、電影、綜藝類電視節(jié)目或體育類電視節(jié)目等,用戶可以在搜索框內(nèi)輸入關(guān)鍵詞進(jìn)行檢索,該關(guān)鍵詞可以是片源名稱或主要演員姓名等資源索引名稱,后臺(tái)服務(wù)器在接收到上述Web瀏覽器或視頻播放器發(fā)送過來的關(guān)鍵詞進(jìn)行多媒體資源檢索時(shí),可以適用于本申請(qǐng)的方案;
[0033]在用戶通過Web瀏覽器,進(jìn)行文本資源檢索時(shí),該文本資源可以為網(wǎng)絡(luò)上的電子書,或一篇文章等,用戶可以在搜索框內(nèi)輸入關(guān)鍵詞進(jìn)行檢索,該關(guān)鍵詞可以是書籍、文章名稱或作者姓名等資源索引名稱,后臺(tái)服務(wù)器在接收到上述Web瀏覽器發(fā)送過來的關(guān)鍵詞進(jìn)行多媒體資源檢索時(shí),可以適用于本申請(qǐng)的方案;
[0034]當(dāng)然,本申請(qǐng)并不限于以上應(yīng)用場(chǎng)景,還存在其他適用的場(chǎng)景,尤其是所要檢索的多媒體資源具有一準(zhǔn)確名稱,然而用戶在進(jìn)行檢索輸入時(shí)可能會(huì)出現(xiàn)部分內(nèi)容錯(cuò)誤輸入的情形,都可以利用本申請(qǐng)的技術(shù)方案以提高檢索的成功率。
[0035]實(shí)施例描沭
[0036]下面以一實(shí)施例對(duì)本申請(qǐng)方法的實(shí)現(xiàn)作進(jìn)一步說明。如圖1所示,為本申請(qǐng)實(shí)施例的方法流程圖,包括:
[0037]步驟S11,根據(jù)接收到的關(guān)鍵詞,在資源索引名稱庫(kù)中進(jìn)行匹配,在未匹配到一致的資源索引名稱時(shí),執(zhí)行步驟S12 ;
[0038]本步驟中,客戶端可以為具有檢索框的Web瀏覽器、音樂播放器或視頻播放器,上述各客戶端可以抓取用戶在檢索框中輸入關(guān)鍵詞,檢索音頻資源、視頻資源或文本資源等內(nèi)容,其中的音頻資源可以為歌曲,視頻資源可以為電視劇、電影、綜藝類電視節(jié)目或體育類電視節(jié)目等內(nèi)容,文本資源可以為電子書或文章類內(nèi)容??蛻舳嗽讷@取到用戶輸入的關(guān)鍵詞后,會(huì)將關(guān)鍵詞發(fā)送給后臺(tái)服務(wù)器,后臺(tái)服務(wù)器接收客戶端發(fā)來的關(guān)鍵詞;
[0039]后臺(tái)服務(wù)器在接收到客戶端發(fā)送的關(guān)鍵詞后,會(huì)根據(jù)該關(guān)鍵詞,與資源索引名稱庫(kù)所存儲(chǔ)的資源索引名稱一一進(jìn)行匹配,直到匹配到一致的資源索引名稱,則說明用戶輸入的關(guān)鍵詞完整且準(zhǔn)確,匹配到一致的資源索引名稱時(shí),可以根據(jù)該資源索引名稱獲取關(guān)聯(lián)的多媒體資源。優(yōu)選的,在上述資源索引名稱庫(kù)中,不僅記錄資源索引名稱,還記錄與該資源索引名稱對(duì)應(yīng)的多媒體資源的標(biāo)識(shí),例如該多媒體資源的URL地址,或TAG標(biāo)簽,使得在匹配成功后,可以直接獲取對(duì)應(yīng)的多媒體資源。如果匹配完所有的資源索引名稱后,仍未匹配成功,則執(zhí)行步驟S12。
[0040]具體的,以用戶搜索視頻資源為例,用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框中輸入了一段關(guān)鍵詞并點(diǎn)擊檢索,則本地Web瀏覽器向影視類網(wǎng)站的后臺(tái)服務(wù)器發(fā)起了一次會(huì)話(session),會(huì)話中承載關(guān)鍵詞(queryN)。后臺(tái)服務(wù)器識(shí)別關(guān)鍵詞,在資源索引名稱庫(kù)中遍歷,沒有命中,說明沒有相關(guān)的視頻資源,或者是用戶輸錯(cuò)了,通常情況下,用戶輸錯(cuò)的可能性很大。
[0041]步驟S12,對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段,分別根據(jù)所述至少兩個(gè)關(guān)鍵詞字段在所述資源索引名稱庫(kù)中進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱;
[0042]本步驟中,用戶輸入的關(guān)鍵詞可以是漢字、字符、拼音,或者其組合,在無(wú)法匹配成功時(shí),可以對(duì)關(guān)鍵詞進(jìn)行切分處理,獲得至少兩個(gè)關(guān)鍵詞字段,并根據(jù)所述至少兩個(gè)關(guān)鍵詞字段,在資源索引名稱庫(kù)中進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱,將這些匹配到的資源索引名稱匯總。其中在對(duì)關(guān)鍵詞進(jìn)行切分獲得關(guān)鍵詞字段時(shí),可以是對(duì)關(guān)鍵詞盡量平均分配,而不是按照關(guān)鍵詞的語(yǔ)義進(jìn)行切分。
[0043]優(yōu)選的,可以對(duì)所述關(guān)鍵詞采用折半方式進(jìn)行切分處理,以獲得兩個(gè)關(guān)鍵詞字段,該折半處理方式也可稱為hash (哈希)方式。該方式可以按照如下的分割原則進(jìn)行,例如:如果關(guān)鍵詞為偶數(shù)個(gè)文字、字符或拼音,從中間位置平均分為前后兩個(gè)關(guān)鍵詞字段;如果關(guān)鍵詞為奇數(shù)個(gè)文字、字符或拼音,找出處于關(guān)鍵詞正中間位置的文字、字符或拼音,從其前或者后的位置將關(guān)鍵詞分為前后兩個(gè)關(guān)鍵詞字段。需要說明的是,該切分不考慮關(guān)鍵詞的自然語(yǔ)義。
[0044]具體的,在用戶輸入關(guān)鍵詞時(shí),如果用戶輸入的關(guān)鍵詞中,輸錯(cuò)了一位,稱為編輯距離為I。如果輸錯(cuò)了兩位,稱為編輯距離為2。本申請(qǐng)的技術(shù)方案對(duì)編輯距離為I的情形具有更佳的效果。通過上面的切分處理后,對(duì)于編輯距離為I的情況,輸錯(cuò)的一位必然會(huì)存在于前部分的關(guān)鍵詞字段或者后部分的關(guān)鍵詞字段,換言之,如果存在于前部分的關(guān)鍵詞字段,那么后部分的關(guān)鍵詞字段就是輸入正確的,如果存在于后部分的關(guān)鍵詞字段,那么前部分的關(guān)鍵詞字段就是輸入正確的。對(duì)于編輯距離為3的情況,可以切分為三個(gè)關(guān)鍵詞字段。根據(jù)這一原理,我們進(jìn)行下一步驟的操作。
[0045]依據(jù)上述切分結(jié)果,可以在資源索引名稱庫(kù)中進(jìn)行遍歷分析。將關(guān)鍵詞劃分為前部分的關(guān)鍵詞字段和后部分的關(guān)鍵詞字段后,分別在資源索引名稱庫(kù)中進(jìn)行遍歷,前部分的關(guān)鍵詞字段和后部分的關(guān)鍵詞字段兩者之一必然會(huì)發(fā)生命中,當(dāng)然,也有可能前部分的關(guān)鍵詞字段和后部分的關(guān)鍵詞字段都發(fā)生命中。
[0046]具體的,如果前部分的關(guān)鍵詞字段在資源索引名稱庫(kù)中發(fā)生命中,而后部分的關(guān)鍵詞字段沒有命中,說明用戶輸入的前部分的關(guān)鍵詞字段是正確的,而后部分的關(guān)鍵詞字段存在輸錯(cuò)的情況,此時(shí)將前部分的關(guān)鍵詞字段命中的資源索引名稱抽出;同理,如果后部分的關(guān)鍵詞字段在資源索引名稱庫(kù)中發(fā)生命中,而前部分的關(guān)鍵詞字段沒有命中,說明用戶輸入的后部分的關(guān)鍵詞字段是正確的,而前部分的關(guān)鍵詞字段存在輸錯(cuò)的情況,此時(shí)將后部分的關(guān)鍵詞字段命中的資源索引名稱抽出;如果前部分的關(guān)鍵詞字段在資源索引名稱庫(kù)中發(fā)生命中,而后部分的關(guān)鍵詞字段也命中,說明前部分的關(guān)鍵詞字段、后部分的關(guān)鍵詞字段都有可能存在輸錯(cuò)的情況,此時(shí)可以將前部分的關(guān)鍵詞字段命中的資源索引名稱以及后部分的關(guān)鍵詞字段命中的資源索引名稱抽出后匯總。
[0047]步驟S13,對(duì)所述關(guān)鍵詞與所述匹配的資源索引名稱進(jìn)行相似度分析,選定與所述關(guān)鍵詞相似度最高的資源索引名稱作為目標(biāo)資源索引名稱;
[0048]具體的,通過步驟S12獲得了一個(gè)或多個(gè)可能的資源索引名稱,此時(shí)可以根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行相似度分析,在步驟S12獲得多媒體準(zhǔn)確資源名稱中選擇相似度最高的資源索引名稱,例如與關(guān)鍵詞僅存在一個(gè)位置上的區(qū)別,即編輯距離為I的資源索引名稱,通過該步驟的篩選,可以得到非常接近用戶真正想輸入的資源索引名稱,該步驟得到的資源索引名稱通常為I個(gè),在有些情況下也可能出現(xiàn)多個(gè)。對(duì)于多個(gè)的情況,可以通過權(quán)重值進(jìn)行篩選,后面的實(shí)施例中會(huì)對(duì)這部分內(nèi)容加以討論。
[0049]步驟S14,根據(jù)所述目標(biāo)資源索引名稱,結(jié)合所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,獲取與所述目標(biāo)資源索引名稱對(duì)應(yīng)的多媒體資源。
[0050]在后臺(tái)服務(wù)器中,可以在所述資源索引名稱庫(kù)中預(yù)先建立資源索引名稱與多媒體資源的關(guān)聯(lián)關(guān)系,獲得目標(biāo)資源索引名稱后,可以直接根據(jù)上述關(guān)聯(lián)關(guān)系獲取對(duì)應(yīng)的多媒體資源。并進(jìn)一步地,可以向客戶端發(fā)送與所述關(guān)鍵詞對(duì)應(yīng)的多媒體資源和/或所述多媒體資源的描述信息,并通過所述客戶端展現(xiàn)所述多媒體資源和/或所述多媒體資源的描述信息,例如可以將檢索到的多媒體資源的URL地址,或者是多媒體資源的TAG標(biāo)簽發(fā)送給客戶端,并由客戶端向用戶展現(xiàn)。
[0051]本申請(qǐng)上述實(shí)施例中的步驟10-步驟14可以以在線的方式實(shí)現(xiàn)對(duì)多媒體資源的檢索,另外在執(zhí)行上述在線的多媒體資源檢索方法之前,優(yōu)選的可以通過離線的方式預(yù)先配置所述資源索引名稱庫(kù):對(duì)在預(yù)設(shè)時(shí)間段內(nèi)接收到的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),獲取所述預(yù)設(shè)時(shí)間段內(nèi)接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞,這種關(guān)鍵詞被絕大部分用戶所認(rèn)可,所以其當(dāng)然可以作為該多媒體資源的準(zhǔn)確名稱,因此將該關(guān)鍵詞作為資源索引名稱,保存在所述資源索引名稱庫(kù)中,還會(huì)建立所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與對(duì)應(yīng)的多媒體資源的關(guān)聯(lián)關(guān)系,并將所述關(guān)聯(lián)關(guān)系保存在所述資源索弓I名稱庫(kù)中。
[0052]具體的,后臺(tái)服務(wù)器可以獲取在檢索多媒體資源時(shí)接收到關(guān)鍵詞的離線記錄。例如以用戶通過Web瀏覽器檢索視頻資源為例,用戶在每一次通過本地Web瀏覽器打開影視類網(wǎng)站時(shí),會(huì)在網(wǎng)站的檢索框中輸入一段文字?jǐn)?shù)據(jù)作為關(guān)鍵詞,并點(diǎn)擊開始檢索,則本地Web瀏覽器會(huì)向影視類網(wǎng)站的后臺(tái)服務(wù)器發(fā)起了一次會(huì)話(session),會(huì)話中承載的文字?jǐn)?shù)據(jù)被稱為query,也就是用戶輸入的關(guān)鍵詞。在一次會(huì)話中,可以放入一個(gè)或多個(gè)query。而影視類網(wǎng)站的后臺(tái)服務(wù)器會(huì)對(duì)這些會(huì)話和會(huì)話中承載的query進(jìn)行記錄,從而形成日志數(shù)據(jù)可以供離線查看。日志數(shù)據(jù)可以參考如下的結(jié)構(gòu):
[0053]Sessionl (queryK query2、query3…)
[0054]Session2 (query2、query4、query5…)
[0055]Session3 (queryl、query2、query3…)
[0056]Session4 (queryl、query6、query5...)
[0057]其中,queryl代表用戶輸入的一個(gè)關(guān)鍵詞,例如可以是文字、字符或拼音,queryN(N= 2, 3,4, 5,6……)代表該用戶輸入的其他關(guān)鍵詞。
[0058]可以統(tǒng)計(jì)預(yù)設(shè)時(shí)間段內(nèi)的日志數(shù)據(jù),統(tǒng)計(jì)該時(shí)間段內(nèi)所有會(huì)話中qUeryl、qUery2、
query3、query4、query5、query6......的被搜索的總次數(shù),即接收次數(shù)。獲取接收次數(shù)大于
第一預(yù)設(shè)值的關(guān)鍵詞,該第一預(yù)設(shè)值可以設(shè)為100萬(wàn)次,若統(tǒng)計(jì)到queryl的接收次數(shù)超過100萬(wàn)次,則說明該queryl被非常多的用戶使用,則可以認(rèn)為該queryl為資源索引名稱,此時(shí)可以將關(guān)鍵詞存入到資源索引名稱庫(kù)中,類似的,如果其他關(guān)鍵詞的輸入次數(shù)也大于上述第一預(yù)設(shè)值,則也可以將該關(guān)鍵詞存入到資源索引名稱庫(kù)中。在上述資源索引名稱庫(kù)中,除記錄資源索引名稱外,還可以記錄其與對(duì)應(yīng)的多媒體資源的關(guān)聯(lián)關(guān)系,即將多媒體資源的URL地址,或TAG標(biāo)簽記錄到資源索引名稱庫(kù),并與資源索引名稱關(guān)聯(lián)。
[0059]進(jìn)一步的,在本申請(qǐng)的實(shí)施例中,還可以獲取所述資源索引名稱的歷史接收次數(shù)以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù),根據(jù)所述資源索引名稱庫(kù)中的每個(gè)資源索引名稱的歷史接收次數(shù)以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取每個(gè)資源索引名稱的權(quán)重值。
`[0060]即除在上述的實(shí)施例中統(tǒng)計(jì)各關(guān)鍵詞預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù),還獲取所述資源索引名稱的歷史接收次數(shù)。針對(duì)上述實(shí)施例中統(tǒng)計(jì)到預(yù)設(shè)時(shí)間段內(nèi)queryl的接收次數(shù)超過100萬(wàn)次,被識(shí)別為是資源索引名稱,另外還需要統(tǒng)計(jì)queryl的歷史接收次數(shù),例如200萬(wàn)次。即相當(dāng)于分別統(tǒng)計(jì)queryl的熱度(預(yù)設(shè)時(shí)間段內(nèi)接收次數(shù))和頻度(歷史接收次數(shù)),對(duì)queryl的熱度和頻度進(jìn)行加權(quán)處理獲得權(quán)重值,例如頻度的加權(quán)值為30%,熱度的加權(quán)值為70%,則權(quán)重值=(200萬(wàn)次*30% + 100萬(wàn)次*70%) / (200萬(wàn)次+ 100萬(wàn)次),上述是關(guān)鍵詞的熱度的加權(quán)值大于頻度的加權(quán)值,可以使得權(quán)重值更側(cè)重于考慮最近一段時(shí)間內(nèi)的接收次數(shù)。上述各資源索引名稱的權(quán)重值也可以存儲(chǔ)在資源索引名稱庫(kù)中。
[0061]在獲取的與所述關(guān)鍵詞相似度最高的資源索引名稱為兩個(gè)以上時(shí),選定其中與所述與關(guān)鍵詞相似度最高且權(quán)重值最高的資源索引名稱作為目標(biāo)資源索引名稱,根據(jù)所述目標(biāo)資源索引名稱,結(jié)合所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,獲取與所述目標(biāo)資源索引名稱關(guān)聯(lián)的多媒體資源。
[0062]本申請(qǐng)的應(yīng)用實(shí)施例一
[0063]在近一個(gè)星期內(nèi),有1.5億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“helloworld”并點(diǎn)擊檢索;在近一個(gè)星期內(nèi),有1.2億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“hellokitty”并點(diǎn)擊檢索;在近一個(gè)星期內(nèi),有1.8億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“hellovenus”并點(diǎn)擊檢索;在近一個(gè)星期內(nèi),有1.9億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“hello小姐”并點(diǎn)擊檢索。[0064]在上述會(huì)話(session)中,共存在4 個(gè) query,分別是 helloworld、hellokitty、hellovenus和hello小姐。影視類網(wǎng)站的后臺(tái)服務(wù)器會(huì)對(duì)這些會(huì)話和query進(jìn)行記錄,從而形成日志數(shù)據(jù)可以供離線查看。
[0065]后臺(tái)服務(wù)器統(tǒng)計(jì)近一個(gè)星期內(nèi)的日志數(shù)據(jù),發(fā)現(xiàn)helloworld、hellokitty、hellovenus和hello小姐被用戶輸入的次數(shù)遠(yuǎn)遠(yuǎn)大于門限200萬(wàn)次。所以可以認(rèn)為它們就是視頻資源的準(zhǔn)確名稱,將helloworld、hellokitty、hellovenus和hello存放到資源索引名稱庫(kù)中,在該詞庫(kù)中將其分別于對(duì)應(yīng)的視頻資源的標(biāo)識(shí)關(guān)聯(lián),其中視頻資源的標(biāo)識(shí)可以是視頻資源的URL地址,或者視頻資源的TAG標(biāo)簽。同時(shí)統(tǒng)計(jì)獲得上述資源索引名稱的歷史接收次數(shù),并計(jì)算得到helloworld、hellokitty、hellovenus和hello的權(quán)重值分別為
a、b、c 和 d,其中 a>b>c>d。
[0066]如果有用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入了“helloword”并點(diǎn)擊檢索,則本地Web瀏覽器向影視類網(wǎng)站的后臺(tái)服務(wù)器發(fā)起了一次會(huì)話(session), session 中承載的關(guān)鍵詞是“helloword”。
[0067]后臺(tái)服務(wù)器識(shí)別“helloword”,在資源索引名稱庫(kù)中進(jìn)行遍歷,沒有命中,自動(dòng)通過折半方式對(duì)關(guān)鍵詞進(jìn)行切分處理,將其分為hello和word。
[0068]后臺(tái)服務(wù)器分別用hello和word在多媒體準(zhǔn)確名稱詞庫(kù)進(jìn)行遍歷,發(fā)現(xiàn)用hello遍歷發(fā)生了命中,命中了 helloworld、hellokitty、hellovenus和hello小姐,將這4個(gè)命中資源索引名稱抽出。
[0069]后臺(tái)服務(wù)器使用用戶輸入的“helloword”,分別與helloworld、hellokitty、hellovenus和hello小姐進(jìn)行相似性分析,發(fā)現(xiàn)只有helloworld的相似度最高,編輯距離為I,則確定用戶真正想輸入的關(guān)鍵詞是“helloworld”,隨后可以獲取與“helloworld”對(duì)應(yīng)視頻資源,同時(shí)還可以將該檢索結(jié)果反饋給本地Web瀏覽器,并本地Web瀏覽器進(jìn)行呈現(xiàn)。本應(yīng)用實(shí)施例中相似度最高資源索引名稱只有一個(gè),因此可以不再使用其權(quán)重值進(jìn)行判斷。
[0070]本申請(qǐng)的應(yīng)用實(shí)施例二
[0071]在近一個(gè)星期內(nèi),有1.5億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“helloworld”并點(diǎn)擊檢索;在近一個(gè)星期內(nèi),有1.2億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“hellokitty”并點(diǎn)擊檢索;在近一個(gè)星期內(nèi),有1.8億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“hellovenus”并點(diǎn)擊檢索;在近一個(gè)星期內(nèi),有1.9億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“hello小姐”并點(diǎn)擊檢索;在近一個(gè)星期內(nèi),有I億個(gè)用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入“hellword”并點(diǎn)擊檢索。
[0072]這些會(huì)話(session)中,存在了 5個(gè)關(guān)鍵詞(query),分別是helloworld、hellokitty、hellovenus、hello小姐和hellword。影視類網(wǎng)站的后臺(tái)服務(wù)器會(huì)對(duì)這些會(huì)話和關(guān)鍵詞進(jìn)行記錄,從而形成日志數(shù)據(jù)可以供離線查看。
[0073]后臺(tái)服務(wù)器統(tǒng)計(jì)近一個(gè)星期內(nèi)的日志數(shù)據(jù),發(fā)現(xiàn)helloworld、hellokitty、hellovenus、hello小姐和hellword小姐都被輸入的次數(shù)遠(yuǎn)遠(yuǎn)大于門限200萬(wàn)次。所以可以認(rèn)為它們就是資源索引名稱,將helloworld、hellokitty、hellovenus、hello小姐和hellword存放入資源索引名稱庫(kù)中,并在該詞庫(kù)中將其分別與對(duì)應(yīng)的視頻資源的標(biāo)識(shí)關(guān)聯(lián),其中視頻資源的標(biāo)識(shí)可以是視頻資源的URL地址,或者視頻資源的TAG標(biāo)簽。
[0074]同時(shí),通過統(tǒng)計(jì)獲得上述資源索引名稱的歷史接收次數(shù),并計(jì)算得到helloworld、hellokitty> hellovenus、hello 小姐和 hellword 的權(quán)重值分別為 a、b、C、d 和 e,其中a>b>c>d>e。
[0075]用戶通過本地Web瀏覽器打開影視類網(wǎng)站,在網(wǎng)站的檢索框輸入了 “helloword”并點(diǎn)擊檢索,則本地瀏覽器向影視類網(wǎng)站的后臺(tái)服務(wù)器發(fā)起了一次會(huì)話(session),會(huì)話中承載的關(guān)鍵詞是“helloword”。
[0076]后臺(tái)服務(wù)器識(shí)別“helloword”,在資源索引名稱庫(kù)中進(jìn)行遍歷,沒有命中,自動(dòng)通過折半方式對(duì)關(guān)鍵詞進(jìn)行切分,將其分為hello和word。
[0077]后臺(tái)服務(wù)器分別用hello和word在資源索引名稱庫(kù)中進(jìn)行遍歷,發(fā)現(xiàn)用hello遍歷發(fā)生了命中,命中了 helloworld、hellokitty、hellovenus和hello小姐,將這4個(gè)命中的資源索引名稱抽出。而發(fā)現(xiàn)用word遍歷也發(fā)生了命中,命中了 hellword,將這個(gè)命中的資源索引名稱也抽出。
[0078]后臺(tái)服務(wù)器使用用戶輸入的“helloword”,分別與helloworld、hellokitty、hellovenus、hello小姐和hellword進(jìn)行相似性分析,發(fā)現(xiàn)helloworld和hellword的相似度最高,編輯距離都為I但是helloworld的權(quán)重值a高于hellword,則確定用戶真正想輸入的關(guān)鍵詞是“helloworld”,將“helloworld”對(duì)應(yīng)的視頻資源作為檢索結(jié)果,同時(shí)可以將該檢索結(jié)果反饋給本地Web瀏覽器,并在本地Web瀏覽器進(jìn)行呈現(xiàn)。
[0079]本實(shí)施例中,如果helloworld的權(quán)重等于hellword,則將helloworld和hellword對(duì)應(yīng)的視頻源,均作為檢索結(jié)果。
[0080]本申請(qǐng)上述兩個(gè)應(yīng)用實(shí)施例中,用戶輸入的關(guān)鍵詞是英文,或者英文與漢字的組合,另外還可以拼音、字符等,或者是其任意組合,同樣可以按照本申請(qǐng)的實(shí)現(xiàn)方式去實(shí)現(xiàn)。
[0081]如圖2所示,是本申請(qǐng)實(shí)施例的裝置結(jié)構(gòu)圖一。多媒體資源服務(wù)器包括:
[0082]資源索引名稱庫(kù)9,用于保存資源索引名稱以及每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系;
[0083]切分模塊1,用于對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段;
[0084]匹配模塊2,與切分模塊I和資源索引名稱庫(kù)9耦接,用于分別根據(jù)所述至少兩個(gè)關(guān)鍵詞字段在所述資源索引名稱庫(kù)中進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱;
[0085]相似度分析模塊3,與匹配模塊2耦接,用于對(duì)所述關(guān)鍵詞與所述匹配的資源索引名稱進(jìn)行相似度分析,選定與所述關(guān)鍵詞相似度最高的資源索引名稱作為目標(biāo)資源索引名稱;
[0086]資源獲取模塊4,分別與所述相似度分析模塊3和資源索引名稱庫(kù)9耦接,用于根據(jù)所述目標(biāo)資源索引名稱,結(jié)合所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,獲取與所述目標(biāo)資源索引名稱對(duì)應(yīng)的多媒體資源。
[0087]進(jìn)一步的,上述切分模塊I,具體用于對(duì)所述關(guān)鍵詞采用折半方式進(jìn)行切分處理以獲得兩個(gè)關(guān)鍵詞字段。
[0088]如圖3所示,是本申請(qǐng)實(shí)施例的裝置結(jié)構(gòu)圖二。多媒體資源服務(wù)器包括連接關(guān)系與功能與圖3所示實(shí)施例相同的切分模塊1、匹配模塊2、相似度分析模塊3、資源獲取模塊4和資源索引名稱庫(kù)9。
[0089]還可以包括:檢索模塊5,與資源索引名稱庫(kù)9耦接,用于接收客戶端發(fā)來的關(guān)鍵詞,根據(jù)所述關(guān)鍵詞在所述資源索引名稱庫(kù)9中進(jìn)行匹配,在沒有匹配到相應(yīng)的資源索引名稱時(shí),通知所述切分模塊I啟動(dòng)。
[0090]還可以包括:配置模塊6和關(guān)聯(lián)關(guān)系建立模塊7 ;
[0091]配置模塊6,與資源索引名稱庫(kù)9耦接,用于預(yù)先配置所述資源索引名稱庫(kù)9,對(duì)在預(yù)設(shè)時(shí)間段內(nèi)接收到的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),獲取在所述預(yù)設(shè)時(shí)間段內(nèi)接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞,將所述接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞作為資源索引名稱保存在所述資源索引名稱庫(kù)9中;
[0092]關(guān)聯(lián)關(guān)系建立模塊7,與所述資源索引名稱庫(kù)9耦接,用于建立所述資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,并將所述關(guān)聯(lián)關(guān)系保存在所述資源索引名稱庫(kù)9中。
[0093]還可以包括:加權(quán)處理模塊8 ; [0094]加權(quán)處理模塊8,與所述資源索引名稱庫(kù)9耦接,用于根據(jù)所述資源索引名稱庫(kù)9中的每個(gè)資源索引名稱的歷史接收次數(shù)以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取每個(gè)資源索引名稱的權(quán)重值,將每個(gè)資源索引名稱的權(quán)重值對(duì)應(yīng)保存在所述資源索引名稱庫(kù)9中;
[0095]資源索引名稱庫(kù)9,還用于保存每個(gè)資源索引名稱的權(quán)重值;
[0096]相似度分析模塊3,與所述資源索引名稱庫(kù)9耦接,用于在獲取的與所述關(guān)鍵詞相似度最聞的資源索引名稱為兩個(gè)以上時(shí),選定其中與所述關(guān)鍵詞相似度最聞且權(quán)重值最聞的資源索引名稱作為目標(biāo)資源索引名稱。
[0097]所述裝置與前述的方法流程描述對(duì)應(yīng),不足之處參考上述方法流程的敘述,不再
--贅述。
[0098]本申請(qǐng)的實(shí)施例還提供了一種多媒體資源糾錯(cuò)檢索系統(tǒng)。如圖4所示,是本申請(qǐng)實(shí)施例的系統(tǒng)架構(gòu)圖,該多媒體資源糾錯(cuò)檢索系統(tǒng)包括若干客戶端20以及多媒體資源服務(wù)器10。若干客戶端20位于用戶本地側(cè),多媒體資源服務(wù)器10位于網(wǎng)絡(luò)側(cè),若干客戶端20通過有線網(wǎng)絡(luò)或者無(wú)線網(wǎng)絡(luò)與多媒體資源服務(wù)器10相連。
[0099]所述多媒體資源服務(wù)器10如上述圖2或圖3所示的多媒體資源服務(wù)器。上述的多媒體資源服務(wù)器10可以設(shè)置在后臺(tái)服務(wù)器中。
[0100]所述客戶端20,均用于獲取輸入的關(guān)鍵詞并發(fā)送至所述多媒體資源服務(wù)器10,并接收所述多媒體資源服務(wù)器10發(fā)來的與所述關(guān)鍵詞關(guān)聯(lián)的多媒體資源和/或多媒體資源的描述信息并展現(xiàn)。
[0101]還需要說明的是,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者系統(tǒng)不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者系統(tǒng)所固有的要素。在沒有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、商品或者系統(tǒng)中還存在另外的相同要素。
[0102]本領(lǐng)域技術(shù)人員應(yīng)明白,本申請(qǐng)的實(shí)施例可提供為方法、系統(tǒng)或計(jì)算機(jī)程序產(chǎn)品。因此,本申請(qǐng)可采用完全硬件實(shí)施例、完全軟件實(shí)施例或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本申請(qǐng)可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0103]以上所述僅為本申請(qǐng)的實(shí)施例而已,并不用于限制本申請(qǐng)。對(duì)于本領(lǐng)域技術(shù)人員來說,本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的權(quán)利要求范圍之內(nèi)。
【權(quán)利要求】
1.一種多媒體資源糾錯(cuò)檢索方法,其特征在于,包括: 對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段; 分別根據(jù)所述至少兩個(gè)關(guān)鍵詞字段在資源索引名稱庫(kù)中進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱; 對(duì)所述關(guān)鍵詞與所述匹配的資源索引名稱進(jìn)行相似度分析,選定與所述關(guān)鍵詞相似度最高的資源索引名稱作為目標(biāo)資源索引名稱; 根據(jù)所述目標(biāo)資源索引名稱,結(jié)合所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,獲取與所述目標(biāo)資源索引名稱對(duì)應(yīng)的多媒體資源。
2.如權(quán)利要求1所述的多媒體資源糾錯(cuò)檢索方法,其特征在于,所述對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段的操作,具體包括: 對(duì)所述關(guān)鍵詞采用折半方式進(jìn)行切分處理以獲得兩個(gè)關(guān)鍵詞字段。
3.如權(quán)利要求1所述的多媒體資源糾錯(cuò)檢索方法,其特征在于, 所述資源索引名稱庫(kù)為預(yù)先配置,其中保存有資源索引名稱以及每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系; 配置所述資源索引名稱庫(kù)時(shí),對(duì)在預(yù)設(shè)時(shí)間段內(nèi)接收到的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),獲取在所述預(yù)設(shè)時(shí)間段內(nèi)接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞,將所述接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞作為資源索引名稱保存在所述資源索引名稱庫(kù)中。
4.如權(quán)利要求3所述的多媒體資源糾錯(cuò)檢索方法,其特征在于,所述方法還包括: 根據(jù)所述資源索引名稱庫(kù)中的每個(gè)資源索引名稱的歷史接收次數(shù)以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取每個(gè)資源索引名稱的權(quán)重值; 在獲取的與所述關(guān)鍵詞相似度最高的資源索引名稱為兩個(gè)以上時(shí),選定其中與所述關(guān)鍵詞相似度最高且權(quán)重值最高的資源索引名稱作為目標(biāo)資源索引名稱。
5.如權(quán)利要求1所述的多媒體資源糾錯(cuò)檢索方法,其特征在于,所述方法還包括: 向客戶端發(fā)送與所述關(guān)鍵詞對(duì)應(yīng)的多媒體資源和所述多媒體資源的描述信息,并通過所述客戶端展現(xiàn)所述多媒體資源和所述多媒體資源的描述信息;或 向客戶端發(fā)送與所述關(guān)鍵詞對(duì)應(yīng)的多媒體資源,并通過所述客戶端展現(xiàn)所述多媒體資源;或 向客戶端發(fā)送與所述關(guān)鍵詞對(duì)應(yīng)的多媒體資源的描述信息,并通過所述客戶端展現(xiàn)所述描述信息。
6.—種多媒體資源服務(wù)器,其特征在于,包括: 資源索引名稱庫(kù),用于保存資源索引名稱以及每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系; 切分模塊,用于對(duì)所述關(guān)鍵詞進(jìn)行切分處理以獲得至少兩個(gè)關(guān)鍵詞字段; 匹配模塊,用于分別根據(jù)所述至少兩個(gè)關(guān)鍵詞字段在所述資源索引名稱庫(kù)中進(jìn)行匹配,對(duì)于每個(gè)關(guān)鍵詞字段,獲取相匹配的資源索引名稱; 相似度分析模塊,用于對(duì)所述關(guān)鍵詞與所述匹配的資源索引名稱進(jìn)行相似度分析,選定與所述關(guān)鍵詞相似度最高的資源索引名稱作為目標(biāo)資源索引名稱; 資源獲取模塊,用于根據(jù)所述目標(biāo)資源索引名稱,結(jié)合所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,獲取與所述目標(biāo)資源索引名稱對(duì)應(yīng)的多媒體資源。
7.如權(quán)利要求6所述的多媒體資源服務(wù)器,其特征在于, 所述切分模塊,具體用于對(duì)所述關(guān)鍵詞采用折半方式進(jìn)行切分處理以獲得兩個(gè)關(guān)鍵詞字段。
8.如權(quán)利要求6所述的多媒體資源服務(wù)器,其特征在于,所述裝置還包括: 配置模塊,用于預(yù)先配置所述資源索引名稱庫(kù),對(duì)在預(yù)設(shè)時(shí)間段內(nèi)接收到的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),獲取在所述預(yù)設(shè)時(shí)間段內(nèi)接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞,將所述接收次數(shù)超過第一預(yù)設(shè)閾值的關(guān)鍵詞作為資源索引名稱保存在所述資源索引名稱庫(kù)中; 關(guān)聯(lián)關(guān)系建立模塊,用于建立所述資源索引名稱庫(kù)中每個(gè)資源索引名稱與多媒體資源之間的關(guān)聯(lián)關(guān)系,并將所述關(guān)聯(lián)關(guān)系保存在所述資源索引名稱庫(kù)中。
9.如權(quán)利要求8所 述的多媒體資源服務(wù)器,其特征在于,所述裝置還包括:加權(quán)處理模塊; 所述加權(quán)處理模塊,用于根據(jù)所述資源索引名稱庫(kù)中的每個(gè)資源索引名稱的歷史接收次數(shù)以及在預(yù)設(shè)時(shí)間段內(nèi)的接收次數(shù)進(jìn)行加權(quán)處理,獲取每個(gè)資源索引名稱的權(quán)重值,將每個(gè)資源索引名稱的權(quán)重值對(duì)應(yīng)保存在所述資源索引名稱庫(kù)中; 所述資源索引名稱庫(kù),還用于保存每個(gè)資源索引名稱的權(quán)重值; 所述相似度分析模塊,用于在獲取的與所述關(guān)鍵詞相似度最高的資源索引名稱為兩個(gè)以上時(shí),選定其中與所述關(guān)鍵詞相似度最高且權(quán)重值最高的資源索引名稱作為目標(biāo)資源索引名稱。
10.一種多媒體資源糾錯(cuò)檢索系統(tǒng),其特征在于,包括:若干客戶端以及多媒體資源服務(wù)器,其中, 所述多媒體資源服務(wù)器,包括如權(quán)利要求6-9任一所述的多媒體資源服務(wù)器; 所述客戶端,用于獲取輸入的關(guān)鍵詞并發(fā)送至所述多媒體資源服務(wù)器,并接收所述多媒體資源服務(wù)器發(fā)來的與所述關(guān)鍵詞關(guān)聯(lián)的多媒體資源和/或多媒體資源的描述信息并展現(xiàn)。
【文檔編號(hào)】G06F17/30GK103678560SQ201310658802
【公開日】2014年3月26日 申請(qǐng)日期:2013年12月6日 優(yōu)先權(quán)日:2013年12月6日
【發(fā)明者】關(guān)濤 申請(qǐng)人:樂視網(wǎng)信息技術(shù)(北京)股份有限公司