亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種音頻數(shù)據(jù)的檢索方法與裝置的制造方法

文檔序號:9579354閱讀:385來源:國知局
一種音頻數(shù)據(jù)的檢索方法與裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實施例涉及互聯(lián)網(wǎng)中數(shù)據(jù)資源檢索技術(shù),尤其涉及一種音頻數(shù)據(jù)的檢索方法和裝置。
【背景技術(shù)】
[0002]在浩如煙海的互聯(lián)網(wǎng)資源數(shù)據(jù)庫中,音頻數(shù)據(jù)的比例日趨增高?,F(xiàn)今,對互聯(lián)網(wǎng)資源的檢索方法大多集中于通過文字信息對文字?jǐn)?shù)據(jù)進行檢索,即使有針對性的對音頻數(shù)據(jù)進行檢索,事實上也是在檢索的過程中將音頻信息轉(zhuǎn)化為文字信息進行檢索。其具體檢索的過程為:首先,獲取用戶輸入的文字檢索信息;其次,將用戶輸入的文字檢索信息與互聯(lián)網(wǎng)資源數(shù)據(jù)庫中的音頻數(shù)據(jù)的文字標(biāo)簽或者文字描述進行比對;最后,將檢索到的文字標(biāo)簽或者文字描述全部或部分包含有用戶輸入的所述文字檢索信息的所述音頻數(shù)據(jù)作為檢索結(jié)果并輸出。在上述檢索過程中,所提及的與所述音頻數(shù)據(jù)的對應(yīng)的文字標(biāo)簽或者文字描述,是由用戶或工作人員在上傳和管理所述音頻數(shù)據(jù)的過程根據(jù)自己的判斷和自己的理解進行添加的。
[0003]現(xiàn)有的這種音頻數(shù)據(jù)檢索方法,事實上是將對音頻信息的檢索轉(zhuǎn)換為對文字信息的檢索。這種音頻信息檢索方法依賴于所述音頻數(shù)據(jù)對應(yīng)的文字標(biāo)簽或者文字描述,而這些文字標(biāo)簽或者文字描述又是由人工進行添加的。人工在添加的過程中難免因為自己思維的局限性,理解偏差等因素,造成所述文字標(biāo)簽或者文字描述對所述音頻數(shù)據(jù)的描述不夠全面、不夠準(zhǔn)確的現(xiàn)象。因此,現(xiàn)有的這種音頻數(shù)據(jù)檢索方法不能夠很好地幫助用戶的對音頻數(shù)據(jù)進行檢索,同時使得用戶體驗感差。

【發(fā)明內(nèi)容】

[0004]本發(fā)明提供一種音頻數(shù)據(jù)的檢索方法及裝置,能夠提高音頻檢索的效率和準(zhǔn)確性。
[0005]第一方面,本發(fā)明實施例提供了一種音頻數(shù)據(jù)的檢索方法,包括:
[0006]獲取并識別用戶輸入的檢索詞;
[0007]將所述檢索詞對應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫中的音頻數(shù)據(jù)進行比對,形成檢索結(jié)果;
[0008]將所述檢索結(jié)果輸出。
[0009]第二方面,本發(fā)明實施例還提供了一種音頻數(shù)據(jù)的檢索裝置,包括:
[0010]檢索詞獲取模塊,用于獲取并識別用戶輸入的檢索詞;
[0011]音頻檢索模塊,用于將所述檢索詞對應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫中的音頻數(shù)據(jù)進行比對,形成檢索結(jié)果;
[0012]檢索結(jié)果輸出模塊,用于將所述檢索結(jié)果輸出。
[0013]本發(fā)明實施例通過將用戶輸入的檢索詞對應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫中的音頻數(shù)據(jù)直接進行比對,解決了現(xiàn)有技術(shù)中對音頻數(shù)據(jù)進行檢索的過程中,需要依賴于具有局限性和不準(zhǔn)確性的文字標(biāo)簽或者文字描述進行檢索,致使在對音頻信息進行檢索的過程中用戶體驗差的問題,實現(xiàn)了以音頻檢索信息本身為檢索對象,直接對資源數(shù)據(jù)庫中的音頻數(shù)據(jù)中進行檢索的目的,改善了用戶在音頻信息檢索方面的用戶體驗。
【附圖說明】
[0014]圖1是本發(fā)明實施例一提供的一種音頻數(shù)據(jù)的檢索方法的流程圖;
[0015]圖2是本發(fā)明實施例二提供的一種音頻數(shù)據(jù)的檢索方法的流程圖;
[0016]圖3是本發(fā)明實施例三提供的一種音頻數(shù)據(jù)的檢索裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0017]下面結(jié)合附圖和實施例對本發(fā)明作進一步的詳細說明??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0018]實施例一
[0019]圖1為本發(fā)明實施例一提供的一種音頻數(shù)據(jù)的檢索方法的流程圖。本方法適用于以音頻檢索信息本身為檢索對象,直接對資源數(shù)據(jù)庫中的音頻數(shù)據(jù)中進行檢索的情況。本方法主要由服務(wù)器來執(zhí)行,尤其是指搜索引擎服務(wù)器,但是用戶需要在用戶終端上的客戶端輸入檢索詞。所述用戶終端可以為但不限于下述設(shè)備中的任意一種:智能手機、電腦以及智能可穿戴設(shè)備。所述服務(wù)器可以通過互聯(lián)網(wǎng)與用戶終端進行通信。所述方法具體包括如下:
[0020]S110、獲取并識別用戶輸入的檢索詞;
[0021]位于用戶終端上的客戶端可以調(diào)用用戶終端上音頻輸入識別類軟件。用戶在啟動用戶終端上的客戶端后,點擊用于輸入音頻信息的輸入按鈕后,用戶開始說話,即輸入檢索詞,用戶終端上的客戶端在接收到用戶輸入的檢索詞后,將其發(fā)送給服務(wù)器。
[0022]由于用戶說話的方式不一樣,可能帶有地域性的口音,也可能帶有沒有實際語意的語氣詞等。所述服務(wù)器在獲取用戶輸入的檢索詞后,需要對用戶輸入的檢索詞進行識別。
[0023]所述服務(wù)器通過將用戶輸入的檢索詞與音頻單元模型庫中的音頻單元模型進行比對,確定檢索詞包含有幾個音頻單元,以及所包括的音頻單元分別為哪些。其中,音頻單元是指具有獨立語意的文字對應(yīng)的音頻信息,可以為單個的字或詞組等。通常用戶輸入的檢索詞中至少包含有一個音頻單元,用戶輸入的檢索詞中除有效音頻單元之外的,諸如語氣詞、或重復(fù)詞等無效音頻信息可丟棄。
[0024]進一步的,音頻單元為采用國家通用語言標(biāo)準(zhǔn)發(fā)音進行表述的具有獨立語意的音頻信息,即具有標(biāo)準(zhǔn)發(fā)音的音頻信息。而音頻單元模型可以利用國家通用語言標(biāo)準(zhǔn)發(fā)音進行表述的具有獨立語意的音頻信息,也可以為利用不同地域性的口音表述(非標(biāo)準(zhǔn)發(fā)音)的具有獨立語意的音頻信息。
[0025]當(dāng)音頻單元模型為利用國家通用語言標(biāo)準(zhǔn)發(fā)音進行表述的具有獨立語意的音頻信息時,每個音頻單元模型與其對應(yīng)的音頻單元等價。在識別檢索詞時,直接將檢索詞與音頻單元模型相對比。若經(jīng)比對后,發(fā)現(xiàn)該檢索詞與該音頻單元模型不匹配,說明該檢索詞不含有該音頻單元模型對應(yīng)的音頻單元。
[0026]當(dāng)音頻單元模型為利用不同地域性的口音表述的具有獨立語意的音頻信息時,每個音頻單元模型與其對應(yīng)的音頻單元不等價。這種情況下,一個音頻單元通常對應(yīng)于多個音頻單元模型。在識別檢索詞時,直接將檢索詞與某音頻單元模型比對后,發(fā)現(xiàn)該檢索詞與該音頻單元模型不匹配,并不能說明該檢索詞不含有該音頻單元模型對應(yīng)的音頻單元。只有將該檢索詞與某一音頻單元對應(yīng)的所有的音頻單元模型都進行比對后,發(fā)現(xiàn)該檢索詞與這些音頻單元模型均不匹配,才能說明該檢索詞不含有該音頻單元。但是,當(dāng)將檢索詞與某音頻單元模型比對后,發(fā)現(xiàn)該檢索詞與該音頻單元模型匹配時,則可以說明該檢索詞含有該音頻單元模型對應(yīng)的音頻單元。采用這種技術(shù)方案有助于提高所述服務(wù)器識別用戶輸入的檢索詞的準(zhǔn)確率。
[0027]S120,將所述檢索詞對應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫中的音頻數(shù)據(jù)進行比對,形成檢索結(jié)果;
[0028]檢索詞對應(yīng)的音頻檢索信息是指經(jīng)識別后,檢索詞包含的所有音頻單元的集合。所述音頻數(shù)據(jù)包括音頻文件或包含有音頻的視頻文件。
[0029]本步驟的具體實施方法為:
[0030]首先,將所述檢索詞對應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫中的音頻數(shù)據(jù)進行比對;
[0031]其次,如果所述音頻數(shù)據(jù)包括所述音頻檢索信息的全部或部分音頻單元,則將所述音頻數(shù)據(jù)確定為檢索結(jié)果。
[0032]在檢索的過程中,優(yōu)選是形成作為檢索結(jié)果的各音頻數(shù)據(jù)與檢索詞對應(yīng)的音頻檢索信息的匹配值,以方便用戶依據(jù)該匹配值,對作為檢索結(jié)果輸出的各音頻數(shù)據(jù)進行有選擇性地查看。
[0033]上述匹配值的計算方法可以有多種,例如,將檢索詞對應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫中的音頻數(shù)據(jù)進行比對之前,可以為音頻檢索信息中每一個音頻單元設(shè)定一個確切的分值,每一個音頻單元對應(yīng)的分值可以相同也可以不同,其具體分值可以由該音頻單元的具體字?jǐn)?shù)或者由客戶意向決定,例如用戶在十分種內(nèi)連續(xù)搜索五次,其中每一次中都包含有“溫暖”或者與“溫暖”為互為同義詞的詞語,則“溫暖”及其同義詞對應(yīng)的分值可以根據(jù)上述情況適當(dāng)上調(diào)。在比對的過程中,若檢索到某一個可作為檢索結(jié)果的音頻數(shù)據(jù),則該音頻檢索信息與檢索到的該音頻數(shù)據(jù)之間的匹配值等于該音頻數(shù)據(jù)中包含的所有音頻單元對應(yīng)的分值之和。
[0034]在上述匹配值的計算方法中,有一個因素可能會影響到上述匹配值計算的準(zhǔn)確性,甚至?xí)绊懙綑z索到的音頻數(shù)據(jù)是否確實含有檢索詞對應(yīng)的音頻檢索信息,該因素為資源數(shù)據(jù)庫中的音頻數(shù)據(jù)中包含有背景音或者該音頻數(shù)據(jù)為帶有地域性的口音(即非標(biāo)準(zhǔn)音)的音頻數(shù)據(jù)等。
[0035]對于上述這種情況,通常有兩種解決方案:
[003
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1