6]—種解決方案是,可以在實(shí)際檢索的過(guò)程中,確定一個(gè)吻合度的參數(shù),用于表示音頻檢索信息中具體某個(gè)音頻單元與資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)中與該音頻單元對(duì)應(yīng)的音頻信息的吻合程度,將它們二者的吻合度與該音頻單元對(duì)應(yīng)的分值之積作為該音頻單元與該音頻數(shù)據(jù)之間的匹配值。同樣地,某個(gè)可以作為檢索結(jié)果的音頻數(shù)據(jù)與檢索詞對(duì)應(yīng)的音頻檢索信息的匹配值等于檢索詞對(duì)應(yīng)的音頻檢索信息中各音頻單元與該音頻數(shù)據(jù)的匹配值之和。
[0037]另一種解決方案是,在將所述檢索詞對(duì)應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)進(jìn)行比對(duì)的過(guò)程中,統(tǒng)一將資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)中的背景音過(guò)濾,同時(shí)將音頻數(shù)據(jù)中非標(biāo)準(zhǔn)音的音頻信息統(tǒng)一轉(zhuǎn)化為具有標(biāo)準(zhǔn)音的音頻信息。
[0038]利用這兩種技術(shù)方案,均可以實(shí)現(xiàn)提高上述匹配值計(jì)算的準(zhǔn)確性目的,同時(shí)有效避免出現(xiàn)檢索失敗的現(xiàn)象。
[0039]S130,將所述檢索結(jié)果輸出。
[0040]所述檢索結(jié)果可以包括下述至少一項(xiàng):所述音頻檢索信息與檢索到的音頻數(shù)據(jù)之間的匹配值、各所述檢索到的音頻數(shù)據(jù)的鏈接地址、來(lái)源和屬性信息、以及所述音頻檢索信息出現(xiàn)在各所述檢索到的音頻數(shù)據(jù)的時(shí)間點(diǎn)等。
[0041]其中,各所述檢索到的音頻數(shù)據(jù)的來(lái)源是指檢索到的各所述音頻數(shù)據(jù)屬于哪個(gè)具體的數(shù)據(jù)庫(kù);各所述檢索到的音頻數(shù)據(jù)的屬性信息是指各檢索到的音頻數(shù)據(jù)的文件類型、文件大小、可播放時(shí)長(zhǎng)、具體上傳時(shí)間、上傳用戶等;所述音頻檢索信息出現(xiàn)在各所述檢索到的音頻數(shù)據(jù)的時(shí)間點(diǎn)是指檢索詞對(duì)應(yīng)的音頻檢索信息中的各音頻單元出現(xiàn)在檢索到的音頻數(shù)據(jù)的具體時(shí)刻。
[0042]所述檢索結(jié)果輸出的方式有多種,例如可以對(duì)檢索到的所述音頻數(shù)據(jù)進(jìn)行排序或分組,其排序或分組的依據(jù)可以為音頻檢索信息與檢索到的音頻數(shù)據(jù)之間的匹配值、各檢索到的音頻數(shù)據(jù)的鏈接地址、來(lái)源和屬性信息、音頻檢索信息出現(xiàn)在各檢索到的音頻數(shù)據(jù)的時(shí)間點(diǎn)中的一項(xiàng)或多項(xiàng)。
[0043]優(yōu)選是,根據(jù)述檢索到的音頻數(shù)據(jù)的匹配值,對(duì)所述檢索到的音頻數(shù)據(jù)進(jìn)行排序并顯示;或根據(jù)所述檢索到的音頻數(shù)據(jù)的匹配值,對(duì)各所述檢索到的音頻數(shù)據(jù)進(jìn)行分組并顯示。由于所述匹配值可以直觀地反映所述檢索到的音頻數(shù)據(jù)與所述檢索詞的匹配吻合度,可以方便用戶查找到自己想要檢索的音頻數(shù)據(jù)。
[0044]檢索結(jié)果顯示的方法有多種,可以為在客戶端界面上依次給出每個(gè)檢索到的音頻數(shù)據(jù)的鏈接地址,以及其相對(duì)應(yīng)的其他信息,也可以在客戶端界面中直接彈出加載有檢索到的音頻數(shù)據(jù)的網(wǎng)絡(luò)播放器。該網(wǎng)絡(luò)播放器可以為音頻播放器,也可以為視頻播放器。進(jìn)一步,優(yōu)選是在播放器中的進(jìn)度條中標(biāo)明與用戶所輸入的檢索詞對(duì)應(yīng)的音頻檢索信息中的各音頻單元對(duì)應(yīng)的時(shí)刻,且用于表示進(jìn)度的圖標(biāo)恰好位于其中某個(gè)音頻單元對(duì)應(yīng)時(shí)刻的位置處,這樣用戶在點(diǎn)擊該網(wǎng)絡(luò)播放器中的播放按鈕后,網(wǎng)絡(luò)播放器開始播放的時(shí)刻恰好為用戶所檢索的內(nèi)容,方便用戶確定所檢索到的內(nèi)容是否為用戶所希望檢索的內(nèi)容。
[0045]本發(fā)明實(shí)施例中的技術(shù)方案以音頻檢索信息本身為檢索對(duì)象,直接與資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)進(jìn)行比對(duì),解決了現(xiàn)有技術(shù)中對(duì)音頻數(shù)據(jù)進(jìn)行檢索需要轉(zhuǎn)換為對(duì)文字信息進(jìn)行檢索的問題,可以實(shí)現(xiàn)對(duì)音頻數(shù)據(jù)直接進(jìn)行檢索,改善用戶在音頻信息檢索方面的用戶體驗(yàn)的目的。
[0046]實(shí)施例二
[0047]圖2為本實(shí)施例提供的一種音頻數(shù)據(jù)的檢索方法的流程圖。本實(shí)施例在前述實(shí)施例基礎(chǔ)上做了兩處改進(jìn):第一改進(jìn)點(diǎn)在于,將獲取并識(shí)別用戶輸入的檢索詞優(yōu)化為兩步,分別為:獲取用戶輸入的檢索詞;判斷所述檢索詞是否為音頻信息;若所述檢查詞為音頻信息,將所述音頻信息進(jìn)行去背景音,并識(shí)別為音頻檢索信息;若所述檢索詞為文字信息,將文字信息轉(zhuǎn)化為音頻檢索信息。
[0048]第二個(gè)改進(jìn)點(diǎn)在于,增加了獲取用戶對(duì)本次檢索的反饋信息的操作。
[0049]本實(shí)施例的方法具體包括:
[0050]S210a,獲取用戶輸入的檢索詞;
[0051]S210b,判斷所述檢索詞是否為音頻信息;若所述檢查詞為音頻信息,將所述音頻信息進(jìn)行去背景音,并識(shí)別為音頻檢索信息;若所述檢索詞為文字信息,將文字信息轉(zhuǎn)化為首頻檢索?目息;
[0052]在本實(shí)施例中,獲取并識(shí)別用戶輸入的檢索詞具體可以包括:獲取用戶輸入的文字信息和/或音頻信息;根據(jù)所述文字信息和/或音頻信息進(jìn)行檢索詞識(shí)別。即,用戶終端的客戶端上設(shè)置有用于輸入文字信息的文字輸入框以及用于輸入音頻信息的輸入按鍵,可獲取用戶輸入文字信息、音頻信息或者同時(shí)參雜有文字信息和音頻信息的信息作為檢索
Τ.κ| ο
[0053]在獲取用戶輸入的檢索詞后,判斷檢索詞是否全部或部分為音頻信息;若檢索詞中全部或者部分為音頻信息,將該音頻信息與背景音數(shù)據(jù)庫(kù)中的背景音模型進(jìn)行比對(duì),若該音頻信息中包含與背景音模型庫(kù)中的某一個(gè)背景音模型一致或吻合度比較高的音頻信息,將該音頻信息過(guò)濾。上述所提到的背景音模型可以來(lái)源與互聯(lián)網(wǎng)中的已有的背景音,也可以為用戶臨時(shí)自己錄制的背景音。
[0054]當(dāng)用戶需要通過(guò)輸入帶有音頻信息的檢索詞進(jìn)行音頻數(shù)據(jù)檢索時(shí),如果用戶所處環(huán)境恰好十分吵雜,優(yōu)選是,首先,用戶在不發(fā)聲的情況下將所處環(huán)境中的聲音錄制為背景音,并將其設(shè)置為背景音模型;其次,用戶在搜索引擎的客戶端中輸入帶有音頻信息的檢索詞。所述服務(wù)器在獲得用戶所輸入的音頻信息后,對(duì)比用戶之前錄制的背景音模型,將用戶所輸入的檢索詞中音頻信息中的背景音過(guò)濾后,識(shí)別用戶輸入的檢索詞對(duì)應(yīng)的音頻檢索信息。這樣,無(wú)論用戶所處環(huán)境多么吵雜,都可以準(zhǔn)確地識(shí)別用戶所輸入的檢索詞對(duì)應(yīng)的音頻檢索ig息。
[0055]另外,用戶可以根據(jù)情況自行設(shè)定是否過(guò)濾用戶所輸入的音頻信息中背景音。用戶還可以設(shè)定需要過(guò)濾的背景音具體參數(shù)(如頻率或響度等)的臨界閾值,當(dāng)用戶所輸入的音頻信息中背景音的參數(shù)的達(dá)到所述臨界閾值,系統(tǒng)可以自行將用戶所輸入的音頻信息中背景音過(guò)濾。
[0056]當(dāng)檢索詞中全部或者部分為文字信息,即在將所述檢索詞對(duì)應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)進(jìn)行比對(duì)之前,若識(shí)別到所述檢索詞為文字信息,根據(jù)文字信息中單個(gè)文字與音節(jié)元素的對(duì)應(yīng)關(guān)系,將所述檢索詞轉(zhuǎn)化為音頻檢索信息。由于每個(gè)用戶自身情況不同、輸入習(xí)慣也不盡相同,通過(guò)將文字信息轉(zhuǎn)化為音頻檢索信息,可以為只能通過(guò)文字信息進(jìn)行檢索的用戶進(jìn)行音頻搜索,有利于改善用戶在音頻數(shù)據(jù)檢索方面的體驗(yàn)效果Ο
[0057]S220,將所述檢索詞對(duì)應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)進(jìn)行比對(duì),形成檢索結(jié)果;
[0058]S230,將所述檢索結(jié)果輸出。
[0059]S240,獲取用戶對(duì)本次檢索的反饋信息。
[0060]上述S240為一個(gè)優(yōu)選操作,當(dāng)單次檢索完成后,所述服務(wù)器還可以通過(guò)客戶端邀請(qǐng)用戶回答調(diào)查問卷的方式獲取用戶對(duì)本次檢索結(jié)果的反饋信息。反饋信息包括用戶滿意程度、檢索存在的問題以及用戶希望改進(jìn)的地方等。通過(guò)獲取用戶對(duì)本次檢索的反饋信息可以有助于工作人員對(duì)上述技術(shù)方案進(jìn)行有針對(duì)性地改進(jìn),以使用戶可以擁有更好的用戶體驗(yàn)。
[0061]例如,若用戶在某次檢索的反饋信息中指出在該次檢索過(guò)程中,服務(wù)器識(shí)別出的音頻單元不在用戶輸入的音頻信息范圍之內(nèi),即服務(wù)器對(duì)用戶輸入的所述檢索詞識(shí)別不正確,這種情況可以請(qǐng)用戶輸入與之前檢索的音頻信息對(duì)應(yīng)的正確的文字。服務(wù)器在獲取該用戶反饋信息后,將用戶輸入的檢索詞中識(shí)別錯(cuò)誤的發(fā)音建立音頻單元模型并保存在音頻單元模型庫(kù)中,為以后具有同類發(fā)音特征的其他用戶進(jìn)行檢索時(shí)提供方便。
[0062]進(jìn)一步的,資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)還可以設(shè)置屬性信息。屬性信息用于表示所述音頻數(shù)據(jù)所伴有的特征,如語(yǔ)音對(duì)象為人類、語(yǔ)音對(duì)象的情緒為興奮、語(yǔ)音對(duì)象的性別為男性、或語(yǔ)音背景為大海等。屬性信息可以為文字標(biāo)簽或者音頻標(biāo)簽。用于表示資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)的屬性信息的標(biāo)簽可以在音頻數(shù)據(jù)上傳時(shí)添加,亦可以在網(wǎng)絡(luò)管理員對(duì)網(wǎng)絡(luò)資源進(jìn)行管理的過(guò)程中添加。
[0063]在具體檢索過(guò)程中,當(dāng)資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)屬性信息為文字屬性信息時(shí),將所述檢索詞對(duì)應(yīng)的音頻檢索信息與資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)進(jìn)行比對(duì)之前,或之后,將所述檢索詞對(duì)應(yīng)的音頻檢索信息對(duì)應(yīng)的文字檢索信息,與所述資源數(shù)據(jù)庫(kù)中音頻數(shù)據(jù)的文字屬性信息進(jìn)行比對(duì),以對(duì)音頻數(shù)據(jù)進(jìn)行過(guò)濾。當(dāng)資源數(shù)據(jù)庫(kù)中的音頻數(shù)據(jù)屬性信息為音頻屬性信息時(shí),將所述檢索詞對(duì)應(yīng)的音頻檢索信息與