亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

計(jì)算機(jī)系統(tǒng)及音頻比對(duì)方法

文檔序號(hào):8320305閱讀:739來源:國(guó)知局
計(jì)算機(jī)系統(tǒng)及音頻比對(duì)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明是有關(guān)于一種計(jì)算機(jī)系統(tǒng)及音頻比對(duì)方法,且特別是有關(guān)于一種循序進(jìn)行 音頻比對(duì)的計(jì)算機(jī)系統(tǒng)及音頻比對(duì)方法。
【背景技術(shù)】
[0002] 音頻比對(duì)是一種快速的音頻檢索方式,使用者可在噪音環(huán)境下錄制一段正在播放 的音頻片段,并在音頻比對(duì)系統(tǒng)中找到最符合此音頻片段的歌曲、電影、電視節(jié)目或廣播節(jié) 目。
[0003] 然而,已知的音頻比對(duì)系統(tǒng)在音頻比對(duì)的正確率、音頻比對(duì)所需的等待時(shí)間以及 執(zhí)行音頻比對(duì)的服務(wù)器的運(yùn)算量上仍有許多改進(jìn)的空間。
[0004] 因此,如何設(shè)計(jì)一個(gè)新的音頻比對(duì)裝置及方法,以解決上述的問題,乃為此一業(yè)界 亟待解決的問題。

【發(fā)明內(nèi)容】

[0005] 因此,本發(fā)明的一方面是在提供一種計(jì)算機(jī)系統(tǒng),用以進(jìn)行音頻比對(duì)。計(jì)算機(jī)系統(tǒng) 包含客戶終端以及服務(wù)器。
[0006] 客戶終端包含分類器、第一地標(biāo)特征擷取模塊、第一編碼模塊以及整合模塊。分類 器用以估算第一音頻樣本的一第一音頻片段的辨識(shí)難易度。第一地標(biāo)特征擷取模塊用以根 據(jù)辨識(shí)難易度,決定地標(biāo)特征擷取的次數(shù),并對(duì)第一音頻片段進(jìn)行相對(duì)應(yīng)次數(shù)的地標(biāo)特征 擷取,以產(chǎn)生多個(gè)第一地標(biāo)特征。第一編碼模塊用以將第一地標(biāo)特征編碼為多個(gè)第一散列 鍵。整合模塊用以整合第一散列鍵,并產(chǎn)生整合后的多個(gè)散列鍵傳送至服務(wù)器。
[0007] 服務(wù)器包含第二地標(biāo)特征擷取模塊、第二編碼模塊、散列表、查表模塊、分析模塊 以及判斷模塊。
[0008] 第二地標(biāo)特征擷取模塊用以對(duì)第二音頻樣本進(jìn)行地標(biāo)特征擷取,以產(chǎn)生多個(gè)第二 地標(biāo)特征。第二編碼模塊用以將第二地標(biāo)特征編碼為多個(gè)第二散列鍵。散列表用以儲(chǔ)存第 二散列鍵與其所對(duì)應(yīng)的多個(gè)散列值。查表模塊,用以將客戶終端所傳送的散列鍵與散列表 中的第二散列鍵進(jìn)行查表比對(duì)。分析模塊用以分析查表比對(duì)的結(jié)果。判斷模塊,用以決定 音頻比對(duì)結(jié)果,并將音頻比對(duì)結(jié)果傳送至客戶終端。
[0009] 依據(jù)本發(fā)明一實(shí)施例,判斷模塊還用以測(cè)量一信心度,當(dāng)信心度達(dá)到門檻值時(shí),則 決定音頻比對(duì)結(jié)果,并將音頻比對(duì)結(jié)果傳送至客戶終端。當(dāng)信心度未達(dá)門檻值時(shí),則判斷模 塊發(fā)送請(qǐng)求至客戶終端,客戶終端配合服務(wù)器依據(jù)請(qǐng)求對(duì)第一音頻樣本中的一第二音頻片 段進(jìn)行音頻處理。
[0010] 依據(jù)本發(fā)明另一實(shí)施例,上述第二音頻片段是接續(xù)于第一音頻片段。
[0011] 依據(jù)本發(fā)明又一實(shí)施例,上述信心度為第一音頻片段中每秒比對(duì)到的散列鍵數(shù) 目。
[0012] 依據(jù)本發(fā)明更具有的一實(shí)施例,上述第一地標(biāo)特征與第二地標(biāo)特征包含一起始頻 率、一頻率差以及一時(shí)間差。
[0013] 依據(jù)本發(fā)明另具有的一實(shí)施例,上述第二散列鍵的散列值包含一地標(biāo)特征開始時(shí) 間以及一節(jié)目數(shù)據(jù)。
[0014] 依據(jù)本發(fā)明又具有的一實(shí)施例,上述分類器于估算該辨識(shí)難易度時(shí),利用第一音 頻片段的一絕對(duì)音量的平均值、一相對(duì)音量的標(biāo)準(zhǔn)差、一三次微分絕對(duì)值加總的標(biāo)準(zhǔn)差中 的一者或上述三者的組合估算辨識(shí)難易度。
[0015] 依據(jù)本發(fā)明再具有的一實(shí)施例,于上述客戶終端中,當(dāng)兩個(gè)第一散列鍵相同時(shí),上 述整合模塊還用以刪除該兩個(gè)第一散列鍵其中之一。
[0016] 依據(jù)本發(fā)明另又一實(shí)施例,上述第一音頻樣本為一歌曲、一電影、一電視節(jié)目或一 廣播節(jié)目的音頻。
[0017] 依據(jù)本發(fā)明另再一實(shí)施例,上述客戶終端為一智能手機(jī)、一平板電腦、一筆記型電 腦、一智能手表、一智能眼鏡、一智能電視,或一數(shù)字電視機(jī)上盒。
[0018] 本發(fā)明的再一方面是在提供一種音頻比對(duì)方法,包含下列步驟:
[0019] 估算第一音頻樣本的一第一音頻片段的辨識(shí)難易度;根據(jù)辨識(shí)難易度,決定地標(biāo) 特征擷取的次數(shù),并對(duì)第一音頻片段進(jìn)行相對(duì)應(yīng)次數(shù)的地標(biāo)特征擷取,以產(chǎn)生多個(gè)地標(biāo)特 征;將地標(biāo)特征編碼為多個(gè)第一散列鍵;整合第一散列鍵,并將整合后的多個(gè)散列鍵與散 列表中的多個(gè)第二散列鍵進(jìn)行查表比對(duì);分析查表比對(duì)的結(jié)果;以及決定音頻比對(duì)結(jié)果。
[0020] 依據(jù)本發(fā)明一實(shí)施例,音頻比對(duì)方法還包含下列步驟:測(cè)量信心度;當(dāng)信心度達(dá) 到門檻值時(shí),則決定音頻比對(duì)結(jié)果;以及當(dāng)信心度未達(dá)門檻值時(shí),則對(duì)第一音頻樣本的一第 二音頻片段重新進(jìn)行上述音頻比對(duì)方法。
[0021] 依據(jù)本發(fā)明另一實(shí)施例,上述音頻比對(duì)方法中,第二音頻片段是接續(xù)于該第一音 頻片段。
[0022] 依據(jù)本發(fā)明又一實(shí)施例,上述音頻比對(duì)方法中,信心度為第一音頻片段中每秒比 對(duì)到的散列鍵數(shù)目。
[0023] 依據(jù)本發(fā)明更具有的一實(shí)施例,上述音頻比對(duì)方法中,各地標(biāo)特征還包含一起始 頻率、一頻率差以及一時(shí)間差。
[0024] 依據(jù)本發(fā)明再具有的一實(shí)施例,上述音頻比對(duì)方法中,各第二散列鍵的散列值還 包含一地標(biāo)特征開始時(shí)間以及一節(jié)目數(shù)據(jù)。
[0025] 依據(jù)本發(fā)明又具有的一實(shí)施例,上述音頻比對(duì)方法中,估算辨識(shí)難易度時(shí),還利用 第一音頻片段的絕對(duì)音量的平均值、相對(duì)音量的標(biāo)準(zhǔn)差、三次微分絕對(duì)值加總的標(biāo)準(zhǔn)差中 的一者或其組合或上述三者的組合。
[0026] 依據(jù)本發(fā)明另具有的一實(shí)施例,上述音頻比對(duì)方法中,整合第一散列鍵的步驟還 包含:當(dāng)兩個(gè)第一散列鍵相同時(shí),刪除該兩個(gè)第一散列鍵其中之一。
[0027] 本發(fā)明的又一方面是在提供一種計(jì)算機(jī)可讀取記錄媒體,儲(chǔ)存一計(jì)算機(jī)程序,用 以執(zhí)行一種音頻比對(duì)方法,音頻比對(duì)方法包含下列步驟:
[0028] 估算第一音頻樣本的一第一音頻片段的辨識(shí)難易度;根據(jù)辨識(shí)難易度,決定地標(biāo) 特征擷取的次數(shù),并對(duì)第一音頻片段進(jìn)行相對(duì)應(yīng)次數(shù)的地標(biāo)特征擷取,以產(chǎn)生多個(gè)地標(biāo)特 征;將地標(biāo)特征編碼為多個(gè)第一散列鍵;整合第一散列鍵,并將整合后的多個(gè)散列鍵與散 列表中的多個(gè)第二散列鍵進(jìn)行查表比對(duì);分析查表比對(duì)的結(jié)果;以及決定音頻比對(duì)結(jié)果。
[0029] 應(yīng)用本發(fā)明的優(yōu)點(diǎn)在于可依音頻片段的音頻特征將取樣音框平移,并多次計(jì)算地 標(biāo)特征以減少音頻片段的取樣音框與音頻樣本的取樣音框不對(duì)齊的影響,如此可有效提高 音頻比對(duì)的正確率。另外,使用者可以循序上傳音頻片段的信息至服務(wù)器進(jìn)行辨識(shí),并在信 心度達(dá)到門檻值后即回傳比對(duì)結(jié)果,如此可有效減少音頻比對(duì)所需的等待時(shí)間,并減少服 務(wù)器的運(yùn)算量,而輕易地達(dá)到上述的目的。
【附圖說明】
[0030] 圖1為本發(fā)明一實(shí)施例中,一種計(jì)算機(jī)系統(tǒng)的方塊示意圖。
[0031] 圖2為本發(fā)明一實(shí)施例中,對(duì)音頻片段進(jìn)行地標(biāo)特征擷取的示意圖。
[0032] 圖3為本發(fā)明一實(shí)施例中,對(duì)音頻片段進(jìn)行地標(biāo)特征擷取的示意圖。
[0033] 圖4為本發(fā)明一實(shí)施例中,一種音頻比對(duì)方法的流程示意圖。
[0034] 圖5為本發(fā)明另一實(shí)施例中,一種音頻比對(duì)方法的流程示意圖。
【具體實(shí)施方式】
[0035] 下文是舉實(shí)施例配合所附附圖作詳細(xì)說明,但所提供的實(shí)施例并非用以限制本發(fā) 明所涵蓋的范圍,而結(jié)構(gòu)運(yùn)作的描述非用以限制其執(zhí)行的順序,任何由元件重新組合的結(jié) 構(gòu),所產(chǎn)生具有均等功效的裝置,皆為本發(fā)明所涵蓋的范圍。此外,附圖僅以說明為目的,并 未依照原尺寸作圖。為使便于理解,下述說明中相同元件將以相同的符號(hào)標(biāo)示來說明。
[0036] 在全篇說明書與權(quán)利要求書所使用的用詞(terms),除有特別注明外,通常具有每 個(gè)用詞使用在此領(lǐng)域中、在此揭露的內(nèi)容中與特殊內(nèi)容中的平常意義。某些用以描述本揭 露的用詞將于下或在此說明書的別處討論,以提供本領(lǐng)域技術(shù)人員在有關(guān)本揭露的描述上 額外的引導(dǎo)。
[0037]另外,關(guān)于本文中所使用的"耦接"或"連接",均可指二或多個(gè)元件相互直接作實(shí) 體或電性接觸,或是相互間接作實(shí)體或電性接觸,亦可指二或多個(gè)元件
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1