br>[0068]對(duì)音頻采用后得到的音頻采樣點(diǎn)可以從中分析出視頻上說話人的聲音特定,即規(guī)律數(shù)據(jù)。例如音頻,音色,振幅的波形圖和音線譜等等。這采用現(xiàn)有的聲音分析軟件實(shí)現(xiàn)。
[0069]在本發(fā)明的另一個(gè)實(shí)施方式中,該方法還包括:
[0070]預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù);
[0071]對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn);
[0072]根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù);
[0073]存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0074]本實(shí)施例繼續(xù)提供一種獲取主持人姓名用來索引視頻的方法,在執(zhí)行該方法之前,如圖2所示,需要先執(zhí)行如下預(yù)先存儲(chǔ)各主持人聲音信息的方案,包括:
[0075]201,預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù);
[0076]202,對(duì)各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn);
[0077]例如對(duì)分別Α、B、C、D四個(gè)主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到Α、B、C、D四個(gè)主持人的音頻采樣點(diǎn)。
[0078]203,根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù);
[0079]例如根據(jù)A的音頻采樣點(diǎn)通過聲音分析軟件得到A主持人的聲音的規(guī)律數(shù)據(jù)a,用以唯一標(biāo)記A的聲音特點(diǎn)。B、C、D主持人的音頻采樣點(diǎn)也同樣處理。
[0080]204,存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0081]例如:建立一個(gè)聲音數(shù)據(jù)庫(kù),庫(kù)中存儲(chǔ)規(guī)律數(shù)據(jù)a及該規(guī)律數(shù)據(jù)a對(duì)應(yīng)的主持人姓名為A。
[0082]預(yù)先儲(chǔ)備各個(gè)主持人的音頻,得到音頻采樣點(diǎn)和主持人姓名的對(duì)應(yīng)關(guān)系后,如圖3所示,該一種獲取主持人姓名用來索引視頻的方法包括:
[0083]301,截取需要主持人索引的視頻的前5分鐘的音頻數(shù)據(jù)。
[0084]302,對(duì)該5分鐘的音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn);
[0085]303,根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。
[0086]304,將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配;
[0087]即將從視頻中得到的規(guī)律數(shù)據(jù)與聲音數(shù)據(jù)庫(kù)中的各規(guī)律數(shù)據(jù)進(jìn)行匹配。例如視頻中得到的規(guī)律數(shù)據(jù)與聲音數(shù)據(jù)庫(kù)中的規(guī)律數(shù)據(jù)c相匹配。
[0088]305,根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名;
[0089]例如c對(duì)應(yīng)的主持人姓名為C,則確定該視頻中的主持人姓名為C。
[0090]306,用所述確定的主持人姓名標(biāo)引所述視頻。
[0091]本實(shí)施例提供的方案采用將從需要主持人索引視頻中提取出的聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特定信息進(jìn)行匹配,進(jìn)而確定該視頻的主持人姓名的技術(shù)手段,解決了現(xiàn)有技術(shù)中沒有為視頻標(biāo)引主持人的技術(shù)問題,進(jìn)而可以實(shí)現(xiàn)方便用戶通過主持人姓名檢索視頻文件,提高檢索效率的技術(shù)效果。
[0092]為了便于上述實(shí)施例1或3中的方法實(shí)現(xiàn),本實(shí)施例繼續(xù)提供一種獲取主持人姓名用來索引視頻的裝置,如圖4所示,包括:
[0093]獲取模塊41,用于獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);
[0094]提取模塊42,用于從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息;
[0095]匹配模塊43,用于將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配;
[0096]確定模塊44,用于根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名;
[0097]標(biāo)引模塊45,用于用所述確定的主持人姓名標(biāo)引所述視頻。
[0098]進(jìn)一步地,所述獲取模塊41,具體用于截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。其中,所述η分鐘為3-6分鐘。
[0099]進(jìn)一步地,所述提取模塊42包括:
[0100]采樣單元,用于對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn);
[0101]確定單元,用于根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。
[0102]為了便于上述實(shí)施例圖2中的方法實(shí)現(xiàn),如圖5所示,該裝置還包括:
[0103]預(yù)取模塊46,用于預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù),對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn);根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù);
[0104]存儲(chǔ)模塊47,用于存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0105]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0106]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0107]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0108]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0109]顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【主權(quán)項(xiàng)】
1.一種獲取主持人姓名用來索引視頻的方法,其特征在于,包括: 獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù); 從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息; 將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配; 根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名; 用所述確定的主持人姓名標(biāo)引所述視頻。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)包括: 截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息包括: 對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn); 根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法還包括: 預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù); 對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn); 根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù); 存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述η分鐘為3-6分鐘。6.一種獲取主持人姓名用來索引視頻的裝置,其特征在于,包括: 獲取模塊,用于獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù); 提取模塊,用于從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息; 匹配模塊,用于將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配; 確定模塊,用于根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名; 標(biāo)引模塊,用于用所述確定的主持人姓名標(biāo)引所述視頻。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取模塊,具體用于截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述提取模塊包括: 采樣單元,用于對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn); 確定單元,用于根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,該裝置還包括: 預(yù)取模塊,用于預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù),對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn);根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù); 存儲(chǔ)模塊,用于存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。10.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述η分鐘為3-6分鐘。
【專利摘要】本發(fā)明公開了一種獲取主持人姓名用來索引視頻的方法及裝置,涉及多媒體通信技術(shù)領(lǐng)域。其中,方法包括:獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息;將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配;根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名,確定所述視頻中的主持人姓名;用所述確定的主持人姓名標(biāo)引所述視頻。
【IPC分類】H04N21/231, G10L17/04
【公開號(hào)】CN104994400
【申請(qǐng)?zhí)枴緾N201510392691
【發(fā)明人】吳曉龍
【申請(qǐng)人】無錫天脈聚源傳媒科技有限公司
【公開日】2015年10月21日
【申請(qǐng)日】2015年7月6日