一種獲取主持人姓名用來索引視頻的方法及裝置的制造方法_2

文檔序號(hào)：9277095閱讀：來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)>一種獲取主持人姓名用來索引視頻的方法及裝置的制造方法

br>[0068]對(duì)音頻采用后得到的音頻采樣點(diǎn)可以從中分析出視頻上說話人的聲音特定，即規(guī)律數(shù)據(jù)。例如音頻，音色，振幅的波形圖和音線譜等等。這采用現(xiàn)有的聲音分析軟件實(shí)現(xiàn)。
[0069]在本發(fā)明的另一個(gè)實(shí)施方式中，該方法還包括:
[0070]預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù)；
[0071]對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn)；
[0072]根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù)；
[0073]存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0074]本實(shí)施例繼續(xù)提供一種獲取主持人姓名用來索引視頻的方法，在執(zhí)行該方法之前，如圖2所示，需要先執(zhí)行如下預(yù)先存儲(chǔ)各主持人聲音信息的方案，包括:
[0075]201，預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù)；
[0076]202，對(duì)各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn)；
[0077]例如對(duì)分別Α、B、C、D四個(gè)主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到Α、B、C、D四個(gè)主持人的音頻采樣點(diǎn)。
[0078]203，根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù)；
[0079]例如根據(jù)A的音頻采樣點(diǎn)通過聲音分析軟件得到A主持人的聲音的規(guī)律數(shù)據(jù)a，用以唯一標(biāo)記A的聲音特點(diǎn)。B、C、D主持人的音頻采樣點(diǎn)也同樣處理。
[0080]204，存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0081]例如:建立一個(gè)聲音數(shù)據(jù)庫(kù)，庫(kù)中存儲(chǔ)規(guī)律數(shù)據(jù)a及該規(guī)律數(shù)據(jù)a對(duì)應(yīng)的主持人姓名為A。
[0082]預(yù)先儲(chǔ)備各個(gè)主持人的音頻，得到音頻采樣點(diǎn)和主持人姓名的對(duì)應(yīng)關(guān)系后，如圖3所示，該一種獲取主持人姓名用來索引視頻的方法包括:
[0083]301，截取需要主持人索引的視頻的前5分鐘的音頻數(shù)據(jù)。
[0084]302，對(duì)該5分鐘的音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn)；
[0085]303，根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù)，將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。
[0086]304，將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配；
[0087]即將從視頻中得到的規(guī)律數(shù)據(jù)與聲音數(shù)據(jù)庫(kù)中的各規(guī)律數(shù)據(jù)進(jìn)行匹配。例如視頻中得到的規(guī)律數(shù)據(jù)與聲音數(shù)據(jù)庫(kù)中的規(guī)律數(shù)據(jù)c相匹配。
[0088]305，根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名，確定所述視頻中的主持人姓名；
[0089]例如c對(duì)應(yīng)的主持人姓名為C，則確定該視頻中的主持人姓名為C。
[0090]306，用所述確定的主持人姓名標(biāo)引所述視頻。
[0091]本實(shí)施例提供的方案采用將從需要主持人索引視頻中提取出的聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特定信息進(jìn)行匹配，進(jìn)而確定該視頻的主持人姓名的技術(shù)手段，解決了現(xiàn)有技術(shù)中沒有為視頻標(biāo)引主持人的技術(shù)問題，進(jìn)而可以實(shí)現(xiàn)方便用戶通過主持人姓名檢索視頻文件，提高檢索效率的技術(shù)效果。
[0092]為了便于上述實(shí)施例1或3中的方法實(shí)現(xiàn)，本實(shí)施例繼續(xù)提供一種獲取主持人姓名用來索引視頻的裝置，如圖4所示，包括:
[0093]獲取模塊41，用于獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)；
[0094]提取模塊42，用于從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息；
[0095]匹配模塊43，用于將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配；
[0096]確定模塊44，用于根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名，確定所述視頻中的主持人姓名；
[0097]標(biāo)引模塊45，用于用所述確定的主持人姓名標(biāo)引所述視頻。
[0098]進(jìn)一步地，所述獲取模塊41，具體用于截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。其中，所述η分鐘為3-6分鐘。
[0099]進(jìn)一步地，所述提取模塊42包括:
[0100]采樣單元，用于對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn)；
[0101]確定單元，用于根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù)，將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。
[0102]為了便于上述實(shí)施例圖2中的方法實(shí)現(xiàn)，如圖5所示，該裝置還包括:
[0103]預(yù)取模塊46，用于預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù)，對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn)；根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù)；
[0104]存儲(chǔ)模塊47，用于存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。
[0105]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此，本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且，本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0106]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器，使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0107]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中，使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0108]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上，使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理，從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0109]顯然，本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【主權(quán)項(xiàng)】
1.一種獲取主持人姓名用來索引視頻的方法，其特征在于，包括: 獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)；從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息；將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配；根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名，確定所述視頻中的主持人姓名；用所述確定的主持人姓名標(biāo)引所述視頻。2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)包括: 截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。3.根據(jù)權(quán)利要求1或2所述的方法，其特征在于，所述從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息包括: 對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn)；根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù)，將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。4.根據(jù)權(quán)利要求3所述的方法，其特征在于，該方法還包括: 預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù)；對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn)；根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù)；存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。5.根據(jù)權(quán)利要求1或2所述的方法，其特征在于，所述η分鐘為3-6分鐘。6.一種獲取主持人姓名用來索引視頻的裝置，其特征在于，包括: 獲取模塊，用于獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)；提取模塊，用于從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息；匹配模塊，用于將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配；確定模塊，用于根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名，確定所述視頻中的主持人姓名；標(biāo)引模塊，用于用所述確定的主持人姓名標(biāo)引所述視頻。7.根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述獲取模塊，具體用于截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。8.根據(jù)權(quán)利要求6或7所述的裝置，其特征在于，所述提取模塊包括: 采樣單元，用于對(duì)所述音頻數(shù)據(jù)進(jìn)行音頻采樣得到音頻采樣點(diǎn)；確定單元，用于根據(jù)所述音頻采樣點(diǎn)確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù)，將規(guī)律數(shù)據(jù)作為聲音特點(diǎn)信息。9.根據(jù)權(quán)利要求8所述的裝置，其特征在于，該裝置還包括: 預(yù)取模塊，用于預(yù)先獲取各主持人的聲音的音頻數(shù)據(jù)，對(duì)所述各主持人的聲音的音頻數(shù)據(jù)進(jìn)行采樣得到相應(yīng)的音頻采樣點(diǎn)；根據(jù)所述相應(yīng)的音頻采樣點(diǎn)確定各主持人的聲音的規(guī)律數(shù)據(jù)；存儲(chǔ)模塊，用于存儲(chǔ)各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對(duì)應(yīng)關(guān)系。10.根據(jù)權(quán)利要求6或7所述的裝置，其特征在于，所述η分鐘為3-6分鐘。
【專利摘要】本發(fā)明公開了一種獲取主持人姓名用來索引視頻的方法及裝置，涉及多媒體通信技術(shù)領(lǐng)域。其中，方法包括：獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)；從所述一段音頻數(shù)據(jù)中提取出聲音特點(diǎn)信息；將所述聲音特點(diǎn)信息與預(yù)存的各主持人的聲音特點(diǎn)信息進(jìn)行匹配；根據(jù)匹配成功的預(yù)存的主持人的聲音特點(diǎn)信息所對(duì)應(yīng)的主持人姓名，確定所述視頻中的主持人姓名；用所述確定的主持人姓名標(biāo)引所述視頻。
【IPC分類】H04N21/231, G10L17/04
【公開號(hào)】CN104994400
【申請(qǐng)?zhí)枴緾N201510392691
【發(fā)明人】吳曉龍
【申請(qǐng)人】無錫天脈聚源傳媒科技有限公司
【公開日】2015年10月21日
【申請(qǐng)日】2015年7月6日

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種獲取主持人姓名用來索引視頻的方法及裝置的制造方法_2