一種獲取主持人姓名用來索引視頻的方法及裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及多媒體通信技術領域,特別的,涉及一種獲取主持人姓名用來索引視頻的方法及裝置。
【背景技術】
[0002]每個視頻資源上通常都有該視頻資源的索引,這些索引就相當于該視頻的關鍵詞,便于用戶在網(wǎng)絡上通過輸入關鍵詞搜索相應視頻。
[0003]由于視頻文件在播放時用戶常常關注的是視頻中的影像,如人物等中心內(nèi)容,因此在檢索時通常通過輸入人物名稱來檢索。一些影視劇方面的視頻,通常會演員的姓名作為索引。但是針對一些新聞或綜藝節(jié)目類的視頻,若用戶想通過輸入主持人姓名進行檢索時,常常很少能得到理想的檢索結果。這是因為新聞或綜藝節(jié)目類的視頻往往注重的是新聞中的播放的消息內(nèi)容或綜藝節(jié)目里的各項節(jié)目信息,因此這類視頻的索引關鍵詞通常是標題、事件或曲名等。由于沒有這樣的用主持人的姓名做索引的視頻,因此若想通過輸入主持人姓名來檢索視頻文件,通常檢索不到相應的視頻資源。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種獲取主持人姓名用來索引視頻的方法及裝置,用以解決現(xiàn)有技術中由于視頻沒有用主持人姓名作為索引所導致的用戶無法通過輸入主持人姓名來搜索視頻、搜索效率低下的技術問題。
[0005]一方面,本發(fā)明實施例提供一種獲取主持人姓名用來索引視頻的方法,該方法包括:
[0006]獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);
[0007]從所述一段音頻數(shù)據(jù)中提取出聲音特點信息;
[0008]將所述聲音特點信息與預存的各主持人的聲音特點信息進行匹配;
[0009]根據(jù)匹配成功的預存的主持人的聲音特點信息所對應的主持人姓名,確定所述視頻中的主持人姓名;
[0010]用所述確定的主持人姓名標引所述視頻。
[0011]本發(fā)明實施例的一些有益效果可以包括:通過將從需要主持人索引視頻中提取出的聲音特點信息與預存的各主持人的聲音特定信息進行匹配,進而確定該視頻的主持人姓名的技術手段,解決了現(xiàn)有技術中沒有為視頻標引主持人的技術問題,進而可以實現(xiàn)方便用戶通過主持人姓名檢索視頻文件,提高檢索效率的技術效果。
[0012]在本發(fā)明的另一個實施方式中,所述獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)包括:
[0013]截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。
[0014]可選的,所述η分鐘為3-6分鐘。
[0015]本發(fā)明實施例的一些有益效果可以包括:視頻的整個播放過程有可能很長,全部用來做分析浪費資源,因此適當?shù)慕厝∫曨l中包含主持人姓名的前η分鐘部分的音頻數(shù)據(jù)用來做分析便于提高分析主持人的處理速度,并且通常前部分時段的視頻中主持人聲音播報的幾率和內(nèi)容較高,同時也可以提高分析的效率。
[0016]在本發(fā)明的另一個實施例中,所述從所述一段音頻數(shù)據(jù)中提取出聲音特點信息包括:
[0017]對所述音頻數(shù)據(jù)進行音頻采樣得到音頻采樣點;
[0018]根據(jù)所述音頻采樣點確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點信息。
[0019]本發(fā)明實施例的一些有益效果可以包括:采用將從音頻中分析出的聲音的規(guī)律數(shù)據(jù)作為聲音特點信息的技術手段,可以較準確的確定主持人的聲音,進而能夠?qū)崿F(xiàn)較精確的確定視頻中的主持人姓名。
[0020]進一步地,該方法還包括:
[0021]預先獲取各主持人的聲音的音頻數(shù)據(jù);
[0022]對所述各主持人的聲音的音頻數(shù)據(jù)進行采樣得到相應的音頻采樣點;
[0023]根據(jù)所述相應的音頻采樣點確定各主持人的聲音的規(guī)律數(shù)據(jù);
[0024]存儲各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對應關系。
[0025]本發(fā)明實施例的一些有益效果可以包括:通過預先存儲各個主持人姓名的聲音的規(guī)律數(shù)據(jù),可以便于與視頻中分析出的主持人的聲音進行匹配,進而實現(xiàn)快速、準確的為視頻標引主持人姓名的技術效果。
[0026]另一方面,本發(fā)明實施例提供一種獲取主持人姓名用來索引視頻的裝置,包括:
[0027]獲取模塊,用于獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);
[0028]提取模塊,用于從所述一段音頻數(shù)據(jù)中提取出聲音特點信息;
[0029]匹配模塊,用于將所述聲音特點信息與預存的各主持人的聲音特點信息進行匹配;
[0030]確定模塊,用于根據(jù)匹配成功的預存的主持人的聲音特點信息所對應的主持人姓名,確定所述視頻中的主持人姓名;
[0031]標引模塊,用于用所述確定的主持人姓名標引所述視頻。
[0032]本發(fā)明實施例的一些有益效果可以包括:具有將從需要主持人索引視頻中提取出的聲音特點信息與預存的各主持人的聲音特定信息進行匹配,進而確定該視頻的主持人姓名的功能,解決了現(xiàn)有技術中沒有為視頻標引主持人的技術問題,進而可以實現(xiàn)方便用戶通過主持人姓名檢索視頻文件,提高檢索效率的技術效果。
[0033]在本發(fā)明的另一個實施例中,所述獲取模塊,具體用于截取需要主持人索引的視頻的前η分鐘的音頻數(shù)據(jù)。
[0034]其中,所述η分鐘為3-6分鐘。
[0035]本發(fā)明實施例的一些有益效果可以包括:視頻的整個播放過程有可能很長,全部用來做分析浪費資源,因此適當?shù)慕厝∫曨l中包含主持人姓名的前η分鐘部分的音頻數(shù)據(jù)用來做分析便于提高分析主持人的處理速度,并且通常前部分時段的視頻中主持人聲音播報的幾率和內(nèi)容較高,同時也可以提高分析的效率。
[0036]在本發(fā)明的另一個實施例中,所述提取模塊包括:
[0037]采樣單元,用于對所述音頻數(shù)據(jù)進行音頻采樣得到音頻采樣點;
[0038]確定單元,用于根據(jù)所述音頻采樣點確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點信息。
[0039]本發(fā)明實施例的一些有益效果可以包括:具有將從音頻中分析出的聲音的規(guī)律數(shù)據(jù)作為聲音特點信息的功能,可以較準確的確定主持人的聲音,進而能夠?qū)崿F(xiàn)較精確的確定視頻中的主持人姓名。
[0040]在本發(fā)明的另一個實施例中,該裝置還包括:
[0041]預取模塊,用于預先獲取各主持人的聲音的音頻數(shù)據(jù),對所述各主持人的聲音的音頻數(shù)據(jù)進行采樣得到相應的音頻采樣點;根據(jù)所述相應的音頻采樣點確定各主持人的聲音的規(guī)律數(shù)據(jù);
[0042]存儲模塊,用于存儲各主持人的聲音的規(guī)律數(shù)據(jù)以及所述各主持人的聲音的規(guī)律數(shù)據(jù)與主持人姓名的對應關系。
[0043]本發(fā)明實施例的一些有益效果可以包括:通過預先存儲各個主持人姓名的聲音的規(guī)律數(shù)據(jù),可以便于與視頻中分析出的主持人的聲音進行匹配,進而實現(xiàn)快速、準確的為視頻標引主持人姓名的技術效果。
[0044]本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權利要求書、以及附圖中所特別指出的結構來實現(xiàn)和獲得。
[0045]下面通過附圖和實施例,對本發(fā)明的技術方案做進一步的詳細描述。
【附圖說明】
[0046]附圖用來提供對本發(fā)明的進一步理解,并且構成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構成對本發(fā)明的限制。在附圖中:
[0047]圖1為本發(fā)明實施例中提供一種獲取主持人姓名用來索引視頻的方法的示例性流程圖;
[0048]圖2為本發(fā)明實施例中提供一種獲取主持人姓名用來索引視頻的方法的另一示例性流程圖;
[0049]圖3為本發(fā)明實施例中提供一種獲取主持人姓名用來索引視頻的方法的再一示例性流程圖;
[0050]圖4為本發(fā)明實施例中提供一種獲取主持人姓名用來索引視頻的裝置的一示例性結構圖;
[0051]圖5為本發(fā)明實施例中提供一種獲取主持人姓名用來索引視頻的裝置的一示例性結構圖。
【具體實施方式】
[0052]以下結合附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0053]本實施例提供一種獲取主持人姓名用來索引視頻的方法,該方法適合部署在需要實現(xiàn)為視頻獲取主持人姓名的設備或裝置上,例如PC機或服務器上等。如圖1所示,該方法包括:
[0054]101,獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù);
[0055]視頻文件通常是有聲音和圖像組成的,因此視頻文件都有對應的音頻數(shù)據(jù)。具體的獲取音頻數(shù)據(jù)的方式獲取的方式可以是人工選定的一段視頻上的音頻,可以是指定的一段時間段內(nèi)的音頻,甚至是隨機的選取也可以。
[0056]102,從所述一段音頻數(shù)據(jù)中提取出聲音特點信息;
[0057]根據(jù)獲取出的這段音頻數(shù)據(jù)從中提取出該段音頻數(shù)據(jù)中錄制的人物語音方面的聲音特點信息。例如新聞主播的說話聲音的聲音特定信息。
[0058]103,將所述聲音特點信息與預存的各主持人的聲音特點信息進行匹配;
[0059]104,根據(jù)匹配成功的預存的主持人的聲音特點信息所對應的主持人姓名,確定所述視頻中的主持人姓名;
[0060]每個預存的主持人的聲音特定信息都可對應到相應的主持人姓名,因此匹配到預存的主持人的聲音特定信息后,便可確定到相應的主持人姓名。
[0061 ] 105,用所述確定的主持人姓名標弓I所述視頻。
[0062]將確定的主持人姓名作為索引標注該視頻。
[0063]在本發(fā)明的另一個實施方式中,上述101中的獲取需要主持人索引的視頻中的一段音頻數(shù)據(jù)包括:
[0064]截取需要主持人索引的視頻的前n(n為自然數(shù))分鐘的音頻數(shù)據(jù)。
[0065]可選的,η分鐘為3_6分鐘。
[0066]在本發(fā)明的另一個實施方式中,上述102中的從所述一段音頻數(shù)據(jù)中提取出聲音特點信息包括:
[0067]對所述音頻數(shù)據(jù)進行音頻采樣得到音頻采樣點;根據(jù)所述音頻采樣點確定所述需要主持人索引的視頻中聲音的規(guī)律數(shù)據(jù),將規(guī)律數(shù)據(jù)作為聲音特點信息。<