一種聲音錄制的方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種聲音錄制的方法及裝置,用以減少音頻文件中空白沒(méi)有聲音的片段,提高音頻文件的有效性,進(jìn)而提高網(wǎng)絡(luò)傳輸效率。其中方法包括:進(jìn)行數(shù)據(jù)實(shí)時(shí)采集,獲得當(dāng)前聲音片段文件;判斷當(dāng)前聲音片段文件內(nèi)是否存在聲音;如果存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則在打開(kāi)的音頻文件中寫(xiě)入當(dāng)前聲音片段文件,否則建立新的音頻文件,并將新的音頻文件作為打開(kāi)的音頻文件并將當(dāng)前聲音片段文件寫(xiě)入;如果不存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存,并丟棄當(dāng)前聲音片段文件;否則直接丟棄當(dāng)前聲音片段文件。
【專利說(shuō)明】一種聲音錄制的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻處理【技術(shù)領(lǐng)域】,特別涉及一種聲音錄制的方法及裝置。
【背景技術(shù)】
[0002]語(yǔ)音采集的一個(gè)重要環(huán)節(jié)是將用戶發(fā)送的語(yǔ)音信號(hào)進(jìn)行錄制,然后由語(yǔ)音采集系統(tǒng)采用相關(guān)的語(yǔ)音數(shù)據(jù)算法對(duì)錄制生成的音頻信號(hào)進(jìn)行語(yǔ)音分析。在現(xiàn)有技術(shù)中,用戶啟動(dòng)語(yǔ)音采集功能后,系統(tǒng)會(huì)通過(guò)麥克風(fēng)開(kāi)始錄音,然而,在實(shí)際的使用過(guò)程中,麥克風(fēng)在錄音時(shí)是不會(huì)考慮中間有沒(méi)有聲音的,一般都是從頭錄到尾,生成一個(gè)語(yǔ)音文件。另外,在錄制過(guò)程中,也不會(huì)考慮背景噪音的影響。
[0003]這樣錄制的聲音,里面很多空白沒(méi)有聲音的片段,會(huì)造成有效內(nèi)容不多,而且文件較大,不利于通過(guò)網(wǎng)絡(luò)進(jìn)行傳輸。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種聲音錄制的方法及裝置,用以減少音頻文件中空白沒(méi)有聲音的片段,提聞首頻文件的有效性,進(jìn)而提聞網(wǎng)絡(luò)傳輸效率。
[0005]本發(fā)明提供一種聲音錄制的方法,包括:
[0006]進(jìn)行數(shù)據(jù)實(shí)時(shí)采集,獲得當(dāng)前聲音片段文件;
[0007]分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音;
[0008]如果所述當(dāng)前聲音片段文件內(nèi)存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件,否則建立新的音頻文件,并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件;
[0009]如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音,則判斷是否存在所述打開(kāi)的音頻文件,是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存,并丟棄所述當(dāng)前聲音片段文件;否則直接丟棄所述當(dāng)前聲音片段文件。
[0010]優(yōu)選的,上述的方法中,所述建立新的音頻文件的步驟中:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
[0011]優(yōu)選的,上述的方法中,還包括:
[0012]將所述待傳輸音頻文件發(fā)送到遠(yuǎn)端,并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
[0013]優(yōu)選的,上述的方法中,分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:
[0014]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑績(jī)蓚€(gè)字節(jié)劃分為一個(gè)單元;
[0015]將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;
[0016]求取所有所述絕對(duì)值的平均值;
[0017]判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0018]優(yōu)選的,上述的方法中,所述分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:
[0019]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?,每四個(gè)字節(jié)劃分為一個(gè)單元;
[0020]將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;
[0021]求取所有所述絕對(duì)值的平均值;
[0022]判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0023]本發(fā)明還提供一種聲音錄制的裝置,包括:
[0024]采集單元,用于:進(jìn)行數(shù)據(jù)實(shí)時(shí)采集,獲得當(dāng)前聲音片段文件;
[0025]分析單元,用于:分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音;
[0026]存儲(chǔ)單元,用于:如果所述當(dāng)前聲音片段文件內(nèi)存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件,否則建立新的音頻文件,并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件;
[0027]丟棄單元,用于:如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音,則判斷是否存在所述打開(kāi)的音頻文件,是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存,并丟棄所述當(dāng)前聲音片段文件;否則直接丟棄所述當(dāng)前聲音片段文件。
[0028]優(yōu)選的,上述的裝置中,所述存儲(chǔ)單元,還用于:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
[0029]優(yōu)選的,上述的裝置中,還包括:
[0030]傳輸單兀,用于:發(fā)送所述待傳輸音頻文件;
[0031]遠(yuǎn)端,接收所述待傳輸音頻文件,并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
[0032]優(yōu)選的,上述的裝置中,所述分析單元,具體用于:
[0033]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?,每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元;
[0034]將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;
[0035]求取所有所述絕對(duì)值的平均值;
[0036]判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0037]優(yōu)選的,上述的裝置中,所述分析單元,具體用于:
[0038]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元;
[0039]將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;
[0040]求取所有所述絕對(duì)值的平均值;
[0041]判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0042]本發(fā)明具有以下技術(shù)效果:
[0043]I)本發(fā)明實(shí)施例中,通過(guò)判斷聲音片段文件內(nèi)是否存在聲音,從而在音頻文件中僅保留有聲音的聲音片段文件,丟棄掉沒(méi)有聲音的聲音片段文件,所以大大減少了音頻文件中空白沒(méi)有聲首的片段,提聞了首頻文件的有效性,進(jìn)而提聞了網(wǎng)絡(luò)傳輸效率。
[0044]2)本發(fā)明實(shí)施例中,通過(guò)對(duì)聲音片段文件進(jìn)行單元?jiǎng)澐?,并通過(guò)求取各單元絕對(duì)值的平均值的方式,來(lái)確定聲音片段文件是否有聲音,這種方法比較準(zhǔn)確,充分考慮了背景噪音的影響,不會(huì)造成誤判。
[0045]3)本發(fā)明實(shí)施例中,通過(guò)每四個(gè)字節(jié)劃分為一個(gè)單元,并僅求取每個(gè)單元的前兩個(gè)字節(jié)的方式,大大提高了處理效率,并且保持了語(yǔ)音識(shí)別的準(zhǔn)確率。
[0046]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述,并且,部分地從說(shuō)明書(shū)中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫(xiě)的說(shuō)明書(shū)、權(quán)利要求書(shū)、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
[0047]下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【專利附圖】
【附圖說(shuō)明】
[0048]附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
[0049]圖1為本發(fā)明實(shí)施例聲音錄制方法的流程圖;
[0050]圖2為本發(fā)明實(shí)施例聲音錄制裝置的示意圖;
[0051]圖3為本發(fā)明另一實(shí)施例的聲音錄制方法的流程圖。
【具體實(shí)施方式】
[0052]以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說(shuō)明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0053]圖1為本發(fā)明實(shí)施例聲音錄制方法的流程圖,如圖1所示,發(fā)明實(shí)施例的一種聲音錄制的方法,包括:
[0054]進(jìn)行數(shù)據(jù)實(shí)時(shí)采集,獲得當(dāng)前聲音片段文件;
[0055]分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音;
[0056]如果所述當(dāng)前聲音片段文件內(nèi)存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件,否則建立新的音頻文件,并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件;
[0057]如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音,則判斷是否存在所述打開(kāi)的音頻文件,是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存,并丟棄所述當(dāng)前聲音片段文件;否則直接丟棄所述當(dāng)前聲音片段文件。
[0058]可見(jiàn),本發(fā)明實(shí)施例中,通過(guò)判斷聲音片段文件內(nèi)是否存在聲音,從而在音頻文件中僅保留有聲音的聲音片段文件,丟棄掉沒(méi)有聲音的聲音片段文件,所以大大減少了音頻文件中空白沒(méi)有聲首的片段,提聞了首頻文件的有效性,進(jìn)而提聞了網(wǎng)絡(luò)傳輸效率。
[0059]在本發(fā)明的一個(gè)實(shí)施例中,在所述建立新的音頻文件的步驟中:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。還包括:將所述待傳輸音頻文件發(fā)送到遠(yuǎn)端,并通過(guò)所述時(shí)間戳確定文件播放的先后順序。通過(guò)這種時(shí)間戳的方式,很容易確定文件的播放順序。
[0060]在本發(fā)明的一個(gè)實(shí)施例中,分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:
[0061]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?,每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元;
[0062]將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;
[0063]求取所有所述絕對(duì)值的平均值;
[0064]判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0065]可見(jiàn),本發(fā)明實(shí)施例中,通過(guò)對(duì)聲音片段文件進(jìn)行單元?jiǎng)澐郑⑼ㄟ^(guò)求取各單元絕對(duì)值的平均值的方式,來(lái)確定聲音片段文件是否有聲音,這種方法比較準(zhǔn)確,充分考慮了背景噪音的影響,不會(huì)造成誤判。
[0066]在本發(fā)明的另一個(gè)實(shí)施例中,所述分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元;將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;求取所有所述絕對(duì)值的平均值;判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0067]可見(jiàn),通過(guò)每四個(gè)字節(jié)劃分為一個(gè)單元,并僅求取每個(gè)單元的前兩個(gè)字節(jié)的方式,大大提高了處理效率,并保持了語(yǔ)音識(shí)別的準(zhǔn)確率,不會(huì)漏掉語(yǔ)音。
[0068]圖2為本發(fā)明實(shí)施例聲音錄制裝置的示意圖,如圖2所示,一種聲音錄制的裝置,包括:
[0069]采集單元201,用于:進(jìn)行數(shù)據(jù)實(shí)時(shí)采集,獲得當(dāng)前聲音片段文件;
[0070]分析單元202,用于:分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音;
[0071]存儲(chǔ)單元203,用于:如果所述當(dāng)前聲音片段文件內(nèi)存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件,否則建立新的音頻文件,并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件;
[0072]丟棄單元204,用于:如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音,則判斷是否存在所述打開(kāi)的音頻文件,是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存,并丟棄所述當(dāng)前聲音片段文件;否則直接丟棄所述當(dāng)前聲音片段文件。
[0073]在本發(fā)明的一個(gè)實(shí)施例中,所述存儲(chǔ)單元,還用于:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。還包括:傳輸單元,用于:發(fā)送所述待傳輸音頻文件;遠(yuǎn)端,接收所述待傳輸音頻文件,并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
[0074]在本發(fā)明的一個(gè)實(shí)施例中,所述分析單元,具體用于:將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?,每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元;將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;求取所有所述絕對(duì)值的平均值;判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0075]在本發(fā)明的另一個(gè)實(shí)施例中,所述分析單元,具體用于:將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元;將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值;求取所有所述絕對(duì)值的平均值;判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0076]圖3為本發(fā)明另一實(shí)施例的聲音錄制方法的流程圖,該實(shí)施例是語(yǔ)音碎片化錄制方法及傳輸方法,其通過(guò)directshow(是微軟公司提供的一套在Windows平臺(tái)上進(jìn)行流媒體處理的開(kāi)發(fā)包)進(jìn)行錄音時(shí),會(huì)邊錄音邊對(duì)聲音進(jìn)行分析,將有聲音的部分進(jìn)行錄制,沒(méi)有聲音的部分不進(jìn)行錄制,這樣會(huì)形成一系列只包含有內(nèi)容的聲音碎片文件,每個(gè)文件會(huì)按照時(shí)間順序標(biāo)記文件ID號(hào)和時(shí)間標(biāo)簽,在通過(guò)網(wǎng)絡(luò)傳輸后,在接收端根據(jù)文件ID號(hào)和時(shí)間標(biāo)簽進(jìn)行聲音碎片重組。本發(fā)明實(shí)施例可用于遠(yuǎn)程會(huì)議、教學(xué)等等各種場(chǎng)景,具有很強(qiáng)的應(yīng)用前景。
[0077]如圖3所示,本發(fā)明實(shí)施例在用戶指定聲音輸入設(shè)備或者默認(rèn)聲音輸入設(shè)備后,利用directshow進(jìn)行聲音采集,在實(shí)時(shí)采集的過(guò)程中,會(huì)不間斷的從聲音輸入設(shè)備中獲取WAV格式(是錄音時(shí)用的標(biāo)準(zhǔn)的WINDOWS文件格式)的聲音數(shù)據(jù),每次獲取到一段聲音數(shù)據(jù)后,對(duì)本段聲音數(shù)據(jù)按照每?jī)蓚€(gè)字節(jié)一個(gè)單位進(jìn)行轉(zhuǎn)換為16位有符號(hào)的整數(shù),對(duì)得到整數(shù)的絕對(duì)值求和后計(jì)算出平均數(shù),根據(jù)本方法事先指定的閾值進(jìn)行判斷,如果大于等于此閾值,表不此段聲音數(shù)據(jù)是存在聲音的,如果小于此閾值,表不此段聲音數(shù)據(jù)不存在聲音,本發(fā)明實(shí)施例為提高效率,是按照每四個(gè)字節(jié)取前兩個(gè)字節(jié)進(jìn)行轉(zhuǎn)換,對(duì)整體效果無(wú)影響;
[0078]判斷存在聲音時(shí),如果之前沒(méi)有聲音,則生成新的以一個(gè)唯一的32位id和當(dāng)前時(shí)間戳命名的音頻文件,保存此id和時(shí)間戳,在新的音頻文件中寫(xiě)入此聲音數(shù)據(jù),如果之前就已經(jīng)存在聲音,則在打開(kāi)的音頻文件中寫(xiě)入此聲音數(shù)據(jù)到文件結(jié)尾;判斷不存在聲音時(shí),如果之前沒(méi)有聲音,放棄此聲音數(shù)據(jù)不做其它處理,如果之前已經(jīng)存在聲音,則放棄此聲音數(shù)據(jù),將當(dāng)前打開(kāi)的聲音文件保存后關(guān)閉流,并且保存此文件以毫秒為單位的時(shí)長(zhǎng);
[0079]當(dāng)關(guān)閉一個(gè)音頻文件流后可以開(kāi)啟一個(gè)新的線程將這個(gè)文件上傳到遠(yuǎn)端,在上傳完畢后,將此文件的詳細(xì)信息(包括文件名、開(kāi)始時(shí)間的時(shí)間戳、id、時(shí)長(zhǎng))發(fā)送到遠(yuǎn)端,遠(yuǎn)端可以根據(jù)文件名稱找到在遠(yuǎn)端的文件,根據(jù)開(kāi)始時(shí)間的時(shí)間戳確定文件的先后順序,并可根據(jù)開(kāi)始時(shí)間的時(shí)間戳確定文件的播放時(shí)間。不再需要采集時(shí),停止采集,不再獲取聲音數(shù)據(jù)。
[0080]由上可知,本發(fā)明實(shí)施例具有以下優(yōu)勢(shì):
[0081]I)本發(fā)明實(shí)施例中,通過(guò)判斷聲音片段文件內(nèi)是否存在聲音,從而在音頻文件中僅保留有聲音的聲音片段文件,丟棄掉沒(méi)有聲音的聲音片段文件,所以大大減少了音頻文件中空白沒(méi)有聲首的片段,提聞了首頻文件的有效性,進(jìn)而提聞了網(wǎng)絡(luò)傳輸效率。
[0082]2)本發(fā)明實(shí)施例中,通過(guò)對(duì)聲音片段文件進(jìn)行單元?jiǎng)澐郑⑼ㄟ^(guò)求取各單元絕對(duì)值的平均值的方式,來(lái)確定聲音片段文件是否有聲音,這種方法比較準(zhǔn)確,充分考慮了背景噪音的影響,不會(huì)造成誤判。
[0083]3)本發(fā)明實(shí)施例中,通過(guò)每四個(gè)字節(jié)劃分為一個(gè)單元,并僅求取每個(gè)單元的前兩個(gè)字節(jié)的方式,大大提高了處理效率,并且保持了語(yǔ)音識(shí)別的準(zhǔn)確率。
[0084]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0085]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0086]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0087]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0088]顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【權(quán)利要求】
1.一種聲音錄制的方法,其特征在于,包括: 進(jìn)行數(shù)據(jù)實(shí)時(shí)采集,獲得當(dāng)前聲音片段文件; 分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音; 如果所述當(dāng)前聲音片段文件內(nèi)存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件,否則建立新的音頻文件,并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件;如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音,則判斷是否存在所述打開(kāi)的音頻文件,是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存,并丟棄所述當(dāng)前聲音片段文件;否則直接丟棄所述當(dāng)前聲音片段文件。
2.如權(quán)利要求1所述的方法,其特征在于,所述建立新的音頻文件的步驟中:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
3.如權(quán)利要求2所述的方法,其特征在于,還包括: 將所述待傳輸音頻文件發(fā)送到遠(yuǎn)端,并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
4.如權(quán)利要求1、2或3所述的方法,其特征在于,分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?,每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元; 將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值; 求取所有所述絕對(duì)值的平均值; 判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
5.如權(quán)利要求1、2或3所述的方法,其特征在于,所述分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?,每四個(gè)字節(jié)劃分為一個(gè)單元; 將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值; 求取所有所述絕對(duì)值的平均值; 判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
6.一種聲音錄制的裝置,其特征在于,包括: 采集單元,用于:進(jìn)行數(shù)據(jù)實(shí)時(shí)采集,獲得當(dāng)前聲音片段文件; 分析單元,用于:分析所述當(dāng)前聲音片段文件,判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音; 存儲(chǔ)單元,用于:如果所述當(dāng)前聲音片段文件內(nèi)存在聲音,則判斷是否存在打開(kāi)的音頻文件,是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件,否則建立新的音頻文件,并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的首頻文件; 丟棄單元,用于:如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音,則判斷是否存在所述打開(kāi)的音頻文件,是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存,并丟棄所述當(dāng)前聲音片段文件;否則直接丟棄所述當(dāng)前聲音片段文件。
7.如權(quán)利要求6所述的裝置,其特征在于,所述存儲(chǔ)單元,還用于:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
8.如權(quán)利要求7所述的裝置,其特征在于,還包括: 傳輸單元,用于:發(fā)送所述待傳輸音頻文件; 遠(yuǎn)端,接收所述待傳輸音頻文件,并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
9.如權(quán)利要求6、7或8所述的裝置,其特征在于,所述分析單元,具體用于: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?,每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元; 將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值; 求取所有所述絕對(duì)值的平均值; 判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
10.如權(quán)利要求6、7或8所述的裝置,其特征在于,所述分析單元,具體用于: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元; 將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù),并取所述整數(shù)的絕對(duì)值; 求取所有所述絕對(duì)值的平均值; 判斷所述平均值是否大于預(yù)定閾值,是則所述當(dāng)前聲音片段文件內(nèi)存在聲音,否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
【文檔編號(hào)】G10L25/78GK104202321SQ201410443068
【公開(kāi)日】2014年12月10日 申請(qǐng)日期:2014年9月2日 優(yōu)先權(quán)日:2014年9月2日
【發(fā)明者】楊金偉 申請(qǐng)人:上海天脈聚源文化傳媒有限公司