一種聲音錄制的方法及裝置制造方法

文檔序號(hào)：2827766閱讀：179來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種聲音錄制的方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種聲音錄制的方法及裝置，用以減少音頻文件中空白沒(méi)有聲音的片段，提高音頻文件的有效性，進(jìn)而提高網(wǎng)絡(luò)傳輸效率。其中方法包括：進(jìn)行數(shù)據(jù)實(shí)時(shí)采集，獲得當(dāng)前聲音片段文件；判斷當(dāng)前聲音片段文件內(nèi)是否存在聲音；如果存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則在打開(kāi)的音頻文件中寫(xiě)入當(dāng)前聲音片段文件，否則建立新的音頻文件，并將新的音頻文件作為打開(kāi)的音頻文件并將當(dāng)前聲音片段文件寫(xiě)入；如果不存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存，并丟棄當(dāng)前聲音片段文件；否則直接丟棄當(dāng)前聲音片段文件。
【專利說(shuō)明】一種聲音錄制的方法及裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻處理【技術(shù)領(lǐng)域】，特別涉及一種聲音錄制的方法及裝置。

【背景技術(shù)】
[0002]語(yǔ)音采集的一個(gè)重要環(huán)節(jié)是將用戶發(fā)送的語(yǔ)音信號(hào)進(jìn)行錄制，然后由語(yǔ)音采集系統(tǒng)采用相關(guān)的語(yǔ)音數(shù)據(jù)算法對(duì)錄制生成的音頻信號(hào)進(jìn)行語(yǔ)音分析。在現(xiàn)有技術(shù)中，用戶啟動(dòng)語(yǔ)音采集功能后，系統(tǒng)會(huì)通過(guò)麥克風(fēng)開(kāi)始錄音，然而，在實(shí)際的使用過(guò)程中，麥克風(fēng)在錄音時(shí)是不會(huì)考慮中間有沒(méi)有聲音的，一般都是從頭錄到尾，生成一個(gè)語(yǔ)音文件。另外，在錄制過(guò)程中，也不會(huì)考慮背景噪音的影響。
[0003]這樣錄制的聲音，里面很多空白沒(méi)有聲音的片段，會(huì)造成有效內(nèi)容不多，而且文件較大，不利于通過(guò)網(wǎng)絡(luò)進(jìn)行傳輸。

【發(fā)明內(nèi)容】

[0004]本發(fā)明提供一種聲音錄制的方法及裝置，用以減少音頻文件中空白沒(méi)有聲音的片段，提聞首頻文件的有效性，進(jìn)而提聞網(wǎng)絡(luò)傳輸效率。
[0005]本發(fā)明提供一種聲音錄制的方法，包括:
[0006]進(jìn)行數(shù)據(jù)實(shí)時(shí)采集，獲得當(dāng)前聲音片段文件；
[0007]分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音；
[0008]如果所述當(dāng)前聲音片段文件內(nèi)存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件，否則建立新的音頻文件，并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件;
[0009]如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音，則判斷是否存在所述打開(kāi)的音頻文件，是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存，并丟棄所述當(dāng)前聲音片段文件；否則直接丟棄所述當(dāng)前聲音片段文件。
[0010]優(yōu)選的，上述的方法中，所述建立新的音頻文件的步驟中:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
[0011]優(yōu)選的，上述的方法中，還包括:
[0012]將所述待傳輸音頻文件發(fā)送到遠(yuǎn)端，并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
[0013]優(yōu)選的，上述的方法中，分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:
[0014]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑績(jī)蓚€(gè)字節(jié)劃分為一個(gè)單元；
[0015]將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；
[0016]求取所有所述絕對(duì)值的平均值；
[0017]判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0018]優(yōu)選的，上述的方法中，所述分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:
[0019]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?，每四個(gè)字節(jié)劃分為一個(gè)單元；
[0020]將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；
[0021]求取所有所述絕對(duì)值的平均值；
[0022]判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0023]本發(fā)明還提供一種聲音錄制的裝置，包括:
[0024]采集單元，用于:進(jìn)行數(shù)據(jù)實(shí)時(shí)采集，獲得當(dāng)前聲音片段文件；
[0025]分析單元，用于:分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音；
[0026]存儲(chǔ)單元，用于:如果所述當(dāng)前聲音片段文件內(nèi)存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件，否則建立新的音頻文件，并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件；
[0027]丟棄單元，用于:如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音，則判斷是否存在所述打開(kāi)的音頻文件，是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存，并丟棄所述當(dāng)前聲音片段文件；否則直接丟棄所述當(dāng)前聲音片段文件。
[0028]優(yōu)選的，上述的裝置中，所述存儲(chǔ)單元，還用于:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
[0029]優(yōu)選的，上述的裝置中，還包括:
[0030]傳輸單兀,用于:發(fā)送所述待傳輸音頻文件；
[0031]遠(yuǎn)端，接收所述待傳輸音頻文件，并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
[0032]優(yōu)選的，上述的裝置中，所述分析單元，具體用于:
[0033]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?，每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元；
[0034]將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；
[0035]求取所有所述絕對(duì)值的平均值；
[0036]判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0037]優(yōu)選的，上述的裝置中，所述分析單元，具體用于:
[0038]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元；
[0039]將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；
[0040]求取所有所述絕對(duì)值的平均值；
[0041]判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0042]本發(fā)明具有以下技術(shù)效果:
[0043]I)本發(fā)明實(shí)施例中，通過(guò)判斷聲音片段文件內(nèi)是否存在聲音，從而在音頻文件中僅保留有聲音的聲音片段文件，丟棄掉沒(méi)有聲音的聲音片段文件，所以大大減少了音頻文件中空白沒(méi)有聲首的片段，提聞了首頻文件的有效性，進(jìn)而提聞了網(wǎng)絡(luò)傳輸效率。
[0044]2)本發(fā)明實(shí)施例中，通過(guò)對(duì)聲音片段文件進(jìn)行單元?jiǎng)澐?，并通過(guò)求取各單元絕對(duì)值的平均值的方式，來(lái)確定聲音片段文件是否有聲音，這種方法比較準(zhǔn)確，充分考慮了背景噪音的影響，不會(huì)造成誤判。
[0045]3)本發(fā)明實(shí)施例中，通過(guò)每四個(gè)字節(jié)劃分為一個(gè)單元，并僅求取每個(gè)單元的前兩個(gè)字節(jié)的方式，大大提高了處理效率，并且保持了語(yǔ)音識(shí)別的準(zhǔn)確率。
[0046]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述，并且，部分地從說(shuō)明書(shū)中變得顯而易見(jiàn)，或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫(xiě)的說(shuō)明書(shū)、權(quán)利要求書(shū)、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
[0047]下面通過(guò)附圖和實(shí)施例，對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。

【專利附圖】

【附圖說(shuō)明】
[0048]附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解，并且構(gòu)成說(shuō)明書(shū)的一部分，與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明，并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
[0049]圖1為本發(fā)明實(shí)施例聲音錄制方法的流程圖；
[0050]圖2為本發(fā)明實(shí)施例聲音錄制裝置的示意圖；
[0051]圖3為本發(fā)明另一實(shí)施例的聲音錄制方法的流程圖。

【具體實(shí)施方式】
[0052]以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說(shuō)明，應(yīng)當(dāng)理解，此處所描述的優(yōu)選實(shí)施例僅用于說(shuō)明和解釋本發(fā)明，并不用于限定本發(fā)明。
[0053]圖1為本發(fā)明實(shí)施例聲音錄制方法的流程圖，如圖1所示，發(fā)明實(shí)施例的一種聲音錄制的方法，包括:
[0054]進(jìn)行數(shù)據(jù)實(shí)時(shí)采集，獲得當(dāng)前聲音片段文件；
[0055]分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音；
[0056]如果所述當(dāng)前聲音片段文件內(nèi)存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件，否則建立新的音頻文件，并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件;
[0057]如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音，則判斷是否存在所述打開(kāi)的音頻文件，是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存，并丟棄所述當(dāng)前聲音片段文件；否則直接丟棄所述當(dāng)前聲音片段文件。
[0058]可見(jiàn)，本發(fā)明實(shí)施例中，通過(guò)判斷聲音片段文件內(nèi)是否存在聲音，從而在音頻文件中僅保留有聲音的聲音片段文件，丟棄掉沒(méi)有聲音的聲音片段文件，所以大大減少了音頻文件中空白沒(méi)有聲首的片段，提聞了首頻文件的有效性，進(jìn)而提聞了網(wǎng)絡(luò)傳輸效率。
[0059]在本發(fā)明的一個(gè)實(shí)施例中，在所述建立新的音頻文件的步驟中:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。還包括:將所述待傳輸音頻文件發(fā)送到遠(yuǎn)端，并通過(guò)所述時(shí)間戳確定文件播放的先后順序。通過(guò)這種時(shí)間戳的方式，很容易確定文件的播放順序。
[0060]在本發(fā)明的一個(gè)實(shí)施例中，分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:
[0061]將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?，每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元；
[0062]將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；
[0063]求取所有所述絕對(duì)值的平均值；
[0064]判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0065]可見(jiàn)，本發(fā)明實(shí)施例中，通過(guò)對(duì)聲音片段文件進(jìn)行單元?jiǎng)澐郑⑼ㄟ^(guò)求取各單元絕對(duì)值的平均值的方式，來(lái)確定聲音片段文件是否有聲音，這種方法比較準(zhǔn)確，充分考慮了背景噪音的影響，不會(huì)造成誤判。
[0066]在本發(fā)明的另一個(gè)實(shí)施例中，所述分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括:將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元；將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；求取所有所述絕對(duì)值的平均值；判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0067]可見(jiàn)，通過(guò)每四個(gè)字節(jié)劃分為一個(gè)單元，并僅求取每個(gè)單元的前兩個(gè)字節(jié)的方式，大大提高了處理效率，并保持了語(yǔ)音識(shí)別的準(zhǔn)確率，不會(huì)漏掉語(yǔ)音。
[0068]圖2為本發(fā)明實(shí)施例聲音錄制裝置的示意圖，如圖2所示，一種聲音錄制的裝置，包括:
[0069]采集單元201，用于:進(jìn)行數(shù)據(jù)實(shí)時(shí)采集，獲得當(dāng)前聲音片段文件；
[0070]分析單元202，用于:分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音；
[0071]存儲(chǔ)單元203，用于:如果所述當(dāng)前聲音片段文件內(nèi)存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件，否則建立新的音頻文件，并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件；
[0072]丟棄單元204，用于:如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音，則判斷是否存在所述打開(kāi)的音頻文件，是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存，并丟棄所述當(dāng)前聲音片段文件；否則直接丟棄所述當(dāng)前聲音片段文件。
[0073]在本發(fā)明的一個(gè)實(shí)施例中，所述存儲(chǔ)單元，還用于:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。還包括:傳輸單元，用于:發(fā)送所述待傳輸音頻文件；遠(yuǎn)端，接收所述待傳輸音頻文件，并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
[0074]在本發(fā)明的一個(gè)實(shí)施例中，所述分析單元，具體用于:將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?，每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元；將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；求取所有所述絕對(duì)值的平均值；判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0075]在本發(fā)明的另一個(gè)實(shí)施例中，所述分析單元，具體用于:將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元；將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；求取所有所述絕對(duì)值的平均值；判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
[0076]圖3為本發(fā)明另一實(shí)施例的聲音錄制方法的流程圖，該實(shí)施例是語(yǔ)音碎片化錄制方法及傳輸方法，其通過(guò)directshow(是微軟公司提供的一套在Windows平臺(tái)上進(jìn)行流媒體處理的開(kāi)發(fā)包)進(jìn)行錄音時(shí)，會(huì)邊錄音邊對(duì)聲音進(jìn)行分析，將有聲音的部分進(jìn)行錄制，沒(méi)有聲音的部分不進(jìn)行錄制，這樣會(huì)形成一系列只包含有內(nèi)容的聲音碎片文件，每個(gè)文件會(huì)按照時(shí)間順序標(biāo)記文件ID號(hào)和時(shí)間標(biāo)簽，在通過(guò)網(wǎng)絡(luò)傳輸后，在接收端根據(jù)文件ID號(hào)和時(shí)間標(biāo)簽進(jìn)行聲音碎片重組。本發(fā)明實(shí)施例可用于遠(yuǎn)程會(huì)議、教學(xué)等等各種場(chǎng)景，具有很強(qiáng)的應(yīng)用前景。
[0077]如圖3所示，本發(fā)明實(shí)施例在用戶指定聲音輸入設(shè)備或者默認(rèn)聲音輸入設(shè)備后，利用directshow進(jìn)行聲音采集，在實(shí)時(shí)采集的過(guò)程中，會(huì)不間斷的從聲音輸入設(shè)備中獲取WAV格式(是錄音時(shí)用的標(biāo)準(zhǔn)的WINDOWS文件格式)的聲音數(shù)據(jù)，每次獲取到一段聲音數(shù)據(jù)后，對(duì)本段聲音數(shù)據(jù)按照每?jī)蓚€(gè)字節(jié)一個(gè)單位進(jìn)行轉(zhuǎn)換為16位有符號(hào)的整數(shù)，對(duì)得到整數(shù)的絕對(duì)值求和后計(jì)算出平均數(shù)，根據(jù)本方法事先指定的閾值進(jìn)行判斷，如果大于等于此閾值，表不此段聲音數(shù)據(jù)是存在聲音的，如果小于此閾值，表不此段聲音數(shù)據(jù)不存在聲音，本發(fā)明實(shí)施例為提高效率，是按照每四個(gè)字節(jié)取前兩個(gè)字節(jié)進(jìn)行轉(zhuǎn)換，對(duì)整體效果無(wú)影響；
[0078]判斷存在聲音時(shí)，如果之前沒(méi)有聲音，則生成新的以一個(gè)唯一的32位id和當(dāng)前時(shí)間戳命名的音頻文件，保存此id和時(shí)間戳，在新的音頻文件中寫(xiě)入此聲音數(shù)據(jù)，如果之前就已經(jīng)存在聲音，則在打開(kāi)的音頻文件中寫(xiě)入此聲音數(shù)據(jù)到文件結(jié)尾；判斷不存在聲音時(shí)，如果之前沒(méi)有聲音，放棄此聲音數(shù)據(jù)不做其它處理，如果之前已經(jīng)存在聲音，則放棄此聲音數(shù)據(jù)，將當(dāng)前打開(kāi)的聲音文件保存后關(guān)閉流，并且保存此文件以毫秒為單位的時(shí)長(zhǎng)；
[0079]當(dāng)關(guān)閉一個(gè)音頻文件流后可以開(kāi)啟一個(gè)新的線程將這個(gè)文件上傳到遠(yuǎn)端，在上傳完畢后，將此文件的詳細(xì)信息(包括文件名、開(kāi)始時(shí)間的時(shí)間戳、id、時(shí)長(zhǎng))發(fā)送到遠(yuǎn)端，遠(yuǎn)端可以根據(jù)文件名稱找到在遠(yuǎn)端的文件，根據(jù)開(kāi)始時(shí)間的時(shí)間戳確定文件的先后順序，并可根據(jù)開(kāi)始時(shí)間的時(shí)間戳確定文件的播放時(shí)間。不再需要采集時(shí)，停止采集，不再獲取聲音數(shù)據(jù)。
[0080]由上可知，本發(fā)明實(shí)施例具有以下優(yōu)勢(shì):
[0081]I)本發(fā)明實(shí)施例中，通過(guò)判斷聲音片段文件內(nèi)是否存在聲音，從而在音頻文件中僅保留有聲音的聲音片段文件，丟棄掉沒(méi)有聲音的聲音片段文件，所以大大減少了音頻文件中空白沒(méi)有聲首的片段，提聞了首頻文件的有效性，進(jìn)而提聞了網(wǎng)絡(luò)傳輸效率。
[0082]2)本發(fā)明實(shí)施例中，通過(guò)對(duì)聲音片段文件進(jìn)行單元?jiǎng)澐郑⑼ㄟ^(guò)求取各單元絕對(duì)值的平均值的方式，來(lái)確定聲音片段文件是否有聲音，這種方法比較準(zhǔn)確，充分考慮了背景噪音的影響，不會(huì)造成誤判。
[0083]3)本發(fā)明實(shí)施例中，通過(guò)每四個(gè)字節(jié)劃分為一個(gè)單元，并僅求取每個(gè)單元的前兩個(gè)字節(jié)的方式，大大提高了處理效率，并且保持了語(yǔ)音識(shí)別的準(zhǔn)確率。
[0084]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此，本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且，本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0085]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器，使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0086]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中，使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0087]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上，使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理，從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0088]顯然，本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【權(quán)利要求】
1.一種聲音錄制的方法，其特征在于，包括: 進(jìn)行數(shù)據(jù)實(shí)時(shí)采集，獲得當(dāng)前聲音片段文件；分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音；如果所述當(dāng)前聲音片段文件內(nèi)存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件，否則建立新的音頻文件，并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的音頻文件；如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音，則判斷是否存在所述打開(kāi)的音頻文件，是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存，并丟棄所述當(dāng)前聲音片段文件；否則直接丟棄所述當(dāng)前聲音片段文件。
2.如權(quán)利要求1所述的方法，其特征在于，所述建立新的音頻文件的步驟中:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
3.如權(quán)利要求2所述的方法，其特征在于，還包括: 將所述待傳輸音頻文件發(fā)送到遠(yuǎn)端，并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
4.如權(quán)利要求1、2或3所述的方法，其特征在于，分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?，每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元；將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；求取所有所述絕對(duì)值的平均值；判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
5.如權(quán)利要求1、2或3所述的方法，其特征在于，所述分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音的步驟具體包括: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?，每四個(gè)字節(jié)劃分為一個(gè)單元；將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；求取所有所述絕對(duì)值的平均值；判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
6.一種聲音錄制的裝置，其特征在于，包括: 采集單元，用于:進(jìn)行數(shù)據(jù)實(shí)時(shí)采集，獲得當(dāng)前聲音片段文件；分析單元，用于:分析所述當(dāng)前聲音片段文件，判斷所述當(dāng)前聲音片段文件內(nèi)是否存在聲音; 存儲(chǔ)單元，用于:如果所述當(dāng)前聲音片段文件內(nèi)存在聲音，則判斷是否存在打開(kāi)的音頻文件，是則在所述打開(kāi)的音頻文件中寫(xiě)入所述當(dāng)前聲音片段文件，否則建立新的音頻文件，并將所述新的音頻文件作為打開(kāi)的音頻文件并將所述當(dāng)前聲音片段文件寫(xiě)入所述打開(kāi)的首頻文件；丟棄單元，用于:如果所述當(dāng)前聲音片段文件內(nèi)不存在聲音，則判斷是否存在所述打開(kāi)的音頻文件，是則關(guān)閉所述打開(kāi)的音頻文件并作為待傳輸音頻文件保存，并丟棄所述當(dāng)前聲音片段文件；否則直接丟棄所述當(dāng)前聲音片段文件。
7.如權(quán)利要求6所述的裝置，其特征在于，所述存儲(chǔ)單元，還用于:以32位id和當(dāng)前時(shí)間戳命名所述新的音頻文件。
8.如權(quán)利要求7所述的裝置，其特征在于，還包括: 傳輸單元，用于:發(fā)送所述待傳輸音頻文件；遠(yuǎn)端，接收所述待傳輸音頻文件，并通過(guò)所述時(shí)間戳確定文件播放的先后順序。
9.如權(quán)利要求6、7或8所述的裝置，其特征在于，所述分析單元，具體用于: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐?，每?jī)蓚€(gè)字節(jié)劃分為一個(gè)單元；將每個(gè)單元中的所述兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；求取所有所述絕對(duì)值的平均值；判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
10.如權(quán)利要求6、7或8所述的裝置，其特征在于，所述分析單元，具體用于: 將所述當(dāng)前聲音片段文件進(jìn)行單元?jiǎng)澐郑克膫€(gè)字節(jié)劃分為一個(gè)單元；將每個(gè)單元中的所述四個(gè)字節(jié)中的前兩個(gè)字節(jié)轉(zhuǎn)換為16位有符號(hào)的整數(shù)，并取所述整數(shù)的絕對(duì)值；求取所有所述絕對(duì)值的平均值；判斷所述平均值是否大于預(yù)定閾值，是則所述當(dāng)前聲音片段文件內(nèi)存在聲音，否則所述當(dāng)前聲音片段文件內(nèi)不存在聲音。
【文檔編號(hào)】G10L25/78GK104202321SQ201410443068
【公開(kāi)日】2014年12月10日申請(qǐng)日期:2014年9月2日優(yōu)先權(quán)日:2014年9月2日
【發(fā)明者】楊金偉申請(qǐng)人:上海天脈聚源文化傳媒有限公司

完整全部詳細(xì)技術(shù)資料下載