音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)與流程

文檔序號：11250595閱讀：1156來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及數(shù)據(jù)處理，具體涉及一種音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)。

背景技術(shù)：

隨著科技的不斷發(fā)展，手機、平板電腦(pad)、智能音箱等電子設(shè)備應(yīng)運而生。其中，智能音箱的輸出音量通常為一出廠默認值或為已被用戶設(shè)置好的固定值，在進行音頻數(shù)據(jù)的播放時，通常以該默認音量或固定音量進行音頻的輸出。目前當要改變其中一個輸出音量大小時，需要用戶進行手動調(diào)整，從而使得用戶執(zhí)行這類操作是麻煩且低效的。

技術(shù)實現(xiàn)要素：

有鑒于此，本發(fā)明實施例為解決現(xiàn)有技術(shù)中存在的至少一個問題而提供一種音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)，能夠使得用戶免于執(zhí)行麻煩且低效的操作。

本發(fā)明實施例的技術(shù)方案是這樣實現(xiàn)的：

第一方面，本發(fā)明實施例提供一種音頻處理方法，所述方法包括：

利用聲音采集裝置采集音頻數(shù)據(jù)；

對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果；

根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令；

執(zhí)行所述執(zhí)行指令。

在其他的實施例中，所述對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果，包括：

對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果。

在其他的實施例中，所述根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令，包括：

根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，所述輸出參數(shù)包括待輸出音頻和/或用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù)；

將所述輸出參數(shù)攜帶在執(zhí)行指令中。

在其他的實施例中，所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果，包括：

對所述音頻數(shù)據(jù)的內(nèi)容進行分析，得到作為處理結(jié)果的分析結(jié)果；

對所述音頻數(shù)據(jù)進行聲紋特征提取，得到第一提取結(jié)果；

將第一提取結(jié)果與預(yù)設(shè)的用戶數(shù)據(jù)庫中的聲紋特征進行比對，得到作為處理結(jié)果的用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)；

對應(yīng)地，所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，包括：

根據(jù)所述分析結(jié)果確定用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻；

根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

在其他的實施例中，所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到識別結(jié)果，包括：

對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取，得到第二提取結(jié)果；所述第一頻率范圍包括用戶不可識別的頻率范圍；

對所述第二提取結(jié)果進行識別，得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果；

對應(yīng)地，所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，包括：根據(jù)所述設(shè)備狀態(tài)參數(shù)確定處于第二頻率范圍的待輸出音頻，所述第二頻率范圍為用戶可識別的頻率范圍。

在其他的實施例中，所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容特征識別，得到識別結(jié)果，包括：

對所述音頻數(shù)據(jù)進行內(nèi)容分析，得到第一音頻部分和第二音頻部分；

對應(yīng)地，所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，包括：

根據(jù)所述第一音頻部分確定待輸出音頻；

根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

第二方面，本發(fā)明實施例提供一種音頻處理裝置，包括：

采集單元，用于利用聲音采集裝置采集音頻數(shù)據(jù)；

處理單元，用于對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果；

確定單元，用于根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令；

執(zhí)行單元，用于執(zhí)行所述執(zhí)行指令。

第三方面，本發(fā)明實施例提供一種電子設(shè)備，所述電子設(shè)備包括聲音采集裝置和處理器，其中，所述處理器，用于：

利用聲音采集裝置采集音頻數(shù)據(jù)；

對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果；

根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令；

執(zhí)行所述執(zhí)行指令。

在其他的實施例中，所述對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果，包括：

對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果。

第四方面，本發(fā)明實施例提供一種計算機存儲介質(zhì)，所述計算機存儲介質(zhì)中存儲有計算機可執(zhí)行指令，該計算機可執(zhí)行指令用于執(zhí)行上述的音頻處理方法。

本發(fā)明實施例中，利用聲音采集裝置采集音頻數(shù)據(jù)；對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果；根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令；執(zhí)行所述執(zhí)行指令；如此，能夠使得用戶免于執(zhí)行麻煩且低效的操作。

附圖說明

圖1為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖；

圖2為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖；

圖3為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖；

圖4為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖；

圖5為本發(fā)明實施例一種音頻處理裝置的實現(xiàn)流程示意圖；

圖6為本發(fā)明實施例一種電子設(shè)備的實現(xiàn)流程示意圖。

具體實施方式

下面結(jié)合附圖和具體實施例對本發(fā)明的技術(shù)方案進一步詳細闡述。

本實施例提供一種音頻處理方法，該方法應(yīng)用于電子設(shè)備，該音頻處理方法所實現(xiàn)的功能可以通過電子設(shè)備中的處理器調(diào)用程序代碼來實現(xiàn)，當然程序代碼可以保存在計算機存儲介質(zhì)中，可見，該電子設(shè)備至少包括處理器和存儲介質(zhì)。

圖1為本發(fā)明實施例種音頻處理方法的實現(xiàn)流程示意圖，如圖1所示，該方法包括：

步驟s101，利用聲音采集裝置采集音頻數(shù)據(jù)；

在實現(xiàn)的過程中，聲音采集裝置可以是電子設(shè)備自身的一部分，在其他的實施例中，聲音采集裝置可以是其他電子設(shè)備上的或者聲音采集裝置作為一個獨立的電子設(shè)備，在步驟s101中，聲音采集裝置采集音頻數(shù)據(jù)，然后將采集到的音頻數(shù)據(jù)發(fā)送給電子設(shè)備。

在實現(xiàn)的過程中，電子設(shè)備可以音響設(shè)備，本實施中的音響設(shè)備為一智能設(shè)備，即該音響設(shè)備具有處理器，處理器具有信息處理能力。

步驟s102，對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果；

步驟s103，根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令；

步驟s104，執(zhí)行所述執(zhí)行指令。

這里，所述執(zhí)行指令中攜帶有待輸出音頻和/或調(diào)整參數(shù)，所述調(diào)整參數(shù)用于調(diào)整所述待輸出音頻的調(diào)整參數(shù)，例如調(diào)整待輸出音頻的音量、頻率范圍。對應(yīng)地，執(zhí)行所述執(zhí)行指令，包括將待輸出音頻輸出至音頻輸出裝置，或者將調(diào)整參數(shù)輸出至音頻輸出裝置，以控制所述音頻輸出裝置按照所述調(diào)整參數(shù)輸出所述音頻輸出裝置。

在實現(xiàn)的過程中，電子設(shè)備可以只包括音響設(shè)備，那么步驟s102至步驟s104即在音響設(shè)備上執(zhí)行。

在其他的實施例中，電子設(shè)備可以包括終端和服務(wù)器，其中音響設(shè)備作為終端設(shè)備，該服務(wù)器用于執(zhí)行步驟s102，這時，本發(fā)明實施例還包括：音響設(shè)備將音頻數(shù)據(jù)發(fā)送給服務(wù)器，服務(wù)器用于執(zhí)行步驟s102。對應(yīng)地，在步驟s103之前，所述方法還包括：服務(wù)器將處理結(jié)果發(fā)送給音響設(shè)備；然后，音響設(shè)備根據(jù)接收到的處理結(jié)果執(zhí)行步驟s103和步驟s104。對應(yīng)地，或者，在步驟s103之后，所述方法還包括：服務(wù)器將執(zhí)行指令發(fā)送給音響設(shè)備，然后音響設(shè)備根據(jù)接收到的執(zhí)行指令執(zhí)行步驟s104。

在本發(fā)明的其他實施例中，所述對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果，包括：對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果。

在實現(xiàn)的過程中，特征提取包括聲紋特征、頻率處于的范圍特征，其中聲紋(voiceprint)是表現(xiàn)攜帶言語信息的聲波頻譜，一般來說，聲紋不僅具有特定性，而且有相對穩(wěn)定性的特點，因為成年人的聲音可保持長期相對穩(wěn)定不變。

在本發(fā)明的其他實施例中，所述根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令，包括：根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，所述輸出參數(shù)包括待輸出音頻和/或用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù)；將所述輸出參數(shù)攜帶在執(zhí)行指令中。

基于前述的實施例，本發(fā)明實施例再提供一種音頻處理方法，該方法包括：

步驟s11，利用聲音采集裝置采集音頻數(shù)據(jù)；

這里，所述音頻數(shù)據(jù)可以是用戶發(fā)出的語音指令，例如“聲音大點”、“把音量調(diào)高”、“靜音”、“耳機輸出”、“播放一首歌曲或戲曲”等。電子設(shè)備會針對用戶的語音指令進行響應(yīng)，例如如果語音指令為“聲音大點”，那么電子設(shè)備就會將正在播放的音頻的音量進行調(diào)高，如果音頻數(shù)據(jù)為“播放一首歌曲或戲曲”，那么電子設(shè)備就會選擇一首歌曲或戲曲輸出至音頻輸出裝置。

步驟s12，對所述音頻數(shù)據(jù)的內(nèi)容進行分析，得到作為處理結(jié)果的分析結(jié)果；

本實施例中，當音頻數(shù)據(jù)為用戶的語音指令時，電子設(shè)備會對音頻數(shù)據(jù)的內(nèi)容進行分析，然后得到分析結(jié)果；

步驟s13，對所述音頻數(shù)據(jù)進行聲紋特征提取，得到第一提取結(jié)果；

當然，當音頻數(shù)據(jù)為用戶的語音指令時，電子設(shè)備還會音頻數(shù)據(jù)的聲紋特征進行分析或者提取，然后分析出用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)。

步驟s14，將第一提取結(jié)果與預(yù)設(shè)的用戶數(shù)據(jù)庫中的聲紋特征進行比對，得到作為處理結(jié)果的用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)；

這里，用戶數(shù)據(jù)庫內(nèi)的聲紋特征取決于電子設(shè)備的應(yīng)用場景，例如如果是家庭使用電子設(shè)備，那么用戶數(shù)據(jù)庫中可以存儲著家庭成員的聲紋特征；如果是學(xué)校使用電子設(shè)備，那么用戶數(shù)據(jù)庫中的存儲著老師、學(xué)生等相關(guān)人員的聲紋特征。

步驟s15，根據(jù)所述分析結(jié)果確定作為輸出參數(shù)的用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻；

這里，需要說明的是，待輸出音頻可以在其他的實施例中沒有，這主要取決于音頻數(shù)據(jù)是否對應(yīng)有待輸出音頻，一般來說，即使是一般的語音指令都會有待輸出音頻，例如電子設(shè)備采集到的“聲音大點”、“把音量調(diào)高”、“靜音”、“耳機輸出”等，那么待輸出音頻可以為兜底音頻，例如“好的”、“我收到了”、“我沒有聽清楚，請再說一遍”。當然采集到的音頻數(shù)據(jù)為“播放一首歌曲或戲曲”等，那么待輸出音頻可以包括兜底音頻和待播放的歌曲或戲曲。

這里，所述待輸出音頻也是輸出參數(shù)；

步驟s16，根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

這里，不同的用戶對聲音的敏感度不一樣，例如聽力不好的人(老人)對聲音比較不敏感，那么輸出的調(diào)整參數(shù)需要將音量調(diào)大，而聽力好的人對聲音比較敏感，那么輸出的調(diào)整參數(shù)需要將音量調(diào)小，例如對于老人，可能60分貝老人就聽不清楚，然而60分貝對于聽力好的人，則足夠了。

步驟s17，將所述輸出參數(shù)攜帶在執(zhí)行指令中，其中所述輸出參數(shù)包括待輸出音頻和用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù)；

步驟s18，執(zhí)行所述執(zhí)行指令。

本實施例中，步驟s18，將待輸出音頻輸出至音頻輸出裝置，然后將調(diào)整參數(shù)輸出至音頻輸出裝置，以控制所述音頻輸出裝置按照所述調(diào)整參數(shù)輸出所述音頻輸出裝置。

本實施例中，如果采集到的音頻數(shù)據(jù)為用戶的語音指令，那么步驟s12至s14提供了一種實現(xiàn)“所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果”的方式；對應(yīng)地，步驟s15和步驟s16提供了一種實現(xiàn)“所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)”的方式。

目前有一種智能音響，用戶可以通過語音與其進行交互。在語音交互過程中會有這樣的問題：如果家中有老人，并且聽力不是很好，當老人與音響交互的時候，如果聽不清，會要求音響調(diào)大音量。但是在下一次重新喚醒音響時，輸出的音量又恢復(fù)到默認值，老人又要重新發(fā)出指令，調(diào)大音量。周而復(fù)始，降低體驗?，F(xiàn)有技術(shù)中，不同用戶有不同的聽覺習慣，每次當音量不符合時，都需要用戶主動通過語音指令或物理按鍵調(diào)整音量大小，以達到最佳聽覺效果。顯然這種方式使得用戶執(zhí)行這類操作是麻煩且低效的。針對該問題，本實施例提供的技術(shù)方案通過對外界聲音信息(用戶的語音指令)的識別和判斷，動態(tài)調(diào)整輸出參數(shù)(例如輸出音量大小)。如圖2所示，當用戶發(fā)出語音指令時，音響設(shè)備會進行學(xué)習(步驟a1)，例如記錄用戶的聲紋信息；如果用戶對音量進行不斷調(diào)整(步驟a2)，那么音響進行學(xué)習和記錄用戶指令；最后音響將學(xué)習到的結(jié)果反饋給用戶(步驟a3)，即音響設(shè)備根據(jù)記錄的用戶聲紋信息和用戶指令動態(tài)調(diào)整音響輸出音量。從以上可以看出，即面對不同聽覺要求的人群，智能音響設(shè)備應(yīng)記錄不同人群的聲紋信息，隨著用戶對音響發(fā)出的音量的不斷調(diào)整和訓(xùn)練，當不同用戶喚醒音響時，播放出來的音頻信息的音量會有針對性的變化。例如，面對聽力不好的人，播放的音量會相對大一些。這樣，通過記錄不同用戶的聲紋信息，可以識別不同的使用者，從而播放出適合的音量，即在播放音量上對不同用戶做了定制化的設(shè)置及反饋。本實施例中，通過記錄不同用戶的聲紋信息及音量使用習慣，針對不同使用者，動態(tài)調(diào)整輸出音量。

基于前述的實施例，本發(fā)明實施例再提供一種音頻處理方法，該方法包括：

步驟s21，利用聲音采集裝置采集音頻數(shù)據(jù)；

這里，音頻數(shù)據(jù)為其他設(shè)備發(fā)出音頻信號或者音響設(shè)備自身發(fā)出音頻信號；本實施例中，音頻數(shù)據(jù)處于人耳不可識別的范圍或者可是識別的范圍。

步驟s22，對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取，得到第二提取結(jié)果；所述第一頻率范圍包括用戶不可識別的頻率范圍；

步驟s23，對所述第二提取結(jié)果進行識別，得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果；

這里，設(shè)備狀態(tài)參數(shù)可以為正常、電量不足、異常、輸入電壓異常等；

步驟s24，根據(jù)所述設(shè)備狀態(tài)參數(shù)確定處于第二頻率范圍的待輸出音頻，所述第二頻率范圍為用戶可識別的頻率范圍。

這里，待輸出音頻用于表征設(shè)備的狀態(tài)，例如待輸出音頻為該設(shè)備處于異常狀態(tài)的音頻，這樣用戶就可以快速得到音響的反饋，從而查看出現(xiàn)異常的設(shè)備。

步驟s25，將所述輸出參數(shù)攜帶在執(zhí)行指令中，其中所述輸出參數(shù)包括待輸出音頻；

步驟s26，執(zhí)行所述執(zhí)行指令。

本實施例中，如果采集到的音頻數(shù)據(jù)為用戶的語音指令，那么步驟s22至s23提供了一種實現(xiàn)“所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果”的方式；對應(yīng)地，步驟s24提供了一種實現(xiàn)“所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)”的方式。

目前有一種智能音響，用戶可以通過語音與其進行交互。在語音交互過程中會有這樣的問題：智能音響目前還沒有針對不同音頻輸入源進行判斷和分類，除了能夠識別人聲外，還應(yīng)該具備環(huán)境聲音的檢測和識別，例如噪音的識別、設(shè)備狀態(tài)聲音的識別。現(xiàn)有技術(shù)中，目前智能家電狀態(tài)判斷方式一般是通過指示燈，或手機客戶端進行查看，顯然這種方式使得用戶執(zhí)行這類操作是麻煩且低效的，即家電狀態(tài)處于被動的狀態(tài)或者啞巴狀態(tài)，并不能主動的告訴用戶，顯然智能音響能夠解決這一問題。針對該問題，本實施例提供的技術(shù)方案通過對外界聲音信息(用戶的語音指令)的識別和判斷，然后智能音響設(shè)備輸出設(shè)備狀態(tài)(例如設(shè)備是正常的還是異常的)，從而能夠主動告訴用戶。如圖3所示，其他設(shè)備發(fā)出音頻信號或者音響設(shè)備自身發(fā)出音頻信號(步驟b1)，那么音頻采集裝置將采集作為音頻數(shù)據(jù)的音頻信號，然后音響對音頻進行處理(步驟b2)，其中處理包括接收音頻信號、分析音頻信號和識別設(shè)備狀態(tài)，然后，音響將識別出的設(shè)備狀態(tài)(步驟b3)。本實施例中，如果家中智能設(shè)備可以發(fā)出某些低頻聲音(某個音域范圍內(nèi))來表示狀態(tài)(正常工作或發(fā)生故障)，智能音響可以通過對低頻聲音信號的識別和放大，判斷設(shè)備狀態(tài)。這樣，通過對家中智能設(shè)備發(fā)出的音頻信號的識別，可以快速獲知設(shè)備狀態(tài)，即使通過音頻信息輸出給用戶。

基于前述的實施例，本發(fā)明實施例再提供一種音頻處理方法，該方法包括：

步驟s31，利用聲音采集裝置采集音頻數(shù)據(jù)；

這里，所述音頻數(shù)據(jù)可以為用戶在一定環(huán)境參數(shù)下發(fā)出的語音指令，其中環(huán)境參數(shù)為時間和噪音，例如“聲音大點”、“把音量調(diào)高”、“靜音”、“耳機輸出”、“播放一首歌曲或戲曲”等。電子設(shè)備會針對用戶的語音指令進行響應(yīng)，例如如果語音指令為“聲音大點”，那么電子設(shè)備就會將正在播放的音頻的音量進行調(diào)高，如果音頻數(shù)據(jù)為“播放一首歌曲或戲曲”，那么電子設(shè)備就會選擇一首歌曲或戲曲輸出至音頻輸出裝置。

步驟s32，對所述音頻數(shù)據(jù)進行內(nèi)容分析，得到第一音頻部分和第二音頻部分；

這里，所述第一音頻部分和所述第二音頻部分是對音頻數(shù)據(jù)的橫向分割，而不是縱向分割，其中橫向分割是內(nèi)容從開始至結(jié)束的分割，而縱向分割為時間維度上的分割，例如輸入的音頻數(shù)據(jù)為5秒鐘的音頻，那么第一音頻數(shù)據(jù)和第二音頻數(shù)據(jù)均為5秒鐘。在實現(xiàn)的過程中，可以將輸入的音頻數(shù)據(jù)分割為噪音部分和非噪音部分，其中非噪音部分可以理解為用戶的語音指令。實際上，音響設(shè)備是很難得知那一部分音頻為噪音部分的，在實施的過程中，音響會對所有的音頻數(shù)據(jù)進行分析，然后將對應(yīng)有待輸出音頻的那一部分輸入的音頻數(shù)據(jù)作為非噪音音頻，而將沒有對應(yīng)有待輸出音頻的那一部分輸入的音頻數(shù)據(jù)作為噪音音頻。例如用戶指令為“把音量調(diào)大”，而旁邊有人喊“吃飯了”，那么輸入的音頻數(shù)據(jù)為“把音量調(diào)大”和“吃飯了”，對于音響而言，“把音量調(diào)大”這一部分音頻為可識別的音頻，即對應(yīng)有待輸出音頻的那一部分音頻(即非噪音音頻)，其中帶輸出音頻可以為兜底音頻；而“吃飯了”這一部分音頻為不可識別的音頻，即沒有對應(yīng)有待輸出音頻的那一部分音頻(即噪音音頻)。

步驟s33，根據(jù)所述第一音頻部分確定待輸出音頻；；

這里，待輸出音頻可以為兜底音頻；

步驟s34，根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

步驟s35，將所述輸出參數(shù)攜帶在執(zhí)行指令中，其中所述輸出參數(shù)包括待輸出音頻和用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù)；

對音頻數(shù)據(jù)進行處理，是能夠識別出音頻中的噪音的，如果噪音太小，可能就直接濾掉了，濾掉的結(jié)果中如果沒有人說話的聲音，說明濾波過于嚴重，應(yīng)該調(diào)小，以確定噪音的音量。

步驟s36，執(zhí)行所述執(zhí)行指令。

本實施例中，步驟s36，將待輸出音頻輸出至音頻輸出裝置，然后將調(diào)整參數(shù)輸出至音頻輸出裝置，以控制所述音頻輸出裝置按照所述調(diào)整參數(shù)輸出所述音頻輸出裝置。

本實施例中，如果采集到的音頻數(shù)據(jù)為用戶的語音指令，那么步驟s32提供了一種實現(xiàn)“所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果”的方式；對應(yīng)地，步驟s33至s34提供了一種實現(xiàn)“所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)”的方式。

目前有一種智能音響，用戶可以通過語音與其進行交互。在語音交互過程中會有這樣的問題：智能音響輸出的音頻信息的音量都有一個默認值，如果外界噪音相對比較嘈雜的時候，音響輸出的音量不會產(chǎn)生變化，此時用戶可能無法聽清音頻內(nèi)容或者聽覺效果不好?，F(xiàn)有技術(shù)中，當外界相對比較嘈雜的時候，解決音響輸出的音頻內(nèi)容聽不清的問題，需要用戶主動通過語音指令或物理按鍵調(diào)大音響音量。針對該問題，本實施例提供的技術(shù)方案通過對外界聲音信息(用戶的語音指令)的識別和判斷，然后動態(tài)調(diào)整輸出音量大小。如圖4所示，音響設(shè)備根對用戶行為與環(huán)境因素進行學(xué)習(步驟c1)，例如音響設(shè)備對時間41、環(huán)境噪音42和語音指令43(音量和音調(diào))等進行學(xué)習，然后根據(jù)實踐、聲音輸入源的解析和判斷(步驟c2)，得到輸出參數(shù)，然后音響將學(xué)習到的結(jié)果反饋給用戶(步驟c3)，即動態(tài)的調(diào)整音響輸出的音量。從以上可以看出，本實施例提供的技術(shù)方案中，智能音響能夠結(jié)合時間、外界環(huán)境音、人發(fā)出的指令聲音的大小，隨時調(diào)整播放音量。例如，白天環(huán)境相對比較嘈雜的時候，音響播放的音量應(yīng)相應(yīng)提高，晚上環(huán)境相對安靜的時候，音響播放的音量應(yīng)相應(yīng)降低。這樣，智能音響播放的音量會隨外界聲音以及指令聲音的大小而變化，以保證在不同使用場景下，用戶都可以聽清。

本發(fā)明實施例提供一種音頻處理裝置，該裝置所包括的各單元、各單元所包括的各模塊，以及各模塊所包括的各子模塊，都可以通過電子設(shè)備中的處理器來實現(xiàn)，當然也可通過具體的邏輯電路實現(xiàn)；在實施的過程中，處理器可以為中央處理器(cpu)、微處理器(mpu)、數(shù)字信號處理器(dsp)或現(xiàn)場可編程門陣列(fpga)等。

圖5為本發(fā)明實施例一種音頻處理裝置的組成結(jié)構(gòu)示意圖，如圖5所示，所述裝置500包括：

采集單元501，用于利用聲音采集裝置采集音頻數(shù)據(jù)；

處理單元502，用于對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果；

確定單元503，用于根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令；

執(zhí)行單元504，用于執(zhí)行所述執(zhí)行指令。

在本發(fā)明的其他實施例中，所述處理單元，用于對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果。

在本發(fā)明的其他實施例中，所述確定單元包括確定模塊和攜帶模塊，其中：

所述確定模塊，用于根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，所述輸出參數(shù)包括待輸出音頻和/或用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù)；

所述攜帶模塊，用于將所述輸出參數(shù)攜帶在執(zhí)行指令中。

在本發(fā)明的其他實施例中，所述處理單元包括分析模塊、第一提取模塊和對比模塊，其中：

所述分析模塊，用于對所述音頻數(shù)據(jù)的內(nèi)容進行分析，得到作為處理結(jié)果的分析結(jié)果；

所述第一提取模塊，用于對所述音頻數(shù)據(jù)進行聲紋特征提取，得到第一提取結(jié)果；

所述對比模塊，用于將第一提取結(jié)果與預(yù)設(shè)的用戶數(shù)據(jù)庫中的聲紋特征進行比對，得到作為處理結(jié)果的用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)；

對應(yīng)地，所述確定模塊包括第一確定子模塊和第二確定子模塊，其中：

所述第一確定子模塊，用于根據(jù)所述分析結(jié)果確定用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻；

所述第二確定子模塊，用于根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

在本發(fā)明的其他實施例中，所述處理單元包括第二提取模塊和識別模塊，其中：

所述第二提取模塊，用于對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取，得到第二提取結(jié)果；所述第一頻率范圍包括用戶不可識別的頻率范圍；

所述識別模塊，用于對所述第二提取結(jié)果進行識別，得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果；

對應(yīng)地，所述確定模塊，用于根據(jù)所述設(shè)備狀態(tài)參數(shù)確定處于第二頻率范圍的待輸出音頻，所述第二頻率范圍為用戶可識別的頻率范圍。

在本發(fā)明的其他實施例中，所述處理單元，用于對所述音頻數(shù)據(jù)進行內(nèi)容分析，得到第一音頻部分和第二音頻部分；

對應(yīng)地，所述確定模塊包括第三確定子模塊和第四確定子模塊，其中：

所述第三確定子模塊，用于根據(jù)所述第一音頻部分確定待輸出音頻；

所述第四確定子模塊，用于根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

這里需要指出的是：以上裝置實施例的描述，與上述方法實施例的描述是類似的，具有同方法實施例相似的有益效果。對于本發(fā)明裝置實施例中未披露的技術(shù)細節(jié)，請參照本發(fā)明方法實施例的描述而理解。

基于前述的實施例，本發(fā)明實施例提供一種電子設(shè)備，圖6為本發(fā)明實施例一種電子設(shè)備的組成結(jié)構(gòu)示意圖，如圖6所示，該電子設(shè)備600包括聲音采集裝置601和處理器602，其中，

聲音采集裝置601，用于采集音頻數(shù)據(jù)；

處理器602，用于利用聲音采集裝置采集音頻數(shù)據(jù)；對所述音頻數(shù)據(jù)進行音頻處理，獲得處理結(jié)果；根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令；執(zhí)行所述執(zhí)行指令。

在實現(xiàn)的過程中，所述聲音采集裝置601可以為麥克。

在本發(fā)明的其他實施例中，所述電子設(shè)備600還可以包括聲音輸出裝置如音響、擴音器等，所述根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令，包括：

將所述輸出參數(shù)攜帶在執(zhí)行指令中。

在本發(fā)明的其他實施例中，所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到處理結(jié)果，包括：

對所述音頻數(shù)據(jù)的內(nèi)容進行分析，得到作為處理結(jié)果的分析結(jié)果；

對所述音頻數(shù)據(jù)進行聲紋特征提取，得到第一提取結(jié)果；

對應(yīng)地，所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，包括：

根據(jù)所述分析結(jié)果確定用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻；

根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

在本發(fā)明的其他實施例中，所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別，得到識別結(jié)果，包括：

對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取，得到第二提取結(jié)果；所述第一頻率范圍包括用戶不可識別的頻率范圍；

對所述第二提取結(jié)果進行識別，得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果；

在本發(fā)明的其他實施例中，所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容特征識別，得到識別結(jié)果，包括：

對所述音頻數(shù)據(jù)進行內(nèi)容分析，得到第一音頻部分和第二音頻部分；

對應(yīng)地，所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)，包括：

根據(jù)所述第一音頻部分確定待輸出音頻；

根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

需要說明的是，本發(fā)明實施例中，如果以軟件功能模塊的形式實現(xiàn)上述的音頻處理方法，并作為獨立的產(chǎn)品銷售或使用時，也可以存儲在一個計算機可讀取存儲介質(zhì)中?；谶@樣的理解，本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中，包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質(zhì)包括：u盤、移動硬盤、只讀存儲器(rom，readonlymemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。這樣，本發(fā)明實施例不限制于任何特定的硬件和軟件結(jié)合。

相應(yīng)地，本發(fā)明實施例再提供一種計算機存儲介質(zhì)，所述計算機存儲介質(zhì)中存儲有計算機可執(zhí)行指令，該計算機可執(zhí)行指令用于執(zhí)行本發(fā)明實施例中音頻處理方法。

這里需要指出的是：以上電子設(shè)備或存儲介質(zhì)實施例項的描述，與上述方法描述是類似的，具有同方法實施例相同的有益效果。對于本發(fā)明電子設(shè)備或存儲介質(zhì)實施例中未披露的技術(shù)細節(jié)，本領(lǐng)域的技術(shù)人員請參照本發(fā)明方法實施例的描述而理解。

應(yīng)理解，說明書通篇中提到的“一個實施例”或“一實施例”意味著與實施例有關(guān)的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個實施例中。因此，在整個說明書各處出現(xiàn)的“在一個實施例中”或“在一實施例中”未必一定指相同的實施例。此外，這些特定的特征、結(jié)構(gòu)或特性可以任意適合的方式結(jié)合在一個或多個實施例中。應(yīng)理解，在本發(fā)明的各種實施例中，上述各過程的序號的大小并不意味著執(zhí)行順序的先后，各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定，而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。上述本發(fā)明實施例序號僅僅為了描述，不代表實施例的優(yōu)劣。

需要說明的是，在本文中，術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下，由語句“包括一個……”限定的要素，并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。

在本申請所提供的幾個實施例中，應(yīng)該理解到，所揭露的設(shè)備和方法，可以通過其它的方式實現(xiàn)。以上所描述的設(shè)備實施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現(xiàn)時可以有另外的劃分方式，如：多個單元或組件可以結(jié)合，或可以集成到另一個系統(tǒng)，或一些特征可以忽略，或不執(zhí)行。另外，所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口，設(shè)備或單元的間接耦合或通信連接，可以是電性的、機械的或其它形式的。

上述作為分離部件說明的單元可以是、或也可以不是物理上分開的，作為單元顯示的部件可以是、或也可以不是物理單元；既可以位于一個地方，也可以分布到多個網(wǎng)絡(luò)單元上；可以根據(jù)實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。

另外，在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理單元中，也可以是各單元分別單獨作為一個單元，也可以兩個或兩個以上單元集成在一個單元中；上述集成的單元既可以采用硬件的形式實現(xiàn)，也可以采用硬件加軟件功能單元的形式實現(xiàn)。

本領(lǐng)域普通技術(shù)人員可以理解：實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成，前述的程序可以存儲于計算機可讀取存儲介質(zhì)中，該程序在執(zhí)行時，執(zhí)行包括上述方法實施例的步驟；而前述的存儲介質(zhì)包括：移動存儲設(shè)備、rom、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

或者，本發(fā)明上述集成的單元如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時，也可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解，本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中，包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質(zhì)包括：移動存儲設(shè)備、rom、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述，僅為本發(fā)明的具體實施方式，但本發(fā)明的保護范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到變化或替換，都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此，本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。

完整全部詳細技術(shù)資料下載

當前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳婧菲;陳智武
技術(shù)所有人：聯(lián)想（北京）有限公司
我是此專利的發(fā)明人

上一篇：一種改進的浮點乘加器及浮點乘加計算方法與流程
上一篇：一種信息輸出方法及其裝置與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

存儲介質(zhì)的擦除方法相關(guān)技術(shù)

電子設(shè)備雷擊試驗方法相關(guān)技術(shù)

音頻處理軟件相關(guān)技術(shù)

音頻處理軟件哪個好相關(guān)技術(shù)

音頻處理相關(guān)技術(shù)

matlab音頻處理相關(guān)技術(shù)

專業(yè)音頻處理軟件相關(guān)技術(shù)

常用音頻處理軟件相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)與流程

音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)與流程