亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)與流程

文檔序號:11250595閱讀:1156來源:國知局
音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)與流程

本發(fā)明涉及數(shù)據(jù)處理,具體涉及一種音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì)。



背景技術(shù):

隨著科技的不斷發(fā)展,手機、平板電腦(pad)、智能音箱等電子設(shè)備應(yīng)運而生。其中,智能音箱的輸出音量通常為一出廠默認值或為已被用戶設(shè)置好的固定值,在進行音頻數(shù)據(jù)的播放時,通常以該默認音量或固定音量進行音頻的輸出。目前當要改變其中一個輸出音量大小時,需要用戶進行手動調(diào)整,從而使得用戶執(zhí)行這類操作是麻煩且低效的。



技術(shù)實現(xiàn)要素:

有鑒于此,本發(fā)明實施例為解決現(xiàn)有技術(shù)中存在的至少一個問題而提供一種音頻處理方法及裝置、電子設(shè)備、存儲介質(zhì),能夠使得用戶免于執(zhí)行麻煩且低效的操作。

本發(fā)明實施例的技術(shù)方案是這樣實現(xiàn)的:

第一方面,本發(fā)明實施例提供一種音頻處理方法,所述方法包括:

利用聲音采集裝置采集音頻數(shù)據(jù);

對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;

根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;

執(zhí)行所述執(zhí)行指令。

在其他的實施例中,所述對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果,包括:

對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果。

在其他的實施例中,所述根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令,包括:

根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),所述輸出參數(shù)包括待輸出音頻和/或用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù);

將所述輸出參數(shù)攜帶在執(zhí)行指令中。

在其他的實施例中,所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果,包括:

對所述音頻數(shù)據(jù)的內(nèi)容進行分析,得到作為處理結(jié)果的分析結(jié)果;

對所述音頻數(shù)據(jù)進行聲紋特征提取,得到第一提取結(jié)果;

將第一提取結(jié)果與預(yù)設(shè)的用戶數(shù)據(jù)庫中的聲紋特征進行比對,得到作為處理結(jié)果的用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù);

對應(yīng)地,所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),包括:

根據(jù)所述分析結(jié)果確定用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻;

根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

在其他的實施例中,所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到識別結(jié)果,包括:

對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取,得到第二提取結(jié)果;所述第一頻率范圍包括用戶不可識別的頻率范圍;

對所述第二提取結(jié)果進行識別,得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果;

對應(yīng)地,所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),包括:根據(jù)所述設(shè)備狀態(tài)參數(shù)確定處于第二頻率范圍的待輸出音頻,所述第二頻率范圍為用戶可識別的頻率范圍。

在其他的實施例中,所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容特征識別,得到識別結(jié)果,包括:

對所述音頻數(shù)據(jù)進行內(nèi)容分析,得到第一音頻部分和第二音頻部分;

對應(yīng)地,所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),包括:

根據(jù)所述第一音頻部分確定待輸出音頻;

根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

第二方面,本發(fā)明實施例提供一種音頻處理裝置,包括:

采集單元,用于利用聲音采集裝置采集音頻數(shù)據(jù);

處理單元,用于對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;

確定單元,用于根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;

執(zhí)行單元,用于執(zhí)行所述執(zhí)行指令。

第三方面,本發(fā)明實施例提供一種電子設(shè)備,所述電子設(shè)備包括聲音采集裝置和處理器,其中,所述處理器,用于:

利用聲音采集裝置采集音頻數(shù)據(jù);

對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;

根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;

執(zhí)行所述執(zhí)行指令。

在其他的實施例中,所述對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果,包括:

對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果。

第四方面,本發(fā)明實施例提供一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)中存儲有計算機可執(zhí)行指令,該計算機可執(zhí)行指令用于執(zhí)行上述的音頻處理方法。

本發(fā)明實施例中,利用聲音采集裝置采集音頻數(shù)據(jù);對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;執(zhí)行所述執(zhí)行指令;如此,能夠使得用戶免于執(zhí)行麻煩且低效的操作。

附圖說明

圖1為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖;

圖2為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖;

圖3為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖;

圖4為本發(fā)明實施例一種音頻處理方法的實現(xiàn)流程示意圖;

圖5為本發(fā)明實施例一種音頻處理裝置的實現(xiàn)流程示意圖;

圖6為本發(fā)明實施例一種電子設(shè)備的實現(xiàn)流程示意圖。

具體實施方式

下面結(jié)合附圖和具體實施例對本發(fā)明的技術(shù)方案進一步詳細闡述。

本實施例提供一種音頻處理方法,該方法應(yīng)用于電子設(shè)備,該音頻處理方法所實現(xiàn)的功能可以通過電子設(shè)備中的處理器調(diào)用程序代碼來實現(xiàn),當然程序代碼可以保存在計算機存儲介質(zhì)中,可見,該電子設(shè)備至少包括處理器和存儲介質(zhì)。

圖1為本發(fā)明實施例種音頻處理方法的實現(xiàn)流程示意圖,如圖1所示,該方法包括:

步驟s101,利用聲音采集裝置采集音頻數(shù)據(jù);

在實現(xiàn)的過程中,聲音采集裝置可以是電子設(shè)備自身的一部分,在其他的實施例中,聲音采集裝置可以是其他電子設(shè)備上的或者聲音采集裝置作為一個獨立的電子設(shè)備,在步驟s101中,聲音采集裝置采集音頻數(shù)據(jù),然后將采集到的音頻數(shù)據(jù)發(fā)送給電子設(shè)備。

在實現(xiàn)的過程中,電子設(shè)備可以音響設(shè)備,本實施中的音響設(shè)備為一智能設(shè)備,即該音響設(shè)備具有處理器,處理器具有信息處理能力。

步驟s102,對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;

步驟s103,根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;

步驟s104,執(zhí)行所述執(zhí)行指令。

這里,所述執(zhí)行指令中攜帶有待輸出音頻和/或調(diào)整參數(shù),所述調(diào)整參數(shù)用于調(diào)整所述待輸出音頻的調(diào)整參數(shù),例如調(diào)整待輸出音頻的音量、頻率范圍。對應(yīng)地,執(zhí)行所述執(zhí)行指令,包括將待輸出音頻輸出至音頻輸出裝置,或者將調(diào)整參數(shù)輸出至音頻輸出裝置,以控制所述音頻輸出裝置按照所述調(diào)整參數(shù)輸出所述音頻輸出裝置。

在實現(xiàn)的過程中,電子設(shè)備可以只包括音響設(shè)備,那么步驟s102至步驟s104即在音響設(shè)備上執(zhí)行。

在其他的實施例中,電子設(shè)備可以包括終端和服務(wù)器,其中音響設(shè)備作為終端設(shè)備,該服務(wù)器用于執(zhí)行步驟s102,這時,本發(fā)明實施例還包括:音響設(shè)備將音頻數(shù)據(jù)發(fā)送給服務(wù)器,服務(wù)器用于執(zhí)行步驟s102。對應(yīng)地,在步驟s103之前,所述方法還包括:服務(wù)器將處理結(jié)果發(fā)送給音響設(shè)備;然后,音響設(shè)備根據(jù)接收到的處理結(jié)果執(zhí)行步驟s103和步驟s104。對應(yīng)地,或者,在步驟s103之后,所述方法還包括:服務(wù)器將執(zhí)行指令發(fā)送給音響設(shè)備,然后音響設(shè)備根據(jù)接收到的執(zhí)行指令執(zhí)行步驟s104。

本發(fā)明實施例中,利用聲音采集裝置采集音頻數(shù)據(jù);對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;執(zhí)行所述執(zhí)行指令;如此,能夠使得用戶免于執(zhí)行麻煩且低效的操作。

在本發(fā)明的其他實施例中,所述對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果,包括:對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果。

在實現(xiàn)的過程中,特征提取包括聲紋特征、頻率處于的范圍特征,其中聲紋(voiceprint)是表現(xiàn)攜帶言語信息的聲波頻譜,一般來說,聲紋不僅具有特定性,而且有相對穩(wěn)定性的特點,因為成年人的聲音可保持長期相對穩(wěn)定不變。

在本發(fā)明的其他實施例中,所述根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令,包括:根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),所述輸出參數(shù)包括待輸出音頻和/或用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù);將所述輸出參數(shù)攜帶在執(zhí)行指令中。

基于前述的實施例,本發(fā)明實施例再提供一種音頻處理方法,該方法包括:

步驟s11,利用聲音采集裝置采集音頻數(shù)據(jù);

這里,所述音頻數(shù)據(jù)可以是用戶發(fā)出的語音指令,例如“聲音大點”、“把音量調(diào)高”、“靜音”、“耳機輸出”、“播放一首歌曲或戲曲”等。電子設(shè)備會針對用戶的語音指令進行響應(yīng),例如如果語音指令為“聲音大點”,那么電子設(shè)備就會將正在播放的音頻的音量進行調(diào)高,如果音頻數(shù)據(jù)為“播放一首歌曲或戲曲”,那么電子設(shè)備就會選擇一首歌曲或戲曲輸出至音頻輸出裝置。

步驟s12,對所述音頻數(shù)據(jù)的內(nèi)容進行分析,得到作為處理結(jié)果的分析結(jié)果;

本實施例中,當音頻數(shù)據(jù)為用戶的語音指令時,電子設(shè)備會對音頻數(shù)據(jù)的內(nèi)容進行分析,然后得到分析結(jié)果;

步驟s13,對所述音頻數(shù)據(jù)進行聲紋特征提取,得到第一提取結(jié)果;

當然,當音頻數(shù)據(jù)為用戶的語音指令時,電子設(shè)備還會音頻數(shù)據(jù)的聲紋特征進行分析或者提取,然后分析出用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)。

步驟s14,將第一提取結(jié)果與預(yù)設(shè)的用戶數(shù)據(jù)庫中的聲紋特征進行比對,得到作為處理結(jié)果的用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù);

這里,用戶數(shù)據(jù)庫內(nèi)的聲紋特征取決于電子設(shè)備的應(yīng)用場景,例如如果是家庭使用電子設(shè)備,那么用戶數(shù)據(jù)庫中可以存儲著家庭成員的聲紋特征;如果是學(xué)校使用電子設(shè)備,那么用戶數(shù)據(jù)庫中的存儲著老師、學(xué)生等相關(guān)人員的聲紋特征。

步驟s15,根據(jù)所述分析結(jié)果確定作為輸出參數(shù)的用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻;

這里,需要說明的是,待輸出音頻可以在其他的實施例中沒有,這主要取決于音頻數(shù)據(jù)是否對應(yīng)有待輸出音頻,一般來說,即使是一般的語音指令都會有待輸出音頻,例如電子設(shè)備采集到的“聲音大點”、“把音量調(diào)高”、“靜音”、“耳機輸出”等,那么待輸出音頻可以為兜底音頻,例如“好的”、“我收到了”、“我沒有聽清楚,請再說一遍”。當然采集到的音頻數(shù)據(jù)為“播放一首歌曲或戲曲”等,那么待輸出音頻可以包括兜底音頻和待播放的歌曲或戲曲。

這里,所述待輸出音頻也是輸出參數(shù);

步驟s16,根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

這里,不同的用戶對聲音的敏感度不一樣,例如聽力不好的人(老人)對聲音比較不敏感,那么輸出的調(diào)整參數(shù)需要將音量調(diào)大,而聽力好的人對聲音比較敏感,那么輸出的調(diào)整參數(shù)需要將音量調(diào)小,例如對于老人,可能60分貝老人就聽不清楚,然而60分貝對于聽力好的人,則足夠了。

步驟s17,將所述輸出參數(shù)攜帶在執(zhí)行指令中,其中所述輸出參數(shù)包括待輸出音頻和用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù);

步驟s18,執(zhí)行所述執(zhí)行指令。

本實施例中,步驟s18,將待輸出音頻輸出至音頻輸出裝置,然后將調(diào)整參數(shù)輸出至音頻輸出裝置,以控制所述音頻輸出裝置按照所述調(diào)整參數(shù)輸出所述音頻輸出裝置。

本實施例中,如果采集到的音頻數(shù)據(jù)為用戶的語音指令,那么步驟s12至s14提供了一種實現(xiàn)“所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果”的方式;對應(yīng)地,步驟s15和步驟s16提供了一種實現(xiàn)“所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)”的方式。

目前有一種智能音響,用戶可以通過語音與其進行交互。在語音交互過程中會有這樣的問題:如果家中有老人,并且聽力不是很好,當老人與音響交互的時候,如果聽不清,會要求音響調(diào)大音量。但是在下一次重新喚醒音響時,輸出的音量又恢復(fù)到默認值,老人又要重新發(fā)出指令,調(diào)大音量。周而復(fù)始,降低體驗?,F(xiàn)有技術(shù)中,不同用戶有不同的聽覺習慣,每次當音量不符合時,都需要用戶主動通過語音指令或物理按鍵調(diào)整音量大小,以達到最佳聽覺效果。顯然這種方式使得用戶執(zhí)行這類操作是麻煩且低效的。針對該問題,本實施例提供的技術(shù)方案通過對外界聲音信息(用戶的語音指令)的識別和判斷,動態(tài)調(diào)整輸出參數(shù)(例如輸出音量大小)。如圖2所示,當用戶發(fā)出語音指令時,音響設(shè)備會進行學(xué)習(步驟a1),例如記錄用戶的聲紋信息;如果用戶對音量進行不斷調(diào)整(步驟a2),那么音響進行學(xué)習和記錄用戶指令;最后音響將學(xué)習到的結(jié)果反饋給用戶(步驟a3),即音響設(shè)備根據(jù)記錄的用戶聲紋信息和用戶指令動態(tài)調(diào)整音響輸出音量。從以上可以看出,即面對不同聽覺要求的人群,智能音響設(shè)備應(yīng)記錄不同人群的聲紋信息,隨著用戶對音響發(fā)出的音量的不斷調(diào)整和訓(xùn)練,當不同用戶喚醒音響時,播放出來的音頻信息的音量會有針對性的變化。例如,面對聽力不好的人,播放的音量會相對大一些。這樣,通過記錄不同用戶的聲紋信息,可以識別不同的使用者,從而播放出適合的音量,即在播放音量上對不同用戶做了定制化的設(shè)置及反饋。本實施例中,通過記錄不同用戶的聲紋信息及音量使用習慣,針對不同使用者,動態(tài)調(diào)整輸出音量。

基于前述的實施例,本發(fā)明實施例再提供一種音頻處理方法,該方法包括:

步驟s21,利用聲音采集裝置采集音頻數(shù)據(jù);

這里,音頻數(shù)據(jù)為其他設(shè)備發(fā)出音頻信號或者音響設(shè)備自身發(fā)出音頻信號;本實施例中,音頻數(shù)據(jù)處于人耳不可識別的范圍或者可是識別的范圍。

步驟s22,對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取,得到第二提取結(jié)果;所述第一頻率范圍包括用戶不可識別的頻率范圍;

步驟s23,對所述第二提取結(jié)果進行識別,得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果;

這里,設(shè)備狀態(tài)參數(shù)可以為正常、電量不足、異常、輸入電壓異常等;

步驟s24,根據(jù)所述設(shè)備狀態(tài)參數(shù)確定處于第二頻率范圍的待輸出音頻,所述第二頻率范圍為用戶可識別的頻率范圍。

這里,待輸出音頻用于表征設(shè)備的狀態(tài),例如待輸出音頻為該設(shè)備處于異常狀態(tài)的音頻,這樣用戶就可以快速得到音響的反饋,從而查看出現(xiàn)異常的設(shè)備。

步驟s25,將所述輸出參數(shù)攜帶在執(zhí)行指令中,其中所述輸出參數(shù)包括待輸出音頻;

步驟s26,執(zhí)行所述執(zhí)行指令。

本實施例中,如果采集到的音頻數(shù)據(jù)為用戶的語音指令,那么步驟s22至s23提供了一種實現(xiàn)“所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果”的方式;對應(yīng)地,步驟s24提供了一種實現(xiàn)“所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)”的方式。

目前有一種智能音響,用戶可以通過語音與其進行交互。在語音交互過程中會有這樣的問題:智能音響目前還沒有針對不同音頻輸入源進行判斷和分類,除了能夠識別人聲外,還應(yīng)該具備環(huán)境聲音的檢測和識別,例如噪音的識別、設(shè)備狀態(tài)聲音的識別。現(xiàn)有技術(shù)中,目前智能家電狀態(tài)判斷方式一般是通過指示燈,或手機客戶端進行查看,顯然這種方式使得用戶執(zhí)行這類操作是麻煩且低效的,即家電狀態(tài)處于被動的狀態(tài)或者啞巴狀態(tài),并不能主動的告訴用戶,顯然智能音響能夠解決這一問題。針對該問題,本實施例提供的技術(shù)方案通過對外界聲音信息(用戶的語音指令)的識別和判斷,然后智能音響設(shè)備輸出設(shè)備狀態(tài)(例如設(shè)備是正常的還是異常的),從而能夠主動告訴用戶。如圖3所示,其他設(shè)備發(fā)出音頻信號或者音響設(shè)備自身發(fā)出音頻信號(步驟b1),那么音頻采集裝置將采集作為音頻數(shù)據(jù)的音頻信號,然后音響對音頻進行處理(步驟b2),其中處理包括接收音頻信號、分析音頻信號和識別設(shè)備狀態(tài),然后,音響將識別出的設(shè)備狀態(tài)(步驟b3)。本實施例中,如果家中智能設(shè)備可以發(fā)出某些低頻聲音(某個音域范圍內(nèi))來表示狀態(tài)(正常工作或發(fā)生故障),智能音響可以通過對低頻聲音信號的識別和放大,判斷設(shè)備狀態(tài)。這樣,通過對家中智能設(shè)備發(fā)出的音頻信號的識別,可以快速獲知設(shè)備狀態(tài),即使通過音頻信息輸出給用戶。

基于前述的實施例,本發(fā)明實施例再提供一種音頻處理方法,該方法包括:

步驟s31,利用聲音采集裝置采集音頻數(shù)據(jù);

這里,所述音頻數(shù)據(jù)可以為用戶在一定環(huán)境參數(shù)下發(fā)出的語音指令,其中環(huán)境參數(shù)為時間和噪音,例如“聲音大點”、“把音量調(diào)高”、“靜音”、“耳機輸出”、“播放一首歌曲或戲曲”等。電子設(shè)備會針對用戶的語音指令進行響應(yīng),例如如果語音指令為“聲音大點”,那么電子設(shè)備就會將正在播放的音頻的音量進行調(diào)高,如果音頻數(shù)據(jù)為“播放一首歌曲或戲曲”,那么電子設(shè)備就會選擇一首歌曲或戲曲輸出至音頻輸出裝置。

步驟s32,對所述音頻數(shù)據(jù)進行內(nèi)容分析,得到第一音頻部分和第二音頻部分;

這里,所述第一音頻部分和所述第二音頻部分是對音頻數(shù)據(jù)的橫向分割,而不是縱向分割,其中橫向分割是內(nèi)容從開始至結(jié)束的分割,而縱向分割為時間維度上的分割,例如輸入的音頻數(shù)據(jù)為5秒鐘的音頻,那么第一音頻數(shù)據(jù)和第二音頻數(shù)據(jù)均為5秒鐘。在實現(xiàn)的過程中,可以將輸入的音頻數(shù)據(jù)分割為噪音部分和非噪音部分,其中非噪音部分可以理解為用戶的語音指令。實際上,音響設(shè)備是很難得知那一部分音頻為噪音部分的,在實施的過程中,音響會對所有的音頻數(shù)據(jù)進行分析,然后將對應(yīng)有待輸出音頻的那一部分輸入的音頻數(shù)據(jù)作為非噪音音頻,而將沒有對應(yīng)有待輸出音頻的那一部分輸入的音頻數(shù)據(jù)作為噪音音頻。例如用戶指令為“把音量調(diào)大”,而旁邊有人喊“吃飯了”,那么輸入的音頻數(shù)據(jù)為“把音量調(diào)大”和“吃飯了”,對于音響而言,“把音量調(diào)大”這一部分音頻為可識別的音頻,即對應(yīng)有待輸出音頻的那一部分音頻(即非噪音音頻),其中帶輸出音頻可以為兜底音頻;而“吃飯了”這一部分音頻為不可識別的音頻,即沒有對應(yīng)有待輸出音頻的那一部分音頻(即噪音音頻)。

步驟s33,根據(jù)所述第一音頻部分確定待輸出音頻;;

這里,待輸出音頻可以為兜底音頻;

步驟s34,根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

這里,待輸出音頻用于表征設(shè)備的狀態(tài),例如待輸出音頻為該設(shè)備處于異常狀態(tài)的音頻,這樣用戶就可以快速得到音響的反饋,從而查看出現(xiàn)異常的設(shè)備。

步驟s35,將所述輸出參數(shù)攜帶在執(zhí)行指令中,其中所述輸出參數(shù)包括待輸出音頻和用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù);

對音頻數(shù)據(jù)進行處理,是能夠識別出音頻中的噪音的,如果噪音太小,可能就直接濾掉了,濾掉的結(jié)果中如果沒有人說話的聲音,說明濾波過于嚴重,應(yīng)該調(diào)小,以確定噪音的音量。

步驟s36,執(zhí)行所述執(zhí)行指令。

本實施例中,步驟s36,將待輸出音頻輸出至音頻輸出裝置,然后將調(diào)整參數(shù)輸出至音頻輸出裝置,以控制所述音頻輸出裝置按照所述調(diào)整參數(shù)輸出所述音頻輸出裝置。

本實施例中,如果采集到的音頻數(shù)據(jù)為用戶的語音指令,那么步驟s32提供了一種實現(xiàn)“所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果”的方式;對應(yīng)地,步驟s33至s34提供了一種實現(xiàn)“所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù)”的方式。

目前有一種智能音響,用戶可以通過語音與其進行交互。在語音交互過程中會有這樣的問題:智能音響輸出的音頻信息的音量都有一個默認值,如果外界噪音相對比較嘈雜的時候,音響輸出的音量不會產(chǎn)生變化,此時用戶可能無法聽清音頻內(nèi)容或者聽覺效果不好?,F(xiàn)有技術(shù)中,當外界相對比較嘈雜的時候,解決音響輸出的音頻內(nèi)容聽不清的問題,需要用戶主動通過語音指令或物理按鍵調(diào)大音響音量。針對該問題,本實施例提供的技術(shù)方案通過對外界聲音信息(用戶的語音指令)的識別和判斷,然后動態(tài)調(diào)整輸出音量大小。如圖4所示,音響設(shè)備根對用戶行為與環(huán)境因素進行學(xué)習(步驟c1),例如音響設(shè)備對時間41、環(huán)境噪音42和語音指令43(音量和音調(diào))等進行學(xué)習,然后根據(jù)實踐、聲音輸入源的解析和判斷(步驟c2),得到輸出參數(shù),然后音響將學(xué)習到的結(jié)果反饋給用戶(步驟c3),即動態(tài)的調(diào)整音響輸出的音量。從以上可以看出,本實施例提供的技術(shù)方案中,智能音響能夠結(jié)合時間、外界環(huán)境音、人發(fā)出的指令聲音的大小,隨時調(diào)整播放音量。例如,白天環(huán)境相對比較嘈雜的時候,音響播放的音量應(yīng)相應(yīng)提高,晚上環(huán)境相對安靜的時候,音響播放的音量應(yīng)相應(yīng)降低。這樣,智能音響播放的音量會隨外界聲音以及指令聲音的大小而變化,以保證在不同使用場景下,用戶都可以聽清。

本發(fā)明實施例提供一種音頻處理裝置,該裝置所包括的各單元、各單元所包括的各模塊,以及各模塊所包括的各子模塊,都可以通過電子設(shè)備中的處理器來實現(xiàn),當然也可通過具體的邏輯電路實現(xiàn);在實施的過程中,處理器可以為中央處理器(cpu)、微處理器(mpu)、數(shù)字信號處理器(dsp)或現(xiàn)場可編程門陣列(fpga)等。

圖5為本發(fā)明實施例一種音頻處理裝置的組成結(jié)構(gòu)示意圖,如圖5所示,所述裝置500包括:

采集單元501,用于利用聲音采集裝置采集音頻數(shù)據(jù);

處理單元502,用于對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;

確定單元503,用于根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;

執(zhí)行單元504,用于執(zhí)行所述執(zhí)行指令。

在本發(fā)明的其他實施例中,所述處理單元,用于對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果。

在本發(fā)明的其他實施例中,所述確定單元包括確定模塊和攜帶模塊,其中:

所述確定模塊,用于根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),所述輸出參數(shù)包括待輸出音頻和/或用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù);

所述攜帶模塊,用于將所述輸出參數(shù)攜帶在執(zhí)行指令中。

在本發(fā)明的其他實施例中,所述處理單元包括分析模塊、第一提取模塊和對比模塊,其中:

所述分析模塊,用于對所述音頻數(shù)據(jù)的內(nèi)容進行分析,得到作為處理結(jié)果的分析結(jié)果;

所述第一提取模塊,用于對所述音頻數(shù)據(jù)進行聲紋特征提取,得到第一提取結(jié)果;

所述對比模塊,用于將第一提取結(jié)果與預(yù)設(shè)的用戶數(shù)據(jù)庫中的聲紋特征進行比對,得到作為處理結(jié)果的用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù);

對應(yīng)地,所述確定模塊包括第一確定子模塊和第二確定子模塊,其中:

所述第一確定子模塊,用于根據(jù)所述分析結(jié)果確定用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻;

所述第二確定子模塊,用于根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

在本發(fā)明的其他實施例中,所述處理單元包括第二提取模塊和識別模塊,其中:

所述第二提取模塊,用于對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取,得到第二提取結(jié)果;所述第一頻率范圍包括用戶不可識別的頻率范圍;

所述識別模塊,用于對所述第二提取結(jié)果進行識別,得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果;

對應(yīng)地,所述確定模塊,用于根據(jù)所述設(shè)備狀態(tài)參數(shù)確定處于第二頻率范圍的待輸出音頻,所述第二頻率范圍為用戶可識別的頻率范圍。

在本發(fā)明的其他實施例中,所述處理單元,用于對所述音頻數(shù)據(jù)進行內(nèi)容分析,得到第一音頻部分和第二音頻部分;

對應(yīng)地,所述確定模塊包括第三確定子模塊和第四確定子模塊,其中:

所述第三確定子模塊,用于根據(jù)所述第一音頻部分確定待輸出音頻;

所述第四確定子模塊,用于根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

這里需要指出的是:以上裝置實施例的描述,與上述方法實施例的描述是類似的,具有同方法實施例相似的有益效果。對于本發(fā)明裝置實施例中未披露的技術(shù)細節(jié),請參照本發(fā)明方法實施例的描述而理解。

基于前述的實施例,本發(fā)明實施例提供一種電子設(shè)備,圖6為本發(fā)明實施例一種電子設(shè)備的組成結(jié)構(gòu)示意圖,如圖6所示,該電子設(shè)備600包括聲音采集裝置601和處理器602,其中,

聲音采集裝置601,用于采集音頻數(shù)據(jù);

處理器602,用于利用聲音采集裝置采集音頻數(shù)據(jù);對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果;根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令;執(zhí)行所述執(zhí)行指令。

在實現(xiàn)的過程中,所述聲音采集裝置601可以為麥克。

在本發(fā)明的其他實施例中,所述對所述音頻數(shù)據(jù)進行音頻處理,獲得處理結(jié)果,包括:對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果。

在本發(fā)明的其他實施例中,所述電子設(shè)備600還可以包括聲音輸出裝置如音響、擴音器等,所述根據(jù)所述處理結(jié)果確定對應(yīng)的執(zhí)行指令,包括:

根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),所述輸出參數(shù)包括待輸出音頻和/或用于調(diào)整待輸出音頻的音量的調(diào)整參數(shù);

將所述輸出參數(shù)攜帶在執(zhí)行指令中。

在本發(fā)明的其他實施例中,所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到處理結(jié)果,包括:

對所述音頻數(shù)據(jù)的內(nèi)容進行分析,得到作為處理結(jié)果的分析結(jié)果;

對所述音頻數(shù)據(jù)進行聲紋特征提取,得到第一提取結(jié)果;

將第一提取結(jié)果與預(yù)設(shè)的用戶數(shù)據(jù)庫中的聲紋特征進行比對,得到作為處理結(jié)果的用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù);

對應(yīng)地,所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),包括:

根據(jù)所述分析結(jié)果確定用于回復(fù)采集的音頻數(shù)據(jù)的待輸出音頻;

根據(jù)用戶的標識信息或用于表征用戶對音量的敏感度的參數(shù)確定用于調(diào)整待輸出音頻的音量的輸出參數(shù)。

在本發(fā)明的其他實施例中,所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容識別,得到識別結(jié)果,包括:

對所述音頻數(shù)據(jù)在第一頻率范圍內(nèi)進行頻率特征提取,得到第二提取結(jié)果;所述第一頻率范圍包括用戶不可識別的頻率范圍;

對所述第二提取結(jié)果進行識別,得到用于表征設(shè)備狀態(tài)參數(shù)的識別結(jié)果;

對應(yīng)地,所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),包括:根據(jù)所述設(shè)備狀態(tài)參數(shù)確定處于第二頻率范圍的待輸出音頻,所述第二頻率范圍為用戶可識別的頻率范圍。

在本發(fā)明的其他實施例中,所述對所述音頻數(shù)據(jù)進行特征提取和/或內(nèi)容特征識別,得到識別結(jié)果,包括:

對所述音頻數(shù)據(jù)進行內(nèi)容分析,得到第一音頻部分和第二音頻部分;

對應(yīng)地,所述根據(jù)所述處理結(jié)果確定用于輸出至聲音輸出裝置的輸出參數(shù),包括:

根據(jù)所述第一音頻部分確定待輸出音頻;

根據(jù)所述第二音頻部分的音量參數(shù)確定用于調(diào)整所述待輸出音頻的音量的輸出參數(shù)。

需要說明的是,本發(fā)明實施例中,如果以軟件功能模塊的形式實現(xiàn)上述的音頻處理方法,并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(rom,readonlymemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。這樣,本發(fā)明實施例不限制于任何特定的硬件和軟件結(jié)合。

相應(yīng)地,本發(fā)明實施例再提供一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)中存儲有計算機可執(zhí)行指令,該計算機可執(zhí)行指令用于執(zhí)行本發(fā)明實施例中音頻處理方法。

這里需要指出的是:以上電子設(shè)備或存儲介質(zhì)實施例項的描述,與上述方法描述是類似的,具有同方法實施例相同的有益效果。對于本發(fā)明電子設(shè)備或存儲介質(zhì)實施例中未披露的技術(shù)細節(jié),本領(lǐng)域的技術(shù)人員請參照本發(fā)明方法實施例的描述而理解。

應(yīng)理解,說明書通篇中提到的“一個實施例”或“一實施例”意味著與實施例有關(guān)的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個實施例中。因此,在整個說明書各處出現(xiàn)的“在一個實施例中”或“在一實施例中”未必一定指相同的實施例。此外,這些特定的特征、結(jié)構(gòu)或特性可以任意適合的方式結(jié)合在一個或多個實施例中。應(yīng)理解,在本發(fā)明的各種實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。

需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。

在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過其它的方式實現(xiàn)。以上所描述的設(shè)備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,如:多個單元或組件可以結(jié)合,或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設(shè)備或單元的間接耦合或通信連接,可以是電性的、機械的或其它形式的。

上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元;既可以位于一個地方,也可以分布到多個網(wǎng)絡(luò)單元上;可以根據(jù)實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。

另外,在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理單元中,也可以是各單元分別單獨作為一個單元,也可以兩個或兩個以上單元集成在一個單元中;上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。

本領(lǐng)域普通技術(shù)人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲于計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括:移動存儲設(shè)備、rom、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

或者,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質(zhì)包括:移動存儲設(shè)備、rom、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1