亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于移動裝置的智能音頻記錄的系統(tǒng)和方法_5

文檔序號:9601015閱讀:來源:國知局
00更新。在圖24處呈現(xiàn)核心音頻記錄模塊的內(nèi)部操作的詳細(xì)描述。在實際音頻記錄正在進(jìn)行中的同時,上下文評估邏輯950可經(jīng)配置以持續(xù)監(jiān)視并分析音頻輸入S270,且進(jìn)而當(dāng)在預(yù)定時間周期期間尚未檢測到引起關(guān)注的上下文信息S600時觸發(fā)結(jié)束事件指示符S940。用于預(yù)定時間周期的示范性實施方案可包括使用在最近S秒期間的音頻數(shù)據(jù)。這種產(chǎn)生結(jié)束事件指示符S940的方法可被稱為“超時機(jī)制”。舉例來說,此類測試方法可包括針對圖8中所揭示的子模塊中的一些或全部的輸出來計算優(yōu)先級的加權(quán)總和以及將所述加權(quán)總和與一個或一個以上閾值進(jìn)行比較。
[0117]圖22為在音頻監(jiān)視狀態(tài)S4期間的音頻記錄處理器230的實施例的流程圖。此處的流程圖可經(jīng)配置以大致上類似于圖15中的流程圖,除了最后的框2240可觸發(fā)開始事件指示符而非第一等級開始事件指示符1540之外。此類似性是歸因于以下事實:圖11的被動音頻監(jiān)視狀態(tài)S1和圖12的音頻監(jiān)視狀態(tài)S4兩者可具有相同目的,即以功率有效方式周期性地感測環(huán)境的聽覺事件。
[0118]圖23為在活動音頻記錄狀態(tài)S5期間的音頻記錄處理器230的實施例的流程圖。因為在S3或S5中的活動記錄處理器可執(zhí)行類似操作,所以除了在流程圖的開始處的額外框2300、2305之外,此處的流程圖還可大致上近似于或等同于圖21中的流程圖。不同于S3狀態(tài)(其先前狀態(tài)始終為主動音頻監(jiān)視狀態(tài)S2,其中上下文識別器560可經(jīng)配置以取決于設(shè)計偏好而周期性地或連續(xù)地識別上下文信息S600),此處可需要這些額外框2300、2305,因為S5的先前狀態(tài)為音頻監(jiān)視狀態(tài)S4,且可在S4狀態(tài)處不執(zhí)行上下文識別步驟。如果由輸入信號處置器540檢測到2310起源于輸入信號S220的結(jié)束事件請求,那么其可觸發(fā)結(jié)束事件指示符2330。如果由輔助信號分析器530檢測到2315起源于輔助信號S240的結(jié)束事件請求,那么其可觸發(fā)結(jié)束事件指示符2330。如果沒有從輸入信號處置器540或輔助信號分析器530檢測到結(jié)束事件,那么在核心音頻記錄模塊2320處執(zhí)行實際音頻記錄。在音頻記錄期間,上下文識別器560可經(jīng)配置以持續(xù)識別上下文信息S600,且存儲在存儲器位置中的較老所識別的上下文信息S600可由較新所識別的上下文信息S600更新。在圖24處呈現(xiàn)核心音頻記錄模塊的內(nèi)部操作的詳細(xì)描述。在實際音頻記錄正在進(jìn)行中的同時,上下文評估邏輯可經(jīng)配置以持續(xù)監(jiān)視并分析音頻輸入S270,且進(jìn)而當(dāng)在預(yù)定時間周期期間尚未檢測到引起關(guān)注的上下文信息S600時觸發(fā)結(jié)束事件指示符S940。用于預(yù)定時間周期的示范性實施方案可包括使用在最近S持續(xù)時間期間的音頻數(shù)據(jù)。這種產(chǎn)生結(jié)束事件指示符S940的方法可被稱為“超時機(jī)制”。舉例來說,此測試方法可包括針對圖8中所揭示的子模塊中的一些或全部的輸出來計算優(yōu)先級的加權(quán)總和以及將所述加權(quán)總和與一個或一個以上閾值進(jìn)行比較。
[0119]圖24為在活動音頻記錄狀態(tài)S3、S5期間的核心音頻記錄模塊的實施例的流程圖。在此示范性實施例中,來自流程圖的頂部的前三個框2410、2415、2420展示智能音頻記錄系統(tǒng)的根據(jù)上下文信息S600的動態(tài)配置特性。A/D轉(zhuǎn)換器的取樣頻率2410和/或數(shù)據(jù)寬度2415可在音頻記錄過程期間基于上下文信息S600來動態(tài)地重新配置。上下文信息S600通常在整個音頻記錄過程期間逐漸地或甚至突然地變化,整個音頻記錄過程可持續(xù)數(shù)分鐘或甚至數(shù)小時以上。舉例來說,會話語音的話題可隨時間而改變。說話者的背景噪聲或環(huán)境可改變,例如,當(dāng)說話者正在行走于街道上或使用公共運輸在途中時。而且,音頻輸入S270的內(nèi)容可隨時間而改變,例如從會話語音改變?yōu)橐魳坊蛞魳芳诱Z音,且反之亦然??尚枰槍σ魳穬?nèi)容使用取樣頻率或數(shù)據(jù)寬度的較高分辨率且針對主要語音信號使用取樣頻率或數(shù)據(jù)寬度的較低分辨率。在另一實施例中,分辨率可經(jīng)配置以根據(jù)語音內(nèi)容的特性而有所不同。舉例來說,所述系統(tǒng)可經(jīng)配置以針對商業(yè)交流使用與朋友之間的私人會話不同的分辨率。用于根據(jù)上下文信息S600的對A/D轉(zhuǎn)換器的配置的動態(tài)設(shè)置和對存儲器位置的動態(tài)選擇的框2410、2415、2420可在本文中所揭示的一般原理的范圍內(nèi)在其之間或與流程圖中的其它框相對地以不同次序重新定位。
[0120]所述系統(tǒng)還可經(jīng)配置以基于上下文信息S600來動態(tài)地選擇存儲器位置2420。舉例來說,所述系統(tǒng)可經(jīng)配置以在一個或一個以上說話者在會話期間結(jié)果滿足例如主要商業(yè)消費者等特定簡檔時或在音頻輸入S270大致上包括比語音信號多的音樂時將音頻記錄數(shù)據(jù)存儲到在服務(wù)器側(cè)處遠(yuǎn)程連接的存儲裝置。在此些情況下,可需要使用A/D轉(zhuǎn)換器的較高分辨率且因此需要較大存儲空間。
[0121]音頻記錄處理器230接著可經(jīng)配置以從緩沖器220讀取音頻數(shù)據(jù)2424??蓮淖罱囊纛l數(shù)據(jù)識別2430新的上下文信息,且可將新上下文信息存儲2435在存儲器中。在另一實施例中,上下文信息S600的上下文識別過程2430或保存過程2434可在本文中所揭示的一般原理的范圍內(nèi)被跳過或與流程圖中的其它框相對地以不同次序來重新定位。
[0122]音頻記錄處理器230可經(jīng)配置以在將經(jīng)處理信號存儲在選定存儲器中之前確定2440音頻輸入S270信號的增強(qiáng)是否為合乎需要的或在此情況下什么類型的增強(qiáng)處理可為合乎需要的。所述確定可基于上下文信息S600或由系統(tǒng)自動地或由用戶手動地預(yù)先配置。此類增強(qiáng)處理可包括聲學(xué)回聲消除(AEC)、接收話音增強(qiáng)(RVE)、主動噪聲消除(ANC)、噪聲抑制(NS)、聲學(xué)增益控制(AGC)、聲學(xué)音量控制(AVC)或聲學(xué)動態(tài)范圍控制(ADRC)。在一個實施例中,信號增強(qiáng)的積極性可基于音頻輸入S270的內(nèi)容或上下文信息S600。
[0123]音頻記錄處理器230可經(jīng)配置以在將經(jīng)處理信號存儲在選定存儲器位置中之前確定2445是否音頻輸入S270信號的壓縮為合乎需要的或在此情況下什么類型的壓縮處理可為合乎需要的。所述確定可基于上下文信息S600或由系統(tǒng)自動地或由用戶手動地預(yù)先配置。舉例來說,所述系統(tǒng)可基于音頻記錄的預(yù)期持續(xù)時間,優(yōu)選地基于日歷信息,選擇在音頻記錄開始之前使用壓縮。對例如語音譯碼或音頻譯碼等壓縮方法的選擇可基于音頻輸入S270的內(nèi)容或上下文信息S600來動態(tài)地配置。除非另有指定,否則在本申請案的上下文內(nèi)的壓縮可意指源譯碼,例如語音編碼/解碼和音頻編碼/解碼。因此,對于所屬領(lǐng)域的技術(shù)人員來說應(yīng)明顯的是,所述壓縮可以可互換地用作編碼,且解壓縮可以可互換地用作解碼。例如位率、編碼模式或通道數(shù)目等編碼參數(shù)也可基于音頻輸入S270的內(nèi)容或上下文信息S600來動態(tài)地配置。
[0124]圖25為根據(jù)常規(guī)麥克風(fēng)控制的單個麥克風(fēng)開啟和關(guān)閉控制的實施例的圖。當(dāng)移動裝置處于閑置模式2550時,通常關(guān)閉2510麥克風(fēng)和麥克風(fēng)的操作所需的相關(guān)塊(例如A/D轉(zhuǎn)換器)。麥克風(fēng)及其相關(guān)塊通常僅在針對需要使用麥克風(fēng)的應(yīng)用(例如話音呼叫或視頻錄入)活動地使用移動裝置期間開啟2520。
[0125]圖26為單個麥克風(fēng)開啟和關(guān)閉控制的第一實施例的圖。與圖25相反,麥克風(fēng)可經(jīng)配置以甚至在移動裝置處于閑置模式2550的周期期間選擇性地開啟2520。麥克風(fēng)可經(jīng)配置以根據(jù)音頻輸入S270的上下文信息S600而選擇性地開啟。在一個實施例中,此特征可對于被動音頻監(jiān)視狀態(tài)S1、主動音頻監(jiān)視狀態(tài)S2或音頻監(jiān)視狀態(tài)S4來說為合乎需要的。
[0126]圖27為單個麥克風(fēng)開啟和關(guān)閉控制的第二實施例的圖。與圖26相反,麥克風(fēng)可經(jīng)配置以甚至在移動裝置處于閑置模式2550的周期期間一貫地開啟2700。在此情況下,可在麥克風(fēng)被開啟時增加所述系統(tǒng)的功率消耗。在一個實施例中,此特征可適用于被動音頻監(jiān)視狀態(tài)S1、主動音頻監(jiān)視狀態(tài)S2、音頻監(jiān)視狀態(tài)S4或活動音頻記錄狀態(tài)S3、S5。
[0127]圖28為多個麥克風(fēng)開啟和關(guān)閉控制的第一實施例的圖。在一個實施例中,一個或一個以上麥克風(fēng)可經(jīng)配置以按與常規(guī)系統(tǒng)類似的方式進(jìn)行操作。換句話說,一個或一個以上麥克風(fēng)可僅在活動話音呼叫期間或在視頻錄入或需要活動地使用一個或一個以上麥克風(fēng)的任何其它應(yīng)用程序期間響應(yīng)于用戶的手動選擇而開啟。然而,其它麥克風(fēng)可經(jīng)配置以間歇地開啟。在所述圖中出于示范性目的而呈現(xiàn)僅兩個麥克風(fēng),但相同的麥克風(fēng)控制概念可應(yīng)用于兩個以上麥克風(fēng)。
[0128]圖29為多個麥克風(fēng)開啟和關(guān)閉控制的第二實施例的圖。與圖28相反,一個或一個以上麥克風(fēng)可經(jīng)配置以按與常規(guī)系統(tǒng)類似的方式進(jìn)行操作,其方式為使得一個或一個以上麥克風(fēng)可僅在活動話音呼叫期間或在視頻錄入或需要活動地使用一個或一個以上麥克風(fēng)的任何其它應(yīng)用程序期間響應(yīng)于用戶的手動選擇來開啟。然而,其它麥克風(fēng)可經(jīng)配置以一直開啟。在此情況下,可在麥克風(fēng)被開啟時增加所述系統(tǒng)的功率消耗。在所述圖中出于示范性目的而呈現(xiàn)僅兩個麥克風(fēng),但相同的麥克風(fēng)控制概念可應(yīng)用于兩個以上麥克風(fēng)。
[0129]圖30為根據(jù)本申請案的活動麥克風(fēng)數(shù)目控制的實施例的圖,其中可根據(jù)上下文信息S600來動態(tài)地控制麥克風(fēng)的活動數(shù)目。出于示范性目的,將可用麥克風(fēng)的最大數(shù)目假設(shè)為三個,且其也為可在被動音頻監(jiān)視狀態(tài)S1、主動音頻監(jiān)視狀態(tài)S2或音頻監(jiān)視狀態(tài)S4期間開啟的麥克風(fēng)的最大數(shù)目。然而,對麥克風(fēng)的不同數(shù)目的選擇仍可在本發(fā)明的范圍內(nèi)。在被動音頻監(jiān)視狀態(tài)S1或音頻監(jiān)視狀態(tài)S4狀態(tài)期間,麥克風(fēng)可經(jīng)配置以周期性地開啟,所以其可監(jiān)視環(huán)境的聽覺事件。因此,在這些狀態(tài)期間,麥克風(fēng)的活動數(shù)目可優(yōu)選地在零個與一個之間改變。在主動音頻監(jiān)視狀態(tài)S2狀態(tài)期間,麥克風(fēng)的活動數(shù)目可持續(xù)優(yōu)選地在零個與一個之間改變,但在開啟周期之間的時間間隔T4可經(jīng)配置以大于被動音頻監(jiān)視狀態(tài)S1或音頻監(jiān)視狀態(tài)S4狀態(tài)的時間間隔!\。
[0130]在活動音頻記錄狀態(tài)S3、S5期間,活動麥克風(fēng)數(shù)目可經(jīng)配置以根據(jù)上下文信息S600而動態(tài)地改變。舉例來說,麥克風(fēng)的活動數(shù)目可經(jīng)配置以在檢測到特定上下文信息S600或高優(yōu)先級上下文信息S600后即刻從一個3045增加到兩個3050。在另一實例中,麥克風(fēng)數(shù)目可經(jīng)配置以在背景噪聲的特性從平穩(wěn)改變?yōu)椴黄椒€(wěn)或從輕微等級改變?yōu)閲?yán)重等級時增加。在此情況下,基于多麥克風(fēng)的噪聲抑制方法可能夠增加音頻輸入S270的質(zhì)量?;顒欲溈孙L(fēng)數(shù)目的增加或減小還可基于音頻輸入S270的質(zhì)量。麥克風(fēng)的數(shù)目可隨音頻輸入S270的質(zhì)量(例如根據(jù)音頻輸入S270的信噪比(SNR))降級為低于特定閾值而增加。
[0131]音頻記錄的存儲裝置可經(jīng)配置以在實際音頻記錄過程期間或在完成音頻記錄之后動態(tài)地在本地存儲裝置與遠(yuǎn)程存儲裝置之間改變。舉例來說,圖31展示存儲位置選擇的實施例,其中所述選擇可根據(jù)預(yù)定義的上下文信息S600優(yōu)先級來控制。此選擇可在開始音頻記錄之前或在完成音頻記錄之后執(zhí)行。舉例來說,上下文信息S600可經(jīng)預(yù)配置以具有不同等級的優(yōu)先級。接著,在開始每一音頻記錄之前,可根據(jù)在某窗口周期期間的上下文信息S600的特性與預(yù)定義的一個或一個以上閾值之間的比較來選擇存儲裝置。在另一實施例中,可在完成每一音頻記錄之后決定長期存儲裝置的選擇。初始音頻記錄可默認(rèn)地出于短期存儲目的而存儲在(例如)本地存儲裝置內(nèi)。在完成音頻記錄后,音頻記錄可即刻由音頻記錄處理器230分析以便確定用于音頻記錄的長期存儲位置。每一音頻記錄可在完成音頻記錄之前或之后被指派優(yōu)先級。長期存儲裝置選擇可經(jīng)配置以基于音頻記錄的優(yōu)先級。圖31展示其中將具有較低優(yōu)先級上下文信息的音頻記錄存儲在本地存儲裝置中而將具有較高優(yōu)先級上下文信息的音頻記錄存儲在網(wǎng)絡(luò)存儲裝置中的示范性系統(tǒng)。應(yīng)注意,在本發(fā)明的范圍內(nèi),具有較低優(yōu)先級上下文信息的音頻記錄可存儲在網(wǎng)絡(luò)存儲裝置中,或具有較高優(yōu)先級上下文信息的音頻記錄可存儲在本地存儲裝置中。
[0132]圖32展示存儲位置選擇的實施例,其中所述選擇可在活動音頻記錄狀態(tài)S3、S5期間根據(jù)上下文信息S600優(yōu)先級來動態(tài)地控制。與圖31相反,存儲裝置選擇可在實際音頻記錄處理期間根據(jù)上下文信息S600、可用存儲器空間或移動裝置與遠(yuǎn)程服務(wù)器之間的信道的質(zhì)量來動態(tài)地切換。
[0133]圖33為存儲裝置期滿時間設(shè)置的實施例的圖,其中期滿時間可根據(jù)預(yù)定義的上下文信息S600優(yōu)先級來控制。存儲在存儲裝置中的音頻記錄可經(jīng)配置以通過用戶的手動選擇來刪除或通過可基于預(yù)定義的期滿時間的機(jī)制而自動期滿。當(dāng)音頻記錄已期滿時,期滿的音頻記錄可經(jīng)配置以被刪除或移動到臨時存儲地點,例如“回收儲倉”。期滿的音頻記錄可經(jīng)配置以在假如其在錄入時未被壓縮的情況下進(jìn)行壓縮。倘若其已經(jīng)在錄入時進(jìn)行編碼,那么其可使用可允許較高壓縮的譯碼格式或譯碼參數(shù)來進(jìn)行代碼轉(zhuǎn)換,從而導(dǎo)致更緊湊的音頻記錄大小。
[0134]期滿時間設(shè)置可在音頻記錄時或在完成音頻之后確定。在一個實施例中,可根據(jù)音頻記錄的上下文信息S600的特性或統(tǒng)計來向每一音頻記錄指派優(yōu)先級值。舉例來說,圖33中的音頻記錄#13340可具有比音頻記錄#33320低的優(yōu)先級。在示范性實施方案中,可需要將音頻記錄#1的期滿時間Ε?\設(shè)置為小于音頻記錄#3的期滿時間ΕΤ3。作為實例,Ε?\可被設(shè)置為“ 1周”,且ΕΤ3可被設(shè)置為“2周”。通常需要使音頻記錄的期滿時間與所述音頻記錄的優(yōu)先級成比例。但應(yīng)注意,具有不同優(yōu)先級的音頻記錄沒有必要必須始
當(dāng)前第5頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1