亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于控制語音激活的方法和設備的制造方法

文檔序號:9457754閱讀:635來源:國知局
用于控制語音激活的方法和設備的制造方法
【專利說明】用于控制語音激活的方法和設備
[0001]優(yōu)先權主張
[0002]本申請案主張共同擁有的2013年5月7日提交的第61/820,526號美國臨時專利申請案、2013年8月9日提交的第61/864,490號美國臨時專利申請案,以及2013年11月27日提交的第14/092,527號美國非臨時申請案的優(yōu)先權,所述申請案中的每一者的內容以全文引用的方式明確地并入本文中。
技術領域
[0003]本發(fā)明大體上涉及語音激活,且更具體來說,涉及在移動裝置中控制語音激活。
【背景技術】
[0004]近年來,移動裝置(例如智能電話、個人數(shù)字助理(PDA)、平板計算機以及膝上型計算機)的使用已經變得分布廣泛。這些裝置允許用戶執(zhí)行多種功能,例如瀏覽因特網(wǎng)、拍攝相片或視頻、打電話或進行視頻通話等。另外,此類裝置通常提供具有各種功能性的應用。
[0005]此外,許多此類移動裝置可以包含用于捕獲音頻信號的一或多個麥克風。這些裝置中的一些可以允許捕獲且處理音頻信號以用于語音激活。使用此類語音激活特征,可以通過在移動裝置中輸入語音關鍵字來激活應用。
[0006]為了充分利用此類語音激活特征,移動裝置通常需要經配置以針對可能的關鍵字連續(xù)監(jiān)視且處理環(huán)境聲音。然而,語音激活特征的連續(xù)操作可能耗盡移動裝置的有限功率資源。

【發(fā)明內容】

[0007]本發(fā)明提供用于在移動裝置中控制語音激活的方法、系統(tǒng)和裝置。在這些方法、系統(tǒng)和裝置中,一旦接收輸入聲音流,就可以在輸入聲音流指示話音時激活語音激活單元以檢測目標關鍵字。此外,可以從輸入聲音流提取至少一個聲音特征,且當所述至少一個聲音特征指示非目標關鍵字時可以去激活語音激活單元。
[0008]根據(jù)本發(fā)明的一個方面,揭示一種用于在移動裝置中通過目標關鍵字控制語音激活的方法。在所述方法中,接收輸入聲音流,且當所述輸入聲音流指示話音時激活語音激活單元以檢測目標關鍵字。從輸入聲音流提取至少一個聲音特征,且當所述至少一個聲音特征指示非目標關鍵字時去激活語音激活單元。本發(fā)明還描述了與此方法相關的裝置、系統(tǒng)、裝置的組合以及計算機可讀媒體。
[0009]根據(jù)本揭示內容的另一方面,揭示一種用于通過目標關鍵字控制語音激活的移動裝置。所述移動裝置包含接收器、話音檢測器、語音激活單元以及語音激活控制單元。所述接收器經配置以接收輸入聲音流。此外,所述話音檢測器經配置以在所述輸入聲音流指示話音時激活語音激活單元以檢測目標關鍵字。語音激活單元經配置以從輸入聲音流提取至少一個聲音特征,且語音激活控制單元經配置以在所述至少一個聲音特征指示非目標關鍵字時去激活所述語音激活單元。
【附圖說明】
[0010]圖1圖示根據(jù)本發(fā)明的一個實施例的移動裝置,其經配置以捕獲輸入聲音且在于所述輸入聲音中檢測到目標關鍵字時執(zhí)行語音激活功能。
[0011]圖2圖示根據(jù)本發(fā)明的一個實施例的在會議中的用戶,其中所述用戶的移動裝置經配置以在所述會議期間的對話不包含目標關鍵字時去激活語音激活單元。
[0012]圖3圖示根據(jù)本發(fā)明的一個實施例的移動裝置的框圖,所述移動裝置經配置以檢測在輸入聲音流中的目標關鍵字以用于激活在所述移動裝置中的功能。
[0013]圖4A圖示根據(jù)本發(fā)明的一個實施例的DSP的框圖,所述DSP經配置以從聲音傳感器接收激活信號和輸入聲音流且產生用于激活語音助理單元的激活信號。
[0014]圖4B圖示根據(jù)本發(fā)明的另一實施例的DSP的框圖,所述DSP經配置以從聲音傳感器接收激活信號和輸入聲音流且產生用于激活語音助理單元的激活信號。
[0015]圖5圖示根據(jù)本發(fā)明的一個實施例的語音激活單元的更詳細框圖,所述語音激活單元經配置以接收輸入聲音流且在所述輸入聲音流中檢測目標關鍵字。
[0016]圖6圖示根據(jù)本發(fā)明的一個實施例的輸入聲音流的多個置信度分數(shù)、多個當前非關鍵字分數(shù)、多個當前關鍵字分數(shù)以及多個總平均非關鍵字分數(shù)的示范性曲線圖。
[0017]圖7圖示根據(jù)本發(fā)明的一個實施例的一種方法的流程圖,所述方法用于基于由語音激活單元計算的關鍵字分數(shù)和非關鍵字分數(shù)去激活移動裝置的語音激活單元。
[0018]圖8圖示根據(jù)本發(fā)明的一個實施例的一種方法的流程圖,所述方法用于通過語音激活控制單元去激活語音激活單元以終止接收輸入聲音流和處理正被接收的輸入聲音流。
[0019]圖9圖示根據(jù)本發(fā)明的一個實施例的一種方法的流程圖,所述方法用于在去激活語音激活單元以終止接收輸入聲音流和處理正被接收的輸入聲音流之后再激活所述語音激活單元。
[0020]圖10圖示根據(jù)本發(fā)明的一個實施例的一種方法的詳細流程圖,所述方法用于檢測輸入聲音流的狀態(tài)改變以在去激活的次數(shù)等于預定值時再激活語音激活單元。
[0021]圖11圖示根據(jù)本發(fā)明的另一實施例的一種方法的詳細流程圖,所述方法用于檢測輸入聲音的狀態(tài)改變以在去激活的次數(shù)等于預定值時再激活語音激活單元。
[0022]圖12A圖示示出根據(jù)本發(fā)明的一個實施例的來自用于確定平均非關鍵字分數(shù)閾值的模擬的多條線的曲線圖。
[0023]圖12B圖示示出根據(jù)本發(fā)明的另一實施例的來自用于確定平均非關鍵字分數(shù)閾值的模擬的多條線的曲線圖。
[0024]圖13是根據(jù)本發(fā)明的一個實施例的具有無線通信能力的示范性移動裝置的框圖。
【具體實施方式】
[0025]現(xiàn)在將詳細參考各種實施例,在附圖中圖示所述實施例的實例。在以下詳細描述中,闡述眾多具體細節(jié)以便提供對本發(fā)明的透徹理解。然而,對于所屬領域的技術人員將顯而易見的是,可在沒有這些具體細節(jié)的情況下實踐本發(fā)明。在其它情況下,未詳細描述眾所周知的方法、程序、系統(tǒng)和組件,以便不會不必要地混淆各種實施例的各方面。
[0026]圖1圖示根據(jù)本發(fā)明的一些實施例的移動裝置110,其經配置以捕獲輸入聲音流且在于所述輸入聲音流中檢測到目標關鍵字時執(zhí)行語音激活功能。在所說明的實施例中,用戶120可以在躺在床130上時說出目標關鍵字且移動裝置110接收所說出的聲音。響應于所說出的聲音,移動裝置110激活語音激活單元以在所接收的輸入聲音流中檢測目標關鍵字。語音激活單元從輸入聲音流提取至少一個聲音特征。當至少一個聲音特征指示非目標關鍵字時,移動裝置I1去激活語音激活單元。
[0027]移動裝置110可以時任何合適的裝置,例如蜂窩式電話、智能電話、配備有聲音捕獲能力(例如,允許檢測目標關鍵字以用于激活語音激活功能的麥克風)的膝上型計算機或平板計算機。例如,在入睡之前,用戶120可以口頭地在移動裝置110中設置鬧鐘。在此情況下,用戶120可以向移動裝置110說出目標關鍵字“設置鬧鐘”,所述移動裝置激活鬧鐘應用。移動裝置110隨后接收所述聲音且確定所接收的聲音(即,輸入聲音流)是否超出預定閾值聲音強度。此外,當所接收的聲音超出預定閾值聲音強度時,移動裝置110通過使用聲音分類方法(例如,支持向量機技術)確定所接收的聲音是否是話音。
[0028]如果移動裝置110確定所接收的聲音是超出預定閾值聲音強度的話音,那么移動裝置110激活語音激活單元以確定所接收的語音聲音是否包含目標關鍵字,所述目標關鍵字可以事先存儲在移動裝置110的關鍵字數(shù)據(jù)庫中。在確定所接收的聲音包含目標關鍵字后,移動裝置110激活與目標關鍵字相關聯(lián)的鬧鐘應用且允許用戶120將鬧鐘設置成所需時間。如本文中所使用,術語“聲音流”是指一或多個聲音信號或聲音數(shù)據(jù)的序列。此外,術語“關鍵字”是指可以用于激活在移動裝置中的功能或應用的一或多個單詞或聲音的任何數(shù)字或模擬表示,且可以包含呈人的話音或對話的口頭形式或經記錄形式的任何數(shù)目的單詞。如本文中所使用,術語“語音激活”意指通過在所捕獲的聲音中檢測預定目標關鍵字來激活移動裝置的至少一個功能或應用。
[0029]為了允許語音激活,移動裝置110可以經配置以連續(xù)監(jiān)視輸入聲音流以用于確定所捕獲的聲音是否包含目標關鍵字,直到移動裝置110從所捕獲的聲音檢測到目標關鍵字。以此方式操作移動裝置110通常導致增加的功率的使用,由此縮短電池壽命。因此,為了節(jié)約功率,可以通過控制語音激活來減少移動裝置110的功率消耗,如下文在一些實施例中所描述。
[0030]在圖1中,一旦激活移動裝置110的語音激活單元,所述語音激活單元就可以活動模式繼續(xù)操作,直到所述語音激活單元檢測到目標關鍵字。在此情況下,因為用戶120在睡覺,所以到移動裝置110的輸入聲音流將不具有包含用戶120的目標關鍵字的任何話音。因此,移動裝置110經配置以自動地去激活移動裝置110的語音激活單元,如下文更詳細地描述。通過監(jiān)視輸入聲音流且按需要自動地去激活語音激活單元,移動裝置110可以節(jié)約功率且提高電池壽命。當移動裝置110確定隨后接收的聲音是話音時,可以再激活去激活語音激活單元。
[0031]如上文所描述,當移動裝置110確定所接收的聲音是超出預定閾值聲音強度的話音時,可以激活移動裝置110的語音激活單元。在一些情況下,移動裝置110的語音激活單元可能在沒有任何語音輸入的情況下由于噪聲或故障而被激活。在此事件中,移動裝置110經配置以檢測激活且去激活語音激活單元以減少功率消耗。例如,如果在用戶120如圖1中所圖示在睡覺時移動裝置110的語音激活單元由于噪聲或故障而被意外地激活,那么移動裝置110可以基于隨后接收的聲音去激活語音激活單元。如本文中所使用,術語“激活”是指從斷開狀態(tài)或非活動狀態(tài)(例如,空閑態(tài))啟用或開啟裝置或單元以允許所述裝置或所述單元執(zhí)行一或多個相關聯(lián)功能。此外,術語“去激活”是指從激活狀態(tài)(例如,“開啟”狀態(tài))停用或斷開裝置或單元。術語“再激活”是指在裝置或單元已經去激活之后啟用或開啟所述裝置或所述單元。
當前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1