亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

激活短語的低功率檢測的制作方法

文檔序號:10571091閱讀:260來源:國知局
激活短語的低功率檢測的制作方法
【專利摘要】本發(fā)明涉及激活短語的低功率檢測。描述了激活短語的低功率檢測的方法。麥克風(fēng)系統(tǒng)包括用于檢測在經(jīng)由麥克風(fēng)接收的音頻流中的預(yù)定義的激活短語的專用硬件邏輯。如果預(yù)定義的激活短語被檢測到,則硬件邏輯發(fā)送觸發(fā)信號以激活在麥克風(fēng)系統(tǒng)外部并可能在低功率待機(jī)狀態(tài)中的例如主語音檢測模塊的模塊。
【專利說明】激活短語的低功率檢測
[0001 ] 背景
[0002]很多消費(fèi)類設(shè)備(包括智能電話、電視機(jī)、導(dǎo)航系統(tǒng)和游戲控制臺)除了例如觸摸、按鈕或單獨(dú)的控制器設(shè)備的更標(biāo)準(zhǔn)的輸入機(jī)制以外現(xiàn)在還可由語音來控制。在一些設(shè)備中,語音控制通過按下特定的控制裝置(例如在電視機(jī)的遙控器上的語音控制按鈕或在智能電話的屏幕上的軟控制裝置)而被啟動(dòng),且在一些設(shè)備中,語音控制(除了通過按下控制裝置之外或代替通過按下控制裝置)可通過激活短語(例如“Hey Siri?”、“OK Google?”、“Hey Cortana?”或“computer” )的使用而被觸發(fā)。在一些例子中,語音控制可用于控制在設(shè)備上運(yùn)行的一個(gè)或多個(gè)應(yīng)用(例如搜索應(yīng)用),且在其它例子中,語音控制可被更一般地使用來控制設(shè)備的操作。
[0003]下面所述的實(shí)施方式不限于解決可被語音控制的已知設(shè)備的缺點(diǎn)中的任何或所有缺點(diǎn)的實(shí)現(xiàn)。
[0004]概述
[0005]本概述被提供來以簡化形式介紹下面在詳細(xì)描述中被進(jìn)一步描述的一系列概念。該概述并不旨在確定所要求保護(hù)的主題的關(guān)鍵特征或本質(zhì)特征,也不旨在用作在確定所要求保護(hù)的主題的范圍時(shí)的幫助。
[0006]描述了激活短語的低功率檢測的方法。麥克風(fēng)系統(tǒng)包括用于檢測在經(jīng)由麥克風(fēng)接收的音頻流中的預(yù)定義的激活短語的專用硬件邏輯。如果預(yù)定義的激活短語被檢測到,則硬件邏輯發(fā)送觸發(fā)信號以激活在麥克風(fēng)系統(tǒng)外部并可在低功率待機(jī)狀態(tài)中的模塊(例如主語首檢測t吳塊)。
[0007]第一方面提供麥克風(fēng)系統(tǒng),其包括麥克風(fēng)和硬件邏輯,硬件邏輯被配置成檢測在經(jīng)由麥克風(fēng)接收的音頻流中的預(yù)定義的短語并響應(yīng)于檢測到預(yù)定義的短語而發(fā)送觸發(fā)信號以激活在麥克風(fēng)系統(tǒng)外部的模塊。
[0008]第二方面提供包括如本文所述的麥克風(fēng)系統(tǒng)的電池供電的計(jì)算設(shè)備。
[0009]第三方面提供操作麥克風(fēng)系統(tǒng)的方法,其包括:使用麥克風(fēng)系統(tǒng)中的麥克風(fēng)檢測音頻流;使用麥克風(fēng)系統(tǒng)中的專用硬件分析音頻流以檢測預(yù)定義的短語,專用硬件被配置成檢測在輸入音頻流中的預(yù)定義的短語;以及響應(yīng)于檢測到預(yù)定義的短語,發(fā)送觸發(fā)信號以激活在麥克風(fēng)系統(tǒng)外部的模塊。
[0010]分析音頻流以檢測預(yù)定義的短語可包括:將檢測到的音頻的一部分分成一個(gè)或多個(gè)組成部分;以及將組成部分與預(yù)定義的短語的一個(gè)或多個(gè)所存儲的組成部分進(jìn)行比較。
[0011]該方法還可包括:在預(yù)定義的短語之后緩存經(jīng)由麥克風(fēng)接收的音頻流。
[0012]該方法還可包括:響應(yīng)于檢測到預(yù)定義的短語,向麥克風(fēng)系統(tǒng)中的放大器發(fā)送信號以增加在分析音頻流之前由放大器在放大檢測到的音頻流時(shí)使用的增益參數(shù)的值。
[0013]該方法還可包括:響應(yīng)于在麥克風(fēng)系統(tǒng)外部的模塊進(jìn)入低功率模式,向麥克風(fēng)系統(tǒng)中的放大器發(fā)送信號以減小在分析音頻流之前由放大器在放大檢測到的音頻流時(shí)使用的增益參數(shù)的值。
[0014]該方法還可包括:響應(yīng)于檢測到預(yù)定義的短語,發(fā)送信號以增加在分析音頻流之前由麥克風(fēng)系統(tǒng)使用來對檢測到的音頻流進(jìn)行采樣的采樣速率和/或采樣分辨率。
[0015]該方法還可包括:響應(yīng)于在麥克風(fēng)系統(tǒng)外部的模塊進(jìn)入低功率模式,發(fā)送信號以減小在分析音頻流之前由麥克風(fēng)系統(tǒng)使用來對檢測到的音頻流進(jìn)行采樣的采樣速率和/或米樣分辨率。
[0016]該方法還可包括:響應(yīng)于檢測到預(yù)定義的短語,使用檢測到的預(yù)定義的短語更新所存儲的預(yù)定義的短語。
[0017]該方法還可包括:響應(yīng)于部分地檢測到預(yù)定義的短語,將包括部分地檢測到的預(yù)定義的短語的音頻流的一部分發(fā)送到在麥克風(fēng)系統(tǒng)外部的模塊。
[0018]該方法還可包括:響應(yīng)于部分地檢測到在音頻流的第一部分中的預(yù)定義的短語:確定包括部分地檢測到的預(yù)定義的短語的音頻流的前一部分是否被存儲;響應(yīng)于確定包括部分地檢測到的預(yù)定義的短語的音頻流的前一部分未被存儲,存儲音頻流的第一部分;響應(yīng)于確定包括部分地檢測到的預(yù)定義的短語的音頻流的前一部分被存儲,將音頻流的第一部分與音頻流的所存儲的前一部分進(jìn)行比較;以及響應(yīng)于檢測到在音頻流的第一部分和音頻流的所存儲的前一部分之間的匹配,發(fā)送觸發(fā)信號以激活在麥克風(fēng)系統(tǒng)外部的模塊。
[0019]預(yù)定義的短語可以是環(huán)境聲音的樣本。
[0020]預(yù)定義的短語可包括一個(gè)或多個(gè)口語詞。
[0021]預(yù)定義的短語可以是用于語音控制計(jì)算設(shè)備的激活短語。
[0022]在麥克風(fēng)系統(tǒng)外部的模塊可以是主語音檢測模塊。
[0023]主語音檢測模塊可由在語音控制計(jì)算設(shè)備中的處理器實(shí)現(xiàn)。
[0024]使用在麥克風(fēng)系統(tǒng)中的專用硬件分析音頻流以檢測預(yù)定義的短語可包括使用在麥克風(fēng)系統(tǒng)中的專用硬件連續(xù)分析音頻流以檢測預(yù)定義的短語。
[0025]本文所述的方法可由被配置有軟件的計(jì)算機(jī)執(zhí)行,軟件是以存儲在有形存儲介質(zhì)上的機(jī)器可讀形式,例如當(dāng)程序在計(jì)算機(jī)上運(yùn)行時(shí)和計(jì)算機(jī)程序可被體現(xiàn)在計(jì)算機(jī)可讀存儲介質(zhì)上的情況下,以包括用于配置計(jì)算機(jī)來執(zhí)行所述方法的組成部分的計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)程序的形式或以包括適于執(zhí)行本文所述的任何方法的所有步驟的計(jì)算機(jī)程序代碼工具的計(jì)算機(jī)程序的形式。有形(或非暫時(shí)性)存儲介質(zhì)的例子包括磁盤、拇指驅(qū)動(dòng)器、存儲卡等,且并不包括傳播信號。軟件可適合于在并行處理器或串行處理器上執(zhí)行,使得方法步驟可被以任何適當(dāng)?shù)捻樞蚧蛲瑫r(shí)執(zhí)行。
[0026]本文描述的硬件部件可由非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)產(chǎn)生,非暫時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)在其上編碼有計(jì)算機(jī)可讀程序代碼。
[0027]這承認(rèn)固件和軟件可被單獨(dú)地使用且是有價(jià)值的。旨在包括在“非智能(dumb)”或標(biāo)準(zhǔn)硬件上運(yùn)行或控制“非智能”或標(biāo)準(zhǔn)硬件的軟件以實(shí)現(xiàn)期望功能。還旨在包括“描述”或定義硬件的配置的軟件以實(shí)現(xiàn)期望功能,所述軟件例如,如用于設(shè)計(jì)硅芯片或用于配置通用可編程芯片的HDL(硬件描述語言)軟件。
[0028]如對技術(shù)人員將是明顯的,優(yōu)選特征可視情況被組合,并且可以被與本發(fā)明的各方面中的任何方面進(jìn)行組合。
[0029]附圖簡述
[0030]將參考下面的附圖通過示例的方式來描述本發(fā)明的實(shí)施方式,在附圖中:
[0031]圖1是示出示例計(jì)算設(shè)備的示意圖;
[0032]圖2是麥克風(fēng)系統(tǒng)的操作的示例方法的流程圖;
[0033]圖3是更詳細(xì)示出示例麥克風(fēng)系統(tǒng)的示意圖;以及
[0034]圖4是示出所存儲的預(yù)定義的短語可以如何被更新的示意圖。
[0035]在全部附圖中使用共同的參考數(shù)字來指示相似的特征。
[0036]詳細(xì)描述
[0037]下面僅僅通過示例的方式描述了本發(fā)明的實(shí)施方式。這些示例代表
【申請人】當(dāng)前已知的實(shí)施本發(fā)明的最佳方式,但是它們不是以其可以實(shí)現(xiàn)本發(fā)明的僅有的方式。該描述闡述示例的功能和用于構(gòu)造和操作示例的步驟的順序。然而,可通過不同的示例來實(shí)現(xiàn)相同或等效的功能和順序。
[0038]如上所述,可通過激活短語(例如“HeySiri?”、“OK Google?”、“Hey Cortana?”或“Computer”)的使用來在一些電子設(shè)備上觸發(fā)語音控制。這意味著設(shè)備必須連續(xù)收聽激活短語。甚至在設(shè)備具有低功率待機(jī)狀態(tài)(例如其顯示屏關(guān)閉)的情況下,設(shè)備也必須繼續(xù)收聽以便設(shè)備能夠?qū)せ疃陶Z做出響應(yīng)。通常這意味著設(shè)備必須保持麥克風(fēng)系統(tǒng)是在工作中的(以便捕獲用戶的語音),且處理器也必須是在工作中的以便能夠分析來自麥克風(fēng)系統(tǒng)的語音樣本以檢測激活短語。這個(gè)分析是復(fù)雜的且如果在設(shè)備上實(shí)現(xiàn)則消耗大量功率,這對于電池供電的設(shè)備導(dǎo)致減小的電池壽命。由于分析的復(fù)雜性(其由于背景噪聲、用戶離麥克風(fēng)的距離等而增加),一些設(shè)備將分析卸載到遠(yuǎn)程計(jì)算機(jī);然而,這需要所捕獲的語音樣本通過數(shù)據(jù)連接(例如W1-Fi?或蜂窩鏈路)傳輸,且這也消耗大量功率。
[0039]在本文描述了包含被配置成僅檢測預(yù)定義的激活短語的專用硬件邏輯的麥克風(fēng)系統(tǒng)。在一些例子中,硬件邏輯僅僅能夠檢測預(yù)定義的激活短語且不能執(zhí)行其它功能;然而,在其它例子中,硬件邏輯也可以能夠執(zhí)行其它功能(例如通過音頻樣本的包化來幫助檢測其它短語)。
[0040]通過使用在麥克風(fēng)系統(tǒng)中的專用硬件邏輯來執(zhí)行激活短語檢測,在語音控制設(shè)備內(nèi)的處理器(例如應(yīng)用CPU)可被關(guān)掉或置于低功率狀態(tài)中,因?yàn)槠洳恍枰獔?zhí)行激活短語的檢測。此外,不必使用數(shù)據(jù)連接以便檢測激活短語,因?yàn)檫@都在麥克風(fēng)系統(tǒng)內(nèi)本地完成。因此,電池供電的語音控制設(shè)備(例如電池供電的計(jì)算設(shè)備,例如智能電話、平板計(jì)算機(jī)、可穿戴設(shè)備或手持游戲控制臺)的電池壽命可被延長。此外,因?yàn)榧せ疃陶Z檢測被在本地(即在設(shè)備內(nèi))和在硬件中執(zhí)行,檢測過程的時(shí)延(例如從用戶說激活短語到設(shè)備檢測到激活短語已經(jīng)被說出的時(shí)間)可被減小。
[0041]通過使用在麥克風(fēng)系統(tǒng)中的專用硬件邏輯來執(zhí)行激活短語檢測,短語檢測硬件可被制造得較小,從而允許它被合并為麥克風(fēng)模塊的部分。這允許整體電子設(shè)備被制造得較小。
[0042]通過使用專用硬件邏輯來執(zhí)行激活短語檢測,設(shè)備的功率消耗減小,使得在各種例子中,硬件邏輯可繼續(xù)收聽(即分析由麥克風(fēng)接收的音頻流)。這實(shí)現(xiàn)真正免提設(shè)備,因?yàn)橛脩舨恍枰谡f激活短語之前按下按鈕。
[0043]因?yàn)閷S糜布壿嬛荒軌驒z測預(yù)定義的激活短語而不能夠檢測其它短語,這可增加語音控制系統(tǒng)的安全性(例如因?yàn)楦浇娜烁y以通過說正確的激活短語來激活設(shè)備),特別是在激活短語由用戶設(shè)置或被調(diào)節(jié)為對應(yīng)于用戶對激活短語的特定發(fā)音的情況下。
[0044]盡管本文所述的麥克風(fēng)系統(tǒng)被描述為被用在電池供電的語音控制設(shè)備中,但將理解的是,麥克風(fēng)系統(tǒng)還可被用在不依賴于內(nèi)部電源(例如電池或超級電容器)而是具有外部電源(例如經(jīng)由電纜和插頭到干線電力供應(yīng)的連接)的語音控制設(shè)備中。
[0045]術(shù)語“語音控制設(shè)備”在本文用于指的是其中功能中的至少一些功能(例如單個(gè)應(yīng)用的控制、所有功能的控制等)可通過語音提示的使用來控制的設(shè)備。該設(shè)備可以例如是消費(fèi)類設(shè)備和/或電池控制的設(shè)備。在很多例子中,這個(gè)設(shè)備是計(jì)算設(shè)備(即具有處理能力使得它可執(zhí)行指令的設(shè)備),且在很多例子中,設(shè)備是便攜式計(jì)算設(shè)備。語音控制設(shè)備的例子可包括智能電話、平板計(jì)算機(jī)、便攜式游戲控制臺、電視機(jī)、家用電器(例如煮咖啡機(jī)、鬧鐘)、可穿戴設(shè)備(例如智能手表、智能衣服等)和車載式系統(tǒng)。
[0046]術(shù)語“激活短語”在本文用于指的是發(fā)起設(shè)備的語音控制的觸發(fā)短語。通常,激活短語不是所使用的單獨(dú)語音命令,而是通常跟隨有“控制”或“動(dòng)作”短語。例如,用戶可以說“電話(phone)、導(dǎo)航到家(navigate home)”,其中“電話(phone)”是激活短語而“導(dǎo)航到家(navigate home)”是觸發(fā)導(dǎo)航應(yīng)用的打開和到目的地“家”的設(shè)置的動(dòng)作短語。在其它例子中,例如在設(shè)備具有由語音命令觸發(fā)的單個(gè)功能的情況下,激活短語還可充當(dāng)動(dòng)作短語。
[0047]術(shù)語“電池供電的”在本文用于指的是這樣的設(shè)備:其具有內(nèi)部電源(例如電池或超電容器),使得在它的操作時(shí)間的至少一部分內(nèi),它可從內(nèi)部電源而不從外部電源(例如干線電力供應(yīng))被供電。
[0048]圖1是示出可以例如是電池供電的計(jì)算設(shè)備的示例計(jì)算設(shè)備100的示意圖。設(shè)備100包括被配置成執(zhí)行激活短語檢測的麥克風(fēng)系統(tǒng)102和主語音檢測模塊104,主語音檢測模塊104是更通用的語音檢測元件并可檢測以及識別多個(gè)短語。主語音檢測模塊104可被在處理器(例如CPU)上實(shí)現(xiàn),且在一些例子中它可連同遠(yuǎn)程短語檢測和識別系統(tǒng)106來操作,其中主語音檢測模塊104使用通信接口 108將語音樣本傳輸?shù)竭h(yuǎn)程系統(tǒng)106。
[0049]麥克風(fēng)系統(tǒng)102包括麥克風(fēng)110、激活短語檢測硬件112(其包括用于檢測單個(gè)預(yù)定義的激活短語的專用硬件)且還可包括音頻緩沖器114??蓞⒖紙D2來描述這個(gè)系統(tǒng)的操作。
[0050]如圖2中所示,麥克風(fēng)系統(tǒng)102使用麥克風(fēng)110檢測音頻(塊202)。檢測到的音頻流由激活短語檢測硬件112分析以檢測預(yù)定義的短語一一如果存在的話(塊204)。在激活短語檢測硬件112識別出在音頻流中的預(yù)定義的短語的情況下(在塊205中的“是”),麥克風(fēng)系統(tǒng)102(且特別是激活短語檢測硬件112)將觸發(fā)信號發(fā)送到主語音檢測模塊104(塊206)。這觸發(fā)主語音檢測模塊104(其不是麥克風(fēng)系統(tǒng)102的一部分)的操作,否則主語音檢測模塊104可能處于低功率或非操作狀態(tài)中。除了發(fā)送觸發(fā)信號(在塊206中)之外,麥克風(fēng)系統(tǒng)102在檢測到的預(yù)定義的短語之后緩存音頻流(通過將其存儲在音頻緩沖器114中)(塊208),使得當(dāng)主語音檢測模塊處于操作狀態(tài)中(例如當(dāng)主語音檢測模塊104從低功率狀態(tài)醒來)時(shí),它可被發(fā)送到主語音檢測模塊104。
[0051]如圖2中所示,可使用模式匹配來執(zhí)行對在檢測到的音頻流內(nèi)的預(yù)定義的短語的檢測(在塊204中)。例如,激活短語檢測硬件112可將任何檢測到的音頻(其可包括語音,但可此外或替代地包括背景噪聲/音樂等)分成一個(gè)或多個(gè)組成部分(塊210),例如檢測到的語音可被分成音素。(在塊210中產(chǎn)生的)這些組成部分然后與預(yù)定義的短語的所存儲的組成部分進(jìn)行比較(塊212)。如果在組成部分之間存在匹配(即以相同順序的相同部分),則發(fā)送觸發(fā)信號(在塊206中);然而,如果沒有匹配(在塊205中的“否”),則不發(fā)送觸發(fā)信號且激活短語檢測硬件112繼續(xù)分析檢測到的音頻流的后續(xù)部分。
[0052]然而在一些例子中,激活短語檢測硬件112可在檢測到的音頻和預(yù)定義的短語之間部分匹配的情況下執(zhí)行附加的分析??梢杂煤芏嗖煌姆绞胶驮诟鞣N例子中定義部分匹配,如當(dāng)只有預(yù)定義的短語的所存儲的組成部分的真子集匹配(例如第一組成部分匹配且第二組成部分不匹配)時(shí)或當(dāng)通過模式匹配得到的結(jié)果超過第一較低閾值但不超過指示完全匹配(因此指示預(yù)定義的短語已經(jīng)被檢測到)的第二較高閾值時(shí)它可以被定義。
[0053]在第一例子中,如果部分匹配被檢測到(在塊220中的“是”),則檢測到的音頻(其導(dǎo)致部分匹配)被發(fā)送到主語音檢測模塊104用于處理(塊222),且其充當(dāng)觸發(fā)信號以從低功率狀態(tài)激活主語音檢測模塊。連同檢測到的音頻一起,激活短語檢測硬件112也可發(fā)送部分匹配的細(xì)節(jié)以幫助主語音檢測模塊104(例如哪些組成部分匹配預(yù)定義的短語以及哪些組成部分不匹配預(yù)定義的短語的指示)。
[0054]在第二例子中,如果部分匹配被檢測到(在塊220中的“是”),則激活短語檢測硬件112檢查前一檢測到的短語是否已經(jīng)被存儲(塊224,例如在塊226的前一迭代中)。如果前一檢測到的短語(即就在當(dāng)前短語被分析之前被檢測到的短語)未被存儲(在塊2 2 4中的“否”),則當(dāng)前短語被存儲(塊226)且激活短語檢測硬件112繼續(xù)分析檢測到的音頻流(其如上所述可以或可以不包括語音)的后續(xù)部分。然而如果前一短語被存儲(在塊224中的“是”),則當(dāng)前短語與這個(gè)所存儲的前一短語進(jìn)行比較,以及如果存在匹配(在塊中的“是”),則激活短語檢測硬件112繼續(xù)進(jìn)行,好像預(yù)定義的短語被檢測到一樣(例如,如由從塊228到來自塊205的“是”路徑的虛線箭頭指示的)并發(fā)送觸發(fā)信號(塊206)等等。如果在當(dāng)前短語和所存儲的前一短語之間沒有匹配,則所存儲的前一短語可被刪除,且激活短語檢測硬件112繼續(xù)分析檢測到的音頻流的后續(xù)部分。
[0055]在上面的第二例子的描述中(且如在圖2中所示的),可從兩個(gè)部分匹配推斷出完全匹配(例如,其中第二部分匹配由于用戶重復(fù)激活短語而產(chǎn)生,用戶重復(fù)激活短語是因?yàn)樵O(shè)備未能對激活短語的第一發(fā)出做出響應(yīng))。然而在其它例子中,在完全匹配被推斷出之前可能需要多于兩個(gè)部分匹配。
[0056]圖3是更詳細(xì)示出示例麥克風(fēng)系統(tǒng)102的示意圖。如圖3中所示,麥克風(fēng)系統(tǒng)102包括放大檢測到的(由麥克風(fēng)110產(chǎn)生的)音頻流的放大器302(其也可被稱為前置放大器)。由麥克風(fēng)110產(chǎn)生(并由放大器302放大)的音頻流通常是模擬信號,其可接著使用模數(shù)(A到D)轉(zhuǎn)換器(ADC)304被轉(zhuǎn)換成數(shù)字信號。ADC 304以參考采樣時(shí)鐘306定義的采樣速率和以定義的采樣分辨率(其可按照每個(gè)樣本中的位數(shù)來定義)對模擬信號進(jìn)行采樣。激活短語檢測硬件112接收由ADC 304輸出的音頻樣本,并接著如上所述的分析它們以確定它們是否包含預(yù)定義的短語。預(yù)定義的短語的細(xì)節(jié)可在麥克風(fēng)系統(tǒng)102內(nèi)存儲在激活短語存儲器308中,且這可例如存儲預(yù)定義的短語的組成部分用于在模式匹配時(shí)使用(在塊212中)。
[0057]激活短語檢測硬件112可例如使用數(shù)字信號處理器(DSP)來實(shí)現(xiàn),數(shù)字信號處理器(DSP)針對語音識別被優(yōu)化(例如通過從DSP指令集移除任何未使用的指令和/或用執(zhí)行相同功能的一個(gè)或少量專用指令代替在預(yù)定義的短語的檢測中使用的一個(gè)或多個(gè)通用指令),且在DSP被使用時(shí),這可包含圖3中所示的ADC 304。通過減小DSP的指令集,節(jié)省了功率并減小DSP的尺寸。在其它例子中,可使用一個(gè)或多個(gè)固定功能硬件塊來代替DSP,且這可提供更高效的實(shí)現(xiàn)。
[0058]當(dāng)預(yù)定義的短語已經(jīng)被檢測到(在塊204中)且主語音檢測模塊104的操作已經(jīng)被(在塊206中由觸發(fā)信號)觸發(fā),在主語音檢測模塊104返回到低功率/非操作狀態(tài)(例如當(dāng)圖2的方法重新開始時(shí))之前,激活短語檢測硬件112可以在語音檢測中不起另外的作用。然而在其它例子中,甚至當(dāng)主語音檢測模塊104是運(yùn)行的時(shí),激活短語檢測硬件112可繼續(xù)幫助語音檢測。在一些例子中,這個(gè)幫助可以只涉及將緩存的(即時(shí)間延遲的)音頻發(fā)送到主語音檢測模塊104。然而在其它例子中,激活短語檢測硬件112可繼續(xù)對所接收的音頻進(jìn)行包化(例如通過將檢測到的音頻分成組成部分)并將包化的音頻樣本(其可以或可以不包括語音)提供到主語音檢測模塊104或通信接口 108用于傳輸?shù)竭h(yuǎn)程短語檢測和識別系統(tǒng)106。這避免在語音檢測系統(tǒng)內(nèi)的重復(fù)(即在激活短語檢測硬件112和主語音檢測模塊104之間的功能的重復(fù))且因此在功率和/或空間方面更高效。
[0059]在各種例子中,麥克風(fēng)系統(tǒng)102(例如圖3中所示的麥克風(fēng)系統(tǒng))可以以兩種模式操作。在第一模式中,麥克風(fēng)系統(tǒng)102執(zhí)行預(yù)定義的短語的檢測(如上所述和在圖2中的塊202-204中所示的)并以(放大器302的)減小的增益和/或減小的采樣速率和/或分辨率(在ADC304中)操作,這減小了當(dāng)以第一模式操作時(shí)麥克風(fēng)系統(tǒng)102的功耗。當(dāng)檢測到預(yù)定義的短語(在塊204中)時(shí),麥克風(fēng)系統(tǒng)102將觸發(fā)信號發(fā)送到主語音檢測模塊104(塊206),開始緩存音頻流(塊208)并通過增加放大器302的增益(塊216)和/或由ADC使用的采樣分辨率和/或由ADC 304使用的采樣速率(塊214)來切換到第二操作模式。在各種例子中,可通過增加采樣時(shí)鐘306的速度來增加采樣速率(在塊214中),且在其它例子中,時(shí)鐘速度可保持相同,但采樣時(shí)鐘信號用于驅(qū)動(dòng)ADC 304的方式可改變。在這個(gè)第二模式中,激活短語檢測硬件112可被繞過(例如使得音頻流傳遞到主語音檢測模塊104用于分析),或如上所述,激活短語檢測硬件112可對所接收的音頻進(jìn)行包化并向主語音檢測模塊104或向通信接口 108提供音頻樣本用于傳輸?shù)竭h(yuǎn)程短語檢測和識別系統(tǒng)106。麥克風(fēng)系統(tǒng)102可保持在第二操作模式中,直到主語音檢測模塊104進(jìn)入低功率狀態(tài)為止,此時(shí)麥克風(fēng)系統(tǒng)102返回到第一操作模式。
[0060]在各種例子中,麥克風(fēng)系統(tǒng)可通過調(diào)節(jié)所使用的增益、采樣速率和/或采樣分辨率來適應(yīng)它在第一操作模式中的操作。這可例如基于被檢測到的部分匹配的數(shù)量來實(shí)現(xiàn)(例如在塊220中)。在一些例子中,如果部分匹配的數(shù)量或頻率達(dá)到第一閾值,則所使用的增益、采樣速率和/或采樣分辨率可被增加。在一些例子中,在部分匹配的數(shù)量或頻率達(dá)到第二閾值或所使用的增益、采樣速率和/或采樣分辨率可適于將部分匹配的數(shù)量或頻率保持在目標(biāo)范圍內(nèi)之前,所使用的增益、采樣速率和/或采樣分辨率可被減小。此外或替代地,麥克風(fēng)系統(tǒng)可通過基于檢測到的背景噪聲的水平調(diào)節(jié)所使用的增益、采樣速率和/或采樣分辨率來適應(yīng)它在第一操作模式中的操作。
[0061 ]通過使用如上所述的兩種模式,麥克風(fēng)系統(tǒng)的功耗減小,因?yàn)楫?dāng)在第一操作模式中操作時(shí),系統(tǒng)將消耗更少的功率。減小的增益和/或采樣速率和/或采樣分辨率的使用由下面的事實(shí)實(shí)現(xiàn):系統(tǒng)只試圖檢測單個(gè)預(yù)定義的短語,因此所使用的音頻樣本的質(zhì)量不需要高到用于很多不同短語的檢測(例如,如由主語音檢測模塊104所需的)。
[0062]如上所述,由激活短語檢測硬件112檢測的短語被預(yù)定義。在一些例子中,它可以是預(yù)定義的和固定的(例如它可以是工廠設(shè)定的或由用戶在設(shè)置語音激活的設(shè)備時(shí)設(shè)定并被保存到激活短語存儲器308內(nèi)),而在其它例子中,雖然它是預(yù)定義的,但是它可隨著時(shí)間的推移而改變。
[0063]在各種例子中,激活短語存儲器308可存儲多個(gè)不同的激活短語,其中只有一個(gè)是在任何時(shí)間“有效的”且因此在與檢測到的音頻比較時(shí)被使用(例如在塊204中)。在各種例子中,用戶可以能夠在所存儲的激活短語之間切換,而在其它例子中,麥克風(fēng)可基于上下文信息在所存儲的激活短語之間自動(dòng)切換。
[0064]如圖2中所示,在各種例子中,當(dāng)預(yù)定義的短語被檢測到(在塊204中)時(shí),除了發(fā)送觸發(fā)信號(在塊206中)并緩存音頻(在塊208中)以外,所存儲的激活短語或其組成部分可使用檢測到的激活短語來進(jìn)行更新(塊218)。這在圖4中被圖形化地示出。如上面參考圖2所描述的,檢測到的音頻402的一部分被分成其組成部分404-407(在塊210中),例如其被分成可以是相同的長度或不同的長度的多個(gè)組成部分。這些檢測到的音頻組成部分404-407接著與預(yù)定義的激活短語的所存儲的組成部分408-410進(jìn)行比較(在塊212中)。在圖4中所示的例子中,檢測到的音頻402的第二部分、第三部分和第四部分405-407匹配預(yù)定義的短語的三個(gè)組成部分408-410,因此觸發(fā)信號被發(fā)送(在塊206中)。然后通過以某種方式組合所存儲的組成部分和其相應(yīng)的檢測到的組成部分(例如使用加權(quán)平均)可以更新所存儲的組成部分408-410(在塊218中)。這個(gè)組合操作產(chǎn)生更新的組成部分408’-410’,其然后被存儲并在隨后的比較操作中被使用(例如在塊212的下一個(gè)迭代中)。
[0065]雖然圖4示出預(yù)定義的激活短語的組成部分的更新,但是將認(rèn)識到,在其它例子中,整個(gè)所存儲的激活短語可被作為一個(gè)元素來更新。在其它例子中,可以用其它方式(例如使用機(jī)器學(xué)習(xí)算法)來更新所存儲的短語。
[0066]通過如上所述更新所存儲的激活短語,麥克風(fēng)系統(tǒng)可學(xué)習(xí)并適應(yīng)用戶說特定短語(例如他們的本國語言、發(fā)音、口音等)的方式。這增加了激活短語檢測硬件112可成功地檢測預(yù)定義的激活短語的概率。
[0067]在各種例子中,所存儲的激活短語的任何適應(yīng)也可被其它因素(例如部分匹配的數(shù)量或背景噪聲的水平)影響。例如,如果部分匹配的數(shù)量降到定義的閾值或預(yù)定義的目標(biāo)值范圍以下,則所存儲的激活短語可被更新。
[0068]圖4和上面的描述示出預(yù)定義的激活短語可以如何隨著時(shí)間的推移而進(jìn)行適應(yīng)。將認(rèn)識到,此外或替代地,預(yù)定義的激活短語可由更新的或新的激活短語來取代。這可例如被從外部源上傳到激活短語存儲器308,或當(dāng)設(shè)備100在特定模式中時(shí)(例如在設(shè)置時(shí)和/或在改變所使用的語言時(shí))可由麥克風(fēng)系統(tǒng)102來記錄。這使用戶能夠個(gè)性化激活短語(這可增加設(shè)備的安全性,如上所述)。
[0069]如上所述,麥克風(fēng)系統(tǒng)102包括音頻緩沖器114,音頻緩沖器114用于在預(yù)定義的短語的檢測(在塊204中)之后存儲檢測到的音頻(在塊208中)以便適應(yīng)在主語音檢測模塊104的喚醒中的時(shí)延(例如使得緊接著在激活短語之后的任何控制或動(dòng)作短語可由主語音檢測模塊104來分析和識別)。然而,在其中激活短語檢測硬件112實(shí)時(shí)(或接近實(shí)時(shí))操作的一些例子中,可以不提供音頻緩沖器114。然而,在一些例子中,音頻緩沖器114可(此外或替代地)用于在至少短時(shí)間段內(nèi)存儲任何檢測到的音頻的組成部分,使得這可用于不同于執(zhí)行與所存儲的預(yù)定義的短語的比較(在塊212中)的目的。
[0070]在其中預(yù)定義的短語未在檢測到的音頻的第一部分中被檢測到的例子中,在至少檢測到的音頻的第二部分(例如檢測到的音頻的下一部分)已經(jīng)被激活短語檢測硬件112分析之前,檢測到的音頻的第一部分可被保留在音頻緩沖器114中。在檢測到的音頻的第二部分和預(yù)定義的短語之間沒有匹配的情況下,檢測到的音頻的第二部分可與檢測到的音頻的所存儲的第一部分進(jìn)行比較(例如以與塊212類似的方式使用模式匹配,但是與檢測到的音頻的所存儲的第一部分而不是預(yù)定義的短語的所存儲的組成部分進(jìn)行比較)。在第一部分和第二部分之間存在匹配的情況下,觸發(fā)信號可被發(fā)送以喚醒主語音檢測模塊104,且檢測到的音頻的第一部分和第二部分中的至少一個(gè)被發(fā)送到主語音檢測模塊104(當(dāng)在操作狀態(tài)中時(shí))用于分析。
[0071]在其中預(yù)定義的短語未在檢測到的音頻的第一部分中被檢測的另一個(gè)例子中,在至少檢測到的音頻的第二部分(例如檢測到的音頻的下一部分)已經(jīng)被激活短語檢測硬件112分析之前,檢測到的音頻的第一部分可被保留在音頻緩沖器114中。在檢測到的音頻的第二部分和預(yù)定義的短語之間沒有匹配的情況下,使用來自第二部分的檢查的知識來重新檢查檢測到的音頻的所存儲的第一部分。例如,如果在執(zhí)行檢測時(shí)檢測到的音頻的部分與預(yù)定義的短語的第一組成部分和第二組成部分進(jìn)行比較且第二部分匹配這些組成部分之一,則當(dāng)重新檢查第一部分時(shí),檢查可集中于來自第二部分的另一(不匹配的)組成部分,且如果所有組成部分可在檢測到的音頻的第一部分和第二部分中的至少一個(gè)中被匹配,則匹配可被認(rèn)為被檢測到。在存在這樣的匹配的情況下,可發(fā)送觸發(fā)信號以喚醒主語音檢測模塊 104。
[0072 ]在圖2中所示的方法中的這些變化應(yīng)對其中麥克風(fēng)系統(tǒng)1 2最初未能檢測到激活短語(例如由于背景噪聲、不同的用戶等)故用戶重復(fù)激活短語的情況。
[0073]雖然觸發(fā)信號(其在塊206中被發(fā)送)在上面被描述為用于喚醒處理器(例如CPU),但是它可附加地被使用(或附加的觸發(fā)信號可被發(fā)送)來喚醒包括麥克風(fēng)系統(tǒng)的設(shè)備的其它部分。例如,觸發(fā)信號可被發(fā)送到通信接口 108以從低功率狀態(tài)喚醒它和/或發(fā)送到顯示接口以開啟顯示屏。在另一例子中,觸發(fā)信號可使設(shè)備產(chǎn)生聲音(例如發(fā)出嘟嘟聲)以指示設(shè)備準(zhǔn)備好進(jìn)一步的語音輸入。
[0074]如上所述,語音檢測機(jī)構(gòu)被分成兩個(gè)部分。在麥克風(fēng)系統(tǒng)內(nèi)在硬件中實(shí)現(xiàn)的第一部分只檢測激活短語(而不檢測其它短語)且第二部分檢測多個(gè)短語并可在通用處理器上(例如在CPU上)在軟件中實(shí)現(xiàn)。通過以這種方式實(shí)現(xiàn)設(shè)備的語音控制,可能出現(xiàn)設(shè)備進(jìn)入低功率狀態(tài)且只有麥克風(fēng)系統(tǒng)操作和仍然能夠?qū)φf出激活短語的用戶快速做出響應(yīng),即:設(shè)備內(nèi)的CPU系統(tǒng)不需要是在工作中的,同時(shí)設(shè)備處于低功率狀態(tài)中。這減少了設(shè)備的功耗并因此在設(shè)備是電池供電的情況下增加了電池壽命。
[0075]因?yàn)榧せ疃陶Z檢測硬件112位于麥克風(fēng)系統(tǒng)102內(nèi),所以它接近麥克風(fēng)接口。這允許設(shè)備被制造得較小并此外能夠使短語檢測被并入沒有高性能CPU(其充當(dāng)主語音檢測模塊)或甚至根本沒有CHJ系統(tǒng)的更簡單的設(shè)備內(nèi)。例如,麥克風(fēng)系統(tǒng)102可被實(shí)現(xiàn)到電燈泡或燈開關(guān)(例如使用“l(fā)ight”或“l(fā)ightswitch”的預(yù)定義的短語)內(nèi)。在這樣的例子中,觸發(fā)信號(在塊206中被發(fā)送)不用于喚醒主語音檢測模塊,但反而用于控制設(shè)備的一部分(例如以觸發(fā)電燈泡接通/關(guān)斷)。
[0076]提供了上面涉及包括一個(gè)或多個(gè)口語詞的激活短語(例如一般短語,例如“computer” 或 “sat nav” 或特定于平臺的短語例如 “Hey Siri?”、“OK Google?” 和 “HeyCortana?”)的使用的描述和各種例子。在另外的例子中,激活短語可包括任何預(yù)定義的聲音(例如環(huán)境聲音),且可以不包括口語詞。例如,上面所述的方法可與嬰兒監(jiān)控應(yīng)用一起使用,且預(yù)定義的激活短語可以是嬰兒哭泣的音頻樣本。在這樣的例子中,預(yù)定義的激活短語(例如以如嬰兒哭泣的環(huán)境聲音的形式)可像上面的電燈泡例子一樣用于觸發(fā)在麥克風(fēng)系統(tǒng)外部的設(shè)備(但其不是主語音檢測模塊)的另一部分的操作??捎米黝A(yù)定義的激活短語的環(huán)境聲音的另外的例子包括交通/道路噪聲(例如對于本文所述的方法的基于交通工具的應(yīng)用)。
[0077]術(shù)語“處理器”和“計(jì)算設(shè)備”(或“計(jì)算機(jī)”)在本文用于指具有處理能力使得其可執(zhí)行指令的任何設(shè)備或其部分。術(shù)語“處理器”可例如包括中央處理單元(CPU)、圖形處理單元(GPU或VPU)、物理處理單元(PPU)、無線電處理單元(RPU)、數(shù)字信號處理器(DSP)、通用處理器(例如通用GPU)、微處理器、被設(shè)計(jì)成加速在CPU外部的任務(wù)的任何處理單元等。本領(lǐng)域中的技術(shù)人員將認(rèn)識到,這樣的處理能力被并入很多不同的設(shè)備內(nèi),且因此術(shù)語“計(jì)算設(shè)備”包括機(jī)頂盒、媒體播放器、數(shù)字收音機(jī)、數(shù)字電視機(jī)、PC、服務(wù)器、移動(dòng)電話、個(gè)人數(shù)字助理和很多其它設(shè)備。
[0078]本領(lǐng)域中的技術(shù)人員將認(rèn)識到,用于存儲程序指令的存儲設(shè)備可分布在整個(gè)網(wǎng)絡(luò)中。例如,遠(yuǎn)程計(jì)算機(jī)可存儲被描述為軟件的過程的實(shí)例。本地或終端計(jì)算機(jī)可訪問遠(yuǎn)程計(jì)算機(jī)并下載軟件的一部分或全部以運(yùn)行程序??蛇x地,本地計(jì)算機(jī)可按需要下載軟件的片段或執(zhí)行在本地終端處的一些軟件指令和在遠(yuǎn)程計(jì)算機(jī)(或計(jì)算機(jī)網(wǎng)絡(luò))處的一些軟件指令。本領(lǐng)域中的技術(shù)人員也將認(rèn)識到,通過利用本領(lǐng)域中的技術(shù)人員已知的常規(guī)技術(shù),軟件指令的全部或一部分可由例如DSP、可編程邏輯陣列等的專用電路來實(shí)現(xiàn)。
[0079]存儲用于在實(shí)現(xiàn)所公開的方面時(shí)使用的機(jī)器可執(zhí)行數(shù)據(jù)的存儲器可以是非暫時(shí)性介質(zhì)。非暫時(shí)性介質(zhì)可以是易失性的或非易失性的。易失性非暫時(shí)性介質(zhì)的例子包括基于半導(dǎo)體的存儲器,例如SRAM或DRAM??捎糜趯?shí)現(xiàn)非易失性存儲器的技術(shù)的例子包括光學(xué)和磁存儲器技術(shù)、閃存、相變存儲器、電阻式RAM。
[0080]對“邏輯”的特定提及指的是執(zhí)行一種功能或多種功能的結(jié)構(gòu)。邏輯的例子包括被布置成執(zhí)行那些功能的電路。例如,這樣的電路可包括晶體管和/或在制造過程中可用的其它硬件元件。例如,這樣的晶體管和/或其它元件可用于形成實(shí)現(xiàn)和/或包含存儲器(例如寄存器、觸發(fā)器或鎖存器)、邏輯運(yùn)算器例如布爾運(yùn)算、數(shù)學(xué)運(yùn)算器(例如加法器、乘法器或移位器)和互連的電路或結(jié)構(gòu)。這樣的元件可被作為定制電路或標(biāo)準(zhǔn)單元庫、宏或在其它抽象層提供。這樣的元件可以在特定的布置中被互連。邏輯可包括具有固定功能的電路,且電路可被編程以執(zhí)行一種功能或多種功能;這樣的編程可被從固件或軟件更新或控制機(jī)制來提供。被識別為執(zhí)行一種功能的邏輯也可包括實(shí)現(xiàn)組成性功能或子過程的邏輯。在例子中,硬件邏輯具有實(shí)現(xiàn)固定功能操作或多個(gè)操作、狀態(tài)機(jī)或過程的電路。
[0081]如對技術(shù)人員將明顯的是,本文給出的任何范圍或設(shè)備值可被擴(kuò)展或改變而不失去所尋求的效果。
[0082]將理解的是,上面描述的益處和優(yōu)點(diǎn)可涉及一個(gè)實(shí)施方式或可涉及幾個(gè)實(shí)施方式。實(shí)施方式不限于解決任何或所有所陳述的問題的那些實(shí)施方式或具有任何或全部所陳述的益處和優(yōu)點(diǎn)的那些實(shí)施方式。
[0083]對“一個(gè)(an)”項(xiàng)的任何提及指的是那些項(xiàng)中的一個(gè)或多個(gè)。術(shù)語“包括(comprising)”在本文用于表示包括所識別的方法塊或元素,但這樣的塊或元素并不包括排他性列表,且裝置可包含附加的塊或元素,以及方法可包含附加的操作或元素。此外,塊、元素和操作本身并不隱含地是封閉的。
[0084]本文描述的方法的步驟可在適當(dāng)情況下被以任何適當(dāng)?shù)捻樞蚧蛲瑫r(shí)執(zhí)行。在附圖中的框之間的箭頭示出方法步驟的一個(gè)示例順序,但并不旨在排除其它順序或并行的多個(gè)步驟的執(zhí)行。此外,單獨(dú)的塊可被從方法中的任意一個(gè)刪除而不偏離本文描述的主題的精神和范圍。上面描述的例子中的任何例子的方面可與所描述的其它例子中的任一個(gè)的方面進(jìn)行組合以形成另外的例子,而不失去所尋求的效果。在附圖的元素箭被示出為由箭頭連接的情況下,將理解的是,這些箭頭僅僅示出在元素之間的通信(包括數(shù)據(jù)和控制消息)的一個(gè)示例流動(dòng)。在元素之間的流動(dòng)可以在任一方向上或在兩個(gè)方向上。
[0085]將理解的是,僅僅通過示例的方式給出了優(yōu)選實(shí)施方式的以上描述,以及可由本領(lǐng)域的技術(shù)人員做出各種修改。盡管以上已經(jīng)以某種程度的特殊性或參考一個(gè)或多個(gè)單獨(dú)的實(shí)施方式描述了各種實(shí)施方式,但是本領(lǐng)域技術(shù)人員可以對所公開的實(shí)施方式做出很多變更而不偏離本發(fā)明的精神或范圍。
【主權(quán)項(xiàng)】
1.一種麥克風(fēng)系統(tǒng)(102),其包括麥克風(fēng)(I 10)和硬件邏輯(I 12),所述硬件邏輯(I 12)被配置成檢測在經(jīng)由所述麥克風(fēng)接收的音頻流中的預(yù)定義的短語,并響應(yīng)于檢測到所述預(yù)定義的短語而發(fā)送觸發(fā)信號以激活在所述麥克風(fēng)系統(tǒng)外部的模塊。2.根據(jù)權(quán)利要求1所述的麥克風(fēng)系統(tǒng),還包括音頻緩沖器(114),所述音頻緩沖器(114)被布置成:在經(jīng)由所述麥克風(fēng)接收的所述音頻流的包括所述預(yù)定義的短語的第一部分之后存儲所述音頻流的第二部分。3.根據(jù)前述權(quán)利要求中的任一項(xiàng)所述的麥克風(fēng)系統(tǒng),其中所述硬件邏輯被配置成:將檢測到的音頻的一部分分成一個(gè)或多個(gè)組成部分并將所述組成部分與所述預(yù)定義的短語的一個(gè)或多個(gè)所存儲的組成部分進(jìn)行比較。4.根據(jù)權(quán)利要求1所述的麥克風(fēng)系統(tǒng),還包括放大器(302),所述放大器(302)被配置成:根據(jù)增益參數(shù)放大經(jīng)由所述麥克風(fēng)接收的所述音頻流并將所放大的音頻流輸出到被配置成檢測所述預(yù)定義的短語的所述硬件邏輯,并且其中所述硬件邏輯還被配置成:響應(yīng)于檢測到所述預(yù)定義的短語而向所述放大器發(fā)送信號以增加所述增益參數(shù)的值。5.根據(jù)權(quán)利要求4所述的麥克風(fēng)系統(tǒng),其中所述硬件邏輯還被配置成:響應(yīng)于在所述麥克風(fēng)系統(tǒng)外部的所述模塊進(jìn)入低功率模式而向所述放大器發(fā)送信號以減小所述增益參數(shù)的值。6.根據(jù)權(quán)利要求1所述的麥克風(fēng)系統(tǒng),還包括模數(shù)轉(zhuǎn)換器(304),所述模數(shù)轉(zhuǎn)換器(304)被配置成:通過以一采樣速率和一采樣分辨率對經(jīng)由所述麥克風(fēng)接收的所述音頻流進(jìn)行采樣來將所接收的音頻流轉(zhuǎn)換成數(shù)字音頻流,并且將所述數(shù)字音頻流輸出到被配置成檢測所述預(yù)定義的短語的所述硬件邏輯,并且其中所述硬件邏輯還被配置成:響應(yīng)于檢測到所述預(yù)定義的短語而發(fā)送信號以增加所述采樣速率和/或采樣分辨率。7.根據(jù)權(quán)利要求6所述的麥克風(fēng)系統(tǒng),其中所述硬件邏輯還被配置成:響應(yīng)于在所述麥克風(fēng)系統(tǒng)外部的所述模塊進(jìn)入低功率模式而發(fā)送信號以減小所述采樣速率和/或采樣分辨率。8.根據(jù)權(quán)利要求1、2和4-7中的任一項(xiàng)所述的麥克風(fēng)系統(tǒng),還包括被布置成存儲所述預(yù)定義的短語的激活短語存儲器(308);其中可選地,所述硬件邏輯還被配置成:響應(yīng)于檢測到所述預(yù)定義的短語而使用所檢測到的預(yù)定義的短語來更新所存儲的預(yù)定義的短語。9.根據(jù)權(quán)利要求1、2和4-7中的任一項(xiàng)所述的麥克風(fēng)系統(tǒng),其中所述硬件邏輯還被配置成:響應(yīng)于部分地檢測到所述預(yù)定義的短語而將所述音頻流的包括所部分地檢測到的預(yù)定義的短語的一部分發(fā)送到在所述麥克風(fēng)系統(tǒng)外部的所述模塊。10.根據(jù)權(quán)利要求1、2和4-7中的任一項(xiàng)所述的麥克風(fēng)系統(tǒng),其中所述硬件邏輯還被配置成:響應(yīng)于部分地檢測到在所述音頻流的第一部分中的所述預(yù)定義的短語來: 確定所述音頻流的包括部分地檢測到的預(yù)定義的短語的前一部分是否被存儲; 響應(yīng)于確定所述音頻流的包括部分地檢測到的預(yù)定義的短語的所述前一部分未被存儲,存儲所述音頻流的所述第一部分; 響應(yīng)于確定所述音頻流的包括部分地檢測到的預(yù)定義的短語的所述前一部分被存儲,將所述音頻流的所述第一部分與所述音頻流的所存儲的前一部分進(jìn)行比較;以及 響應(yīng)于檢測到在所述音頻流的所述第一部分和所述音頻流的所存儲的前一部分之間的匹配,發(fā)送觸發(fā)信號以激活在所述麥克風(fēng)系統(tǒng)外部的所述模塊。11.根據(jù)權(quán)利要求1、2和4-7中的任一項(xiàng)所述的麥克風(fēng)系統(tǒng),其中所述預(yù)定義的短語是環(huán)境聲音的樣本,或其中所述預(yù)定義的短語包括一個(gè)或多個(gè)口語詞和/或其中所述預(yù)定義的短語是用于語音控制計(jì)算設(shè)備的激活短語。12.根據(jù)權(quán)利要求11所述的麥克風(fēng)系統(tǒng),其中在所述麥克風(fēng)系統(tǒng)外部的所述模塊是主語音檢測模塊(104),并且所述主語音檢測模塊由在所述語音控制計(jì)算設(shè)備中的處理器實(shí)現(xiàn)。13.根據(jù)權(quán)利要求11所述的麥克風(fēng)系統(tǒng),其中所述麥克風(fēng)系統(tǒng)包括兩種操作模式,以及其中 在第一操作模式中,所述硬件邏輯被配置成:通過將檢測到的音頻的一部分分成一個(gè)或多個(gè)組成部分并將所述組成部分與所述預(yù)定義的短語的一個(gè)或多個(gè)所存儲的組成部分進(jìn)行比較來檢測經(jīng)由所述麥克風(fēng)接收的音頻流中的預(yù)定義的短語,以及響應(yīng)于檢測到所述預(yù)定義的短語而發(fā)送觸發(fā)信號以激活在所述麥克風(fēng)系統(tǒng)外部的第一模塊;以及 在第二操作模式中,所述硬件邏輯被配置成:將檢測到的音頻的一部分分成一個(gè)或多個(gè)組成部分并將所述組成部分提供到在所述麥克風(fēng)系統(tǒng)外部的第二模塊; 其中可選地,在所述麥克風(fēng)系統(tǒng)外部的所述第一模塊和在所述麥克風(fēng)系統(tǒng)外部的所述第二模塊是相同的,以及所述模塊是主語音檢測模塊(104);或 在所述麥克風(fēng)系統(tǒng)外部的所述第一模塊是主語音檢測模塊(104),而在所述麥克風(fēng)系統(tǒng)外部的所述第二模塊是被布置成將所述組成部分傳輸?shù)竭h(yuǎn)程短語檢測和識別系統(tǒng)(106)的通信接口(108)。14.根據(jù)權(quán)利要求1所述的麥克風(fēng)系統(tǒng),其中所述硬件邏輯被配置成連續(xù)分析經(jīng)由所述麥克風(fēng)接收的所述音頻流以檢測所述預(yù)定義的短語。15.—種操作麥克風(fēng)系統(tǒng)的方法,包括: 使用在所述麥克風(fēng)系統(tǒng)中的麥克風(fēng)檢測音頻流(202); 使用在所述麥克風(fēng)系統(tǒng)中的專用硬件分析所述音頻流以檢測預(yù)定義的短語,所述專用硬件被配置成檢測在輸入音頻流中的所述預(yù)定義的短語(204);以及 響應(yīng)于檢測到所述預(yù)定義的短語(205),發(fā)送觸發(fā)信號以激活在所述麥克風(fēng)系統(tǒng)外部的模塊(206)。
【文檔編號】G10L15/26GK105931640SQ201610099793
【公開日】2016年9月7日
【申請日】2016年2月23日
【發(fā)明人】本杰明·詹姆斯·克爾
【申請人】想象技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1