置指示符410上方。然而,實時語音輸入指示符412可以被定位在顯示402上的任何合適的位置。
[0033]在一些實施例中,實時語音輸入指示符412可以強調所識別的詞語中與已知的話音命令、人、應用和/或被系統(tǒng)識別的其他內容相關聯(lián)的一個或多個關鍵字和/或部分??梢砸匀魏魏线m的方式來強調這樣的關鍵字。例如,實時語音輸入指示符412可以以更大的尺寸、不同的顏色、通過加亮的背景等來顯示所識別的詞語的所述一個或多個關鍵字和/或部分。
[0034]連續(xù)語音識別模式是可以用于向用戶指示語音輸入是否被語音識別系統(tǒng)聽到并理解的反饋的一個非限制性示例。然而可以使用任何其他合適的機制來指示聽到的語音輸入是否也被理解。例如,可以使用不同的顏色、選定的符號(例如,取代所識別的文本的問號)和/或圖形指示符的外觀的任何其他合適的修改來指示語音輸入被聽到但是沒有被理解。這樣,方法300可以包括:在320,如果語音輸入被語音識別系統(tǒng)聽到并理解,則以第一方式修改圖形反饋指示符的外觀,以及在322,如果語音輸入被語音識別系統(tǒng)聽到但是未理解,則以不同的第二方式來修改圖形反饋指示符的外觀。
[0035]圖5圖示了在各種反饋狀態(tài)下針對語音識別系統(tǒng)的圖形反饋指示符500的另一實施例。圖形反饋指示符500具有比圖4A至4F的實施例更緊湊的布局,因此可以被使用在期望更緊湊表示的設置中。例如,可以將圖形反饋指示符500顯示在應用窗口或其他用戶界面的角落或邊緣。
[0036]所描繪的圖形反饋指示符500采取限定了內部區(qū)域的圓的形式,其中圓和內部區(qū)域各自可以用于提供反饋。例如,可以使用外環(huán)的第一外觀502 (例如,第一顏色)和位于內部區(qū)域中的第一元素504來指示被動監(jiān)聽模式。所描繪的第一元素504包括“X”,然而將理解的是,可以使用任何其他合適的指示符。
[0037]接下來,當進入主動監(jiān)聽模式后,可以使用不同的外觀來指示全局或局部范圍主動監(jiān)聽模式。例如,可以使用外環(huán)的第一外觀502與位于內部區(qū)域中的第二元素506的組合來指示全局范圍,而可以使用外環(huán)的第二外觀508與位于內部區(qū)域中的第二元素506相結合來指示局部范圍。盡管第二元素506被圖示為笑臉,然而將理解的是,可以使用任何其他合適的指示符。
[0038]圖5還將音量和位置指示符510圖示為占據(jù)外環(huán)的一部分。例如,可以由音量和位置指示符510的長度來指示當前受關注的所檢測的聲音或語音的音量。此外,可以由音量和位置指示符510在外環(huán)上的位置來圖示正從其接收到語音輸入的用戶的位置,如在510a處所示。例如,當確定語音輸入源自房間的中心時,音量和位置指示符510可以沿著外環(huán)的底部出現(xiàn)。類似的,當確定語音輸入源自房間的左側時,音量和位置指示符510可以沿著外環(huán)的左側出現(xiàn)。音量和位置指示符510的長度和/或位置可以實時改變以向用戶提供連續(xù)并且實時的反饋。將理解的是,在一些實施例中,指示符510可以表示位置而不表示音量,或者表示音量而不表示位置。
[0039]此外,圖形反饋指示符500可以被配置為以連續(xù)識別模式來顯示實時識別語音指示符512。可以以任何合適的方式來顯示實時識別語音指示符512。例如,在一些實施例中,實時識別語音指示符512可以采取靠著圖形反饋指示符的外環(huán)的一側顯示的動畫的或靜止的彈出(stat1nary flyout)的形式。此外,在一些實施例中,可以將識別語音指示符512顯示在與提供所識別的語音輸入的用戶的位置相對應的方位,從而如此地提供位置反饋。
[0040]還可以使用圖形反饋指示符500來顯示當前送入語音輸入的用戶的所確定的身份。例如,圖形反饋指示符500的內部區(qū)域可以顯示所辨認的用戶的名字514和/或可以以任何其他合適的方式(例如,通過顯示與用戶相關聯(lián)的化身或其他圖像、用戶的用戶名等等)來指示用戶的身份。
[0041]此外,圖形反饋指示符500可以被配置為具有不同的外觀以用于指示聽到的語音輸入是否被理解。例如,可以使用連續(xù)識別模式文本顯示或其他肯定指示元素來指示語音輸入被理解,而諸如問號518之類的非肯定元素可以被顯示在內部區(qū)域內以指示聽到的語音輸入未被理解。此外,可以以第三外觀516 (例如,不同的顏色、紋理等)來顯示外環(huán)以提供語音輸入未被理解的另外的用戶反饋。
[0042]還可以修改圖形反饋指示符500的外觀來指示與語音輸入相關聯(lián)的識別置信度和/或不確定性的具體等級(例如,低、中、高等)。例如,可能由于不清楚的語音輸入和/或由于兩個命令發(fā)音相似而導致命令有歧義。因此,在一些實施例中,圖形反饋指示符500可以包括提示性或交互性元素以例如通過以下方式對低置信度語音輸入消除歧義:呈現(xiàn)兩個或更多個可能的命令和/或語音識別結果,用戶可以從中選擇預期的詞語和/或命令。
[0043]同樣地,在沒有歧義地聽到并理解用戶輸入的情況下,可以以指示聽到并理解狀態(tài)的第四外觀520來顯示外環(huán)。例如,第四外觀520可以以顏色和/或亮度的動畫的或靜止的梯度為特征,和/或可以具有任何其他合適的外觀。此外,可以顯示表示聽到并理解語音輸入的文本作為另外的反饋。該文本可以表示用戶所說的確切的詞語或系統(tǒng)所理解的意圖的表示。
[0044]在一些實施例中,本文描述的方法和過程可以依靠一個或多個計算設備的計算系統(tǒng)。具體的,這樣的方法和過程可以被實現(xiàn)為計算機應用程序或服務、應用編程接口(API)、庫和/或其他計算機程序廣品。
[0045]圖6示意性地示出了計算系統(tǒng)600的非限制性實施例,所述計算系統(tǒng)600能夠展現(xiàn)上述方法和過程中的一個或多個。計算系統(tǒng)600以簡化的形式被示出。計算系統(tǒng)600可以采取以下形式:一個或多個游戲控制臺、移動通信設備(例如,智能電話)、移動計算設備、平板計算機、服務器計算機、家庭娛樂計算機、網(wǎng)絡計算設備、個人計算機和/或其他計算設備。
[0046]計算系統(tǒng)600包括邏輯機602和存儲機604。計算系統(tǒng)600可以可選地包括顯示子系統(tǒng)606、輸入子系統(tǒng)608、通信子系統(tǒng)610和/或圖6中未示出的其他組件。
[0047]邏輯機602包括被配置為執(zhí)行指令的一個或多個物理設備。例如,邏輯機可以被配置為執(zhí)行計算機可讀指令,所述計算機可讀指令是一個或多個應用、服務、程序、例程、庫、對象、組件、數(shù)據(jù)結構或其他邏輯構造的一部分。這樣的指令可以被實施來執(zhí)行任務、實施數(shù)據(jù)類型、轉換一個或多個組件的狀態(tài)、實現(xiàn)技術效果或以別的方式達到所希望的結果。
[0048]邏輯機可以包括被配置為執(zhí)行軟件指令的一個或多個處理器。附加地或備選地,邏輯機可以包括被配置為執(zhí)行硬件或固件指令的一個或多個硬件或固件邏輯機。邏輯機的處理器可以是單核或多核的,并且在邏輯機的處理器上執(zhí)行的指令可以被配置用于順序的、并行的和/或分布式的處理。邏輯機的各個組件可選地可以分布在兩個或更多個分離的設備上,所述兩個或更多個分離的設備可以遠程地定位和/或被配置用于協(xié)同處理。邏輯機的一些方面可以由按照云計算配置而配置的遠程可訪問的聯(lián)網(wǎng)計算設備來虛擬化和執(zhí)行。
[0049]存儲機604包括一個或多個物理設備,所述一個或多個物理設備被配置為存儲和持有可由邏輯機執(zhí)行來實施本文描述的