本發(fā)明涉及智能機(jī)器人領(lǐng)域,具體地說,涉及一種不同應(yīng)用場景下智能機(jī)器人的數(shù)據(jù)交互方法及裝置。
背景技術(shù):
對于智能機(jī)器人來說,最重要的部分就是操作系統(tǒng)。要實(shí)現(xiàn)機(jī)器人的智能程度,必須依托于強(qiáng)有力的操作系統(tǒng)來充當(dāng)機(jī)器人的大腦角色。然而,現(xiàn)實(shí)情況卻是,如果要制造運(yùn)算能力達(dá)到人類水平的機(jī)器人,需要一個(gè)體積相當(dāng)于人腦100萬倍的機(jī)器人大腦,這樣大的機(jī)器人大腦與身體根本無法匹配。
因此提出了云端大腦的概念。在智能交互領(lǐng)域,可以利用云端的形態(tài),將記憶認(rèn)識和計(jì)算認(rèn)知從云上獲得,而當(dāng)前的感知、交互認(rèn)識、行為控制和協(xié)調(diào)在端上,使得智能機(jī)器人有自主學(xué)習(xí)和主動尋求幫助的能力。
然而,智能機(jī)器人還需要具有如何在不同應(yīng)用場景以及不同狀態(tài)下進(jìn)行數(shù)據(jù)交互以及正確處理交互內(nèi)容的能力。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法,來解決上述技術(shù)問題。該方法由機(jī)器人操作系統(tǒng)執(zhí)行,所述機(jī)器人操作系統(tǒng)裝載有多個(gè)應(yīng)用。所述方法包括以下步驟:
監(jiān)聽當(dāng)前運(yùn)行應(yīng)用,創(chuàng)建與運(yùn)行應(yīng)用相關(guān)聯(lián)的對話;
拾取用戶針對該運(yùn)行應(yīng)用的多模態(tài)交互輸入并解析,從中獲取語義理解信息;
在與運(yùn)行應(yīng)用關(guān)聯(lián)的對話環(huán)境下,輸出該運(yùn)行應(yīng)用的多模態(tài)數(shù)據(jù)。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法,優(yōu)選的是,所述當(dāng)前運(yùn)行應(yīng)用為系統(tǒng)聊天應(yīng)用,所述系統(tǒng)聊天應(yīng)用為智能機(jī)器人開機(jī)后的默認(rèn)狀態(tài)。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法,優(yōu)選的是,所述方法還包括:
將當(dāng)前運(yùn)行應(yīng)用控制為前臺運(yùn)行狀態(tài),其中,所述上下文對話實(shí)例中的上下文環(huán)境參數(shù)在本地保存;
進(jìn)行交互狀態(tài)切換時(shí),備份當(dāng)前運(yùn)行狀態(tài)下的操作系統(tǒng)的運(yùn)行環(huán)境參數(shù),并在再次切換為該運(yùn)行狀態(tài)時(shí),恢復(fù)所備份的運(yùn)行環(huán)境參數(shù)。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法,優(yōu)選的是,在拾取用戶針對該運(yùn)行應(yīng)用的多模態(tài)交互輸入并解析的步驟中,系統(tǒng)拾取用戶針對該運(yùn)行應(yīng)用的多模態(tài)交互輸入并解析上報(bào)至服務(wù)器;隨后,從服務(wù)器中獲取語義理解信息。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法,優(yōu)選的是,所述方法還包括:
根據(jù)所述語義理解信息,決策該語義理解信息是否與所述運(yùn)行應(yīng)用關(guān)聯(lián),并在具備關(guān)聯(lián)時(shí),輸出多模態(tài)數(shù)據(jù)。
根據(jù)本發(fā)明的另一個(gè)方面,其還提供了一種與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置。該裝置包括在機(jī)器人操作系統(tǒng)中,并包括:
對話管理器,其用以監(jiān)聽當(dāng)前運(yùn)行應(yīng)用,創(chuàng)建與運(yùn)行應(yīng)用相關(guān)聯(lián)的對話;
語義解析單元,其用以拾取用戶針對該運(yùn)行應(yīng)用的多模態(tài)交互輸入并解析,從中獲取語義理解信息;
多模態(tài)輸出單元,其用以在與運(yùn)行應(yīng)用關(guān)聯(lián)的對話環(huán)境下,輸出該運(yùn)行應(yīng)用的多模態(tài)數(shù)據(jù)。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置,其特征在于,所述當(dāng)前運(yùn)行應(yīng)用為系統(tǒng)聊天應(yīng)用,所述系統(tǒng)聊天應(yīng)用為智能機(jī)器人開機(jī)后的默認(rèn)狀態(tài)。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置,其特征在于,所述裝置還包括:
狀態(tài)機(jī),其用以將當(dāng)前運(yùn)行應(yīng)用控制為前臺運(yùn)行狀態(tài),其中,所述上下文對話實(shí)例中的上下文環(huán)境參數(shù)在本地保存;
在進(jìn)行交互狀態(tài)切換時(shí),所述狀態(tài)機(jī)用以備份當(dāng)前運(yùn)行狀態(tài)下的操作系統(tǒng)的運(yùn)行環(huán)境參數(shù),并在再次切換為該運(yùn)行狀態(tài)時(shí),恢復(fù)所備份的運(yùn)行環(huán)境參數(shù)。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置,優(yōu)選的是,在語義解析單元中,
拾取用戶針對該運(yùn)行應(yīng)用的多模態(tài)交互輸入并解析上報(bào)至服務(wù)器;
從服務(wù)器中獲取語義理解信息。
根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置,優(yōu)選的是,所述裝置還包括:
決策單元,其用以根據(jù)所述語義理解信息,決策該語義理解信息是否與所述運(yùn)行應(yīng)用關(guān)聯(lián),并在具備關(guān)聯(lián)時(shí),輸出多模態(tài)數(shù)據(jù)。
本發(fā)明的有利之處在于,由于本發(fā)明輸出多模態(tài)數(shù)據(jù)之前,實(shí)時(shí)監(jiān)聽當(dāng)前運(yùn)行應(yīng)用,同時(shí)創(chuàng)建與運(yùn)行應(yīng)用相關(guān)聯(lián)的對話,隨后獲取用戶針對該運(yùn)行應(yīng)用的語義理解信息,因此使得系統(tǒng)可以在與運(yùn)行應(yīng)用關(guān)聯(lián)的對話環(huán)境下進(jìn)行多模態(tài)數(shù)據(jù)的輸出,從而保證機(jī)器人多模態(tài)輸出的內(nèi)容與對話環(huán)境是關(guān)聯(lián)的。此外,系統(tǒng)還可以根據(jù)云端大腦的返回來維護(hù)當(dāng)前場景的運(yùn)行環(huán)境參數(shù)。同時(shí),本發(fā)明將運(yùn)行上下文參數(shù)保存在機(jī)器人本地,從而不需要云端大腦為每個(gè)機(jī)器人維護(hù)運(yùn)行上下文環(huán)境。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
附圖說明
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例共同用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
圖1顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法的總體流程圖;
圖2顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法的部分流程圖;
圖3顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置的結(jié)構(gòu)框圖,以及
圖4顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互的系統(tǒng)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,以下結(jié)合附圖對本發(fā)明實(shí)施例作進(jìn)一步地詳細(xì)說明。
如圖1所示,其中顯示了一種與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互方法的總體流程圖。
在與人進(jìn)行交互時(shí),機(jī)器人對交互內(nèi)容的處理,需要根據(jù)當(dāng)前機(jī)器人所處的狀態(tài)及機(jī)器人操作系統(tǒng)所處的軟件場景來做出正確的反應(yīng)。在圖1所示的方法中,系統(tǒng)開機(jī)首先進(jìn)行初始化等一系列操作,S101,以便于將機(jī)器人設(shè)定在默認(rèn)的狀態(tài)中。根據(jù)一個(gè)實(shí)施例,機(jī)器人開機(jī)后的默認(rèn)狀態(tài)為聊天狀態(tài)。其他應(yīng)用默認(rèn)不運(yùn)行,而處于接收外部多模態(tài)交互輸入的狀態(tài)。機(jī)器人也可以通過發(fā)送一段問候語的語音、做出打招呼的手勢等來向用戶表明系統(tǒng)啟動正常。在聊天狀態(tài)下,系統(tǒng)可對應(yīng)當(dāng)前狀態(tài)配置一些機(jī)器人屬性,例如語音語速語調(diào)等系統(tǒng)配置。
接下來,在步驟S102中,當(dāng)系統(tǒng)在聊天狀態(tài)下,等待用戶輸入多模態(tài)交互信息時(shí),還不斷地監(jiān)聽當(dāng)前運(yùn)行應(yīng)用。如果監(jiān)聽到有運(yùn)行應(yīng)用被用戶啟動或者在某觸發(fā)條件滿足的情況下,機(jī)器人操作系統(tǒng)自動創(chuàng)建與要進(jìn)入的運(yùn)行應(yīng)用相關(guān)聯(lián)的對話以進(jìn)入應(yīng)用。
當(dāng)應(yīng)用啟動后,機(jī)器人從聊天狀態(tài)進(jìn)入應(yīng)用運(yùn)行狀態(tài)。應(yīng)用運(yùn)行狀態(tài)會將應(yīng)用的密鑰(appkey)等有關(guān)應(yīng)用的信息進(jìn)行保存,同時(shí)還會針對一些應(yīng)用的要求來修改機(jī)器人屬性。
在新的應(yīng)用運(yùn)行時(shí),機(jī)器人操作系統(tǒng)會對機(jī)器人所處的運(yùn)行環(huán)境進(jìn)行維護(hù)。在一個(gè)實(shí)施例中,當(dāng)新場景出現(xiàn)時(shí)(例如,應(yīng)用啟動時(shí))操作系統(tǒng)對默認(rèn)環(huán)境即聊天狀態(tài)下的環(huán)境進(jìn)行備份。并在該場景退出時(shí),機(jī)器人操作系統(tǒng)可通過之前對運(yùn)行環(huán)境參數(shù)的保存而對先前場景進(jìn)行恢復(fù),從而使得當(dāng)機(jī)器人退出運(yùn)行應(yīng)用時(shí),還能夠回到之前的聊天狀態(tài),繼續(xù)進(jìn)行對話聊天。
在步驟S103中,機(jī)器人操作系統(tǒng)拾取用戶針對新的運(yùn)行應(yīng)用下的多模態(tài)交互輸入并進(jìn)行解析,從而從中獲取語義理解信息。在一個(gè)實(shí)施例中,對用戶輸入的多模態(tài)交互信息的識別可以在本地進(jìn)行也可以直接上傳至云端大腦而進(jìn)行分析。例如,用戶發(fā)出的一段語音,可以通過本地ASR模塊進(jìn)行識別,然后通過通信模塊將語音識別內(nèi)容發(fā)送至與機(jī)器人不在同一物理位置的云端大腦。在云端大腦,利用其強(qiáng)大的計(jì)算能力進(jìn)行語義解析從而得到用戶的真實(shí)意圖。
另外,機(jī)器人操作系統(tǒng)還可以通過通信模塊將自身所處的環(huán)境情況數(shù)據(jù)發(fā)送給云端大腦,以讓云端了解機(jī)器人當(dāng)前的狀態(tài)以及運(yùn)行環(huán)境。在這種情況下,云端大腦可以結(jié)合機(jī)器人提供的數(shù)據(jù)對語義解析的內(nèi)容進(jìn)行正確的反饋。并將反饋結(jié)果回傳給機(jī)器人操作系統(tǒng)。
接下來,在步驟S104中,機(jī)器人操作系統(tǒng)在獲取了用戶的真實(shí)意圖后,結(jié)合反饋結(jié)果進(jìn)行判斷是否需要輸出,并在需要輸出的情況下,在與運(yùn)行應(yīng)用相關(guān)聯(lián)的對話環(huán)境下輸出該運(yùn)行應(yīng)用的多模態(tài)數(shù)據(jù)。
最后,在步驟S105中,機(jī)器人操作系統(tǒng)在完成一次交互后,結(jié)束當(dāng)前交互,并退出應(yīng)用運(yùn)行。
如圖2所示,其中顯示了一個(gè)較為具體的在機(jī)器人操作系統(tǒng)中進(jìn)行不同交互狀態(tài)切換的方法流程圖。
本方法開始于步驟S201。在步驟S201中,操作系統(tǒng)在開機(jī)后優(yōu)選將聊天應(yīng)用設(shè)定為智能機(jī)器人開機(jī)后的默認(rèn)狀態(tài)。在默認(rèn)狀態(tài)下,進(jìn)行聊天應(yīng)用環(huán)境參數(shù)的配置,設(shè)置語音語調(diào),選擇語言模式等。還可以,在一段時(shí)間未得到用戶響應(yīng)的時(shí)候,自動發(fā)出問候語,或者
具體地,在此步驟之前,機(jī)器人操作系統(tǒng)還可以根據(jù)云端大腦的返回情況,及一些其他應(yīng)用啟動等導(dǎo)致的運(yùn)行環(huán)境變化對當(dāng)前場景進(jìn)行維護(hù)。例如,當(dāng)云端返回了針對用戶語音的回答結(jié)果后,機(jī)器人操作系統(tǒng)發(fā)現(xiàn)該回答結(jié)果與機(jī)器人所處的當(dāng)前應(yīng)用并無關(guān)聯(lián),例如當(dāng)前已從聊天狀態(tài)切換到其他應(yīng)用運(yùn)行的狀態(tài)(唱歌應(yīng)用),那么此時(shí),機(jī)器人不會輸出語音回答結(jié)果,而是將歌曲繼續(xù)播放完整。該回答結(jié)果可以在機(jī)器人本地做丟棄處理。
在一種情況下,可以通過判斷歌曲應(yīng)用的播放時(shí)間來決定是否在歌曲應(yīng)用結(jié)束后進(jìn)行回答用戶的交互輸入。在另一個(gè)優(yōu)選的實(shí)施例中,還可以通過記錄被打斷的事件,而在歌曲應(yīng)用結(jié)束后,詢問用戶所提出的問題。
當(dāng)然,為了能夠減少機(jī)器人與云端大腦之間不必要的通信量,可以將上下文運(yùn)行環(huán)境參數(shù)保存在機(jī)器人本地,由機(jī)器人操作系統(tǒng)負(fù)責(zé)對自身的運(yùn)行環(huán)境進(jìn)行維護(hù),而不需要云端大腦再為每個(gè)機(jī)器人維護(hù)運(yùn)行上下文環(huán)境。
接下來,在步驟S202中,在進(jìn)入應(yīng)用運(yùn)行時(shí),將當(dāng)前運(yùn)行應(yīng)用控制為前臺運(yùn)行狀態(tài)。把當(dāng)前運(yùn)行應(yīng)用控制為前臺運(yùn)行,可以方便用戶知道機(jī)器人目前所在的狀態(tài),是否適合聊天交互等。在當(dāng)前應(yīng)用運(yùn)行需要被中斷時(shí),機(jī)器人操作系統(tǒng)可以通過特定的命令將當(dāng)前應(yīng)用控制為后臺運(yùn)行或者直接退出運(yùn)行。
接下來,在步驟S203中,當(dāng)系統(tǒng)需要進(jìn)行交互狀態(tài)切換時(shí),操作系統(tǒng)會備份當(dāng)前運(yùn)行狀態(tài)下的操作系統(tǒng)的運(yùn)行環(huán)境參數(shù),并在再次切換為該運(yùn)行狀態(tài)時(shí),恢復(fù)所備份的運(yùn)行環(huán)境參數(shù)。在這種情況下,機(jī)器人操作系統(tǒng)可以在應(yīng)用退出時(shí),自動回到進(jìn)入該應(yīng)用之前的狀態(tài)。
由于本發(fā)明的方法描述的是在計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)的。該計(jì)算機(jī)系統(tǒng)例如可以設(shè)置在機(jī)器人的控制核心處理器中。例如,本文所述的方法可以實(shí)現(xiàn)為能以控制邏輯來執(zhí)行的軟件,其由機(jī)器人控制系統(tǒng)中的CPU來執(zhí)行。本文所述的功能可以實(shí)現(xiàn)為存儲在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中的程序指令集合。當(dāng)以這種方式實(shí)現(xiàn)時(shí),該計(jì)算機(jī)程序包括一組指令,當(dāng)該組指令由計(jì)算機(jī)運(yùn)行時(shí)其促使計(jì)算機(jī)執(zhí)行能實(shí)施上述功能的方法??删幊踢壿嬁梢詴簳r(shí)或永久地安裝在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中,例如只讀存儲器芯片、計(jì)算機(jī)存儲器、磁盤或其他存儲介質(zhì)。除了以軟件來實(shí)現(xiàn)之外,本文所述的邏輯可利用分立部件、集成電路、與可編程邏輯設(shè)備(諸如,現(xiàn)場可編程門陣列(FPGA)或微處理器)結(jié)合使用的可編程邏輯,或者包括它們?nèi)我饨M合的任何其他設(shè)備來體現(xiàn)。所有此類實(shí)施例旨在落入本發(fā)明的范圍之內(nèi)。
因此,根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置300。如圖3所示,該裝置300包括在機(jī)器人操作系統(tǒng)中,并包括:
對話管理器301,其用以監(jiān)聽當(dāng)前運(yùn)行應(yīng)用,創(chuàng)建與運(yùn)行應(yīng)用相關(guān)聯(lián)的對話;
語義解析單元302,其用以拾取用戶針對該運(yùn)行應(yīng)用的多模態(tài)交互輸入并解析,從中獲取語義理解信息;
多模態(tài)輸出單元303,其用以在與運(yùn)行應(yīng)用關(guān)聯(lián)的對話環(huán)境下,輸出該運(yùn)行應(yīng)用的多模態(tài)數(shù)據(jù)。
在根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置中,優(yōu)選的是,所述當(dāng)前運(yùn)行應(yīng)用為系統(tǒng)聊天應(yīng)用,所述系統(tǒng)聊天應(yīng)用為智能機(jī)器人開機(jī)后的默認(rèn)狀態(tài)。
在根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置中,優(yōu)選的是,所述裝置300還包括:
狀態(tài)機(jī),其用以將當(dāng)前運(yùn)行應(yīng)用控制為前臺運(yùn)行狀態(tài),其中,所述上下文對話實(shí)例中的上下文環(huán)境參數(shù)在本地保存;
在進(jìn)行交互狀態(tài)切換時(shí),所述狀態(tài)機(jī)用以備份當(dāng)前運(yùn)行狀態(tài)下的操作系統(tǒng)的運(yùn)行環(huán)境參數(shù),并在再次切換為該運(yùn)行狀態(tài)時(shí),恢復(fù)所備份的運(yùn)行環(huán)境參數(shù)。
在根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置中,優(yōu)選的是,在語義解析單元中,
拾取用戶針對該運(yùn)行應(yīng)用的多模態(tài)交互輸入并解析上報(bào)至服務(wù)器;
從服務(wù)器中獲取語義理解信息。
在根據(jù)本發(fā)明的與運(yùn)行應(yīng)用關(guān)聯(lián)的智能機(jī)器人的數(shù)據(jù)交互裝置中,優(yōu)選的是,所述裝置還包括:
決策單元,其用以根據(jù)所述語義理解信息,決策該語義理解信息是否與所述運(yùn)行應(yīng)用關(guān)聯(lián),并在具備關(guān)聯(lián)時(shí),輸出多模態(tài)數(shù)據(jù)。
如圖4所示,其中詳細(xì)顯示了根據(jù)本發(fā)明一個(gè)實(shí)施例進(jìn)行機(jī)器人交互時(shí)機(jī)器人圖靈操作系統(tǒng)工作的示意圖。在機(jī)器人開機(jī)進(jìn)行綁定后,首先圖靈操作系統(tǒng)控制其進(jìn)入正常的聊天狀態(tài)。這時(shí),如果用戶發(fā)出語音,機(jī)器人的ASR模塊對該段語音進(jìn)行識別,并將識別的ASR內(nèi)容通過本地的大腦服務(wù)器上報(bào)給遠(yuǎn)程的云端大腦做語義理解。
這時(shí),圖靈操作系統(tǒng)會從對話模塊的對話管理器(DialogMananger)中獲取機(jī)器人的當(dāng)前狀態(tài)為:系統(tǒng)聊天。操作系統(tǒng)將之前獲取的語音識別內(nèi)容跟系統(tǒng)聊天的當(dāng)前狀態(tài)一同上報(bào)至云端。發(fā)送至云端的通信方式很多種,例如通過移動通信網(wǎng)絡(luò)、無線局域網(wǎng)等。云端可以根據(jù)當(dāng)前環(huán)境對語音識別內(nèi)容做出對應(yīng)的理解,并向機(jī)器人下發(fā)理解后的文本響應(yīng)內(nèi)容。
機(jī)器人圖靈操作系統(tǒng)接收到文本響應(yīng)內(nèi)容后,根據(jù)當(dāng)前所處狀態(tài)(聊天中),播放出文本到語音(TTS)的內(nèi)容。
當(dāng)進(jìn)入例如唱歌應(yīng)用后,機(jī)器人圖靈操作系統(tǒng)為唱歌應(yīng)用新建對話(Dialog),并加入到對話管理器DialogManager中,并將唱歌Dialog標(biāo)記為前臺。這時(shí),如果已經(jīng)存在本地大腦服務(wù)器做出的語音識別結(jié)果,則同上,云端對識別結(jié)果做出分析后,將分析內(nèi)容發(fā)送給圖靈操作系統(tǒng)。
接下來,圖靈操作系統(tǒng)會根據(jù)當(dāng)前狀態(tài),并結(jié)合云端返回的信息的類型,如果是唱歌應(yīng)用關(guān)心的交互則將消息發(fā)給唱歌應(yīng)用,如果是閑聊內(nèi)容則丟棄。
對于用戶輸入信息(例如識別出的語音內(nèi)容)的處理策略的選擇,根據(jù)從對話管理器(DialogManager)中和系統(tǒng)全局配置文件中讀取狀態(tài),對輸入信息的處理策略做出選擇。
在一個(gè)實(shí)施例中,對于上傳云端所要求的數(shù)據(jù),則需要從對話管理器(DialogManager)中取得,云端結(jié)合機(jī)器人的狀態(tài)結(jié)合輸入內(nèi)容一同決定語義如何理解。對于云端識別后下發(fā)的命令,則結(jié)合當(dāng)前狀態(tài)決定是直接輸出,或者新建應(yīng)用并切換到另外的應(yīng)用運(yùn)行狀態(tài)中。
應(yīng)該理解的是,本發(fā)明所公開的實(shí)施例不限于這里所公開的特定結(jié)構(gòu)、處理步驟或材料,而應(yīng)當(dāng)延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應(yīng)當(dāng)理解的是,在此使用的術(shù)語僅用于描述特定實(shí)施例的目的,而并不意味著限制。
說明書中提到的“一個(gè)實(shí)施例”或“實(shí)施例”意指結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,說明書通篇各個(gè)地方出現(xiàn)的短語“一個(gè)實(shí)施例”或“實(shí)施例”并不一定均指同一個(gè)實(shí)施例。
雖然本發(fā)明所公開的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所公開的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。