本公開涉及一種用于電子設備的語音處理方法及系統(tǒng)。
背景技術(shù):
:隨著互聯(lián)網(wǎng)的快速發(fā)展,各種各樣的電子設備應運而生。電子設備現(xiàn)在是人們生活必不可少的一部分,但是在使用電子設備的時候也會遇到許多問題,例如現(xiàn)在的大多數(shù)電子設備都依賴于用戶的手動操作,例如用手敲擊鍵盤或點擊鼠標,以輸入指令。技術(shù)實現(xiàn)要素:本公開的一個方面提供了一種用于電子設備的語音處理方法,包括:獲取語音;根據(jù)所述語音生成至少一條指令;基于所述至少一條指令,確定所述電子設備上與所述指令匹配的窗口;以及在所述窗口中應用所述至少一條指令??蛇x地,根據(jù)所述語音生成至少一條指令包括:從所述語音中提取關鍵詞,所述關鍵詞包括操作關鍵詞和對象關鍵詞;以及根據(jù)所述操作關鍵詞確定與其所對應的對象關鍵詞??蛇x地,基于所述至少一條指令,確定所述電子設備上與所述指令匹配的窗口包括根據(jù)所述至少一條指令的屬性,從所述電子設備的預設表中確定出與所述至少一條指令的屬性匹配的窗口??蛇x地,該方法還包括檢測所述電子設備的顯示區(qū)域的窗口,對所述顯示區(qū)域中的每個窗口進行分類并存儲到所述預設表??蛇x地,該方法還包括:判斷所述語音是否有效;以及如果有效,則對所述語音進行處理以生成至少一條指令,并且/或者如果無效,則發(fā)送提示信號,并將判斷結(jié)果記錄在日志。本公開的另一個方面提供了一種用于電子設備的語音處理系統(tǒng),包括:獲取語音模塊,用于獲取語音;指令生成模塊,根據(jù)所述語音生成至少一條指令;窗口匹配模塊,基于所述至少一條指令,確定所述電子設備上與所述指令匹配的窗口;以及指令應用模塊,用于在所述窗口中應用所述至少一條指令。可選地,所述語音獲取模塊還用于從所述語音內(nèi)容中提取關鍵詞,所述關鍵詞包括操作關鍵詞和對象關鍵詞;以及根據(jù)所述操作關鍵詞確定與其所對應的對象關鍵詞??蛇x地,所述窗口匹配模塊還用于根據(jù)所述至少一條指令的屬性,從所述電子設備的預設表中確定出與所述至少一條指令的屬性匹配的窗口??蛇x地,該系統(tǒng)還包括窗口檢測模塊,用于檢測所述電子設備的顯示區(qū)域的窗口,對所述顯示區(qū)域中的每個窗口進行分類并存儲到所述預設表??蛇x地,該系統(tǒng)還包括判斷模塊,用于判斷所述語音是否有效;其中,如果所述判斷模塊判斷所述語音有效,則對所述語音進行處理以生成至少一條指令,并且/或者如果判斷模塊判斷所述語音無效,則發(fā)送提示信號,并將判斷結(jié)果記錄在日志。本公開的另一方面提供了一種電子設備,包括:一個或多個處理器;以及一個或多個存儲器,存儲有可執(zhí)行指令,所述指令在被處理器執(zhí)行時,使得處理器執(zhí)行如上所述的方法。本公開的另一方面提供了一種非易失性存儲介質(zhì),存儲有計算機可執(zhí)行指令,所述指令在被執(zhí)行時用于實現(xiàn)如上所述的方法。本公開的另一方面提供了一種計算機程序,所述計算機程序包括計算機可執(zhí)行指令,所述指令在被執(zhí)行時用于實現(xiàn)如上所述的方法。附圖說明為了更完整地理解本公開及其優(yōu)勢,現(xiàn)在將參考結(jié)合附圖的以下描述,其中:圖1示意性示出了根據(jù)本公開實施例的電子設備的語音處理方法和電子設備的應用場景;圖2示意性示出了根據(jù)本公開實施例的用于電子設備的語音處理方法的流程圖;圖3示意性示出了根據(jù)本公開另一實施例的用于電子設備的語音處理方法的流程圖;圖4示意性示出了根據(jù)本公開另一實施例的用于電子設備的語音處理方法的流程圖;圖5示意性示出了根據(jù)本公開另一實施例的用于電子設備的語音處理方法的流程圖;圖6示意性示出了根據(jù)本公開實施例的用于電子設備的語音處理系統(tǒng)的框圖;以及圖7示意性示出了根據(jù)本公開實施例的電子設備的框圖。具體實施方式以下,將參照附圖來描述本公開的實施例。但是應該理解,這些描述只是示例性的,而并非要限制本公開的范圍。此外,在以下說明中,省略了對公知結(jié)構(gòu)和技術(shù)的描述,以避免不必要地混淆本公開的概念。在此使用的術(shù)語僅僅是為了描述具體實施例,而并非意在限制本公開。這里使用的詞語“一”、“一個(種)”和“該”等也應包括“多個”、“多種”的意思,除非上下文另外明確指出。此外,在此使用的術(shù)語“包括”、“包含”等表明了所述特征、步驟、操作和/或部件的存在,但是并不排除存在或添加一個或多個其他特征、步驟、操作或部件。在此使用的所有術(shù)語(包括技術(shù)和科學術(shù)語)具有本領域技術(shù)人員通常所理解的含義,除非另外定義。應注意,這里使用的術(shù)語應解釋為具有與本說明書的上下文相一致的含義,而不應以理想化或過于刻板的方式來解釋。附圖中示出了一些方框圖和/或流程圖。應理解,方框圖和/或流程圖中的一些方框或其組合可以由計算機程序指令來實現(xiàn)。這些計算機程序指令可以提供給通用計算機、專用計算機或其他可編程數(shù)據(jù)處理裝置的處理器,從而這些指令在由該處理器執(zhí)行時可以創(chuàng)建用于實現(xiàn)這些方框圖和/或流程圖中所說明的功能/操作的裝置。因此,本公開的技術(shù)可以硬件和/或軟件(包括固件、微代碼等)的形式來實現(xiàn)。另外,本公開的技術(shù)可以采取存儲有指令的計算機可讀介質(zhì)上的計算機程序產(chǎn)品的形式,該計算機程序產(chǎn)品可供指令執(zhí)行系統(tǒng)使用或者結(jié)合指令執(zhí)行系統(tǒng)使用。在本公開的上下文中,計算機可讀介質(zhì)可以是能夠包含、存儲、傳送、傳播或傳輸指令的任意介質(zhì)。例如,計算機可讀介質(zhì)可以包括但不限于電、磁、光、電磁、紅外或半導體系統(tǒng)、裝置、器件或傳播介質(zhì)。計算機可讀介質(zhì)的具體示例包括:磁存儲裝置,如磁帶或硬盤(hdd);光存儲裝置,如光盤(cd-rom);存儲器,如隨機存取存儲器(ram)或閃存;和/或有線/無線通信鏈路。本公開的實施例提供了一種用于電子設備的語音處理方法,包括:獲取語音;根據(jù)語音生成至少一條指令;基于至少一條指令,確定電子設備上與指令匹配的窗口;以及在窗口中應用所述至少一條指令。圖1示意性示出了根據(jù)本公開實施例的電子設備的語音處理方法和電子設備的應用場景。根據(jù)本公開實施例,電子設備可以是臺式電腦、手機、平板電腦、筆記本電腦或膝上型便攜式電腦等等,但不限于此。如圖1所示,電子設備100(例如,臺式電腦)包括但不限于顯示器101、鍵盤102和鼠標103。當用戶使用鍵盤102和鼠標103對顯示器101上顯示的窗口進行操作時,電子設備100獲取用戶的語音,并對該語音進行處理,生成至少一條指令,電子設備100將至少一條指令應用在顯示器101的顯示窗口上,以對顯示窗口的對象進行操作,此時用戶可以在使用鍵盤102和鼠標103的同時對電子設備施加語音命令,用戶也可以不使用鍵盤102和鼠標103,只對電子設備施加語音命令。根據(jù)本公開實施例,電子設備100獲取的用戶語音可以是針對顯示器101窗口的操作指令,例如顯示器101的窗口是一款游戲中的某一窗口(例如,商店窗口,但不限于此),此時用戶語音可以是一條購買指令(例如,購買武器,但不限于此)。電子設備100可以將購買指令應用在商品窗口上,并對所述商品窗口中的對象進行購買,無需用戶使用鍵盤102和鼠標103對選中對象進行購買。圖2示意性示出了根據(jù)本公開實施例的用于電子設備的語音處理方法的流程圖。如圖2所示,該方法包括操作s201~s204。在操作s201,獲取語音。在操作s202,根據(jù)該語音生成至少一條指令。在操作s203,基于至少一條指令,確定電子設備上與指令匹配的窗口。在操作s204,在窗口中應用至少一條指令。根據(jù)本公開的實施例,應用上述方法對電子設備100的某一窗口進行操作時,無需用戶在電子設備100的本地對該窗口進行操作,只需電子設備100獲取用戶語音,并將語音中的指令應用在該窗口。這樣,使得用戶使用電子設備100更加方便,提高了用戶體驗。根據(jù)本公開實施例,電子設備可以是臺式電腦、手機、平板電腦、筆記本電腦或膝上型便攜式電腦等等,但不限于此。根據(jù)本公開的實施例,在操作s201中的語音可以是用戶在電子設備100的可接收區(qū)域內(nèi)發(fā)出的語音,也可以是用戶事先錄制的語音。所述語音的內(nèi)容可以是與電子設備100的窗口相關聯(lián)的內(nèi)容。例如,電子設備100的窗口是一款游戲窗口(例如,英雄聯(lián)盟的窗口),所述語音可以是針對該游戲窗口的操作內(nèi)容(例如,釋放碎裂之火技能)。再例如,電子設備100的窗口是辦公軟件的窗口(例如,microsoftword2010的窗口),所述語音可以是針對該辦公軟件的窗口的操作內(nèi)容(例如,進入修訂模式)。圖3示意性示出了根據(jù)本公開另一實施例的用于電子設備的語音處理方法的流程圖。如圖3所示,根據(jù)本公開實施例,操作s202包括操作s301和操作s302。在操作s301,從語音中提取關鍵詞,該關鍵詞包括操作關鍵詞和對象關鍵詞。具體地,從語音中提取的關鍵詞可以是與電子設備100的窗口相關聯(lián)的關鍵詞。例如,電子設備100的窗口是一款游戲窗口(例如,英雄聯(lián)盟的窗口),所述關鍵詞可以是針對該游戲窗口的操作關鍵詞和對象關鍵詞(例如,釋放、碎裂之火技能)。再例如,電子設備100的窗口是辦公軟件的窗口(例如,microsoftword2010的窗口),所述關鍵詞可以是針對該辦公軟件的窗口的操作關鍵詞和對象關鍵詞(例如,進入、修訂模式)。在操作s302,根據(jù)操作關鍵詞確定與其所對應的對象關鍵詞。具體地,當電子設備100獲取的語音包括多個操作關鍵詞和對象關鍵詞時,電子設備100可以根據(jù)操作關鍵詞的含義確定出與其所對應的對象關鍵詞。例如,電子設備100獲取的語音內(nèi)容是“回城購買一雙鞋”,這段語音包括“回”和“購買”兩個操作關鍵詞,還包括“城”和“鞋”兩個對象關鍵詞。這種情況下,電子設備100從語音中提取出四個關鍵詞,并根據(jù)操作關鍵詞(例如“回”和“購買”)的含義確定出與其所對應的對象關鍵詞(例如“城”和“鞋”),生成至少一條指令(例如“回城”和“購買鞋”)。根據(jù)本公開的實施例,在操作s203中的至少一條指令可以包括但不限于游戲操作指令、辦公操作指令或娛樂操作指令。例如,游戲操作指令可以是針對游戲中的某一窗口進行操作的指令(例如,釋放技能指令),辦公操作指令可以是辦公軟件中的某一窗口進行操作的指令(例如,進入修訂模式指令),娛樂操作指令可以是多媒體應用軟件中的某一窗口進行操作的指令(例如,搜索歌曲指令)。根據(jù)本公開的實施例,在操作s203中的確定電子設備100上與上述指令匹配的窗口。例如,當至少一條指令是游戲操作指令(例如,釋放技能指令)時,電子設備100的處理器對顯示器101的所有窗口進行掃描,并確定出與該游戲指令相對應的游戲窗口。當至少一條指令是辦公操作指令(例如,進入修訂模式指令)時,電子設備100的處理器對顯示器101的所有窗口進行掃描,并確定出與該辦公操作指令相對應的辦公窗口。當至少一條指令是娛樂操作指令(例如,搜索歌曲指令)時,電子設備100的處理器對顯示器101的所有窗口進行掃描,并確定出與該娛樂操作指令相對應的多媒體應用軟件的窗口。圖4示意性示出了根據(jù)本公開另一實施例的用于電子設備的語音處理方法的流程圖。如圖4所示,根據(jù)本公開的實施例,操作s203包括操作s401。具體地,基于至少一條指令,確定電子設備100上與指令匹配的窗口包括根據(jù)至少一條指令的屬性,從電子設備100的預設表中確定出與至少一條指令的屬性匹配的窗口。根據(jù)本公開實施例,至少一條指令的屬性可以指上述提到的游戲、辦公或娛樂等屬性,但不限于此。根據(jù)指令屬性(例如,游戲)從電子設備100的預設表中確定出與該指令所對應的窗口(例如,游戲窗口)。根據(jù)本公開的實施例,電子設備100的預設表的內(nèi)容如下表所示:游戲窗口英雄聯(lián)盟穿越火線跑跑卡丁車辦公窗口microsoftwordmicrosoftvisiomicrosoftexcel娛樂窗口音樂播放器視頻播放器小說閱讀器需要說明的是,上述每個窗口可以包括多個子窗口(表中未示出)。例如,英雄聯(lián)盟窗口可以包括但不限于商店窗口、技能窗口或設置窗口。根據(jù)本公開的實施例,該方法還包括檢測電子設備100的顯示區(qū)域的窗口,對顯示區(qū)域中的每個窗口進行分類并存儲到預設表。具體地,用戶可以在使用電子設備100的期間不間斷的對顯示器101的顯示區(qū)域進行檢測,并將檢測到的窗口進行分類,然后將不同種類的窗口按其屬性存儲到電子設備100的預設表中?;蛘?,可以在檢測到用戶觸發(fā)新的窗口和/或關閉窗口時,檢測顯示區(qū)域,將檢測到的窗口進行分類并按照其屬性存儲到電子設備100的預設表中。圖5示意性示出了根據(jù)本公開另一實施例的用于電子設備的語音處理方法的流程圖。如圖5所示,上述方法還包括操作s501~操作s503。在操作s201,獲取語音。在操作s501,判斷語音是否有效。在操作s502,如果有效,則對語音進行處理以生成至少一條指令。在操作s203,基于至少一條指令,確定電子設備上與指令匹配的窗口。在操作s204,在窗口中應用至少一條指令。根據(jù)本公開的實施例,如果獲取的語音無效,則執(zhí)行操作s503,發(fā)送提示信號,并將判斷結(jié)果記錄在日志。根據(jù)本公開的實施例,在操作s503中發(fā)出提示信號可以包括但不限于聲信號或者光信號。例如,聲信號可以是由電子設備100的揚聲器發(fā)出的各種提示聲音(例如滴答聲),光信號可以是由電子設備100的電源指示燈發(fā)出的光信號(例如,電源指示燈閃爍)。這樣可以提醒用戶本次輸入的語音無效,使得用戶重新輸入語音。根據(jù)本公開的實施例,在操作s503中將判斷結(jié)果記錄在日志。具體地,可以是將本次輸入語音的無效原因記錄在電子設備100的日志,并把相應的時間記錄在該日志中。這樣,可以方便用戶查詢,并對查出的日志進行分析處理,使得以后不再出現(xiàn)同樣的情況。圖6示意性示出了根據(jù)本公開實施例的用于電子設備的語音處理系統(tǒng)的框圖。如圖6所示,電子設備的語音處理系統(tǒng)600包括獲取語音模塊610、指令生成模塊620、窗口匹配模塊630和指令應用模塊640。該系統(tǒng)600可以執(zhí)行上面參考圖2~圖5描述的方法,以實現(xiàn)電子設備100對用戶語音進行處理并生成指令,該指令可以應用在電子設備100的窗口中。具體地,獲取語音模塊610,用于獲取語音。指令生成模塊620,用于根據(jù)該語音生成至少一條指令。窗口匹配模塊630,基于至少一條指令,確定電子設備上與指令匹配的窗口。指令應用模塊640,在窗口中應用至少一條指令。根據(jù)本公開的實施例,應用系統(tǒng)600對電子設備的某一窗口進行操作時,無需用戶在電子設備100的本地對該窗口進行操作,只需電子設備100獲取用戶語音,并將語音中的指令應用在該窗口中。這樣,使得用戶使用電子設備100更加方便,提高了用戶體驗。根據(jù)本公開的實施例,在獲取語音610中的語音可以是用戶在電子設備100的可接收區(qū)域內(nèi)發(fā)出的語音,也可以是用戶事先錄制的語音。所述語音的內(nèi)容可以是與電子設備100的窗口相關聯(lián)的內(nèi)容。例如,電子設備100的窗口是一款游戲窗口(例如,英雄聯(lián)盟的窗口),所述語音可以是針對該游戲窗口的操作內(nèi)容(例如,釋放碎裂之火技能)。再例如,電子設備100的窗口是辦公軟件的窗口(例如,microsoftword2010的窗口),所述語音可以是針對該辦公軟件的窗口的操作內(nèi)容(例如,進入修訂模塊式)。根據(jù)本公開的實施例,該系統(tǒng)600還包括窗口檢測模塊650,用于檢測電子設備100的顯示區(qū)域的窗口,對顯示區(qū)域中的每個窗口進行分類并存儲到預設表。具體地,用戶可以在使用電子設備100的期間不間斷的對顯示器101的顯示區(qū)域進行檢測,并將檢測到的窗口進行分類,然后將不同種類的窗口按其屬性存儲到電子設備100的預設表中?;蛘?,可以在檢測到用戶觸發(fā)新的窗口和/或關閉窗口時,檢測顯示區(qū)域,將檢測到的窗口進行分類并按照其屬性存儲到電子設備100的預設表中。根據(jù)本公開的實施例,該系統(tǒng)600還包括判斷模塊660。該判斷模塊660用于判斷語音是否有效。其中,如果判斷模塊660判斷該語音有效,則對該語音進行處理以生成至少一條指令,或者如果判斷模塊660判斷該語音無效,則發(fā)送提示信號,并將判斷結(jié)果記錄在日志。根據(jù)本公開的實施例,如果獲取的語音無效,則發(fā)送提示信號,并將判斷結(jié)果記錄在日志。根據(jù)本公開的實施例,在判斷模塊660中的發(fā)出提示信號可以包括但不限于聲信號或者光信號。例如,聲信號可以是由電子設備100的揚聲器發(fā)出的各種提示聲音(例如滴答聲),光信號可以是由電子設備100的電源指示燈發(fā)出的光信號(例如,電源指示燈閃爍)。這樣可以提醒用戶本次輸入的語音無效,使得用戶重新輸入語音。根據(jù)本公開的實施例,在判斷模塊660中的將判斷結(jié)果記錄在日志。具體地,可以是將本次輸入語音的無效原因記錄在電子設備100的日志,并把相應的時間記錄在該日志中。這樣,可以方便用戶查詢,并對查出的日志進行分析處理,使得以后不再出現(xiàn)同樣的情況??梢岳斫獾氖?,獲取語音模塊610、指令生成模塊620、窗口匹配模塊630、指令應用模塊640、窗口檢測模塊650以及判斷模塊660可以合并在一個模塊中實現(xiàn),或者其中的任意一個模塊可以被拆分成多個模塊。或者,這些模塊中的一個或多個模塊的至少部分功能可以與其他模塊的至少部分功能相結(jié)合,并在一個模塊中實現(xiàn)。根據(jù)本發(fā)明的實施例,獲取語音模塊610、指令生成模塊620、窗口匹配模塊630、指令應用模塊640、窗口檢測模塊650以及判斷模塊660中的至少一個可以至少被部分地實現(xiàn)為硬件電路,例如現(xiàn)場可編程門陣列(fpga)、可編程邏輯陣列(pla)、片上系統(tǒng)、基板上的系統(tǒng)、封裝上的系統(tǒng)、專用集成電路(asic),或可以以對電路進行集成或封裝的任何其他的合理方式等硬件或固件來實現(xiàn),或以軟件、硬件以及固件三種實現(xiàn)方式的適當組合來實現(xiàn)?;蛘?,獲取語音模塊610、指令生成模塊620、窗口匹配模塊630、指令應用模塊640、窗口檢測模塊650以及判斷模塊660中的至少一個可以至少被部分地實現(xiàn)為計算機程序模塊,當該程序被計算機運行時,可以執(zhí)行相應模塊的功能。圖7示意性示出了根據(jù)本公開實施例的電子設備的框圖。如圖7所示,電子設備700包括處理器710和計算機可讀存儲介質(zhì)720。電子設備700可以執(zhí)行上面參考圖2~圖5描述的方法,以實現(xiàn)電子設備對用戶語音進行處理并生成指令,該指令可以應用在電子設備的窗口中。具體地,處理器710例如可以包括通用微處理器、指令集處理器和/或相關芯片組和/或?qū)S梦⑻幚砥?例如,專用集成電路(asic)),等等。處理器710還可以包括用于緩存用途的板載存儲器。處理器710可以是用于執(zhí)行參考圖2~圖5描述的根據(jù)本公開實施例的方法流程的不同動作的單一處理單元或者是多個處理單元。計算機可讀存儲介質(zhì)720,例如可以是能夠包含、存儲、傳送、傳播或傳輸指令的任意介質(zhì)。例如,可讀存儲介質(zhì)可以包括但不限于電、磁、光、電磁、紅外或半導體系統(tǒng)、裝置、器件或傳播介質(zhì)??勺x存儲介質(zhì)的具體示例包括:磁存儲裝置,如磁帶或硬盤(hdd);光存儲裝置,如光盤(cd-rom);存儲器,如隨機存取存儲器(ram)或閃存;和/或有線/無線通信鏈路。計算機可讀存儲介質(zhì)720可以包括計算機程序721,該計算機程序721可以包括代碼/計算機可執(zhí)行指令,其在由處理器710執(zhí)行時使得處理器710執(zhí)行例如上面結(jié)合圖2~圖5所描述的方法流程及其任何變形。計算機程序721可被配置為具有例如包括計算機程序模塊的計算機程序代碼。例如,在示例實施例中,計算機程序721中的代碼可以包括一個或多個程序模塊,例如包括721a、模塊721b、……。應當注意,模塊的劃分方式和個數(shù)并不是固定的,本領域技術(shù)人員可以根據(jù)實際情況使用合適的程序模塊或程序模塊組合,當這些程序模塊組合被處理器710執(zhí)行時,使得處理器710可以執(zhí)行例如上面結(jié)合圖2~圖5所描述的方法流程及其任何變形。根據(jù)本發(fā)明的實施例,獲取語音模塊610、指令生成模塊620、窗口匹配模塊630、指令應用模塊640、窗口檢測模塊650以及判斷模塊660中的至少一個可以實現(xiàn)為參考圖7描述的計算機程序模塊,其在被處理器710執(zhí)行時,可以實現(xiàn)上面描述的相應操作。本領域技術(shù)人員可以理解,本公開的各個實施例和/或權(quán)利要求中記載的特征可以進行多種組合或/或結(jié)合,即使這樣的組合或結(jié)合沒有明確記載于本公開中。特別地,在不脫離本公開精神和教導的情況下,本公開的各個實施例和/或權(quán)利要求中記載的特征可以進行多種組合和/或結(jié)合。所有這些組合和/或結(jié)合均落入本公開的范圍。盡管已經(jīng)參照本公開的特定示例性實施例示出并描述了本公開,但是本領域技術(shù)人員應該理解,在不背離所附權(quán)利要求及其等同物限定的本公開的精神和范圍的情況下,可以對本公開進行形式和細節(jié)上的多種改變。因此,本公開的范圍不應該限于上述實施例,而是應該不僅由所附權(quán)利要求來進行確定,還由所附權(quán)利要求的等同物來進行限定。當前第1頁12