亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于人工智能的語音識(shí)別方法、裝置和系統(tǒng)與流程

文檔序號(hào):11232704閱讀:861來源:國知局
基于人工智能的語音識(shí)別方法、裝置和系統(tǒng)與流程

本發(fā)明涉及語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的語音識(shí)別方法、裝置和系統(tǒng)。



背景技術(shù):

人工智能(artificialintelligence),英文縮寫為ai。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語音識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。其中,人工智能最重要的方面就是語音識(shí)別技術(shù)。

目前語音識(shí)別主要是通過多個(gè)http連接發(fā)送語音數(shù)據(jù)到語音服務(wù)端,語音服務(wù)端將語音數(shù)據(jù)重新整合后進(jìn)行識(shí)別。

但是,在實(shí)現(xiàn)本發(fā)明的過程中發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:通過多個(gè)http連接進(jìn)行語音識(shí)別的過程中,語音服務(wù)端需要對(duì)語音數(shù)據(jù)重新排序整合,無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和下發(fā),并且每個(gè)連接都會(huì)額外消耗http頭等結(jié)構(gòu),消耗流量大。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。

為此,本發(fā)明的第一個(gè)目的在于提出一種基于人工智能的語音識(shí)別方法,以實(shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā)。

本發(fā)明的第二個(gè)目的在于提出一種基于人工智能的語音識(shí)別方法。

本發(fā)明的第三個(gè)目的在于提出一種人工智能的語音識(shí)別裝置。

本發(fā)明的第四個(gè)目的在于提出一種人工智能的語音識(shí)別裝置。

本發(fā)明的第五個(gè)目的在于提出一種客戶端。

本發(fā)明的第六個(gè)目的在于提出一種服務(wù)端。

本發(fā)明的第七個(gè)目的在于提出一種基于人工智能的語音識(shí)別系統(tǒng)。

本發(fā)明的第八個(gè)目的在于提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

本發(fā)明的第九個(gè)目的在于提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

本發(fā)明的第十個(gè)目的在于提出一種計(jì)算機(jī)程序產(chǎn)品。

本發(fā)明的第十一個(gè)目的在于提出一種計(jì)算機(jī)程序產(chǎn)品。

為達(dá)上述目的,本發(fā)明第一方面實(shí)施例提出了一種基于人工智能的語音識(shí)別方法,包括:在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù);在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別方法,通過與服務(wù)端的上行連接向服務(wù)端發(fā)送包含待識(shí)別的語音數(shù)據(jù)的上行數(shù)據(jù)流,并行通過與服務(wù)端的下行連接接收包含語音識(shí)別的結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

為達(dá)上述目的,本發(fā)明第二方面實(shí)施例提出了一種基于人工智能的語音識(shí)別方法,包括:通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別方法,通過與客戶端的上行連接接收包含待識(shí)別語音數(shù)據(jù)的上行數(shù)據(jù)流,對(duì)待語音數(shù)據(jù)進(jìn)行語音識(shí)別,并行通過與客戶端的下行連接向客戶端發(fā)送包含語音識(shí)別結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

為達(dá)上述目的,本發(fā)明第三方面實(shí)施例提出了一種基于人工智能的語音識(shí)別裝置,包括:采集模塊,用于在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);發(fā)送模塊,用于通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù);接收模塊,用于在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別方法,通過與服務(wù)端的上行連接向服務(wù)端發(fā)送包含待識(shí)別的語音數(shù)據(jù)的上行數(shù)據(jù)流,并行通過與服務(wù)端的下行連接接收包含語音識(shí)別的結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

為達(dá)上述目的,本發(fā)明第四方面實(shí)施例提出了一種基于人工智能的語音識(shí)別裝置,包括:接收模塊,用于通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;處理模塊,用于對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);發(fā)送模塊,用于在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別方法,通過與客戶端的上行連接接收客戶端發(fā)送的包含待識(shí)別語音數(shù)據(jù)的上行數(shù)據(jù)流,對(duì)待語音數(shù)據(jù)進(jìn)行語音識(shí)別,并行通過與客戶端的下行連接向客戶端發(fā)送包含語音識(shí)別結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

為達(dá)上述目的,本發(fā)明第五方面實(shí)施例提出了一種客戶端,包括:處理器;用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;其中,處理器被配置為:在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括所述語音數(shù)據(jù);在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是所述服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

為達(dá)上述目的,本發(fā)明第六方面實(shí)施例提出了一種服務(wù)端,處理器;用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;其中,處理器被配置為:通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

為達(dá)上述目的,本發(fā)明第七方面實(shí)施例提出了一種基于人工智能的語音識(shí)別系統(tǒng),包括第五方面實(shí)施例的客戶端,以及第六方面實(shí)施例的服務(wù)端;客戶端和服務(wù)端之間通過上行連接和下行連接進(jìn)行通信。

為了實(shí)現(xiàn)上述目的,本發(fā)明第八方面實(shí)施例提出了一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)存儲(chǔ)介質(zhì)中的指令由客戶端處理器被執(zhí)行時(shí),使得客戶端能夠執(zhí)行一種基于人工智能的語音識(shí)別方法,方法包括:在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù);在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

為了實(shí)現(xiàn)上述目的,本發(fā)明第九方面實(shí)施例提出了一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)存儲(chǔ)介質(zhì)中的指令由服務(wù)端處理器被執(zhí)行時(shí),使得服務(wù)端能夠執(zhí)行一種基于人工智能的語音識(shí)別方法,方法包括:通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

為了實(shí)現(xiàn)上述目的,本發(fā)明第十方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時(shí),執(zhí)行一種基于人工智能的語音識(shí)別方法,包括:在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù);在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

為了實(shí)現(xiàn)上述目的,本發(fā)明第十一方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時(shí),執(zhí)行一種基于人工智能的語音識(shí)別方法,包括:通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。

附圖說明

本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:

圖1為本發(fā)明實(shí)施例所提供的一種基于人工智能的語音識(shí)別方法的流程示意圖;

圖2為本發(fā)明實(shí)施例所提供的在一次語音識(shí)別過程中,移動(dòng)終端與服務(wù)端之間建立的兩條http連接的效果示意圖;

圖3為本發(fā)明實(shí)施例所提供的一種數(shù)據(jù)內(nèi)容的結(jié)構(gòu)的示意圖;

圖4為本發(fā)明實(shí)施例所提供的另一種基于人工智能的語音識(shí)別方法的流程示意圖;

圖5為本發(fā)明實(shí)施例所提供的一種基于人工智能的語音識(shí)別裝置的結(jié)構(gòu)示意圖;

圖6為本發(fā)明實(shí)施例所提供的另一種基于人工智能的語音識(shí)別裝置的結(jié)構(gòu)示意圖;

圖7為本發(fā)明實(shí)施例所提供的又一種基于人工智能的語音識(shí)別裝置的結(jié)構(gòu)示意圖;

圖8為本發(fā)明實(shí)施例所提供的再一種基于人工智能的語音識(shí)別裝置的結(jié)構(gòu)示意圖;

圖9為本發(fā)明實(shí)施例所提供的一種服務(wù)端的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。

下面參考附圖描述本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別方法、裝置和系統(tǒng)。

圖1為本發(fā)明實(shí)施例所提供的一種基于人工智能的語音識(shí)別方法的流程示意圖。

隨著語音識(shí)別技術(shù)的成熟與發(fā)展,人們對(duì)語音識(shí)別的要求也越來越高。比如,需要一種語音識(shí)別方法能夠支持用戶在說話的同時(shí),服務(wù)端能夠?qū)崟r(shí)接收用戶的語音數(shù)據(jù),并且實(shí)時(shí)下發(fā)識(shí)別結(jié)果。

目前語音識(shí)別主要是通過多個(gè)http連接發(fā)送語音數(shù)據(jù)到語音服務(wù)端,語音服務(wù)端將語音數(shù)據(jù)重新整合后進(jìn)行識(shí)別。但是,現(xiàn)有的語音識(shí)別方法中,服務(wù)端需要將語音數(shù)據(jù)重新整合后識(shí)別,無法實(shí)現(xiàn)語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā)。

針對(duì)這一問題,本發(fā)明實(shí)施例提供了一種基于人工智能的語音識(shí)別方法,以實(shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā)。如圖1所示,該基于人工智能的語音識(shí)別方法,包括以下步驟:

s101,在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù)。

在本發(fā)明的一個(gè)實(shí)施例中,在語音識(shí)別的過程中,可用具有語音識(shí)別功能的移動(dòng)終端例如手機(jī)、平板電腦等,采集待識(shí)別的語音數(shù)據(jù)。例如,某用戶想通過手機(jī)上的瀏覽器搜索2017年有哪些熱門電影,這時(shí)用戶可打開手機(jī)上的百度瀏覽器,按住語音按鈕語音輸入“2017熱門電影”,以使手機(jī)采集待識(shí)別的語音數(shù)據(jù)。

s102,通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流。

其中,上行數(shù)據(jù)流包括語音數(shù)據(jù)。

在本發(fā)明的一個(gè)實(shí)施例中,移動(dòng)終端采集到待識(shí)別的語音數(shù)據(jù)后,可向服務(wù)端同時(shí)發(fā)送兩條http連接請(qǐng)求,以使移動(dòng)終端與服務(wù)端之間建立兩條連接,分別為上行連接和下行連接,以通過上行連接向服務(wù)端發(fā)送上行數(shù)據(jù)流,通過下行連接接收服務(wù)端發(fā)送的下行數(shù)據(jù)流。

為了區(qū)分同一個(gè)語音識(shí)別過程中的兩條連接,可通過連接的統(tǒng)一資源定位符(uniformresourcelocator,簡(jiǎn)稱url)中的up和down來進(jìn)行區(qū)分,連接的url中包含up的是上行連接,包含down的為下行連接。

為了保證兩條http連接請(qǐng)求是一次語音識(shí)別過程,可使上行連接的url與下行連接的url包含語音識(shí)別過程的會(huì)話標(biāo)識(shí),且會(huì)話標(biāo)識(shí)相同,使會(huì)話標(biāo)識(shí)與語音識(shí)別過程一一對(duì)應(yīng),以使服務(wù)端根據(jù)會(huì)話標(biāo)識(shí),確定上行連接與下行連接之間的對(duì)應(yīng)關(guān)系。

如圖3所示,在一次語音識(shí)別過程中,移動(dòng)終端與服務(wù)端建立了兩條http連接,兩條連接的url中會(huì)話標(biāo)識(shí)sn相同,值均為123。通過比較兩條連接的url可知,http://speech.baidu.com/up?sn=123中包含up,可知該url為上行連接的url,http://speech.baidu.com/down?sn=123中包含down,該url為下行連接的url。

在本發(fā)明的一個(gè)實(shí)施例中,上行連接與下行連接是基于http協(xié)議的,可以利用httpchunked協(xié)議實(shí)現(xiàn)數(shù)據(jù)的流式上傳,以及識(shí)別結(jié)果的流式下發(fā),從而實(shí)現(xiàn)移動(dòng)終端與服務(wù)端之間全雙工通信。

并且,該協(xié)議指示了上行數(shù)據(jù)流和下行數(shù)據(jù)流中數(shù)據(jù)內(nèi)容的結(jié)構(gòu),其中,數(shù)據(jù)內(nèi)容的結(jié)構(gòu)包括:數(shù)據(jù)類型、數(shù)據(jù)長(zhǎng)度和取值。數(shù)據(jù)結(jié)構(gòu)如圖3所示,tpye表示數(shù)據(jù)類型、length表示當(dāng)前數(shù)據(jù)長(zhǎng)度、value為數(shù)據(jù)內(nèi)容。其中,數(shù)據(jù)類型,用于指示數(shù)據(jù)內(nèi)容的數(shù)據(jù)處理方式。

本發(fā)明實(shí)施例中,由于數(shù)據(jù)類型可以是多種不同的類型,因此http協(xié)議指定的數(shù)據(jù)內(nèi)容的結(jié)構(gòu),可以方便的進(jìn)行數(shù)據(jù)擴(kuò)展。并且,通過該數(shù)據(jù)內(nèi)容的結(jié)構(gòu)和兩條http連接傳輸數(shù)據(jù)的方案,與現(xiàn)有的通過多個(gè)http連接傳輸數(shù)據(jù)的方案相比,精簡(jiǎn)了用戶流量,節(jié)省了語音識(shí)別過程中的網(wǎng)絡(luò)消耗。

移動(dòng)終端與服務(wù)端建立http連接后,可將語音數(shù)據(jù)按照上述數(shù)據(jù)內(nèi)容結(jié)構(gòu)進(jìn)行封裝后,通過與服務(wù)端的上行連接將包含語音數(shù)據(jù)的上行數(shù)據(jù)流發(fā)送至服務(wù)端。

需要說明的是,在語音識(shí)別過程中,移動(dòng)終端發(fā)送到服務(wù)端的數(shù)據(jù)除了語音數(shù)據(jù)外,也可能包含參數(shù)數(shù)據(jù)如移動(dòng)終端的標(biāo)識(shí)、型號(hào)等,以及應(yīng)用數(shù)據(jù)如第三方應(yīng)用數(shù)據(jù)等。因此,在向服務(wù)端發(fā)送上行數(shù)據(jù)流之前,可根據(jù)語音數(shù)據(jù)、參數(shù)數(shù)據(jù)和應(yīng)用數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)類型,進(jìn)行封裝,得到符合http協(xié)議的第一數(shù)據(jù)內(nèi)容,將第一數(shù)據(jù)內(nèi)容添加到上行數(shù)據(jù)流中,發(fā)送到服務(wù)端。

s103,在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流。

其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

在本發(fā)明的一個(gè)實(shí)施例中,移動(dòng)終端在向服務(wù)端發(fā)送包括語音數(shù)據(jù)的上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的包含語音識(shí)別結(jié)果的下行數(shù)據(jù)流。

移動(dòng)終端接收到下行數(shù)據(jù)流中的第二數(shù)據(jù)內(nèi)容后,查詢數(shù)據(jù)類型,根據(jù)數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式,對(duì)第二數(shù)據(jù)內(nèi)容進(jìn)行處理。例如,如果查詢到某數(shù)據(jù)內(nèi)容的數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式是語音識(shí)別結(jié)果數(shù)據(jù),可以將數(shù)據(jù)結(jié)果展示給用戶。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別方法,通過與服務(wù)端的上行連接向服務(wù)端發(fā)送包含待識(shí)別的語音數(shù)據(jù)的上行數(shù)據(jù)流,并行通過與服務(wù)端的下行連接接收包含語音識(shí)別的結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

上述實(shí)施例是從客戶端側(cè)描述的基于人工智能的語音識(shí)別方法,為了清楚說明上一實(shí)施例,下面結(jié)合圖4從服務(wù)端側(cè)描述本發(fā)明實(shí)施例提出的基于人工智能的語音識(shí)別方法。

如圖4所示,該基于人工智能的語音識(shí)別方法,包括以下步驟:

s401,通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流。

在本發(fā)明的一個(gè)實(shí)施例中,當(dāng)用戶使用客戶端提供的語音識(shí)別功能時(shí),服務(wù)端根據(jù)接收到的客戶端發(fā)送的建立兩條http連接的請(qǐng)求,與客戶端之間建立兩條連接,分別為上行連接和下行連接,關(guān)于上行連接和下行連接的解釋說明參見上述實(shí)施例,在此不再贅述。

在語音識(shí)別過程中,服務(wù)端可通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流中的第一內(nèi)容包括待識(shí)別的語音數(shù)據(jù),除了語音數(shù)據(jù)外還可包含參數(shù)數(shù)據(jù)、應(yīng)用數(shù)據(jù)等。

s402,對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù)。

在本發(fā)明的一個(gè)實(shí)施例中,服務(wù)端接收到客戶端發(fā)送的第一數(shù)據(jù)內(nèi)容后,對(duì)第一數(shù)據(jù)內(nèi)容查詢數(shù)據(jù)內(nèi)容的結(jié)構(gòu)中的數(shù)據(jù)類型。對(duì)于查詢出的數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式為語音識(shí)別的數(shù)據(jù),進(jìn)行語音識(shí)別,得到語音識(shí)別的結(jié)果數(shù)據(jù)。

在本發(fā)明的一個(gè)實(shí)施例中,如果查詢出數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式不為語音識(shí)別,例如參數(shù)數(shù)據(jù)、或者第三方應(yīng)用數(shù)據(jù)等等,對(duì)第一數(shù)據(jù)內(nèi)容進(jìn)行相應(yīng)的數(shù)據(jù)處理。例如,對(duì)于第一數(shù)據(jù)內(nèi)容中包含客戶端標(biāo)識(shí)的參數(shù)數(shù)據(jù),服務(wù)端根據(jù)參數(shù)數(shù)據(jù)可以確定發(fā)送待識(shí)別語音數(shù)據(jù)的客戶端的標(biāo)識(shí);如果是第三方應(yīng)用數(shù)據(jù),服務(wù)端可以根據(jù)語音識(shí)別結(jié)果和第三方應(yīng)用數(shù)據(jù)去第三方獲取相關(guān)的資源數(shù)據(jù)。舉例來說,用戶在客戶端語音輸入“今天的天氣如何”,服務(wù)端根據(jù)語音數(shù)據(jù)識(shí)別出用戶想查詢今天的天氣情況,這時(shí)服務(wù)端可根據(jù)語音識(shí)別結(jié)果和第一數(shù)據(jù)內(nèi)容中的第三方應(yīng)用數(shù)據(jù),向第三方天氣預(yù)報(bào)平臺(tái)獲取今天的天氣情況。

s403,在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流。

其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

在本發(fā)明的一個(gè)實(shí)施例中,由于會(huì)話標(biāo)識(shí)與語音識(shí)別過程一一對(duì)應(yīng),因此服務(wù)端在通過上行連接接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,可根據(jù)上行連接的url中包含的會(huì)話標(biāo)識(shí),查詢url中包含相同會(huì)話標(biāo)識(shí)的下行連接,并行通過查詢到的下行連接向客戶端發(fā)送下行數(shù)據(jù)流。具體而言,服務(wù)端可對(duì)第一數(shù)據(jù)內(nèi)容的數(shù)據(jù)處理得到的參數(shù)數(shù)據(jù)、結(jié)果數(shù)據(jù)和應(yīng)用數(shù)據(jù),查詢對(duì)應(yīng)的數(shù)據(jù)類型,進(jìn)行封裝,得到符合http協(xié)議的第二數(shù)據(jù)內(nèi)容,并將第二數(shù)據(jù)內(nèi)容添加到下行數(shù)據(jù)流中,通過下行連接發(fā)送至客戶端。

進(jìn)一步而言,如果第二數(shù)據(jù)內(nèi)容中含有第三方應(yīng)用數(shù)據(jù),在第三方資源數(shù)據(jù)較大的情況下,客戶端可根據(jù)第三方應(yīng)用數(shù)據(jù)與第三方服務(wù)進(jìn)行對(duì)接,兩者采用上述流式傳輸協(xié)議。第三方服務(wù)通過上述流式傳輸協(xié)議將資源數(shù)據(jù)傳輸至客戶端,可使客戶端更快地接收資源數(shù)據(jù)。對(duì)于資源數(shù)據(jù)較大的情況,客戶端可以在接收到部分?jǐn)?shù)據(jù)時(shí)即進(jìn)行相關(guān)的預(yù)處理或者加載操作,從而可以減少用戶的等待時(shí)間。

可見,本發(fā)明實(shí)施例提出的流式傳輸協(xié)議,在復(fù)雜的語音識(shí)別場(chǎng)景中,可以更好的對(duì)接第三方資源。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別方法,通過與客戶端的上行連接接收包含待識(shí)別語音數(shù)據(jù)的上行數(shù)據(jù)流,對(duì)待語音數(shù)據(jù)進(jìn)行語音識(shí)別,并行通過與客戶端的下行連接向客戶端發(fā)送包含語音識(shí)別結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種基于人工智能的語音識(shí)別裝置。

圖5為本發(fā)明實(shí)施例提供的一種基于人工智能的語音識(shí)別裝置的結(jié)構(gòu)示意圖。

如圖5所示,該基于人工智能的語音識(shí)別裝置包括:采集模塊510、發(fā)送模塊520、接收模塊530。

采集模塊510用于在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù)。

發(fā)送模塊520用于通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù)。

接收模塊530用于在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

基于上述實(shí)施例,本發(fā)明實(shí)施例還提供了一種基于人工智能的語音識(shí)別裝置的可能的實(shí)現(xiàn)方式。如圖6所示,該基于人工智能的語音識(shí)別裝置還可包括:封裝模塊540、處理模塊550。

封裝模塊540用于根據(jù)語音數(shù)據(jù)、參數(shù)數(shù)據(jù)和/或應(yīng)用數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)類型,進(jìn)行封裝,得到符合協(xié)議的第一數(shù)據(jù)內(nèi)容;將第一數(shù)據(jù)內(nèi)容添加到上行數(shù)據(jù)流中。

處理模塊550用于對(duì)下行數(shù)據(jù)流中的第二數(shù)據(jù)內(nèi)容,查詢數(shù)據(jù)類型;采用數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式,對(duì)第二數(shù)據(jù)內(nèi)容進(jìn)行數(shù)據(jù)處理。

在本發(fā)明的一個(gè)實(shí)施例中,上行連接的url與下行連接的url包含語音識(shí)別過程的會(huì)話標(biāo)識(shí),以使服務(wù)端根據(jù)會(huì)話標(biāo)識(shí),確定上行連接與下行連接之間的對(duì)應(yīng)關(guān)系。上行連接與下行連接基于http協(xié)議,協(xié)議指示了上行數(shù)據(jù)流和下行數(shù)據(jù)流中數(shù)據(jù)內(nèi)容的結(jié)構(gòu),數(shù)據(jù)內(nèi)容的結(jié)構(gòu)包括:數(shù)據(jù)類型、數(shù)據(jù)長(zhǎng)度和/或取值。其中,數(shù)據(jù)類型,用于指示數(shù)據(jù)內(nèi)容的數(shù)據(jù)處理方式。

需要說明的是,前述對(duì)基于人工智能的語音識(shí)別方法實(shí)施例的解釋說明也適用于該實(shí)施例的基于人工智能的語音識(shí)別裝置,此處不再贅述。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別裝置,通過與服務(wù)端的上行連接向服務(wù)端發(fā)送包含待識(shí)別的語音數(shù)據(jù)的上行數(shù)據(jù)流,并行通過與服務(wù)端的下行連接接收包含語音識(shí)別的結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

為達(dá)上述目的,本發(fā)明還提出了另一種基于人工智能的語音識(shí)別裝置。

如圖7所示,該基于人工智能的語音識(shí)別裝置包括:接收模塊710、處理模塊720、發(fā)送模塊730。

接收模塊710用于通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流。

處理模塊720用于對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù)。

處理模塊720還用于對(duì)上行數(shù)據(jù)流中的第一數(shù)據(jù)內(nèi)容,查詢數(shù)據(jù)類型;查詢出數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式為語音識(shí)別。

發(fā)送模塊730用于在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

基于上述實(shí)施例,本發(fā)明實(shí)施例還提供了一種基于人工智能的語音識(shí)別裝置的可能的實(shí)現(xiàn)方式,在上一實(shí)施例的基礎(chǔ)上,如圖8所示,該裝置還包括:封裝模塊740。

封裝模塊740用于若查詢出數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式不為語音識(shí)別,采用數(shù)據(jù)類型所指示的數(shù)據(jù)處理方式,對(duì)第一數(shù)據(jù)內(nèi)容進(jìn)行數(shù)據(jù)處理;根據(jù)數(shù)據(jù)處理得到的參數(shù)數(shù)據(jù)、語音數(shù)據(jù)和/或應(yīng)用數(shù)據(jù),查詢對(duì)應(yīng)的數(shù)據(jù)類型,進(jìn)行封裝,得到符合所述協(xié)議的第二數(shù)據(jù)內(nèi)容;將第二數(shù)據(jù)內(nèi)容添加到下行數(shù)據(jù)流中。

需要說明的是,前述對(duì)基于人工智能的語音識(shí)別方法實(shí)施例的解釋說明也適用于該實(shí)施例的基于人工智能的語音識(shí)別裝置,此處不再贅述。

本發(fā)明實(shí)施例的基于人工智能的語音識(shí)別裝置,通過與客戶端的上行連接接收包含待識(shí)別語音數(shù)據(jù)的上行數(shù)據(jù)流,對(duì)待語音數(shù)據(jù)進(jìn)行語音識(shí)別,并行通過與客戶端的下行連接向客戶端發(fā)送包含語音識(shí)別結(jié)果的下行數(shù)據(jù)流,通過兩條并行的數(shù)據(jù)流,以流式數(shù)據(jù)傳輸?shù)姆绞綄?shí)現(xiàn)待識(shí)別語音數(shù)據(jù)的實(shí)時(shí)上傳和語音識(shí)別結(jié)果的實(shí)時(shí)下發(fā),解決了現(xiàn)有技術(shù)中無法實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)上傳和實(shí)時(shí)下發(fā)的技術(shù)問題。

為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種客戶端,包括:處理器,以及用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器。

其中,處理器被配置為:在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù);在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是所述服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種服務(wù)端,包括:處理器,以及用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器。

其中,處理器被配置為:通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

為了清楚說明前述的服務(wù)端的具體結(jié)構(gòu),圖9示出了適于用來實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性服務(wù)端12的框圖。圖9顯示的服務(wù)端12僅僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來任何限制。

如圖9所示,服務(wù)端12以通用計(jì)算設(shè)備的形式表現(xiàn)。服務(wù)端12的組件可以包括但不限于:一個(gè)或者多個(gè)處理器或者處理單元16,系統(tǒng)存儲(chǔ)器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲(chǔ)器28和處理單元16)的總線18。

總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(industrystandardarchitecture,簡(jiǎn)稱isa)總線,微通道體系結(jié)構(gòu)(microchannelarchitecture,簡(jiǎn)稱mac)總線,增強(qiáng)型isa總線、視頻電子標(biāo)準(zhǔn)(vedioelectronicstandardassociation,簡(jiǎn)稱vesa)局域總線以及外圍組件互連(peripheralcomponentinterconnect,簡(jiǎn)稱pci)總線。

服務(wù)端12典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被服務(wù)端12訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動(dòng)的和不可移動(dòng)的介質(zhì)。

系統(tǒng)存儲(chǔ)器28可以包括易失性存儲(chǔ)器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(randomaccessmemory,簡(jiǎn)稱ram)30和/或高速緩存存儲(chǔ)器32。服務(wù)端12可以進(jìn)一步包括其它可移動(dòng)/不可移動(dòng)的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲(chǔ)介質(zhì)。僅作為舉例,存儲(chǔ)系統(tǒng)34可以用于讀寫不可移動(dòng)的、非易失性磁介質(zhì)(圖9未顯示,通常稱為“硬盤驅(qū)動(dòng)器”)。盡管圖9中未示出,可以提供用于對(duì)可移動(dòng)非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動(dòng)器,以及對(duì)可移動(dòng)非易失性光盤(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫的光盤驅(qū)動(dòng)器。在這些情況下,每個(gè)驅(qū)動(dòng)器可以通過一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線18相連。存儲(chǔ)器28可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實(shí)施例的功能。

具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具40,可以存儲(chǔ)在例如存儲(chǔ)器28中,這樣的程序模塊42包括但不限于操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實(shí)施例中的功能和/或方法。

服務(wù)端12也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤、指向設(shè)備、顯示器24等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該服務(wù)端12交互的設(shè)備通信,和/或與使得該服務(wù)端12能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口22進(jìn)行。并且,服務(wù)端12還可以通過網(wǎng)絡(luò)適配器20與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng),廣域網(wǎng)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器20通過總線18與服務(wù)端12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合服務(wù)端12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、獨(dú)立磁盤冗余陣列(redundantarrayofindependentdisks,簡(jiǎn)稱raid)系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。

處理單元16通過運(yùn)行存儲(chǔ)在系統(tǒng)存儲(chǔ)器28中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,實(shí)現(xiàn)上述基于人工智能的語音識(shí)別方法。

為達(dá)上述目的,本發(fā)明提出了一種基于人工智能的語音識(shí)別系統(tǒng),包括上述實(shí)施例的客戶端,以及服務(wù)端;客戶端和服務(wù)端之間通過上行連接和下行連接進(jìn)行通信。

為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)存儲(chǔ)介質(zhì)中的指令由客戶端處理器執(zhí)行時(shí),使得客戶端能夠執(zhí)行一種基于人工智能的語音識(shí)別方法,方法包括:在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù);在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出另一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)存儲(chǔ)介質(zhì)中的指令由服務(wù)端處理器執(zhí)行時(shí),使得服務(wù)端能夠執(zhí)行一種基于人工智能的語音識(shí)別方法,方法包括:通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)計(jì)算機(jī)程序產(chǎn)品中的指令由處理器執(zhí)行時(shí),執(zhí)行一種基于人工智能的語音識(shí)別方法,方法包括:在語音識(shí)別過程中,采集待識(shí)別的語音數(shù)據(jù);通過與服務(wù)端的上行連接,向服務(wù)端發(fā)送上行數(shù)據(jù)流,其中,上行數(shù)據(jù)流包括語音數(shù)據(jù);在向服務(wù)端發(fā)送上行數(shù)據(jù)流的過程中,并行通過與服務(wù)端的下行連接,接收服務(wù)端發(fā)送的下行數(shù)據(jù)流;其中,下行數(shù)據(jù)流,包括結(jié)果數(shù)據(jù),結(jié)果數(shù)據(jù)是服務(wù)端根據(jù)語音數(shù)據(jù)進(jìn)行語音識(shí)別得到的。

為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出另一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)計(jì)算機(jī)程序產(chǎn)品中的指令由處理器執(zhí)行時(shí),執(zhí)行一種基于人工智能的語音識(shí)別方法,方法包括:通過與客戶端的上行連接,接收客戶端發(fā)送的上行數(shù)據(jù)流;對(duì)上行數(shù)據(jù)流中的語音數(shù)據(jù)進(jìn)行語音識(shí)別,得到結(jié)果數(shù)據(jù);在接收客戶端發(fā)送的上行數(shù)據(jù)流的過程中,并行通過與客戶端的下行連接,向客戶端發(fā)送下行數(shù)據(jù)流,其中,下行數(shù)據(jù)流包括結(jié)果數(shù)據(jù)。

在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。

此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。

流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)定制邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。

在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲(chǔ)器(ram),只讀存儲(chǔ)器(rom),可擦除可編輯只讀存儲(chǔ)器(eprom或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤只讀存儲(chǔ)器(cdrom)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。

應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。如,如果用硬件來實(shí)現(xiàn)和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場(chǎng)可編程門陣列(fpga)等。

本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。

此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。

上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1