專利名稱:基于云計算的語音識別系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及終端語音采集裝置,具體涉及一種基于云計算的語音識別系統(tǒng)。
背景技術(shù):
語音識別技術(shù)近年來逐漸被普遍使用于各個領(lǐng)域。語音識別技術(shù)使得人們可以僅僅通過語音來操控電子設(shè)備。例如,可以通 過語音來進行電話呼叫和計算機操作。然而,傳統(tǒng)的語音識別技術(shù)都是采用本地語音識別軟件進行語音識別,因此要求終端必須具有較強的CPU和足夠大的存儲空間來存儲盡可能大的詞匯表。并且由于語音采集終端廠家技術(shù)的不斷更新,新的語音識別軟件迫使語音識別終端必須不停地升級自己的軟硬件,嚴重限制了語音識別應(yīng)用的發(fā)展。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種利用通信網(wǎng)絡(luò)采用云計算方式進行語音識別或采用本地語音識別器進行語音識別的語音識別系統(tǒng),使低性能的語音識別終端可以在不進行任何軟硬件升級的條件下具備高質(zhì)量的語音識別能力。為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為基于云計算的語音識別系統(tǒng),由語音識別終端、決策器、通信網(wǎng)絡(luò)、云計算端和本地語音識別器組成,其特征在于語音識別終端把采集到的語音片段進行模數(shù)轉(zhuǎn)換后,傳送到?jīng)Q策器進行決策,若決策值小于規(guī)定的閾值,決策器就通過通信網(wǎng)絡(luò)將語音數(shù)據(jù)上傳至云計算端進行語音識別,反饋結(jié)果至語音識別終端,若決策值大于規(guī)定的閾值,決策器就將語音數(shù)據(jù)傳送給本地語音識別器進行語音識別,反饋結(jié)果至語音識別終端。本發(fā)明相對于現(xiàn)有技術(shù),具有以下優(yōu)點和效果I)當(dāng)本地語音識別器識別質(zhì)量不能滿足要求時,可以通過云計算端的語音識別器進行高質(zhì)量的語音識別;2)由于語音識別并不完全依賴于本地語音識別器,就降低語音識別終端的性能要求,甚至使不具有本地語音識別功能的低端終端也能通過云計算端實現(xiàn)高質(zhì)量的語音識別功能;3)用戶只需在云計算端進行升級即可提高語音識別質(zhì)量和增加新的語音識別應(yīng)用,而不必進行其他任何升級,具有極大的靈活性。
圖I為本發(fā)明的系統(tǒng)結(jié)構(gòu)流程示意圖。
具體實施例方式以下結(jié)合具體實施例對本方案做進一步描述結(jié)合附圖,本方案所述的基于云計算的語音識別系統(tǒng),由語音識別終端、決策器、通信網(wǎng)絡(luò)、云計算端和本地語音識別器組成,語音識別終端把采集到的語音片段進行模數(shù)轉(zhuǎn)換后,傳送到?jīng)Q策器進行決策,若決策值小于規(guī)定的閾值,決策器就通過通信網(wǎng)絡(luò)將語音數(shù)據(jù)上傳至云計算端進行語音識別,反饋結(jié)果至語音識別終端;若決策值大于規(guī)定的閾值,決策器就將語音數(shù)據(jù)傳送給本地語音識別器進行語音識別,反饋結(jié)果至語音識別終端。本發(fā)明的工作流程是第一步,語音識別終端通過錄音功能對語音片段進行采集并模數(shù)轉(zhuǎn)化成語音數(shù)據(jù);第二步,語音識別終端將語音數(shù)據(jù) 傳送到?jīng)Q策器進行決策;第三步,決策器對語音數(shù)據(jù)進行決策,若決策值小于規(guī)定的閾值,則進行第四、五、六步;若決策值大于規(guī)定的閾值,則進行第七、八、九步;第四步,決策器通過通信網(wǎng)絡(luò)將語音數(shù)據(jù)上傳至云計算端服務(wù)器,服務(wù)器接收;第五步,云計算端服務(wù)器上的語音識別器對語音信號進行識別;第六步,反饋識別結(jié)果給語音識別終端應(yīng)用;第七步,決策器直接將語音數(shù)據(jù)傳送給本地語音識別器;第八步,本地語音識別器對語音信號進行識別;第九步,反饋識別結(jié)果給語音識別終端應(yīng)用。本發(fā)明,低成本,高性能,易擴展,廣泛應(yīng)用于基于云計算的語音識別系統(tǒng)領(lǐng)域。
權(quán)利要求
1.基于云計算的語音識別系統(tǒng),由語音識別終端、決策器、通信網(wǎng)絡(luò)、云計算端和本地語音識別器組成,其特征在于語音識別終端把采集到的語音片段進行模數(shù)轉(zhuǎn)換后,傳送到?jīng)Q策器進行決策,若決策值小于規(guī)定的閾值,決策器就通過通信網(wǎng)絡(luò)將語音數(shù)據(jù)上傳至云計算端進行語音識別,反饋結(jié)果至語音識別終端,若決策值大于規(guī)定的閾值,決策器就將語音數(shù)據(jù)傳送給本地語音識別器進行語音識別,反饋結(jié)果至語音識別終端。
全文摘要
本發(fā)明的目的在于,提供了一種基于云計算的語音識別系統(tǒng),由語音識別終端、決策器、通信網(wǎng)絡(luò)、云計算端和本地語音識別器組成,其特征在于語音識別終端把采集到的語音片段進行模數(shù)轉(zhuǎn)換后,傳送到?jīng)Q策器進行決策,若決策值小于規(guī)定的閾值,決策器就通過通信網(wǎng)絡(luò)將語音數(shù)據(jù)上傳至云計算端進行語音識別,反饋結(jié)果至語音識別終端,即可進行應(yīng)用;若決策值大于規(guī)定的閾值,決策器就將語音數(shù)據(jù)傳送給本地語音識別器進行語音識別,反饋結(jié)果至語音識別終端,即可進行應(yīng)用。本發(fā)明,低成本,高性能,易擴展,廣泛應(yīng)用于基于云計算的語音識別系統(tǒng)領(lǐng)域。
文檔編號G10L15/26GK102682770SQ20121004258
公開日2012年9月19日 申請日期2012年2月23日 優(yōu)先權(quán)日2012年2月23日
發(fā)明者曹玉清, 石廣海, 石輝, 裴文斌, 陳俊平 申請人:西安雷迪維護系統(tǒng)設(shè)備有限公司