專利名稱:用于發(fā)送短信的語音輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及本一種語音輸入方法,特別涉及一種用于發(fā)送短信的語音輸入方法。
背景技術(shù):
隨著行動通訊裝置的普遍使用,應(yīng)用在行動通訊裝置上的輸入方法也越來越重要。由于行動通訊裝置上一般均不會設(shè)置太多按鍵,在有限的按鍵上鍵入信息往往耗時費(fèi)力,通常需不斷的在屏幕選單中上下搜尋才能取得想要輸入的信息。且行動通訊裝置的按鍵大小通常都比較小,不符合人體工學(xué)上的設(shè)計(jì)需求,使用者按鍵久了會有手指痛等癥狀,因此語音輸入方法在行動通訊裝置上應(yīng)用成為必然的趨勢。另外,行動通訊裝置均設(shè)置有發(fā)送短信的功能,發(fā)送短信是時尚年輕人喜愛的聯(lián)絡(luò)方式之一,但是已有技術(shù)中的發(fā)送短信均需通過按鍵來完成,會造成上述不便。
如圖1所示,圖1為已有技術(shù)的一種語音輸入方法示意圖,其中至少包含語音接收模塊11、語音辨識模塊12以及語音數(shù)據(jù)庫13。語音接收模塊11接收外界語音信號14,該語音信號14一般為使用者的語音信號。接著語音辨識模塊12對語音信號14進(jìn)行分析,由于語音信號14通常為連續(xù)發(fā)音的文字,需要將連續(xù)發(fā)音的文字進(jìn)行辨識,語音辨識模塊12還可包含音節(jié)辨識器121。音節(jié)辨識器121用以將連續(xù)發(fā)音的語音信號14拆解成連續(xù)的單音信號。以中文普通話為例,單音信號大約為一千三百多種,包含平仄四聲等發(fā)音方式以及音調(diào)等等,但是對應(yīng)的中文文字卻有數(shù)十萬字,即使以常用中文字也有五萬余字。一個單音信號對應(yīng)多個中文文字,所以無法僅憑單獨(dú)的單音信號轉(zhuǎn)換成對應(yīng)的中文文字,但是有些慣用的規(guī)則,例如特定幾個單音信號的順序排列即代表某個特定的文字語詞等,利用紀(jì)錄上述慣用規(guī)則的語音數(shù)據(jù)庫13,可以取得單音信號組合對應(yīng)的句子15。最后將轉(zhuǎn)換得到的句子15連續(xù)輸出即完成語音輸入的方法。該方法可以將接收的語音信號14轉(zhuǎn)換為對應(yīng)的句子15后輸出。
如圖2所示,圖2為依據(jù)圖1所示的一種語音輸入方法流程圖,首先語音接收模塊接收語音信號S21,其次音節(jié)辨識器辨析語音信號成單音信號S22,再次語音辨識模塊以及語音數(shù)據(jù)庫辨析單音信號組合得到句子S23,最后輸出句子到對應(yīng)的接收裝置S24。
上述的語音輸入方法具有免動手輸入的方便性,且使用者只需會說話發(fā)聲即可使用該語音輸入方法。但是由于各地方使用者口音不盡相同,往往使得語音辨識模塊在辨識語音信號時造成誤判,反而讓使用者在修改誤判時花費(fèi)更多精力,造成極度不便。又由于單音信號組合對應(yīng)文字詞語的數(shù)據(jù)量非常龐大,且實(shí)時處理前述的對應(yīng)關(guān)系需要使用高速處理單元進(jìn)行處理,因此已有技術(shù)中的該語音輸入方法大多局限于計(jì)算機(jī)等具有龐大儲存媒體以及脈沖較高、信號較強(qiáng)的中央處理器的工具可以使用,而一般行動通訊裝置由于內(nèi)部儲存媒體較少,且中央處理單元執(zhí)行效率也較慢,這些因素使得較難實(shí)施上述語音輸入方法。尤其在行動通訊裝置發(fā)送短信這項(xiàng)功能上,如果要以上述的語音輸入方法進(jìn)行短信發(fā)送,則勢必要建立龐大的語音數(shù)據(jù)庫,這樣會減慢行動通訊裝置的執(zhí)行效率,以及增加開機(jī)時間等等,反而無法達(dá)到預(yù)期的效果。
筆劃輸入法為目前一般行動通訊裝置都具有的一種輸入方法,其實(shí)施方式是將一個字拆解成多個筆劃單元的排列,而筆劃單元的總數(shù)一般為六個,可由行動通訊裝置上的按鍵鍵入該筆劃單元,而取得對應(yīng)的文字。以中文文字為例,其中多個筆劃單元可為“橫”、“豎”、“撇”、“捺”、“折”及“勾”,所對應(yīng)的文字結(jié)構(gòu)單元為“一”、“丨”、“丿”、“乀”、“乛”及“亅”,可以由該些筆劃單元的順序組合而得對應(yīng)的文字。以文字“王”為例,其拆解的文字結(jié)構(gòu)單元順序組合為“一一丨一”,當(dāng)使用者依序輸入“橫”、“橫”、“豎”、“橫”的筆劃單元組合時,即可輸入文字“王”的信息。
如圖3所示,圖3為已有技術(shù)的一種筆劃輸入法的示意圖,其中至少包含輸入模塊31、處理單元32以及數(shù)據(jù)庫33。輸入模塊31可為鍵盤或?yàn)榘存I,用以接收使用者鍵入的輸入信號34并將該輸入信號轉(zhuǎn)換成對應(yīng)的筆劃單元后,傳送至處理單元32。當(dāng)處理單元32接收到多個筆劃單元后,通過數(shù)據(jù)庫33比較該多個筆劃單元順序組合對應(yīng)的文字35,若有符合的文字35,則輸出該文字35。其中數(shù)據(jù)庫33含有該多個筆劃單元對應(yīng)該文字的對照表。以中文文字為例,中文常用字有數(shù)萬字,當(dāng)使用者鍵入的筆劃單元個數(shù)不足以順序組合出對應(yīng)的特定文字時,此筆劃輸入法可提供多個候選字供使用者選擇,其中該多個候選字對應(yīng)的筆劃單元順序組合均可滿足使用者輸入的筆劃單元。
如圖4所示,圖4為圖3的一種用于發(fā)送短信的筆劃輸入法的流程圖。首先使用者利用輸入裝置鍵入筆劃單元S41,接著利用數(shù)據(jù)庫根據(jù)使用者輸入筆劃單元順序組合篩選可能的候選字S42,其中候選字對應(yīng)的筆劃單元順序組合均可滿足使用者輸入的筆劃單元,由于顯示屏幕可能放不下所有的候選字,使用者可以卷動窗口尋找正確的候選字,以決定候選字是否正確S43?若是,則確認(rèn)文字S44即為該候選字,并輸出,若否,則使用者繼續(xù)鍵入筆劃單元S41,以縮小篩選可能的候選字S42的范圍讓使用者確認(rèn)。接著,系統(tǒng)會詢問是否輸入完畢S45?若否,則使用者則繼續(xù)鍵入筆劃單元S41,以繼續(xù)輸入文字作為短信的組合,若是,則可進(jìn)行設(shè)定收件人S46,接著發(fā)送短信S47。
上述已有技術(shù)用于發(fā)送短信的筆劃輸入法的特點(diǎn)在于其數(shù)據(jù)庫很小,不需要很大的儲存媒體即可實(shí)施此筆劃輸入法,又由于中文文字結(jié)構(gòu)的特殊性,將中文文字拆解成筆劃單元的順序組合非常容易讓使用者使用,該種筆劃輸入法特別適用于中文文字的輸入,但不僅限于中文文字的輸入。另外,由于此筆劃輸入法在輸入每一個文字時,均需要使用者確認(rèn),如此可以大幅降低誤判等錯誤情事的發(fā)生。盡管筆劃輸入法具有上述的種種特點(diǎn),但是仍需要使用鍵盤或按鍵鍵入相關(guān)信息,造成非常不便,尤其對于行動通訊裝置而言,其設(shè)置的按鍵大小通常都比較小,不符合人體工學(xué)上的設(shè)計(jì)需求,使用者按鍵久了甚至?xí)惺种竿吹劝Y狀。另外,有些年老的使用者視力并不是很好,要看清楚較小的按鍵是件吃力的事情,使上述用于發(fā)送短信的筆劃輸入法無用武之地。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種用于發(fā)送短信的語音輸入方法,該方法可以不需要龐大的儲存媒體,誤判率較低,辨識速度較快。
為解決上述技術(shù)問題,本發(fā)明一種用于發(fā)送短信的語音輸入方法,首先,語音接收模塊接收預(yù)設(shè)語音信號,其中該預(yù)設(shè)語音信號可為使用端預(yù)先設(shè)定的語音信號,使用端可為使用者。其次,語音辨識模塊辨識上述預(yù)設(shè)語音信號并取得該預(yù)設(shè)語音信號對應(yīng)的多個筆劃單元,其中該筆劃單元可對應(yīng)于文字結(jié)構(gòu)單元,藉由多個筆劃單元的順序組合可對應(yīng)特定文字。第三步,在紀(jì)錄前述對應(yīng)關(guān)系的數(shù)據(jù)庫中取得該多個筆劃單元對應(yīng)的文字作為短信的組合。最后,發(fā)送短信。
本發(fā)明提供的一種于行動通訊裝置中發(fā)送短信的語音輸入方法,使用者無需按鍵即可發(fā)送短信,可以讓使用者發(fā)送短信更加方便;且由于該預(yù)設(shè)語音信號為使用者預(yù)先輸入,可配合使用者口音而使辨識率提高;本發(fā)明不需要龐大的儲存媒體存放語音數(shù)據(jù)庫,非常適合在行動通訊裝置上使用。
下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步描述圖1為已有技術(shù)的一種語音輸入方法的功能模塊示意圖;圖2為對應(yīng)于圖1的一種語音輸入方法流程圖;圖3為已有技術(shù)的一種筆劃輸入法的功能模塊示意圖;圖4為對應(yīng)于圖3的一種用于發(fā)送短信的筆劃輸入法的流程圖;
圖5為本發(fā)明用于發(fā)送短信的語音輸入方法功能模塊示意圖;圖6為本發(fā)明用于發(fā)送短信的語音輸入方法流程圖;圖7為本發(fā)明中預(yù)先設(shè)定預(yù)設(shè)語音信號的流程圖;圖8為依據(jù)本發(fā)明的用于發(fā)送短信的語音輸入方法的操作流程示意圖;圖9為延續(xù)圖8的用于發(fā)送短信的語音輸入方法的操作流程示意圖。
其中11為語音接收模塊;12為語音辨識模塊;121為音節(jié)辨識器;13為語音數(shù)據(jù)庫;14為語音信號;15為句子;31為輸入模塊;32為處理單元;33為數(shù)據(jù)庫;34為輸入信號;35為文字;51為語音接收模塊;52為語音辨識模塊;53為預(yù)設(shè)語音信號;54為文字;S21-S24、S41-S47、S61-S69、S71-S74為流程步驟;S81-S89為屏幕畫面。
具體實(shí)施例方式
本發(fā)明提出一種用于發(fā)送短信的語音輸入方法,適用于在行動通訊裝置中發(fā)送短信,先將使用者輸入的預(yù)設(shè)語音信號轉(zhuǎn)換為對應(yīng)的筆劃單元,利用數(shù)據(jù)庫搜尋出該筆劃單元順序組合對應(yīng)的文字作為該短信的組合,在發(fā)送短信。
如圖5所示,圖5為本發(fā)明用于發(fā)送短信的語音輸入方法功能模塊示意圖。其中至少包含語音接收模塊51、語音辨識模塊52、處理單元32以及數(shù)據(jù)庫33。首先,語音接收模塊51接收預(yù)設(shè)語音信號53,該預(yù)設(shè)語音信號53可為使用端預(yù)先設(shè)定的語音信號,其中使用端可為使用者。其次,語音辨識模塊52對預(yù)設(shè)語音信號53進(jìn)行分析。由于預(yù)設(shè)語音信號53為使用者預(yù)先輸入,所以可以依據(jù)先前紀(jì)錄使用者的口音語調(diào)而能迅速準(zhǔn)確地將預(yù)設(shè)語音信號53轉(zhuǎn)換為對應(yīng)的多個筆劃單元。其中該筆劃單元可對應(yīng)于文字結(jié)構(gòu)單元,由多個筆劃單元的順序組合可對應(yīng)于特定文字。以中文文字為實(shí)施例,其中多個筆劃單元可為“橫”、“豎”、“撇”、“捺”、“折”及“勾”,其所對應(yīng)的文字結(jié)構(gòu)單元為“一”、“丨”、“丿”、“乀”、“乛”及“亅”,可以由該些筆劃單元的順序組合而得對應(yīng)的文字。以文字“王”為例,其拆解的文字結(jié)構(gòu)單元順序組合為“一一丨一”,當(dāng)依序輸入“橫”、“橫”、“豎”、“橫”的筆劃單元組合時,即可輸入文字“王”的信息。由于筆劃單元的數(shù)量不多,對應(yīng)的預(yù)設(shè)語音信號也就不多,也因此不需要很龐大的儲存媒體存放預(yù)設(shè)語音信號轉(zhuǎn)換筆劃單元的語音數(shù)據(jù)庫。再次,處理單元32接收到多個筆劃單元,通過數(shù)據(jù)庫比較該多個筆劃單元順序組合對應(yīng)的文字54,若有符合的文字54,則輸出該文字54。在此實(shí)施例中,該數(shù)據(jù)庫33含該多個筆劃單元對應(yīng)該文字的對照表。最后,將該文字作為短信的組合,并發(fā)送該短信。又以中文文字為例,其常用字有數(shù)萬字,當(dāng)使用者鍵入的筆劃單元個數(shù)不足以順序組合出對應(yīng)的特定文字時,筆劃輸入法可提供多個候選字供使用者選擇,其中該多個候選字對應(yīng)的筆劃單元順序組合均可滿足使用者輸入的筆劃單元。
如圖6所示,圖6為本發(fā)明用于發(fā)送短信的語音輸入方法流程圖。首先,啟動短信功能S61;第二步,語音接收模塊接收預(yù)設(shè)語音信號S62。其中該預(yù)設(shè)語音信號為使用者發(fā)出;第三步,語音辨識模塊分析該預(yù)設(shè)語音信號并取得對應(yīng)的筆劃單元S63;第四步,通過數(shù)據(jù)庫依據(jù)筆劃單元順序組合可能的候選字S64;第五步,使用者可以在屏幕顯示表中尋找正確的候選字,以決定候選字是否正確S65?若是,則進(jìn)行第六步確認(rèn)文字S66;即為該候選字并輸出,若否,則回到第二步語音接收模塊接收預(yù)設(shè)語音信號S62;語音辨識模塊分析該預(yù)設(shè)語音信號并取得對應(yīng)的筆劃單元S63;縮小篩選可能的候選字范圍S64,決定候選字是否正確S65,直到第六步使用者確認(rèn)文字S66;第七步,系統(tǒng)會詢問是否輸入完畢S67;若否,則回到第二步使用者輸入預(yù)設(shè)語音信號使語音接收模塊繼續(xù)接收預(yù)設(shè)語音信號S62,以繼續(xù)輸入文字作為短信的組合;若是,則進(jìn)行第八步繼續(xù)利用語音輸入設(shè)定收件人S68;第九步,發(fā)送短信S69。
如圖7所示,圖7為本發(fā)明中預(yù)先設(shè)定預(yù)設(shè)語音信號的流程圖。第一步,使用者輸入預(yù)設(shè)語音信號S71;其中預(yù)設(shè)語音信號對應(yīng)筆劃單元。以筆劃單元“橫”為例,預(yù)設(shè)語音信號為使用者說出“橫”的讀音,第二步,使用者確認(rèn)預(yù)設(shè)語音信號對應(yīng)的筆劃單元S72;第三步,儲存設(shè)定S73;由于可設(shè)定不止一個預(yù)設(shè)語音信號,因此,第四步,行動通訊裝置接著會詢問使用者是否設(shè)定完成S74。若否,則回到第一步,使用者再次輸入預(yù)設(shè)語音信號S71;若是,則完成預(yù)先設(shè)定筆劃單元對應(yīng)的預(yù)設(shè)語音信號。
如圖8所示,圖8為依據(jù)本發(fā)明的用于發(fā)送短信的語音輸入方法的操作流程示意圖,針對行動通訊裝置屏幕的畫面說明本發(fā)明的語音輸入方法的操作流程。首先如S81所示,進(jìn)入語音輸入功能選單,系統(tǒng)會顯示要求使用者輸入內(nèi)容。以使用者欲輸入文字“王”為例,使用者發(fā)出語音信號,該語音信號為“橫”的讀音,用以表示“橫”的筆劃單元,即為“一”的文字結(jié)構(gòu)單元。當(dāng)使用者輸入后,如S82所示,系統(tǒng)屏幕會顯示“一”的文字結(jié)構(gòu)單元,并根據(jù)該對應(yīng)的筆劃單元順序組合搜尋出可能的候選字,并顯示在屏幕上。由于屏幕容量有限無法顯示所有的候選字,所以系統(tǒng)會自動挑出較常用的顯示在屏幕上,如“一二三大天木”,由于文字“王”并不在屏幕顯示上,使用者必須要繼續(xù)輸入語音信號。接著,使用者又輸入“橫”的讀音的語音信號,如S83所示,系統(tǒng)屏幕會顯示“一一”的文字結(jié)構(gòu)單元,并根據(jù)該對應(yīng)的筆劃單元順序組合搜尋出可能的候選字,并顯示在屏幕上,由于S83與S82的筆劃單元順序組合不同,故對應(yīng)的候選字也會不同,如“二三天青表次”。繼續(xù)如S84所示,使用者繼續(xù)輸入“豎”以及“橫”的語音信號,而系統(tǒng)屏幕顯示對應(yīng)“一一丨一”的文字結(jié)構(gòu)單元,并根據(jù)該對應(yīng)的筆劃單元順序組合搜尋出可能的候選字,并顯示在屏幕上,由于文字“王”已經(jīng)顯示在屏幕的候選字中,使用者可用語音輸入確認(rèn),系統(tǒng)自動彈出數(shù)字標(biāo)號,如S85所示。最后如S86所示,由于文字“王”對應(yīng)于1的數(shù)字標(biāo)號,所以使用者可直接語音輸入『1』的讀音,以選取該對應(yīng)的文字。
如圖9所示,圖9為延續(xù)圖8的用于發(fā)送短信的語音輸入方法的操作流程示意圖。當(dāng)使用者輸入完短信文字后,可以語音輸入“發(fā)送短信”的讀音,系統(tǒng)跳出設(shè)定收件者的畫面,在本實(shí)施例中,則為輸入收件者電話號碼,如S87所示,接著如S88所示,使用者可直接語音輸入“0937123456”的讀音以輸入電話號碼,最后確認(rèn)發(fā)送短信,則如S89所示,屏幕顯示發(fā)送短信中的相關(guān)內(nèi)容。
本發(fā)明提供的一種用于發(fā)送短信的語音輸入方法,先將使用者輸入的預(yù)設(shè)語音信號轉(zhuǎn)換為對應(yīng)的筆劃單元,利用數(shù)據(jù)庫搜尋出該筆劃單元順序組合對應(yīng)的文字作為該短信的組合,不需要龐大的儲存媒體以存放語音數(shù)據(jù)庫,使得非常適合于行動通訊裝置上使用。
權(quán)利要求
1.一種用于發(fā)送短信的語音輸入方法,其特征在于,包含以下步驟第一步,語音接收模塊接收預(yù)設(shè)語音信號;第二步,語音辨識模塊辨識上述預(yù)設(shè)語音信號并獲取該語音信號對應(yīng)的多個筆劃單元;第三步,數(shù)據(jù)庫中調(diào)用上述多個筆劃單元對應(yīng)的文字作為該短信的組合。
2.如權(quán)利要求1所述的一種用于發(fā)送短信的語音輸入方法,其特征在于,所述的預(yù)設(shè)語音信號為外部語音信號。
3.如權(quán)利要求1所述的一種用于發(fā)送短信的語音輸入方法,其特征在于,所述的多個筆劃單元包括“橫”、“豎”、“撇”、“捺”、“折”及“勾”。
4.如權(quán)利要求1所述的一種用于發(fā)送短信的語音輸入方法,其特征在于,所述的數(shù)據(jù)庫含有所述的多個筆畫單元及對應(yīng)文字的對照表。
5.如權(quán)利要求1所述的一種用于發(fā)送短信的語音輸入方法,其特征在于,數(shù)據(jù)庫中包含利用所述的多個筆劃單元的各種排列方式排列所對應(yīng)的文字。
6.如權(quán)利要求1所述的一種用于發(fā)送短信的語音輸入方法,其特征在于,所述的文字為中文文字。
全文摘要
本發(fā)明公開了一種用于發(fā)送短信的語音輸入方法。首先利用語音接收模塊接收預(yù)設(shè)語音信號,其中該預(yù)設(shè)語音信號可為使用端預(yù)先設(shè)定的語音信號。接著利用語音辨識模塊取得該預(yù)設(shè)語音信號對應(yīng)的多個筆劃單元,其中多個筆劃單元的順序組合可對應(yīng)特定文字。最后利用記錄前述對應(yīng)關(guān)系的數(shù)據(jù)庫取得該多個筆劃單元對應(yīng)的文字作為短信的組合,并發(fā)送該短信。本發(fā)明采用語音筆畫輸入方式,不占用大的存儲空間,適合移動通訊各種設(shè)備。
文檔編號H04M1/27GK1873776SQ200510026359
公開日2006年12月6日 申請日期2005年6月1日 優(yōu)先權(quán)日2005年6月1日
發(fā)明者朱元博, 蔡世光, 何代水 申請人:英華達(dá)(上海)電子有限公司