專利名稱:電話號碼檢索系統(tǒng)和方法
背景技術(shù):
1.發(fā)明領(lǐng)域本發(fā)明涉及顯示和存儲電話號碼。尤其是,本發(fā)明涉及用于從電話號碼服務(wù)中顯示和存儲電話號碼的電話號碼檢索系統(tǒng)。
2.相關(guān)領(lǐng)域的描述如果用戶不知道電話號碼,則用戶就會請求用于輔助服務(wù)的電話號碼服務(wù)。電話號碼服務(wù)的操作者接收來自用戶,例如商店或者百貨公司的電話號碼請求。執(zhí)行電話號碼搜索。電話號碼服務(wù)經(jīng)由自動響應(yīng)服務(wù)(ARS)提供電話號碼給用戶。用戶寫下或者存儲例如由ARS的機械聲音提供的電話號碼。用戶例如經(jīng)由自動鏈接功能請求電話號碼,自動鏈接功能基于用戶的命令撥電話號碼。
如果例如由于噪聲,用戶不能理解ARS的機械聲音,則用戶需要再次聯(lián)絡(luò)電話號碼服務(wù)。這種不方便導(dǎo)致時間損失,并且可以導(dǎo)致支付一個或多個額外的費用去接入電話號碼服務(wù)。如果用戶不想使用自動鏈接服務(wù),則用戶被要求記錄電話號碼。忘記或者丟失電話號碼的用戶必須再次使用電話號碼服務(wù),這就導(dǎo)致用戶時間和錢財?shù)膿p失。
圖1和2舉例說明現(xiàn)有技術(shù)電話號碼服務(wù)的例子,其自動地?fù)苡捎脩粽埱蟮碾娫捥柎a。在一個現(xiàn)有技術(shù)的例子中,常規(guī)的神經(jīng)網(wǎng)絡(luò)算法接收并學(xué)習(xí)ARS的機械聲音。常規(guī)的神經(jīng)網(wǎng)絡(luò)算法難以從ARS的機械聲音中辨別話務(wù)員的語音。常規(guī)的電話號碼服務(wù)使用機械聲音識別算法,諸如隱藏的馬爾可夫模型(HMM)或者神經(jīng)電路,其取決于說話者的語音。使用隱藏的馬爾可夫模型(HMM)或者神經(jīng)電路網(wǎng)絡(luò)預(yù)置的ARS機械聲音提供低的效率,而且不具有準(zhǔn)確地確定電話號碼的性能。
孤立字識別算法難以從目標(biāo)電話號碼和/或其它的信息中辨別由ARS說出的字。如果語音類型或者自動響應(yīng)類型被改變,則常規(guī)的語音識別算法不能有效地適合于這些變化,以準(zhǔn)確地接收想要的電話號碼。
因此,存在對電話號碼檢索系統(tǒng)的需要,其對現(xiàn)有技術(shù)系統(tǒng)提供改進,諸如甚至改進在嘈雜的環(huán)境條件之下電話號碼的識別,以及提供其它的優(yōu)點,諸如如果用戶希望在以后的時間里打電話,則具有一個存儲電話號碼的能力。
發(fā)明概述本發(fā)明是一種電話號碼檢索系統(tǒng)。在此處公開的電話號碼檢索系統(tǒng)從電話號碼服務(wù)中顯示和/或存儲電話號碼。該系統(tǒng)提供了一種對與常規(guī)的電話號碼檢索系統(tǒng)有關(guān)的問題的解決方案,諸如在嘈雜的條件之下識別電話號碼,當(dāng)響應(yīng)一個響應(yīng)系統(tǒng)或者語音類型的變化時更新性能,以及在用戶希望打電話之前存儲電話號碼。
按照一個實施例,電話號碼檢索系統(tǒng)與諸如自動響應(yīng)服務(wù)(ARS)這樣的電話號碼服務(wù)相聯(lián)系。自動響應(yīng)服務(wù)例如使用參考矢量序列。參考矢量序列從自動響應(yīng)服務(wù)中指定一種格式,其中指定的字或者字句被加在電話號碼的數(shù)字之前和之后。指定的字是由關(guān)鍵字定點程序識別的。連接指定的字的數(shù)字被抽取和處理,以生成一個已識別的電話號碼。
在一個實施例中,連接在指定的字之間的語音信號被存儲在緩存器中。緩存器的內(nèi)容驅(qū)動號碼識別器。號碼識別器處理內(nèi)容,并且輸出一個電話號碼服務(wù)的已識別的電話號碼。已識別的電話號碼被顯示在終端上,和/或存儲在諸如緩存器的這樣的存儲器中。
在另一個實施例中,動態(tài)時間偏離(DTW)被用作號碼識別器。DTW利用數(shù)字序列(諸如,從0到9)生成一個特征向量序列。該特征向量序列定義一個用于確定習(xí)慣于生成電話號碼的號碼位置的矢量參考模式。按照系統(tǒng)的一個供選擇的實施例,特征向量序列被預(yù)先定義。在該系統(tǒng)的又一個實施例中,特征向量序列是使用Mel頻率Cepstral系數(shù)(MFCC),線性的預(yù)測Cepstral系數(shù)(LPCC)或者感性的線性預(yù)測(PLP)生成的。在該系統(tǒng)的又一個供選擇的實施例中,特征向量適合于電話號碼服務(wù)的特定的格式。
在另一個實施例中,當(dāng)ARS在語音類型或者響應(yīng)類型方面具有變化時,除了DTW之外,隱藏的馬爾可夫模型(HMM),矢量量化(VQ),或者神經(jīng)網(wǎng)絡(luò)(NN)可以用于識別連接字,一個用于特征向量的適宜的參考模式被重新下載并存儲。
本發(fā)明的附加的特點和優(yōu)點將在隨后的描述中闡述,并且該描述在某種程度上是清晰可見的,或者可以通過實踐本發(fā)明來得到。應(yīng)當(dāng)明白,上文的概述和下面的本發(fā)明的詳細說明是示范性和說明性的,并且作為權(quán)利要求意欲對發(fā)明提供進一步的說明。
對于那些本領(lǐng)域技術(shù)人員來說,從下列與附圖有關(guān)的實施例的詳細說明中,這些和其它的實施例也將變得更加顯而易見的,本發(fā)明不局限于公開的任何特定的實施例。
附圖的簡要說明附圖被包括以提供對本發(fā)明進一步的理解,并且被結(jié)合進而構(gòu)成本說明書的一部分,其舉例說明本發(fā)明的實施例,并且與說明書一起可以起解釋本發(fā)明原理的作用。
在不同的附圖中,按照一個或多個實施例由相同的數(shù)字提及的本發(fā)明的特點,單元和方面,表示相同的,等效的或者類似的特點,單元或者方面。
圖1是一個舉例說明用于通過神經(jīng)網(wǎng)絡(luò)算法來搜索和自動地?fù)茈娫捥柎a的現(xiàn)有技術(shù)常規(guī)的裝置的結(jié)構(gòu)圖。
圖2是一個舉例說明現(xiàn)有技術(shù)常規(guī)的用于通過與說話者相關(guān)的孤立字識別算法來識別和自動地?fù)茈娫捥柎a的順序步驟的流程圖。
圖3是一個舉例說明按照發(fā)明實施例的用于顯示和存儲自動響應(yīng)電話號碼的方法的流程圖。
圖4是一個舉例說明按照本發(fā)明實施例的用于顯示和存儲自動響應(yīng)電話號碼的方法的順序步驟的流程圖。
圖5是舉例說明按照本發(fā)明一個實施例的移動通信設(shè)備的方框圖。
圖6是舉例說明按照本發(fā)明一個實施例的UTRAN的方框圖。
優(yōu)選實施例的詳細說明本發(fā)明涉及顯示和存儲來自電話服務(wù)的電話號碼。尤其是,本發(fā)明是用于在移動終端上顯示和存儲來自語音或者其它的響應(yīng)系統(tǒng),諸如自動響應(yīng)系統(tǒng)(ARS)的自動響應(yīng)電話號碼的電話號碼檢索系統(tǒng)和方法。自動響應(yīng)電話號碼被顯示在終端上,供用戶實際上同時使用,和/或存儲在終端的電話簿中稍后供用戶使用。這個存儲特點允許用戶有選擇地打電話。
電話號碼檢索系統(tǒng)對與常規(guī)的響應(yīng)系統(tǒng)有關(guān)的問題提供一種解決方案,諸如通過提供指定的序列在嘈雜的條件之下識別電話號碼。當(dāng)語音類型或者響應(yīng)改變時,通過下載一個電話號碼服務(wù)的向量序列,電話號碼檢索系統(tǒng)提供更新性能和通用性。電話號碼檢索系統(tǒng)具有在用戶希望打電話以前,用于存儲電話號碼的存儲器存儲容量。
雖然電話號碼檢索系統(tǒng)是相對于一個終端舉例說明的,但期待本發(fā)明可以在任何的通信設(shè)備中應(yīng)用于顯示和存儲來自響應(yīng)系統(tǒng)的電話號碼。在下面的詳細描述中,公知的功能或者結(jié)構(gòu)不做詳細描述,因為不必要的細節(jié)將使本發(fā)明難以理解。
用戶接入一個希望從電話號碼服務(wù)來得到電話號碼的移動終端,該電話號碼服務(wù)具有諸如自動響應(yīng)系統(tǒng)(ARS)這樣的響應(yīng)系統(tǒng)。移動終端可以是任何的移動通信設(shè)備,諸如蜂窩移動電話,移動電話,PDA等等。在一個供選擇的檢索系統(tǒng)的實施例中,終端可以是一個基站終端。
在生產(chǎn)終端期間,參考特征向量序列被預(yù)先準(zhǔn)備和存儲在存儲器中。指定的字被預(yù)先存儲在終端的存儲器中,其是包括電話號碼的自動響應(yīng)的一部分的字。參考特征向量表示將要傳送給用戶的電話號碼的格式。
用戶從終端使用常規(guī)的信息數(shù)字請求常規(guī)的電話服務(wù)以獲得一個電話號碼。電話號碼服務(wù)從ARS以形式化了的格式提供一個電話號碼給用戶。該格式可以是諸如“號碼是xxx-xxxx。號碼是xxx-xxxx。如果你想要你的呼叫直接連接,則請按號碼1。你將為你的請求成功付費100”。X表示例如從0到9的數(shù)字。
在一個例子中,由用戶請求的使用者是234-5678。ARS經(jīng)由移動終端揚聲器提供一個機械聲音給用戶,諸如“號碼是234-5678。號碼是234-5678。如果你想要你的呼叫直接連接,則請按號碼1。你將為你的請求成功付費100”。
號碼檢索系統(tǒng)作為接收的音頻響應(yīng),諸如機械聲音來接收電話號碼。接收的音頻響應(yīng)是通過號碼檢索系統(tǒng)對于指定的關(guān)鍵字搜索的,例如只有要接入的電話號碼服務(wù)才有的。搜索是通過一個關(guān)鍵字定點程序?qū)τ谠谥付ǖ年P(guān)鍵字之間或者在指定的關(guān)鍵字之中的連接字執(zhí)行的。關(guān)鍵字定點程序從順序的關(guān)鍵字中抽取有意義的關(guān)鍵字,示出類似電話號碼服務(wù)的ARS的有關(guān)相同的揚聲器的相同的語音近似完整的精度。因此,對應(yīng)于號碼的音頻數(shù)據(jù)可以近似完整的精確度從ARS的語音中分離出來。
參考圖3,表示大量電話號碼的連接字被存儲在緩存器中(S10)。號碼識別器處理在緩存器中的內(nèi)容(S20),以識別電話號碼。已識別的電話號碼被顯示在諸如LCD這樣的顯示器上,或者存儲在存儲器中(S30)。
如果ARS的響應(yīng)類型被改變,則更新電話檢索系統(tǒng)的內(nèi)容是為準(zhǔn)確地識別電話號碼所必需的。例如,如果電話號碼服務(wù)(諸如ARS)的語音類型或者響應(yīng)類型被改變,則終端的軟件必須升級。更新可以通過經(jīng)由有線和/或無線因特網(wǎng)接入連接,從因特網(wǎng)下載參考模式、特征向量序列或者參數(shù)文件來發(fā)生。在一個實施例中,電話號碼服務(wù)具有一種格式變化,并且服務(wù)提供者通知用戶如何去下載已改變的內(nèi)容,并且以商業(yè)模式的形式收費。
電話檢索系統(tǒng)其它的特點包括接收信號的預(yù)先處理。語音預(yù)先處理技術(shù)抽取接收的音頻響應(yīng)的特征。使用的某些語音預(yù)先處理技術(shù)的例子包括Mel頻率Cepstral系數(shù)(MFCC),線性的預(yù)測Cepstral系數(shù)(LPCC)或者感性的線性預(yù)測(PLP)。
在一個例子中,用戶請求電話號碼服務(wù),由用戶的終端接收的包括“號碼是”的音頻響應(yīng)是在關(guān)鍵字定點程序中用于搜索的指定的關(guān)鍵字。號碼的參考向量序列確認(rèn)在指定的關(guān)鍵字之間的連接字,其包含電話號碼。與連接字有關(guān)的號碼被處理并顯示在終端上,供用戶使用或者在存儲器中存儲以備將來之用。
參考圖4,具有諸如便攜式終端或者常規(guī)的有線電話這樣的終端的用戶請求電話號碼服務(wù),已接收的語音,即,話務(wù)員的語音和ARS的機械聲音被搜索(S100)。終端在其存儲器中存儲由語音預(yù)先處理技術(shù)定義的參考特征向量序列“號碼是0、1、2、3、4、5、6、7、8、9”。
從所接收的語音中通過關(guān)鍵字定點算法作為關(guān)鍵字來搜索“號碼是”(S110)。在由關(guān)鍵字定點算法搜索“號碼是”之后,從檢測的語音作為關(guān)鍵字再次搜索說出的短語“號碼是”(S120)。由關(guān)鍵字定點算法搜索的在“號碼是”和“號碼是”之間的語音信號被存儲在緩存器中(S130)。語音信號包括表示電話號碼的號碼信息。爾后,在這個實施例中,號碼信息是通過連接字識別算法,諸如動態(tài)時間偏離(DTW)識別的。特征向量序列“0、1、2、3、4、5、6、7、8、9”被用作參考模式(S140)。
在此處公開的電話號碼檢索系統(tǒng)與現(xiàn)有技術(shù)系統(tǒng)不同,該系統(tǒng)提供了監(jiān)控接收的語音特征的變化。在此處公開的電話號碼檢索系統(tǒng)按照與向量參考模式相比較的時間軸監(jiān)控變量,諸如接收的語音的持續(xù)時間,在大量電話號碼之間的指定字的長度,和號碼的位置。
相比之下,如果不監(jiān)控這些變量和考慮這些變量,則可能導(dǎo)致錯誤或者號碼識別失敗。利用基于來自Vintsynk、Chiba和Sakoe的動態(tài)編程(DP)的時間軸非線性彈性匹配方法的軟件算法,諸如DTW可以有效地處理這些接收的語音持續(xù)時間變化。
在號碼被識別之后,識別結(jié)果被顯示在終端的顯示屏上,或者存儲在終端的電話薄中(S150),使得用戶可以在任何時候調(diào)用電話號碼。
如以前論述的,用于顯示和存儲自動響應(yīng)電話號碼的方法通過使用關(guān)鍵字定點算法和連接字識別算法,以很少的計算來精確地從ARS的語音中識別和搜索電話號碼,并且在終端的顯示器上顯示電話號碼,或者在終端的電話薄中存儲電話號碼,以便用戶可以方便地使用電話號碼。
此外,一旦用戶請求電話號碼服務(wù),他/她不必再次請求電話號碼服務(wù)或者搜索電話號碼摘錄。用戶可以在任何時候調(diào)用存儲在終端中的電話號碼,這使用戶感到非常地舒服。經(jīng)濟上這也是有益的。
雖然參考某些優(yōu)選實施例已經(jīng)示出和描述了本發(fā)明,但是那些本領(lǐng)域技術(shù)人員應(yīng)理解,可以在形式和細節(jié)方面進行各種各樣的變化。例如,當(dāng)連接字是由隱藏的馬爾可夫模型(HMM),矢量量化(VQ)或者神經(jīng)網(wǎng)絡(luò)(NN)以及DTW識別時,可以適用本發(fā)明。此外,如果機械聲音或者ARS的響應(yīng)類型是通過電話號碼服務(wù)改變的,則其可以通過下載改變的內(nèi)容來處理。此外,如在下面進行描述的,以上所述的方法適用于任何的移動通信設(shè)備和/或基站終端。
參考圖5,舉例說明了本發(fā)明的移動通信設(shè)備500的方框圖,諸如一個用于執(zhí)行本發(fā)明方法的移動電話。移動通信設(shè)備500包括處理單元510,諸如微處理器或者數(shù)字信號處理器,RF模塊535,功率管理模塊505,天線540,電池555,顯示器515,小鍵盤520,存儲單元530,諸如閃存,ROM或者SRAM,揚聲器545和麥克風(fēng)550。
用戶例如通過按壓小鍵盤520的按鍵,或者通過使用麥克風(fēng)550語音激活來輸入命令信息,諸如電話號碼。處理單元510接收和處理命令信息,以執(zhí)行適宜的功能,諸如撥電話號碼。操作數(shù)據(jù)可以從存儲單元530中恢復(fù)以執(zhí)行功能。此外,處理單元510可以在顯示器515上顯示命令和操作信息,以方便用戶參考。
處理單元510發(fā)出命令信息給RF模塊535,以啟動通信,例如發(fā)射包括話音通信數(shù)據(jù)的無線電信號。RF模塊535包括接收機和發(fā)射機,以接收和發(fā)射無線電信號。天線540方便無線電信號的發(fā)射和接收。一旦接收到無線電信號,RF模塊535可以轉(zhuǎn)發(fā)和變換信號為基帶頻率,以便由處理單元510處理。處理的信號將被轉(zhuǎn)換為經(jīng)由揚聲器545輸出的聽得見的或者可讀的信息。
處理單元510適合于執(zhí)行在上面的圖3-4中舉例說明的方法。作為一個例子,處理單元510適合于接入一個電話號碼服務(wù)和從包括電話號碼部分的電話號碼服務(wù)中接收音頻響應(yīng)。處理單元在音頻響應(yīng)內(nèi)按照關(guān)鍵字定點程序來搜索電話號碼服務(wù)的至少一個指定的字。在指定的字之間的號碼被抽取和存儲在緩存器中。號碼識別器讀取緩存器的內(nèi)容,并且處理來自緩存器的已識別的電話號碼。已識別的電話號碼被傳送給顯示器,諸如移動終端,用于由用戶查看,和/或傳送給一個存儲位置,諸如在移動終端上的電話號簿,以備將來之用。如上在圖3和4中所述的其它的特點可以同樣結(jié)合進處理單元510之內(nèi)。
處理單元510在存儲單元530中存儲從其它的用戶接收的消息和發(fā)送給其它的用戶的消息,接收用于由用戶輸入的消息的條件請求,處理條件請求以對應(yīng)于條件請求從存儲單元中讀出數(shù)據(jù)。處理單元510輸出信息數(shù)據(jù)給顯示單元515。存儲單元530適合于存儲接收的和發(fā)送的兩個消息的消息數(shù)據(jù)。
圖6舉例說明一個按照本發(fā)明的優(yōu)選實施例的UTRAN 600的方框圖。UTRAN 600包括一個或多個無線電網(wǎng)絡(luò)子系統(tǒng)(RNS)625。每個RNS 625包括一個無線電網(wǎng)絡(luò)控制器(RNC)623和多個由RNC管理的節(jié)點B(基站)621。RNC623處理無線電資源的分配和管理,并且相對于核心網(wǎng)絡(luò)起一個的接入點的作用。此外,RNC 623適合于執(zhí)行本發(fā)明的方法。
節(jié)點B 621接收由終端的物理層經(jīng)由上行鏈路發(fā)送的信息,和經(jīng)由下行鏈路發(fā)送數(shù)據(jù)給終端。節(jié)點B 621起用于終端的UTRAN 600的接入點或者發(fā)射機和接收機的作用。對于一個本領(lǐng)域技術(shù)人員來說將是顯而易見的,可以容易地或者單獨或者與外部支持邏輯相結(jié)合使用,例如處理單元510(圖5的)或者其它的數(shù)據(jù)或者數(shù)字處理設(shè)備來實施移動通信設(shè)備500。
通過利用本發(fā)明,如上在圖3-4中所述,移動通信設(shè)備的用戶可以存儲多媒體數(shù)據(jù)。作為一個例子,控制器610適合于接入一個電話號碼服務(wù)和從包括電話號碼部分的電話號碼服務(wù)中接收音頻響應(yīng)??刂破鲉卧谝纛l響應(yīng)內(nèi)按照關(guān)鍵字定點程序搜索電話號碼服務(wù)的至少一個指定的字。在指定的字之間的大量電話號碼被抽取和存儲在緩存器中。號碼識別器讀取和處理緩存器的內(nèi)容,生成已識別的電話號碼。已識別的電話號碼被傳送給顯示器以便由用戶查看和/或被傳送給一個存儲位置以備將來之用。
對于一個本領(lǐng)域技術(shù)人員來說將是顯而易見的,可以容易地或者單獨或者與外部支持邏輯相結(jié)合使用,例如處理單元510(圖5的)或者其它的數(shù)據(jù)或者數(shù)字處理設(shè)備來實施本發(fā)明的優(yōu)選實施例。
雖然在移動通信的范圍中描述了本發(fā)明,但是本發(fā)明還可以在任何一種使用移動設(shè)備的無線通信系統(tǒng)中使用,諸如PDA和配備有無線通信性能的便攜式計算機。此外,對于描述本發(fā)明所使用的某些術(shù)語不應(yīng)限制于本發(fā)明范圍的某些類型的無線通信系統(tǒng),諸如UMTS。本發(fā)明還可適用于其它的使用不同的空中接口和/或物理層的無線通信系統(tǒng),例如,TDMA,CDMA,F(xiàn)DMA,WCDMA等等。
優(yōu)選實施例可以作為方法,裝置或者使用標(biāo)準(zhǔn)程序和/或施工技術(shù)制造的產(chǎn)品來實施,以產(chǎn)生軟件,程序包,硬件或者其任意的組合。在此處使用的術(shù)語“制造的產(chǎn)品”指的是以硬件邏輯(例如,集成電路片,現(xiàn)場可編程門陣列(FPGA),專用集成電路(ASIC)等等)實現(xiàn)的代碼或邏輯,或者計算機可讀介質(zhì)(例如,磁存儲介質(zhì)(例如,硬盤驅(qū)動器,軟盤,磁帶等等),光存儲(CD-ROM,光盤等等),易失的和非易失性存儲器設(shè)備(例如,EEPROM,ROM,PROM,RAM,DRAM,SRAM,程序包,可編程邏輯等等)。
在計算機可讀介質(zhì)中的代碼是由處理器訪問和執(zhí)行的。其中優(yōu)選實施例執(zhí)行的代碼可以進一步經(jīng)由傳輸介質(zhì)或者經(jīng)網(wǎng)絡(luò)從文件服務(wù)器訪問。在此情況下,其中代碼被實現(xiàn)的制造的產(chǎn)品可以包括傳輸介質(zhì),諸如網(wǎng)絡(luò)傳輸線,無線傳輸介質(zhì),信號經(jīng)由空間,無線電波,紅外信號等等傳送。當(dāng)然,那些本領(lǐng)域技術(shù)人員將理解,不脫離本發(fā)明的范圍可以對這些結(jié)構(gòu)進行很多的修改,而且制造的產(chǎn)品可以包括在本領(lǐng)域已知的任何信息承載媒體中。
在附圖中示出的邏輯實施例描述了作為以特定的順序發(fā)生的特定的操作。在供選擇的實施例中,某些邏輯操作可以以不同的順序?qū)嵤?,修改或者除去,并且仍然實現(xiàn)本發(fā)明的優(yōu)選實施例。此外,步驟可以被添加給以上所述的邏輯,并且仍然符合本發(fā)明的實施例。
上述的實施例和優(yōu)點僅僅是示范性的,并且不應(yīng)理解為限制本發(fā)明。當(dāng)前的教導(dǎo)可以容易地應(yīng)用于其它類型的裝置。本發(fā)明的描述意圖是說明性的,而不是限制權(quán)利要求的范圍。對于那些本領(lǐng)域技術(shù)人員來說許多的替換,修改和變化將是顯而易見的。因此,本發(fā)明不局限于在上文中詳細描述的那些明確的對于權(quán)利要求,申請人的意圖是權(quán)利要求不按照U.S.C.章節(jié)11235的第六段落解釋,除非使用的術(shù)語“裝置”后面有功能性陳述。
在那些權(quán)利要求中,裝置加功能從句意圖是當(dāng)執(zhí)行列舉的功能時覆蓋在此處描述的結(jié)構(gòu),以及不僅僅是結(jié)構(gòu)上的等效,而且是等效的結(jié)構(gòu)。此外,對于權(quán)利要求,應(yīng)當(dāng)明白,在下面進行描述的任何一個權(quán)利要求都可以為了發(fā)明的目的而被合并。
權(quán)利要求
1.在移動通信設(shè)備中,一種用于在緩存器中顯示和/或存儲已識別的電話號碼以便將來由用戶檢索的方法,其特征在于,所述方法包括步驟接入一個電話號碼服務(wù);接收一個來自電話號碼服務(wù)的音頻響應(yīng),該音頻響應(yīng)包括電話號碼部分;在音頻響應(yīng)內(nèi)按照關(guān)鍵字定點程序搜索電話號碼服務(wù)的至少一個指定的字;在緩存器中抽取和存儲在指定字之間的號碼;利用號碼識別器從緩存器的內(nèi)容中讀取已識別的電話號碼;和傳送用于由用戶查看的已識別的電話號碼給顯示器和存儲位置中的至少一個。
2.根據(jù)權(quán)利要求1的方法,其特征在于,所述電話號碼服務(wù)是一種自動響應(yīng)系統(tǒng)。
3.根據(jù)權(quán)利要求1的方法,其特征在于,所述電話號碼服務(wù)具有語音類型或者響應(yīng)類型,該類型已經(jīng)被改變,并且終端下載參數(shù)文件以保持電話服務(wù)的高性能。
4.根據(jù)權(quán)利要求1的方法,其特征在于,所述方法進一步包括步驟由服務(wù)提供者提供用戶信息,即電話號碼服務(wù)具有格式變化,以及如何去下載已改變的內(nèi)容,并且以商業(yè)模式的形式收費。
5.根據(jù)權(quán)利要求1的方法,其特征在于,所述方法進一步包括步驟一旦從因特網(wǎng)接收信息,就由終端經(jīng)由個人計算機下載參考模式或者參數(shù)文件。
6.根據(jù)權(quán)利要求2的方法,其特征在于,所述方法進一步包括步驟由終端直接在無線因特網(wǎng)上下載參考模式。
7.根據(jù)權(quán)利要求1的方法,其特征在于,所述方法進一步包括步驟由用戶從話務(wù)員的語音和自動響應(yīng)系統(tǒng)的說話者相關(guān)的機械聲音中至少一個收聽電話號碼。
8.根據(jù)權(quán)利要求1的方法,其特征在于,所述指定的字包含至少一個在電話號碼的號碼部分之前和之后的特定的字。
9.根據(jù)權(quán)利要求1的方法,其特征在于,從語音信號中已識別的電話號碼是通過字識別算法識別的。
10.根據(jù)權(quán)利要求9的方法,其特征在于,所述字識別算法是一種動態(tài)時間偏離(DTW)算法。
11.根據(jù)權(quán)利要求9的方法,其特征在于,所述DTW算法使用特征向量序列0至9作為參考模式。
12.根據(jù)權(quán)利要求9的方法,其特征在于,所述字識別算法是一種隱藏馬爾可夫模型(HMM)算法。
13.根據(jù)權(quán)利要求9的方法,其特征在于,所述字識別算法是一種矢量量化(VQ)算法。
14.根據(jù)權(quán)利要求9的方法,其特征在于,所述字識別算法是一種神經(jīng)網(wǎng)絡(luò)(NN)算法。
15.根據(jù)權(quán)利要求1的方法,其特征在于,所述方法進一步包括步驟一旦關(guān)鍵字定點程序結(jié)束,就定義特征向量作為由語音預(yù)先處理技術(shù)產(chǎn)生的序列。
16.根據(jù)權(quán)利要求16的方法,其特征在于,所述方法進一步包括在終端的存儲器中存儲已定義的特征向量。
17.根據(jù)權(quán)利要求1的方法,其特征在于,音頻響應(yīng)利用包括Mel頻率Cepstral系數(shù)(MFCC)的語音預(yù)先處理技術(shù),用于抽取音頻響應(yīng)的特征。
18.根據(jù)權(quán)利要求15的方法,其特征在于,所述語音預(yù)先處理技術(shù)利用線性的預(yù)測Cepstral系數(shù),其用于抽取音頻響應(yīng)的特征。
19.根據(jù)權(quán)利要求15的方法,其特征在于,所述語音預(yù)先處理技術(shù)利用感性的線性預(yù)測,其用于抽取音頻響應(yīng)的特征。
20.一種用于移動通信終端的在與電話號碼相關(guān)的存儲器中存儲特定的參考特征向量序列的方法,其特征在于,所述方法包括搜索一個接入電話服務(wù)的終端,該電話號碼服務(wù)用于話務(wù)員語音和自動響應(yīng)系統(tǒng)(ARS)的機械聲音的至少一個;利用關(guān)鍵字定點程序在話務(wù)員的語音和自動響應(yīng)系統(tǒng)的機械聲音的至少一個中搜索第一指定字和第二指定字;在緩存器中存儲在已搜索的第一指定字和第二指定字之間的語音響應(yīng);對存儲在緩存器中的語音響應(yīng)應(yīng)用一種字識別算法;從緩存器的內(nèi)容中識別電話號碼,和在顯示器上顯示已識別的電話號碼,并且在終端的電話簿中存儲電話號碼。
21.根據(jù)權(quán)利要求20的方法,其特征在于,所述方法進一步包括步驟按照語音預(yù)先處理技術(shù)定義特征向量作為一個序列,和使用從已定義的特征向量中獲得的特定的參考向量來應(yīng)用關(guān)鍵字定點程序。
22.根據(jù)權(quán)利要求21的方法,其特征在于,所述語音預(yù)先處理技術(shù)利用Mel頻率Cepstral系數(shù),其用于抽取語音的特征。
23.根據(jù)權(quán)利要求21的方法,其特征在于,所述語音預(yù)先處理技術(shù)利用線性的預(yù)測Cepstral系數(shù),用于抽取語音特征。
24.根據(jù)權(quán)利要求21的方法,其特征在于,所述語音預(yù)先處理技術(shù)利用感性的線性預(yù)測,其用于抽取語音特征。
25.根據(jù)權(quán)利要求21的方法,其特征在于,關(guān)鍵字定點程序使用“號碼是”的特征向量序列作為參考模式。
26.根據(jù)權(quán)利要求21的方法,其特征在于,所述字識別算法是一種動態(tài)時間偏離算法。
27.根據(jù)權(quán)利要求26的方法,其特征在于,所述動態(tài)時間偏離算法使用特征向量序列“0、1、2、3、4、5、6、7、8、9”作為參考模式。
28.根據(jù)權(quán)利要求20的方法,其特征在于,所述字識別算法是一種隱藏的馬爾可夫模型算法。
29.根據(jù)權(quán)利要求20的方法,其特征在于,所述字識別算法是一種矢量量化算法。
30.根據(jù)權(quán)利要求20的方法,其特征在于,所述字識別算法是一種神經(jīng)網(wǎng)絡(luò)算法。
31.一種用于管理在移動通信系統(tǒng)中互通的消息的移動通信設(shè)備,其特征在于,所述移動通信設(shè)備包括一個RF模塊,它包括在移動通信系統(tǒng)中互通消息的發(fā)射機和接收機;和用于接入一個電話號碼服務(wù)的裝置;用于接收一個來自電話號碼服務(wù)的音頻響應(yīng)的裝置,該電話號碼服務(wù)包括電話號碼部分;用于在音頻響應(yīng)內(nèi)按照關(guān)鍵字定點程序來搜索電話號碼服務(wù)的至少一個指定的字的裝置;用于在緩存器中抽取和存儲在指定的字之間的號碼的裝置;用于利用號碼識別器從緩存器的內(nèi)容中讀取已識別的電話號碼的裝置;和用于傳送已識別的電話號碼給顯示器以便由用戶查看,和/或傳送到存儲位置以備將來之用的裝置。
32.根據(jù)權(quán)利要求31的設(shè)備,其特征在于,所述電話號碼服務(wù)是一種自動響應(yīng)系統(tǒng)。
33.根據(jù)權(quán)利要求31的設(shè)備,其特征在于,所述電話號碼服務(wù)具有語音類型或者響應(yīng)類型,該類型已經(jīng)被改變,并且終端下載參數(shù)文件以保持電話服務(wù)的高性能。
34.根據(jù)權(quán)利要求31的設(shè)備,其特征在于,所述電話號碼服務(wù)具有一種格式變化,并且服務(wù)提供者通知用戶如何去下載已改變的內(nèi)容,并且以商業(yè)模式的形式收費。
35.一種用于與移動通信系統(tǒng)中的終端進行無線電通信的網(wǎng)絡(luò),其特征在于,所述網(wǎng)絡(luò)包括在移動通信網(wǎng)絡(luò)中通信的至少一個發(fā)射機和至少一個接收機;用于接入一個電話號碼服務(wù)的裝置;用于接收一個來自電話號碼服務(wù)的音頻響應(yīng)的裝置,該電話號碼服務(wù)包括一個電話號碼部分;用于在音頻響應(yīng)內(nèi)按照關(guān)鍵字定點程序來搜索電話號碼服務(wù)的至少一個指定的字的裝置;用于在緩存器中抽取和存儲在指定的字之間的號碼的裝置;用于利用號碼識別器從緩存器的內(nèi)容中讀取已識別的電話號碼的裝置;和用于傳送已識別的電話號碼給顯示器以便由用戶查看,和/或傳送到存儲位置以備將來之用的裝置。
36.根據(jù)權(quán)利要求35的網(wǎng)絡(luò),其特征在于,所述電話號碼服務(wù)是一種自動響應(yīng)系統(tǒng)。
37.根據(jù)權(quán)利要求35的網(wǎng)絡(luò),其特征在于,所述電話號碼服務(wù)具有語音類型或者響應(yīng)類型,該類型已經(jīng)被改變,并且終端下載一個向量參考模式以改變電話服務(wù)的變量。
38.根據(jù)權(quán)利要求35的網(wǎng)絡(luò),其特征在于,所述電話號碼服務(wù)具有一種格式變化,并且服務(wù)提供者通知用戶如何去下載已改變的內(nèi)容,并且以商業(yè)模式的形式收費。
全文摘要
本發(fā)明提供了一種控制電話號碼檢索的方法和系統(tǒng)。一個終端從電話號碼服務(wù)中請求一個電話號碼。包括電話號碼是音頻響應(yīng)從電話號碼服務(wù)中被接收。特征向量序列作為用于已接收的音頻響應(yīng)的參考模式被存儲在終端的存儲器中。該音頻響應(yīng)具有在多個電話號碼之間和在多個電話號碼當(dāng)中指定的字。關(guān)鍵字定點程序搜索指定的字。包括電話號碼的設(shè)置在指定的字之間和設(shè)置在指定的字之中的連接字被抽取并存儲在緩存器中。號碼識別器分析緩存器的內(nèi)容。號碼識別器輸出已識別的電話號碼,其用于顯示在終端上和/或存儲在存儲器中,以備將來之用。
文檔編號H04B1/40GK1620083SQ200410104788
公開日2005年5月25日 申請日期2004年10月29日 優(yōu)先權(quán)日2003年10月29日
發(fā)明者金燦佑 申請人:Lg電子株式會社