專利名稱:語(yǔ)音識(shí)別設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音識(shí)別設(shè)備和語(yǔ)音識(shí)別方法。 背景絲
作為與語(yǔ)音識(shí)別設(shè)備相關(guān)的技術(shù),可使用生成用于語(yǔ)音識(shí)別的語(yǔ)法的 技術(shù)。這里提到的語(yǔ)法(或語(yǔ)音識(shí)別語(yǔ)法)表示通過它提供一個(gè)或更多語(yǔ) 音識(shí)別目標(biāo)詞匯的數(shù)據(jù)或信息。這里提到的詞匯表示一組字或句子。語(yǔ)音 識(shí)別設(shè)備將執(zhí)行語(yǔ)音識(shí)別時(shí)通過語(yǔ)法提供的一個(gè)或更多詞匯中的每一個(gè)看 作語(yǔ)音識(shí)別目標(biāo)詞匯。
作為語(yǔ)法生成技術(shù)之一,可用的方法是通過組合與情況對(duì)應(yīng)的詞匯(例 如,對(duì)應(yīng)于設(shè)備的狀態(tài)或模式)來(lái)生成語(yǔ)法。作為具體實(shí)例,將描述在車 輛導(dǎo)航系統(tǒng)中語(yǔ)音識(shí)別語(yǔ)法的生成方法的實(shí)例。在車輛導(dǎo)航系統(tǒng)中,在剛 剛打開電源之后的模式下(即,初始條件),語(yǔ)法僅包括用于車輛導(dǎo)航操 作命令的詞匯。當(dāng)在初始條件下用戶輸入命令時(shí),其他模式被選擇(例如, 地圖檢索模式或電話號(hào)碼檢索模式)。當(dāng)實(shí)現(xiàn)所選模式時(shí),與其他模式固 有的操作種類對(duì)應(yīng)的一個(gè)或更多詞匯被添加到初始條件下的語(yǔ)法中。此后, 依據(jù)進(jìn)行了從哪個(gè)模式到哪個(gè)模式的轉(zhuǎn)換,在所迷轉(zhuǎn)換和/或一個(gè)或更多不 必要的詞匯被從中刪除之前,將一個(gè)或更多必要的詞匯添加到語(yǔ)法。
在上文描述的實(shí)例中,語(yǔ)音識(shí)別語(yǔ)法僅是一組詞匯。這里,假設(shè)語(yǔ)法為X,預(yù)先準(zhǔn)備的詞匯是Xi至Xn。當(dāng)從&至Xn選擇k個(gè)詞匯《Xu,Xi2,…XnJ
時(shí),語(yǔ)法X-W…+Xik。如果從k個(gè)詞匯(Xu,Xi2,…XnJ選擇了將 要?jiǎng)h除的m個(gè)詞匯{ Xdl, Xd2,...Xdm},則可通過X — X - Xdl - Xd2 - ... - Xdm 的刪除搮作來(lái)更新語(yǔ)法。
作為更普通的情況,考慮其中句型被預(yù)先確定并且該句中的一個(gè)或更 多詞匯是可變的語(yǔ)法。這里,將日語(yǔ)句型"Xno Y (X的Y),,作為實(shí)例 來(lái)說明。在該"XnoY"的句型實(shí)例中,可以在X中設(shè)置用于X的任意詞 匯,并且可以在Y中設(shè)置用于Y的任意詞匯,例如,如果分別將X和Y 設(shè)置為(KANREN陽(yáng)GAISHA( affiliate company,聯(lián)營(yíng)公司),KOGAISHA (subsidiary company,子公司))和(JUSHO (地址),DENWABANGO (電話號(hào)碼)},則獲得用于表示4個(gè)句子"KANREN-GAISHA no JUSHO (聯(lián)營(yíng)公司的地址)"、"DENWABANGO no KANREN-GAISHA (聯(lián) 營(yíng)公司的電話號(hào)碼)"、"KOGAISHA no JUSHO (子公司的地址),,、 "KOGAISHA no DENWABGANGO (子公司的電話號(hào)碼)"的語(yǔ)法。而 且在該實(shí)例中,類似于前述車輛導(dǎo)航系統(tǒng)的實(shí)例,通it^預(yù)先準(zhǔn)備的詞匯 選擇一些詞匯,以及操作以組合所選詞匯(操作以添加),例如X-Xu十 Xi2+... + Xim, Y-Y"+Yi2+…+Yin,和/或操作以刪除詞匯,來(lái)實(shí)現(xiàn)語(yǔ)法 的生成和更新。
作為用于表達(dá)語(yǔ)音識(shí)別中使用的詞匯的方法,可使用以網(wǎng)絡(luò)表達(dá)詞匯 的方法(參見例如,Stephen E. Levinson: "Structural Methods in Automatic Speech Recognition" , IEEE ^H義錄的73巻,No.ll, 1625 - 1650頁(yè),1985 年ll月)。當(dāng)4吏用詞匯網(wǎng)絡(luò)時(shí),也可發(fā)生詞匯的添加/刪除。
作為執(zhí)行詞匯網(wǎng)絡(luò)的添加/刪除的傳統(tǒng)方法,可使用考慮合并復(fù)數(shù)個(gè)字 的共同的字頭(common word head,共同字頭)以及合并復(fù)數(shù)個(gè)字的共同 字尾(common word tail,共同字尾)的方法。通過合并共同字頭/共同字 尾,可減少存儲(chǔ)量和計(jì)算量。然而,該方法具有的問題是,需要相對(duì)更多
的計(jì)算時(shí)間用于考慮了合并的處理。
另一方面,作為用于執(zhí)行詞匯網(wǎng)絡(luò)的添加/刪除的另一方法,存在一種將復(fù)數(shù)個(gè)詞匯網(wǎng)^彼此并聯(lián)連接的方法。該方法具有另一問題,即盡管 處理簡(jiǎn)單,但是與考慮共同字頭/共同字尾的合并的情況相比,需要更多的 存儲(chǔ)量和計(jì)算量。
如上文所述,還沒有有效地執(zhí)行詞匯的添加/刪除的方法。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一方面,提供一種使用提供一組識(shí)別目標(biāo)字或句子的語(yǔ)
法網(wǎng)絡(luò)的語(yǔ)音識(shí)別設(shè)備,包括存儲(chǔ)單元,被配置為存儲(chǔ)多個(gè)詞匯,每個(gè) 所述詞匯包括多個(gè)字體數(shù)據(jù),通過從任意字或句子移除特定的字頭來(lái)獲得 每個(gè)所述字體數(shù)據(jù),以及被配置為存儲(chǔ)至少一個(gè)包括多個(gè)標(biāo)記節(jié)點(diǎn)的字頭 部分,以侵束示至少一個(gè)共同字頭,所述共同字頭對(duì)于所述多個(gè)詞匯中的 至少兩個(gè)是共同的;指令接收單元,被配置為接收來(lái)自所述多個(gè)詞匯的用 于逸擇目標(biāo)詞匯的第一指令,以及用于指示對(duì)所述目標(biāo)詞匯的操作內(nèi)容的 第二指令;語(yǔ)法網(wǎng)絡(luò)生成單元,被配置為當(dāng)通過所述第一指令指示添加所 述目標(biāo)詞匯的處理時(shí),生成包含所述字頭部分、通過所述第二指令選擇的 所述目標(biāo)詞匯和字頭部分側(cè)連接信息的語(yǔ)法網(wǎng)絡(luò),所述字頭部分側(cè)連接信 息指示每個(gè)包含在所述目標(biāo)詞匯中的所述多個(gè)字體數(shù)據(jù),被連接至包含在
所述字頭部分的所述多個(gè)標(biāo)記節(jié)點(diǎn)的預(yù)先匹配的一個(gè);以及語(yǔ)音識(shí)別單元, 被配置為使用生成的語(yǔ)法網(wǎng)g行語(yǔ)音識(shí)別。
圖i是示出根據(jù)實(shí)施例的語(yǔ)音識(shí)別設(shè)備的配置實(shí)例的示圖2是示出語(yǔ)法編輯單元的內(nèi)部配置的實(shí)例的示圖3是示出從詞匯操作到記錄的處理過程的實(shí)例的流程圖4是示出語(yǔ)法框架的實(shí)例的示圖5是示出字頭部分和字尾部分的示圖6是示出詞匯網(wǎng)絡(luò)的第一實(shí)例(字體部分)的示圖7是示出詞匯網(wǎng)絡(luò)的第二實(shí)例(字體部分)的示圖;圖8是示出詞匯網(wǎng)絡(luò)的第三實(shí)例(字體部分)的示圖9是示出語(yǔ)法網(wǎng)絡(luò)生成的處理過程的實(shí)例的流程圖IO示出圖9中的附加例程的處理過程的實(shí)例;
圖11示出圖9中的刪除例程的處理過程的實(shí)例;
圖12示出通過初始設(shè)置過程處理的語(yǔ)法框架的網(wǎng)絡(luò)結(jié)構(gòu);
圖13是示出對(duì)其執(zhí)行附加例程的語(yǔ)法框架的網(wǎng)絡(luò)結(jié)構(gòu)實(shí)例的示圖14是示出語(yǔ)法框架的另一實(shí)例的示圖15是示出可用于兩個(gè)子網(wǎng)絡(luò)的字體部分的結(jié)構(gòu)實(shí)例的示圖16是示出語(yǔ)法網(wǎng)絡(luò)生成的處理過程的另一實(shí)例的流程圖17是示出圖16中的附加例程的處理過程實(shí)例的流程圖18是示出圖16中的刪除例程的處理過程實(shí)例的流程圖19是示出字頭部分的另一實(shí)例的示圖20是示出詞匯網(wǎng)絡(luò)的第四實(shí)例(字體部分)的示圖21是示出詞匯網(wǎng)絡(luò)的第五實(shí)例(字體部分)的示圖22是示出詞匯網(wǎng)絡(luò)的笫六實(shí)例(字體部分)的示圖23是示出語(yǔ)法編輯單元的內(nèi)部配置的另一實(shí)例的示圖24是示出用于更新字頭部分的處理過程實(shí)例的流程圖25是示出圖24中的合并例程的處理過程實(shí)例的流程圖26是示出圖25中的合并例程的處理過程實(shí)例的流程圖27是說明傳統(tǒng)詞匯網(wǎng)絡(luò)的添加操作/刪除操作的第 一示圖28是說明傳統(tǒng)詞匯網(wǎng)絡(luò)的添加操作/刪除操作的第二示圖29是說明傳統(tǒng)詞匯網(wǎng)絡(luò)的添加操作/刪除操作的第三示圖30是說明傳統(tǒng)詞匯網(wǎng)絡(luò)的添加操作/刪除操作的第四示圖;以及
圖31是說明傳統(tǒng)詞匯網(wǎng)絡(luò)的添加操作/刪除操作的第五示圖。
下文中,將參考附圖描述本發(fā)明的實(shí)施例。 (第一實(shí)施例)首先,將描述用網(wǎng)絡(luò)表達(dá)詞匯的方法,而且將基于該表達(dá)方法詳細(xì)描 述現(xiàn)有技術(shù)的問題。
通常,用網(wǎng)絡(luò)表達(dá)語(yǔ)音識(shí)別中使用的詞匯具有下列兩個(gè)優(yōu)點(diǎn)。
(i) 具有共同字頭的不同的字可共享共同字頭的數(shù)據(jù)(網(wǎng)絡(luò)的節(jié)點(diǎn)和 弧(are)),和/或具有共同字尾的不同的字可共享共同字尾的數(shù)據(jù)。因 此,可以更小的存儲(chǔ)量保存詞匯。
(ii) 通過共享共同字頭和/或共同字尾,可共享語(yǔ)音識(shí)別所必須的字 分?jǐn)?shù)(word score )計(jì)算。因此,可通過更小的計(jì)算量計(jì)算字分?jǐn)?shù)。
同時(shí),根據(jù)以樹形結(jié)構(gòu)表達(dá)詞匯的方法,字頭被共享而字尾沒有被共 享。因此,樹形結(jié)構(gòu)是一種網(wǎng)絡(luò)。
圖27示出其中表達(dá)了復(fù)數(shù)個(gè)字的詞匯網(wǎng)絡(luò)實(shí)例。圖27表達(dá)了三個(gè)日 語(yǔ)字(城市名)"ka-ma-ta"(圖中的路線(route ) 201) , "ka-wa-sa-ki" (圖中的路線202 ) ,"chi-ga-sa-ki"(圖中的路線203 )。在圖27中, 共享共同字頭"ka",共享共同字尾"sa-ki"。
圖28示出詞匯網(wǎng)絡(luò)的其他實(shí)例。圖28表達(dá)了三個(gè)日語(yǔ)字"i-ki-sa-ki (目的地)"(圖中的路線204 ) ,"ka-ku-te-i (確定)"(圖中的路線 205 )和"se-n-ta-ku (選擇)"(圖中的路線206 )。在圖28中,沒有字 頭和字尾被共享。
在用網(wǎng)絡(luò)表達(dá)詞匯時(shí),實(shí)現(xiàn)詞匯增加(詞匯組合)的傳統(tǒng)方法是對(duì)現(xiàn) 有詞匯網(wǎng)絡(luò)添加新的詞匯網(wǎng)絡(luò),然后合并共同字頭和/或共同字尾。
例如,如果將圖28的詞匯網(wǎng)絡(luò)與圖27的詞匯網(wǎng)*并,則獲得圖29 所示的詞匯網(wǎng)絡(luò)。該詞匯網(wǎng)絡(luò)提供用于語(yǔ)音識(shí)別的語(yǔ)法(語(yǔ)法網(wǎng)絡(luò))。在 圖27至29中具有相同標(biāo)號(hào)的路線表示相同的字。
以與上i^目反的方式執(zhí)行詞匯的刪除,例如,通過從圖29的詞匯網(wǎng)絡(luò) 刪除圖28的詞匯網(wǎng)絡(luò),獲得圖27的詞匯網(wǎng)絡(luò)。
然而,如上所述的添加詞匯網(wǎng)絡(luò)和合并共同字頭和/或共同字尾要花費(fèi) 相對(duì)多的計(jì)算時(shí)間,這是一個(gè)問題。 一旦執(zhí)行合并,則所保持的合并網(wǎng)絡(luò) 結(jié)構(gòu)中不必要的詞匯需要被刪除,從而需要計(jì)算時(shí)間。因此,這種詞匯網(wǎng)絡(luò)的這種添加和刪除方法不適合于字的數(shù)量較大或計(jì)算機(jī)的處理能力較低 的情況。
另一方面,在以網(wǎng)絡(luò)表達(dá)詞匯時(shí),實(shí)現(xiàn)詞匯添加的另一傳統(tǒng)方法是預(yù) 先準(zhǔn)備復(fù)數(shù)個(gè)詞匯網(wǎng)絡(luò),并且僅并聯(lián)地連接從這些詞匯網(wǎng)絡(luò)選擇的兩個(gè)或
更多詞匯網(wǎng)絡(luò)。圖30示出選擇兩個(gè)詞匯網(wǎng)絡(luò)的情況。
例如,如果選擇圖27的詞匯網(wǎng)絡(luò)和圖28的詞匯網(wǎng)絡(luò),則獲得圖31 所示的詞匯網(wǎng)絡(luò)(或語(yǔ)法網(wǎng)絡(luò))。
根據(jù)上述方法,通過僅向/從網(wǎng)絡(luò)添加/刪除搮作目標(biāo)詞匯網(wǎng)絡(luò),來(lái)實(shí)現(xiàn) 詞匯網(wǎng)絡(luò)的添加/刪除。從而實(shí)現(xiàn)高速操作(上述方法已經(jīng)實(shí)際使用)。
然而,根據(jù)該方法,僅能在預(yù)先準(zhǔn)備的每個(gè)詞匯網(wǎng)絡(luò)內(nèi)完成共同字頭 和/或共同字尾的共享。因此,如果網(wǎng)絡(luò)的數(shù)量增加或計(jì)算機(jī)的處理能力較 低,則未合并部分的存儲(chǔ)浪費(fèi)或字分?jǐn)?shù)計(jì)算占用的時(shí)間的浪費(fèi)是不可忽視 的,這是另一個(gè)問題。
當(dāng)關(guān)注X或Y時(shí),上述問題存在于具有^^ "X的Y"句型的語(yǔ)法以及 僅是字集的總和的語(yǔ)法,并且對(duì)于其他語(yǔ)法也是如此。
下文中,將詳細(xì)描述該實(shí)施例。
圖1是示出該實(shí)施例的語(yǔ)音識(shí)別設(shè)備的配置實(shí)例的框圖。
如圖1所示,本實(shí)施例的語(yǔ)音識(shí)別設(shè)備包括語(yǔ)法存儲(chǔ)單元ll、語(yǔ)法編 輯單元12和語(yǔ)音識(shí)別單元l3。
語(yǔ)法存儲(chǔ)單元11存儲(chǔ)一個(gè)或更多字頭部分(圖中的U2)、 一個(gè)或更 多字尾部分(圖中的114 )、兩個(gè)或更多字體部分(圖中的116 )和一個(gè)或 更多語(yǔ)法框架(圖中的118)。
在該實(shí)施例中,語(yǔ)音識(shí)別目標(biāo)字或句子包括字頭、字體和字尾中的全 部或一些(通常包括它們的全部)。
字或句子的字頭是字或句子的字頭側(cè)特定范圍中的部分(字頭側(cè)部 分),字或句子的字尾是字或句子的字尾側(cè)特定范圍中的部分(字尾側(cè)部 分)。通過從該字或句子移除字頭和/或字尾得到包含在詞匯中的單獨(dú)的字 或句子的字體。字頭部分112包括一個(gè)或更多字頭數(shù)據(jù)(即該實(shí)施例中被標(biāo)記的節(jié) 點(diǎn)),并表示分別對(duì)至少兩個(gè)詞匯共同的一個(gè)或更多(共同的)字頭,這 將在后面詳細(xì)描述。
字尾部分116包括一個(gè)或更多字尾數(shù)據(jù)(即該實(shí)施例中被標(biāo)記的節(jié) 點(diǎn)),并表示分別對(duì)至少兩個(gè)詞匯共同的一個(gè)或更多(共同的)字尾,這 將在后面詳細(xì)描述。
詞匯表達(dá)多個(gè)字或句子。
字體部分(即該實(shí)施例中的詞匯網(wǎng)絡(luò))114包括多個(gè)字體數(shù)據(jù)(即該 實(shí)施例中的字體網(wǎng)絡(luò)),并表示多個(gè)字或句子。當(dāng)將字體數(shù)據(jù)與字頭部分 的匹配字頭數(shù)據(jù)以及字尾部分的匹配字尾數(shù)據(jù)組合時(shí), 一個(gè)字體數(shù)據(jù)表示 與該字體數(shù)據(jù)對(duì)應(yīng)的一個(gè)字或句子,這將在后面詳細(xì)描述。
字頭部分112的量Nh和字尾部分116的量Nb小于字體部分114的量 Nt。即,l《Nh<Nb,和"Nt《Nb。
語(yǔ)法框架118是定義了詞匯之間的連接方法(句型)的網(wǎng)絡(luò),這將在 后面詳細(xì)描述。
如圖2所示,語(yǔ)法編輯單元12包括指令接收單元121、語(yǔ)法網(wǎng)絡(luò)生成 單元122和輸出單元123。語(yǔ)法網(wǎng)絡(luò)生成單元122包括添加處理單元1221 和刪除處理單元1222。
現(xiàn)在將參考圖3描述通過語(yǔ)音識(shí)別設(shè)備的語(yǔ)法編輯單元12和語(yǔ)音識(shí)別 單元13,進(jìn)行從對(duì)于語(yǔ)法網(wǎng)絡(luò)的詞匯操作到語(yǔ)法網(wǎng)絡(luò)的記錄的處理過程實(shí) 例。
指令接收單元121接收詞匯選擇指令,該詞匯選擇指令用于選擇詞匯 作為操作目標(biāo),以及接收操作選擇指令,該操作選擇指令用于選擇對(duì)于該 詞匯的操作內(nèi)容(即添加和刪除中的任何一個(gè))(步驟S1)。作為通過它 用戶輸入期望的指令并且指令接收單元121接收該指令的方法,允許使用 諸如GUI的任何方法。
如果通過操作選擇指令指示添加(步驟S2 ),則語(yǔ)法網(wǎng)絡(luò)生成單元122 的添加處理單元1221將與詞匯選擇指令指示的詞匯對(duì)應(yīng)的字體部分的每個(gè)字體數(shù)據(jù),連接至預(yù)先指定的字頭部分的字頭數(shù)據(jù)和預(yù)先指定的字尾部
分的字尾數(shù)據(jù)(步驟S3)。另一方面,如果指示刪除(步驟S4),則語(yǔ) 法網(wǎng)絡(luò)生成單元122的刪除處理單元1222從字頭數(shù)據(jù)和字尾數(shù)據(jù)斷開每個(gè) 字體數(shù)據(jù)(步驟S5)。通過詞匯的添加和/或刪除,生成或更新語(yǔ)法網(wǎng)絡(luò)。
輸出單元123將生成或更新的語(yǔ)法網(wǎng)絡(luò)輸出至語(yǔ)音識(shí)別單元13,并在 語(yǔ)音識(shí)別單元13中記錄語(yǔ)法網(wǎng)絡(luò).
可以對(duì)每個(gè)詞匯實(shí)現(xiàn)或?qū)?fù)數(shù)個(gè)詞匯全體地實(shí)現(xiàn)到指令接收單元121 的指令錄入。在后一情況下,可以同時(shí)執(zhí)行一個(gè)或更多詞匯的添加和一個(gè) 或更多詞匯的刪除??梢酝瑫r(shí)執(zhí)行復(fù)數(shù)個(gè)詞匯的添加和復(fù)數(shù)個(gè)詞匯的刪除 中的任何一個(gè)。
當(dāng)語(yǔ)音識(shí)別單元13收到來(lái)自語(yǔ)法編輯單元12的語(yǔ)法網(wǎng)絡(luò)時(shí),其在存 儲(chǔ)器(未示出)中將該語(yǔ)法網(wǎng)絡(luò)記錄為初始或更新的語(yǔ)法網(wǎng)絡(luò)(步驟S6)。 語(yǔ)音識(shí)別單元13使用當(dāng)前記錄的更新語(yǔ)法網(wǎng)g行對(duì)輸入語(yǔ)音的語(yǔ)音識(shí) 別,并輸出語(yǔ)音識(shí)別的結(jié)果。語(yǔ)音識(shí)別單元13可以是與傳統(tǒng)的相同的結(jié)構(gòu)。
接下來(lái),將參考圖4至11描述該實(shí)施例的語(yǔ)音識(shí)別設(shè)備的語(yǔ)法編輯單 元12的操作實(shí)例。圖4至8是將要存儲(chǔ)在語(yǔ)法存儲(chǔ)單元11中的數(shù)據(jù)的概 念上的示圖。圖9至11是示出語(yǔ)法編輯單元12的操作實(shí)例的流程圖。
語(yǔ)法框架是指示語(yǔ)音識(shí)別設(shè)備可接收的句型的網(wǎng)絡(luò)模型。語(yǔ)法框架包 括至少一個(gè)或更多"其中詞匯是可變的部分"。語(yǔ)法框架中的"其中詞匯 是可變的部分"被稱為"子網(wǎng)絡(luò)"。語(yǔ)法框架可包括一個(gè)或更多"其中詞 匯是固定的部分"。語(yǔ)法框架中的"其中詞匯是固定的部分"被稱為"詞 匯固定節(jié)點(diǎn)"。
圖4示出最簡(jiǎn)單的語(yǔ)法框架的實(shí)例。該語(yǔ)法框架指示詞匯在X中祐:i殳 置。圖4中通過雙圓形表示的頭節(jié)點(diǎn)(圖中的81)指示初始條件下的節(jié)點(diǎn), 通過雙圓形表示的尾節(jié)點(diǎn)(圖中的82)指示最終條件下的節(jié)點(diǎn)。為了從節(jié) 點(diǎn)區(qū)分子網(wǎng)絡(luò),以虛線表示子網(wǎng)絡(luò)(圖中的83),并且以實(shí)線(與其他圖 中的相同)表示節(jié)點(diǎn)(圖中的81、 82)。在圖4的情況下,語(yǔ)法編輯單元 12通過向/從子網(wǎng)絡(luò)X添加/刪除詞匯來(lái)生成語(yǔ)法網(wǎng)絡(luò)。語(yǔ)法框架具有各種句型。例如,圖14示出指示"XnoY" (no:指示 所有、所屬和特性等的狀態(tài)的小品詞(particle))句型的語(yǔ)法框架的實(shí)例。 在圖l4的情況下,語(yǔ)法編輯單元12通過在每個(gè)子網(wǎng)絡(luò)X、 Y中設(shè)置一個(gè) 或更多詞匯來(lái)限定語(yǔ)法網(wǎng)絡(luò)。
為了闡明該實(shí)施例的特征,將舉例說明其中提供了一個(gè)字頭部分112 (即Nh = 1)和一個(gè)字尾部分116 (即Nt = 1)并且語(yǔ)法框架保持有子網(wǎng)絡(luò) X的情況。此外,將描述其中節(jié)點(diǎn)標(biāo)記是日語(yǔ)KANA字母的情況。在這種 情況下,以羅馬字母表達(dá)KANA字母。盡管將詞匯提供了一組字的情況作 為實(shí)例來(lái)描述,但是其中詞匯提供一組句子或一組字和句子的情況也是相 同的。
圖5示出字頭部分和字尾部分的實(shí)例。在圖5中,頭節(jié)點(diǎn)(圖中的101) 指示初始務(wù)泮下的節(jié)點(diǎn),并且尾節(jié)點(diǎn)(圖中的102)指示最終條件下的節(jié) 點(diǎn)。在圖5中,在初始條件下的五個(gè)被標(biāo)記的孩子節(jié)點(diǎn)(圖中的103)是 "字頭部分節(jié)點(diǎn)",在最終條件下的五個(gè)被標(biāo)記的雙親(parent)節(jié)點(diǎn)(圖 中的104)是"字尾部分節(jié)點(diǎn)"。標(biāo)識(shí)符"hid"指示字頭部分節(jié)點(diǎn)標(biāo)識(shí)符, 另一標(biāo)識(shí)符"tid"指示字尾部分節(jié)點(diǎn)標(biāo)識(shí)符。
由圖5顯然,字頭部分是樹形結(jié)構(gòu)網(wǎng)絡(luò)。另一方面,由于通過從最終 條件節(jié)點(diǎn)反轉(zhuǎn)弧的方向獲得樹形結(jié)構(gòu),因此字尾部分U轉(zhuǎn)方向指示的樹 形結(jié)構(gòu)網(wǎng)絡(luò)。
圖6至8示出詞匯網(wǎng)絡(luò)(詞體部分的)的實(shí)例,這將凈皮詳細(xì)描述。圖 6至8的實(shí)例的每個(gè)詞匯網(wǎng)絡(luò)包括三個(gè)字。
詞匯網(wǎng)絡(luò)中的每個(gè)字體數(shù)據(jù)組成網(wǎng)絡(luò),該網(wǎng)絡(luò)通過保持有將被連接的 字頭部分節(jié)點(diǎn)和字尾部分節(jié)點(diǎn)的信息以及沒有包含在字頭部分/字尾部分 的標(biāo)記(label)的信息(例如KANA字符串),來(lái)提供字(或句子)。
更具體地,例如,對(duì)于屬于詞匯網(wǎng)絡(luò)的字,其字體數(shù)據(jù)保持有字的標(biāo) 識(shí)信息、可連接的字頭部分節(jié)點(diǎn)的標(biāo)識(shí)信息、可連接的字尾部分節(jié)點(diǎn)的標(biāo) 識(shí)信息以及^皮標(biāo)記的節(jié)點(diǎn)序列(通過一個(gè)或更多有向弧連接的^皮標(biāo)記的節(jié) 點(diǎn)或被標(biāo)記的節(jié)點(diǎn)序列),所述被標(biāo)記的節(jié)點(diǎn)序列指示沒有包含在字頭部分/字尾部分的標(biāo)記。有向弧指示節(jié)點(diǎn)的連接關(guān)系,即節(jié)點(diǎn)和標(biāo)記的連接順 序關(guān)系。然而,由于某些字僅包括字頭和/或字尾,所以有時(shí)不存在被標(biāo)記 的節(jié)點(diǎn)序列。每個(gè)節(jié)點(diǎn)序列具有線性結(jié)構(gòu),該線性結(jié)構(gòu)不包含對(duì)于其他節(jié) 點(diǎn)序列的弧。字體數(shù)據(jù)被稱為"字體網(wǎng)絡(luò)"。
在圖6至8中示出的每個(gè)字的字體網(wǎng)絡(luò)的結(jié)構(gòu)中,開始側(cè)的矩形節(jié)點(diǎn)
(例如圖中的節(jié)點(diǎn)131)保持有可連接的字頭部分節(jié)點(diǎn)的標(biāo)識(shí)符hid,結(jié)尾 側(cè)的矩形節(jié)點(diǎn)(例如圖中的節(jié)點(diǎn)132)保持可連接的字尾部分節(jié)點(diǎn)的標(biāo)識(shí) 符tid。標(biāo)識(shí)符"wid"指示字的標(biāo)識(shí)符。開始側(cè)的虛線弧(例如圖中的弧 134)指示,在具有該弧保持的字標(biāo)識(shí)符wid (例如圖中的wid 133)的字 中,實(shí)現(xiàn)從字頭部分節(jié)點(diǎn)到"字體部分節(jié)點(diǎn)"(例如圖中的節(jié)點(diǎn)135)的 連接,其中所述字頭部分節(jié)點(diǎn)通過處于該弧的開始點(diǎn)的字體網(wǎng)絡(luò)(例如圖 中的節(jié)點(diǎn)131)的頭節(jié)點(diǎn)(hid保持節(jié)點(diǎn))保持的hid來(lái)指示,所迷"字體 部分節(jié)點(diǎn)"通過該弧的結(jié)尾點(diǎn)來(lái)指示。結(jié)尾側(cè)的虛線弧(例如圖中的弧136 ) 指示,在具有該弧保持的字標(biāo)識(shí)符wid (例如圖中的widl33)的字中,實(shí) 現(xiàn)了從該弧的開始點(diǎn)指示的字體部分節(jié)點(diǎn)(例如圖中的節(jié)點(diǎn)137)到字尾 部分節(jié)點(diǎn)的連接,所述字尾部分節(jié)點(diǎn)通過該弧的結(jié)尾點(diǎn)上的字體網(wǎng)絡(luò)(例 如圖中的節(jié)點(diǎn)132 )的尾節(jié)點(diǎn)(tid保持節(jié)點(diǎn))保持的tid來(lái)指示。通過兩 個(gè)弧(例如圖中的弧134和136)相夾的部分(例如圖中的節(jié)點(diǎn)135、弧 138和節(jié)點(diǎn)137 )是構(gòu)成字體網(wǎng)絡(luò)的標(biāo)記節(jié)點(diǎn)序列??墒褂霉?jié)點(diǎn)的標(biāo)識(shí)符tid
(未示出)來(lái)標(biāo)識(shí)字體網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)。
事實(shí)上,hid保持節(jié)點(diǎn)(例如圖中的131) 、 tid保持節(jié)點(diǎn)(例如圖中 的132)和以虛線指示的弧(例如圖中的134、 136)不僅是字體網(wǎng)絡(luò)的節(jié) 點(diǎn)和弧,還是與每個(gè)字的字體網(wǎng)絡(luò)關(guān)連的信息(數(shù)據(jù))。因此,可將它們 稱為"連接信息"(關(guān)于字頭部分節(jié)點(diǎn)/字尾部分節(jié)點(diǎn))。
在圖6至8中,圖6中舉例說明的詞匯網(wǎng)絡(luò)(1)表達(dá)"ka-nm-ta,,
(wid=l) 、 "ka-wa-sa-ki,, (wid=2 )和"chi-ga-sa-ki" (wid=3)。 圖7中舉例說明的詞匯網(wǎng)絡(luò)(2)表達(dá)"i-ki-sa-ki"(wicN4)、 "ka-ku-te-i"
(wid=5 )和"se-n畫ta畫ku" (widN6 )。圖8中舉例說明的詞匯網(wǎng)絡(luò)(3 )表達(dá)例如位置名稱"se-ta,, ( wid=7 )、 "a" (wicN8)和"n" (wid=9 )。這些是不存在字的字體部分節(jié)點(diǎn)的實(shí) 例(或字的所有標(biāo)記包含在字頭部分和/或字尾部分中)。由圖8的hid保 持節(jié)點(diǎn)(圖中的141)保持的標(biāo)識(shí)符"0"指示字頭部分的初始條件節(jié)點(diǎn)(頭 節(jié)點(diǎn)或路線節(jié)點(diǎn)),由圖8的tid保持節(jié)點(diǎn)(圖中的142 )保持的標(biāo)識(shí)符"0" 指示字尾部分的最終條件節(jié)點(diǎn)(尾節(jié)點(diǎn)或葉子節(jié)點(diǎn))。
圖5舉例說明了與圖6至8的實(shí)例對(duì)應(yīng)的字頭部分和字尾部分。
參照?qǐng)D5,對(duì)于字頭部分,該樹形結(jié)構(gòu)保持有對(duì)于圖6的詞匯網(wǎng)絡(luò)(1) 和圖7的詞匯網(wǎng)絡(luò)(2)共同的字頭處的KANA字母"ka"、對(duì)于圖7的 詞匯網(wǎng)絡(luò)(2)和圖8的詞匯網(wǎng)絡(luò)(3)共同的KANA字母"se"、以及包 含在三個(gè)詞匯網(wǎng)絡(luò)中的所有其他字的開頭字母。對(duì)于字尾部分,該樹形結(jié) 構(gòu)保持有詞匯網(wǎng)絡(luò)(1)和詞匯網(wǎng)絡(luò)(2)共同的KANA字母"ki"、以及 包含在三個(gè)詞匯網(wǎng)絡(luò)中的所有其他字的末尾字母。
在圖5的實(shí)例中,字頭部分節(jié)點(diǎn)和字尾部分節(jié)點(diǎn)的每個(gè)標(biāo)記的節(jié)點(diǎn)都 僅保持有KANA字母。然而,由標(biāo)記的節(jié)點(diǎn)保持的字母數(shù)量不限于一個(gè)字 母。例如,可以在字尾部分節(jié)點(diǎn)中保持兩個(gè)KANA字母的串"sa-ki"(即, 對(duì)于"ka-wa曙sa-ki" 、 "chi-ga畫sa-ki" 、 "i畫ki-sa-ki"共同的"sa-ki,,)。
接下來(lái),參考圖6至8,指示了詞匯網(wǎng)絡(luò)(1)中字標(biāo)識(shí)符wid^的字 體網(wǎng)絡(luò)的字體部分節(jié)點(diǎn)"ma",被連接至hid-3的字頭部分節(jié)點(diǎn)(圖5中 以"ka,,標(biāo)記的節(jié)點(diǎn))和tid=4的字尾部分節(jié)點(diǎn)(圖5中以"ta"標(biāo)記的 節(jié)點(diǎn))。因此,通過將該字體網(wǎng)絡(luò)連接至字頭部分節(jié)點(diǎn)和字尾部分節(jié)點(diǎn), 在語(yǔ)法網(wǎng)絡(luò)中記錄字"ka-ma-ta"。
由于如同詞匯網(wǎng)絡(luò)(3)的字那樣由兩個(gè)或更少的KANA字母組成的 字包含在字頭部分節(jié)點(diǎn)和/或字尾部分節(jié)點(diǎn)中,因此視情況而定,不存在字 體網(wǎng)絡(luò)的KANA字母。在這種情況下,每個(gè)字的字體網(wǎng)g是從字頭部分 的節(jié)點(diǎn)到字尾部分的節(jié)點(diǎn)的連接信息。例如,在wid=7的字的情況下,hid=4 的字頭部分節(jié)點(diǎn)(圖5中的"se")和tid=4的字尾部分節(jié)點(diǎn)(圖5中的"ta") 彼此直接連接,從而獲得字"se-ta"。在該實(shí)例中,每個(gè)節(jié)點(diǎn)具有單個(gè)KANA字母作為節(jié)點(diǎn)標(biāo)記。然而,該 節(jié)點(diǎn)不限于該實(shí)例,而是該節(jié)點(diǎn)標(biāo)記可以是單個(gè)KANA字母,或者比單個(gè) KANA字母更大的單元(例如字、字串等),或者比單個(gè)KANA字母更 小的單元(例如音素(phoneme) 、 HMM的狀態(tài)ID),或者將上述要素 混合。
接下來(lái),將描述通過對(duì)指示的詞匯實(shí)現(xiàn)所指示的操作(添加和刪除中 的任何一個(gè)),從語(yǔ)法框架、字頭部分、字尾部分和字體部分生成語(yǔ)法的 處理過程的實(shí)例。
現(xiàn)在將在參考圖9至11描述在該情況下的流程圖的實(shí)例。圖10示出 圖9中的步驟S15的添加例程的處理過程的實(shí)例,圖11示出圖9中的步驟 S16的刪除例程的處理過程的實(shí)例。
輸入了子網(wǎng)絡(luò)X (見圖4)、以及詞匯Xi和對(duì)該詞匯Xj的操作Aj的 組的列表(Xi, Aj 。這里,N是詞匯的數(shù)目,其中i=l,2,...N。
首先,如果對(duì)于初始詞匯操作,語(yǔ)法框架的子網(wǎng)絡(luò)是X-()),也就是如 杲對(duì)于X沒有字被記錄(步驟Sll),則執(zhí)行初始i殳置處理(步驟S12 )。 也就是在初始設(shè)置處理中,從子網(wǎng)絡(luò)X移除字頭部分的初始條件節(jié)點(diǎn)(圖 5中的101),作為替代,其被連接至語(yǔ)法框架的初始條件節(jié)點(diǎn)(圖4中的 81)。同時(shí),移除字尾部分的最終條件節(jié)點(diǎn)(圖5中的102),作為替代, 其被連接至語(yǔ)法框架的最終條件節(jié)點(diǎn)(圖4中的82 )。從而提供了兩個(gè)分 離的網(wǎng)絡(luò)。
圖12示出此時(shí)的語(yǔ)法框架的網(wǎng)絡(luò)結(jié)構(gòu)。圖12中以虛線指示的區(qū)域(圖 中的83)指示子網(wǎng)絡(luò)X。
為何如步驟S12的初始設(shè)置處理中所示,從X移除字頭部分的初始條 件節(jié)點(diǎn)和字尾部分的最終條件節(jié)點(diǎn),并將X連接至語(yǔ)法框架的初始M節(jié)
點(diǎn)和最終條件節(jié)點(diǎn)的原因是,在字頭部分和字尾部分連接時(shí),避免初始條 件節(jié)點(diǎn)和最終條件節(jié)點(diǎn)的交迭,并且不是必要的操作。
如果在步驟Sll中選擇否,則跳過步驟S12。
接下來(lái),在步驟S13, i被設(shè)置為l。此后,該處理被重復(fù)直到N個(gè)詞匯被全部處理。
首先,在步驟S14,確定對(duì)第i個(gè)詞匯Xj的操作Ai,并且在添加的情 況下,在步驟S15執(zhí)行添加例程。另一方面,在刪除的情況下,在步驟S16 執(zhí)行刪除例程。然后,除非在步驟S17中i = N,否則在步驟S18將i加l, 并且該過程返回至步驟S14,其中對(duì)下一個(gè)詞匯的操作被執(zhí)行。
最后,如果在步驟S17中i-N,則結(jié)束操作。
從而生成新的子網(wǎng)絡(luò)X。
接下來(lái),將描述圖10中所示的添加例程(圖9中的S15)。 在添加例程中,對(duì)屬于詞匯Xj的所有字的字體網(wǎng)絡(luò)(節(jié)點(diǎn)和弧結(jié)構(gòu))
執(zhí)行添加操作。這里,將屬于詞匯Xi的字的數(shù)目表示為Ni,并且將屬于詞
匯Xj的每個(gè)字表示為Wy (j-l, 2,…Ni)。
首先,在步驟S21,將j設(shè)置為l。此后,該處理被重復(fù),直到Ni個(gè)
字被全部處理。
在步驟S22,生成從字頭部分節(jié)點(diǎn)到對(duì)于字Wjj的頭節(jié)點(diǎn)的下一個(gè)節(jié) 點(diǎn)的弧,其中所述字頭部分節(jié)點(diǎn)具有第j個(gè)字Wjj的字體網(wǎng)絡(luò)的頭節(jié)點(diǎn)保 持的字頭部分標(biāo)識(shí)符hid。對(duì)所生成的弧分配由字體網(wǎng)絡(luò)保持的字標(biāo)識(shí)符 wid。
在步驟S23,生成從對(duì)于字Wij的字體網(wǎng)絡(luò)的尾節(jié)點(diǎn)的在前節(jié)點(diǎn)到字 尾部分節(jié)點(diǎn)的弧,其中所述字尾部分節(jié)點(diǎn)具有由尾節(jié)點(diǎn)保持的字尾部分標(biāo) 識(shí)符tid。
允許首先執(zhí)行步驟S22或步驟S23,或同時(shí)執(zhí)行它們。
然后,除非在步驟S24中j - N,否則在步驟S25將j加l,并且該過
程返回至步驟S22,其中對(duì)于下一個(gè)字的添加處理被執(zhí)行。 最后,如果在步驟S24中j-Nj,則結(jié)束該添加例程。 作為實(shí)例,圖13示出其中字"ka-wa-sa-ki" 、 "se-ta" 、 "a" 、 "n" (見圖6至8)被連接至字頭部分/字尾部分(見圖5)的情形下的語(yǔ)法框
架的網(wǎng)絡(luò)結(jié)構(gòu)。在圖13中,粗線(圖中的151至155)指示通過添加操作
生成的弧。接下來(lái),將描述圖11中所示的刪除例程(圖9中的步驟S16)。 在刪除例程中,對(duì)屬于詞匯Xi的所有字Wij的字體網(wǎng),行刪除操作。 首先,在步驟S31,將j設(shè)置為l。此后,該處理被重復(fù),直到Nj個(gè) 字被全部處理。
在步驟S32,刪除從字頭部分節(jié)點(diǎn)到對(duì)于字Wy的頭節(jié)點(diǎn)的下一個(gè)節(jié)
點(diǎn)的弧,其中所述字頭部分節(jié)點(diǎn)具有第j個(gè)字Wij的字體網(wǎng)絡(luò)的頭節(jié)點(diǎn)(hid
保持節(jié)點(diǎn))^呆持的字頭部分標(biāo)識(shí)符hid。
在步驟S33,刪除從對(duì)于字Wij的字體網(wǎng)絡(luò)的尾節(jié)點(diǎn)(tid保持節(jié)點(diǎn))
的在前節(jié)點(diǎn)到字尾部分節(jié)點(diǎn)的弧,其中所迷字尾部分節(jié)點(diǎn)具有字Wij的尾
節(jié)點(diǎn)保持的字尾部分標(biāo)識(shí)符tid。
允許首先執(zhí)行步驟S32或步驟S33,或同時(shí)執(zhí)行它們兩者。
然后,除非在步驟S34中j = N,否則在步驟S35將j加l,并且該過
程返回至步驟S32,其中對(duì)下一個(gè)字的刪除操作被執(zhí)行。 最后,如果在步驟S34中j-Nj,則結(jié)束該刪除例程。 通過上文描述的添加/刪除處理,語(yǔ)法框架的子網(wǎng)絡(luò)X被更新,并且基
于接下來(lái)的添加/刪除操作,對(duì)該更新的子網(wǎng)絡(luò)X的另外的添加/刪除操作
被執(zhí)行。
通過添加/刪除處理生成的語(yǔ)法框架被作為用于語(yǔ)音識(shí)別的語(yǔ)法網(wǎng)絡(luò) 記錄到語(yǔ)音識(shí)別單元13中。語(yǔ)音識(shí)別單元13使用該語(yǔ)法網(wǎng)絡(luò)在輸入的語(yǔ) 音上執(zhí)行語(yǔ)音識(shí)別。盡管這里省略了相關(guān)描述,但是使用語(yǔ)法網(wǎng)絡(luò)進(jìn)行語(yǔ) 音識(shí)別的具體方法詳細(xì)地公開在Stephen E. Levinson: "Structural Methods in Automatic Speech Recognition" , IEEE ^i義錄的73巻,No.ll, 第1625 - 1650頁(yè),1985年11月。
如果在圖6至8的實(shí)例中僅使用詞匯網(wǎng)絡(luò)(1)和詞匯網(wǎng)絡(luò)(2),則 在沒有初始條件節(jié)點(diǎn)101的情況下不存在連接到圖5中的字頭部分節(jié)點(diǎn)'V, 的任何節(jié)點(diǎn),并且在沒有最終條件節(jié)點(diǎn)102的情況下不存在連接到圖5中 的字尾部分節(jié)點(diǎn)"n"的任何節(jié)點(diǎn)(當(dāng)使用詞匯網(wǎng)絡(luò)(3)時(shí),節(jié)點(diǎn)"a"和 節(jié)點(diǎn)"n"是必要的)。顯然,依據(jù)詞匯的組合,如果從該節(jié)點(diǎn)相繼追蹤到子/雙親節(jié)點(diǎn),則存在某些不能到達(dá)字體網(wǎng)絡(luò)的節(jié)點(diǎn)的節(jié)點(diǎn)。這樣的節(jié)點(diǎn)在 語(yǔ)音識(shí)別時(shí)是不必要的節(jié)點(diǎn),因此字頭部分節(jié)點(diǎn)/字尾部分節(jié)點(diǎn)的每個(gè)節(jié)點(diǎn)
被提供標(biāo)記符(flag),標(biāo)記符指示其對(duì)于語(yǔ)音識(shí)別是否是必要的,并且 對(duì)于語(yǔ)音識(shí)別是必要的節(jié)點(diǎn)被設(shè)置為1,而不必要的節(jié)點(diǎn)被設(shè)置為0。然后, 在語(yǔ)音識(shí)別時(shí),僅標(biāo)記符被設(shè)置為1的節(jié)點(diǎn)可被使用。
通過使用上述字頭部分和字尾部分,復(fù)數(shù)個(gè)詞匯的共同部分被合并, 而每個(gè)詞匯僅保持有字體部分。因此,與傳統(tǒng)方法相比,可以減少存儲(chǔ)詞
匯所需的存儲(chǔ)容量。
通過僅將字體連接至合適的字頭/字尾來(lái)執(zhí)行詞匯的添加,并通過僅斷 開字頭/字尾和字體之間的連接來(lái)執(zhí)行詞匯的刪除。因此,相對(duì)快速的詞匯 添加和刪除是可能的。
在該實(shí)施例中,給出了優(yōu)選方式用以闡明基本特性而不是表明存儲(chǔ)減 少的效果,并且作為特定的實(shí)例,描述了字的數(shù)目較小并且字頭部分和字 尾部分兩者都具有單個(gè)KANA字母的筒單實(shí)例。不必說的是,如杲詞匯中 字的數(shù)目增加或者由字頭部分/字尾部分共享的字符數(shù)目增加,則存儲(chǔ)減少 的效果將明顯地顯現(xiàn)。
如上文所述,該實(shí)施例實(shí)現(xiàn)了快速的詞匯添加/刪除操作,并同時(shí)實(shí)現(xiàn) 了在詞匯網(wǎng)絡(luò)之間合并(以減少必要的存儲(chǔ)容量)。 (第二實(shí)施例)
下文中,將圍繞不同于第一實(shí)施例的主要點(diǎn)來(lái)描述第二實(shí)施例。 該實(shí)施例與第一實(shí)施例的不同在于,不需要擁有任何作為獨(dú)立數(shù)據(jù)的 語(yǔ)法4匡架。
在筒單句型的情況下,在該簡(jiǎn)單句型中語(yǔ)法框架僅包^(口同第一實(shí)施 例那樣的子網(wǎng)絡(luò)X,語(yǔ)法框架不需要被存儲(chǔ)在語(yǔ)法存儲(chǔ)單元11中。就是說, 顯然從上述描迷中,即使語(yǔ)法框架沒有被存儲(chǔ)為數(shù)據(jù),通過直接對(duì)字頭部 分/字尾部分添加/刪除詞匯來(lái)生成語(yǔ)法網(wǎng)絡(luò),可獲得與使用語(yǔ)法框架時(shí)相同 的語(yǔ)法網(wǎng)絡(luò)。通過與圖9至11中相同的處理過程來(lái)實(shí)現(xiàn)詞匯的添加/刪除。
才艮據(jù)該實(shí)施例,可建立像第一實(shí)施例那樣的語(yǔ)法網(wǎng)絡(luò),并且可獲得與第一實(shí)施例相同的效果。 (第三實(shí)施例)
下文中,將圍繞與第一實(shí)施例的主要不同點(diǎn)描述第三實(shí)施例。 盡管圍繞存在單獨(dú)的用于操作詞匯的子網(wǎng)絡(luò)的實(shí)例描述了第一實(shí)施
例,但是還可圍繞使用包含復(fù)數(shù)個(gè)子網(wǎng)絡(luò)的語(yǔ)法框架的情況來(lái)描述該實(shí)施例。
圖14示出包含復(fù)數(shù)個(gè)子網(wǎng)絡(luò)的語(yǔ)法框架的實(shí)例。圖14是表達(dá) "X-no-Y" Uo)句型的語(yǔ)法框架的實(shí)例。該實(shí)例也是包含詞匯固定節(jié)點(diǎn) 的實(shí)例。
在圖14中,頭節(jié)點(diǎn)(圖中的161)指示初始條件節(jié)點(diǎn),尾節(jié)點(diǎn)(圖中 的162)指示最終條件節(jié)點(diǎn)。X (圖中的163)和Y (圖中的165)是子網(wǎng) 絡(luò)。就是il該語(yǔ)法框架指示在子網(wǎng)絡(luò)X和Y中的每一個(gè)設(shè)置詞匯。用"no" 標(biāo)記的節(jié)點(diǎn)(圖中的164)是詞匯固定節(jié)點(diǎn),并且該實(shí)例指示X和Y與節(jié) 點(diǎn)"no"連接。
在圖14的情況下,語(yǔ)法編輯單元12對(duì)子網(wǎng)絡(luò)X和子網(wǎng)絡(luò)Y的每個(gè)執(zhí) 糊匯操作(添加操作/刪除操作)。
關(guān)于字頭部分,該實(shí)施例需要一個(gè)或更多字頭部分用于X,以及一個(gè) 或更多字頭部分用于Y。同樣,關(guān)于字尾部分,需要一個(gè)或更多字尾部分 用于X,以及一個(gè)或更多字尾部分用于Y。用于X/Y的字頭部分/字尾部分 的配置可以與圖5中的相同,并且他們中的每個(gè)都是網(wǎng)絡(luò)的一部分,所述 網(wǎng)絡(luò)包含對(duì)于兩個(gè)或更多詞匯共同的字頭/字尾。
對(duì)于字體部分,存在對(duì)圖6至8增加的特征。即,用于使用的詞匯包 括在子網(wǎng)絡(luò)X和Y兩者中使用的詞匯,以及僅在X和Y中的任一個(gè)中使 用的詞匯。因此,根據(jù)該實(shí)施例,表示字體部分的每個(gè)字的字體網(wǎng)絡(luò)的頭 節(jié)點(diǎn)/尾節(jié)點(diǎn),都需要保持有像笫一實(shí)施例那樣的可連接的字頭部分節(jié)點(diǎn)的 標(biāo)識(shí)符hid/可連接的字尾部分節(jié)點(diǎn)的標(biāo)識(shí)符tid,以及額外地保持有用于標(biāo) 識(shí)其可,皮連接到的子網(wǎng)絡(luò)的標(biāo)識(shí)信息(sid)。
如果某個(gè)詞匯可用于圖14的實(shí)例中的子網(wǎng)絡(luò)X和Y兩者,則其指示關(guān)于字頭部分/字尾部分的連接的頭節(jié)點(diǎn)/尾節(jié)點(diǎn),保持有在用于子網(wǎng)絡(luò)X
時(shí)可被連接的字頭部分節(jié)點(diǎn)的標(biāo)識(shí)符hid和字尾部分節(jié)點(diǎn)的標(biāo)識(shí)符tid兩者
/在用于子網(wǎng)絡(luò)Y時(shí)可被連接的字尾部分節(jié)點(diǎn)的標(biāo)識(shí)符tid和字頭部分節(jié)點(diǎn) 的標(biāo)識(shí)符hid。
圖15示出這種情況的字體網(wǎng)絡(luò)的字結(jié)構(gòu)的實(shí)例。
圖15的實(shí)例示出如果該字體網(wǎng)絡(luò)用于子網(wǎng)絡(luò)X,則連接hid二5的字頭 部分節(jié)點(diǎn)和tid=2的字尾部分節(jié)點(diǎn),并且如果其用于子網(wǎng)絡(luò)Y,則連接hid=3 的字頭部分節(jié)點(diǎn)和ticH4的字尾部分節(jié)點(diǎn)(圖中的171、 172)。
語(yǔ)法編輯單元12的語(yǔ)法生成過程需要包括詞匯、將被連接的子網(wǎng)絡(luò) (在該實(shí)例中X或Y)和操作{詞匯、連接子網(wǎng)絡(luò)、^^乍}三者的組,而不 是圖9至11中所迷的詞匯和操作的組。
接下來(lái),將描述通過對(duì)所指示的詞匯執(zhí)行所指示的操作(添加和刪除 中的任一個(gè)),從語(yǔ)法框架、字頭部分、字尾部分和字體部分生成語(yǔ)法和 連接子網(wǎng)絡(luò)的處理過程。
現(xiàn)在描述在參考圖16至18的這種情況下的流程圖的實(shí)例。圖17示出 用于圖16的步驟S115的添加例程的處理過程的實(shí)例,圖18示出圖16的 步驟S116的刪除例程的處理過程的實(shí)例。
輸入子網(wǎng)絡(luò)X、 Y (見圖14),以及詞匯Xj、詞匯應(yīng)該凈皮連接到的子 網(wǎng)絡(luò)Si和對(duì)詞匯Xi的搮作Aj的組的列表(Xi, Si, AJ 。這里,N是詞匯 的數(shù)目,其中i-l,2,…N。
圖16的流程基本與圖9的流程相同。然而,步驟S112的初始設(shè)置處 理如下。在圖14的實(shí)例中,對(duì)于子網(wǎng)絡(luò)X,從中移除字頭部分的初始M 節(jié)點(diǎn),作為替代,語(yǔ)法框架的初始條件節(jié)點(diǎn)(圖14中的161)被連接到那 里。同時(shí),移除字尾部分的最終^Hf節(jié)點(diǎn),作為替代,語(yǔ)法框架的詞匯固 定節(jié)點(diǎn)(圖14中的164)被連接。同樣,對(duì)于子網(wǎng)絡(luò)Y,從中移除字頭部 分的初始條件節(jié)點(diǎn),作為替代,語(yǔ)法框架的詞匯固定節(jié)點(diǎn)被連接。同時(shí), 移除字尾部分的最終條件節(jié)點(diǎn),作為替代,語(yǔ)法框架的最終條件節(jié)點(diǎn)(圖 14中的162)被連接。當(dāng)然,像第一實(shí)施例那樣,該操作不是必要的操作。接下來(lái),將描述圖17中所示的添加例程(圖16中的S115)。 圖17中的添加例程基本與圖10的添加例程相同。在圖17的添加例程 中,對(duì)通過復(fù)數(shù)個(gè)子網(wǎng)絡(luò)Si指示的子網(wǎng)絡(luò)執(zhí)行添加操作。
接下來(lái),將描述圖18中所示的刪除例程(圖16中的S116)。 圖18的刪除例程基本與圖11的刪除例程相同。然而,圖18的刪除例 程對(duì)通過復(fù)數(shù)個(gè)子網(wǎng)絡(luò)Si指定的子網(wǎng),行刪除操作。
顯然從上述描述,在使用存在復(fù)數(shù)個(gè)子網(wǎng)絡(luò)的語(yǔ)法框架的情況下,以 及在使用存在單個(gè)子網(wǎng)絡(luò)的語(yǔ)法框架的情況下,都可以以極好的存儲(chǔ)器效 率快速生成語(yǔ)法網(wǎng)絡(luò)。此外,在提供了復(fù)數(shù)個(gè)語(yǔ)法框架的情況下可完成相 同的事件,并且在這種情況下顯然可獲得相同的效果。
由于該實(shí)施例的語(yǔ)法是簡(jiǎn)單句型"X-no-Y",所以像第二實(shí)施例那樣, 語(yǔ)法框架不需要被存儲(chǔ)到語(yǔ)法存儲(chǔ)單元11中。如果沒有提供語(yǔ)法框架作為 獨(dú)立數(shù)據(jù),則在通過語(yǔ)法編輯單元12根據(jù)圖16至18的處理過程生成X 和Y的每個(gè)之后,在子網(wǎng)絡(luò)X和子網(wǎng)絡(luò)Y之間插入表示KANA字母"no" 的詞匯固定節(jié)點(diǎn),以便生成語(yǔ)法網(wǎng)絡(luò)。在能夠有規(guī)律地生成語(yǔ)法網(wǎng)絡(luò)的情 況下,語(yǔ)法框架是不必要的。 (第四實(shí)施例)
下文中,將圍繞與第一至第三實(shí)施例的主要不同點(diǎn)描述第四實(shí)施例。 通常,對(duì)于語(yǔ)音識(shí)別,樹形結(jié)構(gòu)是特定的一個(gè)其經(jīng)常被用作詞匯網(wǎng)絡(luò)。 在使用樹形結(jié)構(gòu)網(wǎng)絡(luò)的情況下,構(gòu)成詞匯網(wǎng)絡(luò)使得對(duì)于復(fù)數(shù)個(gè)字共同的字 頭被共享,但是不共享字尾。這種情況下,字尾部分是不必要的。通過從 該字或句子移除字頭(字頭側(cè)部分),來(lái)得到包含在詞匯中的單獨(dú)的字或 句子的字體。
圖19至22示出以樹形結(jié)構(gòu)網(wǎng)絡(luò)實(shí)現(xiàn)圖5至8的詞匯的實(shí)例。圖19 示出字頭部分的實(shí)例,圖20至22示出詞匯網(wǎng)絡(luò)的實(shí)例。在圖19至22的 實(shí)例中,與圖5至8的實(shí)例相比,沒有字尾部分,作為替代,字體的尾部 被連接至最終條件節(jié)點(diǎn)(圖中的181)。
語(yǔ)法框架可以與上述實(shí)施例中的相同(見圖4和14)。如果使用了樹形結(jié)構(gòu),如果在上述實(shí)施例中取消對(duì)字尾部分的操作,
則顯然語(yǔ)法編輯單元12可通過相同的處理來(lái)生成語(yǔ)法。更具體地,可以通 過從上述實(shí)施例的流程圖移除對(duì)字尾部分的操作(圖10的步驟S23/圖11 中的步驟S33,圖17中的步驟S123/圖18中的步驟S133),來(lái)獲得操作 詞匯的流程圖。
而且,如果語(yǔ)法框架是像上述各實(shí)施例那樣的簡(jiǎn)單句型,則沒有語(yǔ)法 框架需要被存儲(chǔ)在語(yǔ)法存儲(chǔ)單元ll中。
在傳浙形結(jié)構(gòu)那樣沒有提供字尾部分的情況下,可通過共享字頭來(lái)獲 得與上述各實(shí)施例相同的存儲(chǔ)減少的效果。 (第五實(shí)施例)
下文中,將圍繞與第一至笫四實(shí)施例的主要不同點(diǎn)描迷第五實(shí)施例。 盡管在上述實(shí)施例中,描述了詞匯網(wǎng)絡(luò)的節(jié)點(diǎn)標(biāo)記是單個(gè)KANA字母 的實(shí)例,但是節(jié)點(diǎn)標(biāo)記不限于該實(shí)例,節(jié)點(diǎn)標(biāo)記可以是單個(gè)KANA字母, 或者比單個(gè)KANA字母更大的單元(例如字、字串等),或者比單個(gè)KANA 字母更小的單元(例如音素、HMM的狀態(tài)ID)。
這里,將描述在上述各實(shí)施例中詞匯網(wǎng)絡(luò)的節(jié)點(diǎn)處于HMM狀態(tài)的情況。
實(shí)際上,詞匯網(wǎng)絡(luò)和語(yǔ)法網(wǎng)絡(luò)通常由隱馬爾可夫模型(HMM)構(gòu)成。 根據(jù)通常使用的方法,字由音素HMM接合點(diǎn)(joint)構(gòu)成,并且語(yǔ)法網(wǎng) 絡(luò)的每個(gè)節(jié)點(diǎn)指示音素HMM的狀態(tài)。更具體地,這一點(diǎn)已經(jīng)在例如 "Lawrence Rabiner, Biing國(guó)Hwang Jauang: 'Fundamentals of Speech Recognition* , Prentice Hall International Editions, 1993"中公開。
如果在笫一至第四實(shí)施例中使用上述網(wǎng)絡(luò),則其操作本質(zhì)上沒有不同 于以上描述,并且在以上描述中,用音素HMM的狀態(tài)而非KANA字母 代替節(jié)點(diǎn)標(biāo)記。因此,根據(jù)該實(shí)施例,像上述實(shí)施例那樣構(gòu)成字頭部分/ 字尾部分和字體部分,從而可有效地執(zhí)行詞匯的添加/刪除。 (第六實(shí)施例)
下文中,將圍繞與第一至第五實(shí)施例的主要不同點(diǎn)描述第六實(shí)施例。在以上實(shí)施例中,字頭部分/字尾部分被預(yù)先指定和固定。
當(dāng)用戶實(shí)際使用具有笫一實(shí)施例的語(yǔ)法框架的語(yǔ)音識(shí)別設(shè)備時(shí),假設(shè)
用戶A經(jīng)常使用子網(wǎng)絡(luò)X由詞匯X1和詞匯X2構(gòu)成的情形,而用戶B經(jīng) 常使用子網(wǎng)絡(luò)X由詞匯X3、詞匯X4和詞匯X5構(gòu)成的情形。在這種情況 下,如果用戶A使用字頭部分/字尾部分,其中適用于詞匯XI和詞匯X2 的節(jié)點(diǎn)凈皮共享,而用戶B^f吏用字頭部分/字尾部分,其中適用于詞匯X3、 詞匯X4和詞匯X5的節(jié)點(diǎn)被共享,而不是像現(xiàn)在那樣使用預(yù)先提供的字頭 部分/字尾部分,則可提高字頭部分/字尾部分的存儲(chǔ)效率。
除了上文提及的實(shí)例之外,通過將字頭部分/字尾部分的節(jié)點(diǎn)的共享更 新為適用于所需要的使用的詞匯,可進(jìn)一步提高存儲(chǔ)效率,而不是像現(xiàn)在 那樣使用固定的字頭部分/字尾部分。在該實(shí)施例中,將描述字頭部分/字尾 部分的更新方法。可在適當(dāng)?shù)臅r(shí)間自動(dòng)進(jìn)行字頭部分/字尾部分的更新處 理,例如,在用戶對(duì)語(yǔ)音識(shí)別設(shè)備直接給出更新指令或在語(yǔ)音識(shí)別設(shè)備進(jìn) 入特定的務(wù)降時(shí)。
該實(shí)施例的語(yǔ)音識(shí)別設(shè)備的配置與圖1中的相同。
圖23示出該實(shí)施例的語(yǔ)法編輯單元12的內(nèi)部配置的實(shí)例。在具有圖 2的結(jié)構(gòu)的該實(shí)施例的語(yǔ)法編輯單元12中,語(yǔ)法網(wǎng)絡(luò)生成單元122還包括 更新單元1223。
下文中,將描述在更新單元1223中更新字頭部分的處理過程的實(shí)例。 圖24至26示出在這種情況下的流程圖的實(shí)例。圖25示出圖24的步驟S217 的合并例程的處理過程的實(shí)例,圖26示出圖25的步驟S224的合并執(zhí)行例 程的處理過程的實(shí)例。
作為執(zhí)行該處理的前提,假設(shè)語(yǔ)音框架的子網(wǎng)絡(luò)X為空(X^小),即 詞匯械/沒置。此外,對(duì)于字頭部分,假^L初始條件節(jié)點(diǎn)的字頭部分節(jié)點(diǎn)標(biāo) 識(shí)符hid為0,以從1開始的序號(hào),對(duì)除了初始務(wù)ft節(jié)點(diǎn)中的之外的字頭 部分的每個(gè)節(jié)點(diǎn)分配標(biāo)識(shí)符hid。同樣,對(duì)于字尾部分,假設(shè)最終條件節(jié) 點(diǎn)的字尾部分節(jié)點(diǎn)標(biāo)識(shí)符tid為0,以從1開始的序號(hào),對(duì)除了初始條件中 的之外的字尾部分的每個(gè)節(jié)點(diǎn)分配標(biāo)識(shí)符tid。在圖24的處理過程中,輸入子網(wǎng)絡(luò)。
首先在步驟S211,在BAG中記錄連接到字體部分的節(jié)點(diǎn),即該子網(wǎng) 絡(luò)的字頭部分的節(jié)點(diǎn)。這里,可以從連接信息獲得與字體部分連接的節(jié)點(diǎn), 所述連接信息關(guān)于屬于與子網(wǎng)絡(luò)連接的字體部分的每個(gè)字的字頭部分。
此后,重復(fù)該處理,直到記錄在BAG中的所有節(jié)點(diǎn)都#>處理(即, 直到在步驟S218中BAG變?yōu)榭?())))。
首先,在步驟S212,從BAG選出4壬意的節(jié)點(diǎn)V。
接下來(lái),在步驟S213,獲得選出的節(jié)點(diǎn)V的所有孩子節(jié)點(diǎn),并且它們 被看作集合C。在步驟S214,確定C是否為空。除非C為空,否則過程 進(jìn)行到步驟S215,其中從C選出任意節(jié)點(diǎn)n。在步驟S216,通過輸入的 節(jié)點(diǎn)V、集合C和節(jié)點(diǎn)n,執(zhí)行隨后描述的合并例程。通過合并例程更新 集合C。在步驟S217,如果存在通過合并例程新生成的節(jié)點(diǎn)x,則將其添 加至BAG,并且該過程返回至步驟S214。
在步驟S218,檢查BAG,并且除非BAG-小,否則該過程返回至步驟 S212,其中對(duì)下一個(gè)節(jié)點(diǎn)V的操作被執(zhí)行。最后,如果在步驟S218中BAG=(|),則結(jié)束該字頭部分的更新處理。
從實(shí)際應(yīng)用的角度,如果在步驟S216中處理被重復(fù)直到BAG變?yōu)榭眨?則花費(fèi)大量的時(shí)間,從而產(chǎn)生用戶在該段時(shí)間不能使用語(yǔ)音識(shí)別設(shè)備的不 便。為此,作為步驟S218的停止條件,允許使用如果從步驟S212至步驟 S217的處理^_過預(yù)定時(shí)間地重復(fù),則即使BAG不為空也終止處理的條 件,或者如果在開始字頭部分的更新處理之后經(jīng)過X或更多秒,則即使 BAG不為空(()))也終止該處理的M。
接下來(lái),將描述圖25中所示的合并例程(圖24的步驟S327)。
在圖25的處理過程中,輸入節(jié)點(diǎn)V、節(jié)點(diǎn)集合C和節(jié)點(diǎn)n。
首先,在步驟S221,假設(shè)X是具有與C中的n相同的節(jié)點(diǎn)標(biāo)記的所 有節(jié)點(diǎn)的集合,從而
S—{n}+X
C —c一x如果在步驟S222,不存在具有與節(jié)點(diǎn)n相同的節(jié)點(diǎn)標(biāo)記的節(jié)點(diǎn),即, S = {n},則過程進(jìn)行到步驟S223。在步驟S223,通過輸出x,建立指示沒 有節(jié)點(diǎn)存在的小。
如果在步驟S222中,S^Mn),即存在具有與n相同的節(jié)點(diǎn)標(biāo)記的節(jié)點(diǎn), 則過程進(jìn)行到步驟S224。在步驟S224,執(zhí)行合并執(zhí)行例程,并且作為其 輸出,獲得節(jié)點(diǎn)x。
接下來(lái),將說明合并執(zhí)行例程(圖25的步驟S224 )。
在圖26的處理過程中,在步驟S231,生成字頭部分的節(jié)點(diǎn)x,并生成 對(duì)于從節(jié)點(diǎn)組S的雙親節(jié)點(diǎn)V到x的弧。在步驟S231,將節(jié)點(diǎn)x的節(jié)點(diǎn)標(biāo) 識(shí)符hid設(shè)置為字頭部分的節(jié)點(diǎn)數(shù)目+1。
此后,該處理被重復(fù),直到S的所有節(jié)點(diǎn)被處理(即,直到在步驟S236 中S變?yōu)榭?小))。
首先,在步驟S232,從S選出任意節(jié)點(diǎn)y。由于V是字頭部分的節(jié)點(diǎn), 并且y是某個(gè)字的字體網(wǎng)絡(luò)的節(jié)點(diǎn),所以從V到y(tǒng)的弧具有像圖13中以 粗線指示的弧(圖13中的151至155)那樣的字標(biāo)識(shí)符wid。因此,可通 過該字標(biāo)識(shí)符wid獲得該字的字體網(wǎng)絡(luò)。該節(jié)點(diǎn)y是處于該字的字體網(wǎng)絡(luò) 的標(biāo)記節(jié)點(diǎn)序列的頭部的標(biāo)記節(jié)點(diǎn)(例如圖6中的135)。
接下來(lái),在步驟S233,刪除從V到y(tǒng)的弧,并通過參考由該弧保持的 字標(biāo)識(shí)符wid,獲得該字的字體網(wǎng)絡(luò)。
接下來(lái),在步驟S234,刪除處于字體網(wǎng)絡(luò)的標(biāo)記節(jié)點(diǎn)序列的頭部的標(biāo) 記節(jié)點(diǎn)y。
然后,在步驟S235,更新關(guān)于字的字頭部分的連接信息。就是說,如 果在字體部分中存在節(jié)點(diǎn)y的孩子節(jié)點(diǎn),則對(duì)于關(guān)于字體網(wǎng)絡(luò)的字頭部分 的連接信息,將從字頭部分的連接改變?yōu)閺男鹿?jié)點(diǎn)x到節(jié)點(diǎn)y (例如圖6 中的135)的孩子節(jié)點(diǎn)(例如圖6中的137)的連接。除非字體中存在節(jié)點(diǎn) y的孩子節(jié)點(diǎn)(即,如果字體只有y),否則通過參考關(guān)于字體網(wǎng)絡(luò)的字尾 部分的連接信息,更新關(guān)于字尾部分的連接信息,使得新節(jié)點(diǎn)x被直接連 接到字尾部分(見圖8的詞匯網(wǎng)絡(luò)(3)的"se-ta")。除非在步驟S236中S = (|),否則過程返回至步驟S232,其中對(duì)下一個(gè) 節(jié)點(diǎn)的處理,支執(zhí)行。
最后,如果在步驟S236中S - ((>,則結(jié)束該合并執(zhí)行例程。
因此,對(duì)于字體部分,具有相同節(jié)點(diǎn)標(biāo)記的節(jié)點(diǎn)被合并并組合為字頭 部分的節(jié)點(diǎn)(在步驟S231中的節(jié)點(diǎn)x),從而提高存儲(chǔ)效率。
盡管上文提及的處理是對(duì)于單個(gè)子網(wǎng)絡(luò)的處理,但是如果存在多個(gè)子 網(wǎng)絡(luò),可對(duì)每個(gè)子網(wǎng)g行相同的處理。
提到執(zhí)行字頭部分的更新的時(shí)間,當(dāng)在子網(wǎng)絡(luò)中設(shè)置了具有高可用性 的詞匯的組合時(shí),優(yōu)選地更新字頭部分。然后,允許在語(yǔ)法編輯單元12 中記錄對(duì)于每個(gè)子網(wǎng)絡(luò)的詞匯的組合和使用的頻率,并當(dāng)某個(gè)子網(wǎng)絡(luò)中的 詞匯的組合超過預(yù)定次數(shù)時(shí),更新字頭部分。
盡管上迷處理是對(duì)于字頭部分的更新處理,但是顯然可對(duì)字尾部分采 用相同的更新處理,并省略其詳細(xì)描述。
根據(jù)該實(shí)施例,通過根據(jù)需要優(yōu)化字頭部分/字尾部分,可實(shí)現(xiàn)更有效 的網(wǎng)絡(luò)。
(笫七實(shí)施例)
下文中,將圍繞與第六實(shí)施例的主要不同點(diǎn)描迷第七實(shí)施例。 顯然從第六實(shí)施例中所示的更新處理過程,可以僅從字頭部分/字尾部 分的初始條件/最終條件開始更新處理過程,以便通過該更新處理生成字頭 部分/字尾部分。由于字頭部分/字尾部分不需要^皮預(yù)先創(chuàng)建,所以該方法是 便利的。
該語(yǔ)音識(shí)別設(shè)備可通過使用通用計(jì)算機(jī)作為基本硬件來(lái)實(shí)現(xiàn)。就是說, 可通過使加載在計(jì)算機(jī)單元上的處理器執(zhí)行程序,來(lái)實(shí)現(xiàn)語(yǔ)法編輯單元和 語(yǔ)音識(shí)別單元。此時(shí),可通過在計(jì)算機(jī)上安裝程序或通過在例如CD-ROM 的存儲(chǔ)介質(zhì)中存儲(chǔ)該程序,然后經(jīng)過網(wǎng)絡(luò)分發(fā)該程序并在計(jì)算機(jī)單元上適 當(dāng)?shù)匕惭b該程序,來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別設(shè)備??墒褂弥T如在內(nèi)部安裝的或與計(jì) 算機(jī)單元、硬盤、CD-R、 CD-RW、 DVD-RAM和DVD-R適當(dāng)?shù)赝獠窟B 接的存儲(chǔ)器的存儲(chǔ)介質(zhì),來(lái)實(shí)現(xiàn)語(yǔ)法存儲(chǔ)單元ll。對(duì)于本領(lǐng)域普通技術(shù)人員,容易實(shí)現(xiàn)其他優(yōu)點(diǎn)和修改。因此,本發(fā)明 在其更廣泛的方面不限于這里所示和描述的特定的細(xì)節(jié)和代表的實(shí)施例。 因此,在不背離通過所附權(quán)利要求及其等同物限定的發(fā)明總體概念的精神 或范圍的情況下,可以進(jìn)行各種修改。
權(quán)利要求
1.一種使用提供一組識(shí)別目標(biāo)字或句子的語(yǔ)法網(wǎng)絡(luò)的語(yǔ)音識(shí)別設(shè)備,包括存儲(chǔ)單元,被配置為存儲(chǔ)多個(gè)詞匯,每個(gè)所述詞匯包括多個(gè)字體數(shù)據(jù),通過從任意字或句子移除特定的字頭來(lái)獲得每個(gè)所述字體數(shù)據(jù),以及存儲(chǔ)至少一個(gè)包括多個(gè)被標(biāo)記的節(jié)點(diǎn)的字頭部分,以便表示至少一個(gè)共同字頭,所述共同字頭對(duì)于所述多個(gè)詞匯中的至少兩個(gè)是共同的;指令接收單元,被配置為接收第一指令,用于從所述多個(gè)詞匯選擇目標(biāo)詞匯,以及第二指令,用于指示對(duì)所述目標(biāo)詞匯的操作的內(nèi)容;語(yǔ)法網(wǎng)絡(luò)生成單元,被配置為當(dāng)通過所述第一指令指示用于添加所述目標(biāo)詞匯的處理時(shí),生成包含所述字頭部分、通過所述第二指令選擇的所述目標(biāo)詞匯以及字頭部分側(cè)連接信息的語(yǔ)法網(wǎng)絡(luò),所述字頭部分側(cè)連接信息指示包含在所述目標(biāo)詞匯中的每個(gè)所述多個(gè)字體數(shù)據(jù),被連接至包含在所述字頭部分中的所述多個(gè)被標(biāo)記的節(jié)點(diǎn)中的預(yù)先匹配的一個(gè);以及語(yǔ)音識(shí)別單元,被配置為使用所生成的語(yǔ)法網(wǎng)絡(luò)執(zhí)行語(yǔ)音識(shí)別。
2. 才艮據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別設(shè)備,其中當(dāng)指示用于刪除所述 目標(biāo)詞匯的處理時(shí),所述語(yǔ)法網(wǎng)絡(luò)生成單元從所述語(yǔ)法網(wǎng)絡(luò)刪除所述目標(biāo) 詞匯以;Sj t應(yīng)于所述目標(biāo)詞匯的所述字頭部分側(cè)連接信息。
3. 根據(jù)權(quán)利要求2所迷的語(yǔ)音識(shí)別設(shè)備,其中每個(gè)所述字體數(shù)據(jù)由 包含被標(biāo)記的節(jié)點(diǎn)序列的網(wǎng)絡(luò)構(gòu)成,以及所述語(yǔ)音識(shí)別設(shè)備還包括更新單元,被配置為更新所述字頭部分,以 便減少包含在兩個(gè)或更多所述字體數(shù)據(jù)中的被標(biāo)記的節(jié)點(diǎn)的數(shù)量,以及更 新所述兩個(gè)或更多所述字體數(shù)據(jù),以便適合于更新的字頭部分。
4. 根據(jù)權(quán)利要求3所述的語(yǔ)音識(shí)別設(shè)備,其中所述字頭部分由包含 帶有充當(dāng)路線節(jié)點(diǎn)的初始條件節(jié)點(diǎn)的所述標(biāo)記的節(jié)點(diǎn)的網(wǎng)絡(luò)構(gòu)成;以及以僅包含所述初始條件節(jié)點(diǎn)的所述字頭部分的初始條件,執(zhí)行所述字 頭部分的更新和所述字體數(shù)據(jù)的更新。
5,根據(jù)權(quán)利要求2所述的語(yǔ)音識(shí)別設(shè)備,其中所述存儲(chǔ)單元還存儲(chǔ) 語(yǔ)法框架,所述語(yǔ)法框架是所述語(yǔ)法網(wǎng)絡(luò)的模型,其限定在所迷語(yǔ)法網(wǎng)絡(luò) 中詞匯是可變的那些部分中的至少一個(gè),以及所述語(yǔ)法網(wǎng)絡(luò)生成單元通過用作模型的所迷語(yǔ)法框架生成所述語(yǔ)法網(wǎng)絡(luò)。
6. 根據(jù)權(quán)利要求5所述的語(yǔ)音識(shí)別設(shè)備,其中每個(gè)所述字體數(shù)據(jù)由 包含被標(biāo)記的節(jié)點(diǎn)序列的網(wǎng)絡(luò)構(gòu)成;以及所述語(yǔ)音識(shí)別設(shè)備還包括更新單元,被配置為更新所述字頭部分,以 減少包含在兩個(gè)或更多所述字體數(shù)據(jù)中的被標(biāo)記的節(jié)點(diǎn)的數(shù)量,以及更新 所述兩個(gè)或更多所述字體數(shù)據(jù),以適合于更新的字頭部分。
7. 根據(jù)權(quán)利要求6所述的語(yǔ)音識(shí)別設(shè)備,其中所述字頭部分由包含 所述被標(biāo)記的節(jié)點(diǎn)的網(wǎng)絡(luò)構(gòu)成,所述被標(biāo)記的節(jié)點(diǎn)帶有充當(dāng)路線節(jié)點(diǎn)的初始條件節(jié)點(diǎn);以及以僅包含所述初始條件節(jié)點(diǎn)的所述字頭部分的所述初始條件,執(zhí)行所 述字頭部分的更新和所述字體數(shù)據(jù)的更新。
8. 根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別設(shè)備,其中通過從任意字或句子移除特定的字頭和特定的字尾來(lái)獲得每個(gè)所述字體數(shù)據(jù),所述存儲(chǔ)單元還存儲(chǔ)包括多個(gè)被標(biāo)記的節(jié)點(diǎn)的至少一個(gè)字尾部分,以 ^t表示至少一個(gè)共同字尾,所述共同字尾對(duì)于所述多個(gè)詞匯中的至少兩個(gè)是共同的;以及當(dāng)通過所述第一指令指示用于添加所述目標(biāo)詞匯的處理時(shí),所述語(yǔ)法 網(wǎng)絡(luò)生成單元生成包含所述字頭部分、所述字尾部分、通過所迷第二指令 選擇的所述目標(biāo)詞匯、字頭部分側(cè)連接信息以及字尾部分側(cè)連接信息的語(yǔ) 法網(wǎng)絡(luò),其中所述字頭部分側(cè)連接信息指示包含在所迷目標(biāo)詞匯中的每個(gè) 所述多個(gè)字體數(shù)據(jù),被連接至包含在所述字頭部分中的所述多個(gè)被標(biāo)記的 節(jié)點(diǎn)中預(yù)先匹配的一個(gè),所述字尾部分側(cè)連接信息指示包含在所述目標(biāo)詞 匯中的每個(gè)所述多個(gè)字體數(shù)據(jù),被連接至包含在所述字尾部分中的所述多 個(gè)凈皮標(biāo)記的節(jié)點(diǎn)中預(yù)先匹配的 一個(gè)。
9. 根據(jù)權(quán)利要求7所述的語(yǔ)音識(shí)別設(shè)備,其中當(dāng)指示用于刪除所述 目標(biāo)詞匯的處理時(shí),所述語(yǔ)法網(wǎng)絡(luò)生成單元從所述語(yǔ)法網(wǎng)絡(luò)刪除所述目標(biāo) 詞匯、以及對(duì)應(yīng)于所述目標(biāo)詞匯的字頭部分側(cè)連接信息和字尾部分側(cè)連接 信息。
10. 根據(jù)權(quán)利要求9所述的語(yǔ)音識(shí)別設(shè)備,其中每個(gè)所述字體數(shù)據(jù)由 包含被標(biāo)記的節(jié)點(diǎn)序列的網(wǎng)絡(luò)構(gòu)成,以及所述語(yǔ)音識(shí)別設(shè)備還包括更新單元,,皮配置為更新所述字頭部分和所 述字尾部分,以減少包含在兩個(gè)或更多所述字體數(shù)據(jù)中的所述被標(biāo)記的節(jié) 點(diǎn)的數(shù)量,以及更新所述兩個(gè)或更多字體數(shù)據(jù),以適合于更新的字頭部分 和字尾部分。
11. 根據(jù)權(quán)利要求10所述的語(yǔ)音識(shí)別設(shè)備,其中所述字頭部分由包 含所述被標(biāo)記的節(jié)點(diǎn)的網(wǎng)絡(luò)構(gòu)成,其中所述被標(biāo)記的節(jié)點(diǎn)帶有充當(dāng)路線節(jié) 點(diǎn)的初始^節(jié)點(diǎn),所述字尾部分由包含所述被標(biāo)記的節(jié)點(diǎn)的網(wǎng)絡(luò)構(gòu)成,所述被標(biāo)記的節(jié) 點(diǎn)帶有充當(dāng)葉子節(jié)點(diǎn)的最終條件節(jié)點(diǎn),以及分別以僅包含所述初始條件節(jié)點(diǎn)和所述最終條件節(jié)點(diǎn)的所述字頭部分 和所述字尾部分的所述初始條件,執(zhí)行所述字頭部分和所述字尾部分的更 新以及所述字體lt據(jù)的更新。
12. 根據(jù)權(quán)利要求9所述的語(yǔ)音識(shí)別設(shè)備,其中所述存儲(chǔ)單元還存儲(chǔ) 語(yǔ)法框架,所述語(yǔ)法框架是所迷語(yǔ)法網(wǎng)絡(luò)的模型,其限定所述語(yǔ)法網(wǎng)絡(luò)中 所述詞匯是可變的那些部分中的至少一個(gè),以及所述語(yǔ)法網(wǎng)絡(luò)生成單元通過用作模型的所述語(yǔ)法框架生成所述語(yǔ)法網(wǎng)絡(luò)。
13. 根據(jù)權(quán)利要求12所述的語(yǔ)音識(shí)別設(shè)備,其中每個(gè)所述字體數(shù)據(jù)由包含被標(biāo)記的節(jié)點(diǎn)序列的網(wǎng)絡(luò)構(gòu)成;以及所述語(yǔ)音識(shí)別設(shè)備還包括更新單元,被配置為更新所述字頭部分和所 述字尾部分,以減少包含在兩個(gè)或更多所述字體數(shù)據(jù)中的被標(biāo)記的節(jié)點(diǎn)的 數(shù)量,以及更新所述兩個(gè)或更多所述字體數(shù)據(jù),以適合于更新的字頭部分和字尾部分。
14. 根據(jù)權(quán)利要求13所述的語(yǔ)音識(shí)別設(shè)備,其中所述字頭部分由包含所述^:標(biāo)記的節(jié)點(diǎn)的網(wǎng)絡(luò)構(gòu)成,所述被標(biāo)記的節(jié)點(diǎn)帶有充當(dāng)路線節(jié)點(diǎn)的 初始條件節(jié)點(diǎn),所述字尾部分由包含所述被標(biāo)記的節(jié)點(diǎn)的網(wǎng)絡(luò)構(gòu)成,所述被標(biāo)記的節(jié) 點(diǎn)帶有充當(dāng)葉子節(jié)點(diǎn)的最終條件節(jié)點(diǎn),以及分別以僅包含所述初始條件節(jié)點(diǎn)和所述最終條件節(jié)點(diǎn)的所迷字頭部分 和所述字尾部分的所述初始條件,執(zhí)行所述字頭部分和所述字尾部分的更 新和所述字體數(shù)據(jù)的更新。
15. 根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別設(shè)備,其中當(dāng)通過所述第一指令 指示用于添加所述目標(biāo)詞匯的處理時(shí),在將要初始生成語(yǔ)法網(wǎng)絡(luò)的情況下, 所述語(yǔ)法網(wǎng)絡(luò)生成單元生成僅包含所述字頭部分的語(yǔ)法網(wǎng)絡(luò),然后向生成信息,以及在所述語(yǔ)法網(wǎng)絡(luò)已經(jīng)存在的情況下,所迷語(yǔ)法網(wǎng)絡(luò)生成單元向 現(xiàn)有的語(yǔ)法網(wǎng)絡(luò)添加所述目標(biāo)詞匯以及對(duì)應(yīng)于所迷目標(biāo)詞匯的所述字頭部 分側(cè)連接信息。
16. 根據(jù)權(quán)利要求8所述的語(yǔ)音識(shí)別設(shè)備,其中當(dāng)通過所述第一指令 指示用于添加所述目標(biāo)詞匯的處理時(shí),在將要初始生成語(yǔ)法網(wǎng)絡(luò)的情況下,絡(luò),然存問^夙的特 所述字頭部分側(cè)連接信息和所述字尾部分側(cè)連接信息,以及在所述語(yǔ)法網(wǎng) 絡(luò)已經(jīng)存在的情況下,所述語(yǔ)法網(wǎng)絡(luò)生成單元向現(xiàn)有的語(yǔ)法網(wǎng)絡(luò)添加所述 目標(biāo)詞匯以^J"應(yīng)于所述目標(biāo)詞匯的所述字頭部分側(cè)連接信息和所述字尾 部分側(cè)連接信息。
17. —種語(yǔ)法網(wǎng)絡(luò)生成方法,包括存儲(chǔ)多個(gè)詞匯,每個(gè)所述詞匯包括多個(gè)字體數(shù)據(jù),通it^任意字或句 子移除特定的字頭來(lái)獲得每個(gè)所述字體數(shù)據(jù),以及存儲(chǔ)至少一個(gè)包括多個(gè) 被標(biāo)記的節(jié)點(diǎn)的字頭部分,以便表示至少一個(gè)共同字頭,所述共同字頭對(duì)、、/詞標(biāo)應(yīng)以匚*、y詞標(biāo)絡(luò)語(yǔ)的于所述多個(gè)詞匯中的至少兩個(gè)是共同的;接收第一指令,用于從所述多個(gè)詞匯選擇目標(biāo)詞匯,以及第二指令, 用于指示對(duì)所述目標(biāo)詞匯的操作的內(nèi)容;當(dāng)通過所述第一指令指示用于添加所述目標(biāo)詞匯的處理時(shí),生成包含 所迷字頭部分、通過所述笫二指令選擇的所述目標(biāo)詞匯以及字頭部分側(cè)連 接信息的語(yǔ)法網(wǎng)絡(luò),所述字頭部分側(cè)連接信息指示包含在所述目標(biāo)詞匯中 的每個(gè)所述多個(gè)字體數(shù)據(jù),被連接至包含在所述字頭部分中的所述多個(gè)被 標(biāo)記的節(jié)點(diǎn)中的預(yù)先匹配的一個(gè);以及使用所生成的提供一組識(shí)別目標(biāo)字或句子的語(yǔ)法網(wǎng)g行語(yǔ)音識(shí)別。
18. —種存儲(chǔ)計(jì)算機(jī)程序的指令的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述計(jì)算 機(jī)程序的指令被計(jì)算機(jī)執(zhí)行時(shí),使得包括下列步驟的執(zhí)行存儲(chǔ)多個(gè)詞匯,每個(gè)所述詞匯包括多個(gè)字體數(shù)據(jù),通it^M壬意字或句 子移除特定的字頭來(lái)獲得每個(gè)所述字體數(shù)據(jù),以及存儲(chǔ)至少一個(gè)包括多個(gè) 被標(biāo)記的節(jié)點(diǎn)的字頭部分,以便表示至少一個(gè)共同字頭,所述共同字頭對(duì) 于所述多個(gè)詞匯中的至少兩個(gè)是共同的;接收第一指令,用于從所述多個(gè)詞匯選擇目標(biāo)詞匯,以及第二指令, 用于指示對(duì)所述目標(biāo)詞匯的"^作的內(nèi)容;當(dāng)通過所述第一指令指示用于添加所述目標(biāo)詞匯的處理時(shí),生成包含 所述字頭部分、通過所述第二指令選擇的所迷目標(biāo)詞匯以及字頭部分側(cè)連 接信息的語(yǔ)法網(wǎng)絡(luò),所述字頭部分側(cè)連接信息指示包含在所述目標(biāo)詞匯中 的每個(gè)所述多個(gè)字體數(shù)據(jù),被連接至包含在所述字頭部分中的所述多個(gè)被 標(biāo)記的節(jié)點(diǎn)中的預(yù)先匹配的一個(gè);以及使用所生成的提供一組識(shí)別目標(biāo)字或句子的語(yǔ)法網(wǎng)^行語(yǔ)音識(shí)別。
全文摘要
一種語(yǔ)音識(shí)別設(shè)備,包括存儲(chǔ)詞匯的存儲(chǔ)單元,每個(gè)詞匯包括復(fù)數(shù)個(gè)字體數(shù)據(jù),通過從字或句子移除特定的字頭來(lái)獲得每個(gè)所述字體數(shù)據(jù),以及存儲(chǔ)至少一個(gè)包括被標(biāo)記的節(jié)點(diǎn)的字頭部分,以表示至少一個(gè)共同字頭,所述共同字頭對(duì)于所述詞匯中的至少兩個(gè)是共同的;指令接收單元,其接收目標(biāo)詞匯的指令和操作的指令;語(yǔ)法網(wǎng)絡(luò)生成單元,當(dāng)指示添加時(shí),其生成包含所述字頭部分、所述目標(biāo)詞匯和連接信息的語(yǔ)法網(wǎng)絡(luò),所述連接信息指示包含在所述目標(biāo)詞匯中的每個(gè)所述字體數(shù)據(jù),被連接至包含在所述字頭部分中的所述被標(biāo)記的節(jié)點(diǎn)中的特定的一個(gè);以及語(yǔ)音識(shí)別單元,其使用所生成的語(yǔ)法網(wǎng)絡(luò)執(zhí)行語(yǔ)音識(shí)別。
文檔編號(hào)G10L15/22GK101540169SQ20091012805
公開日2009年9月23日 申請(qǐng)日期2009年3月19日 優(yōu)先權(quán)日2008年3月19日
發(fā)明者田中信一, 館森三慶 申請(qǐng)人:株式會(huì)社東芝