亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于生成亞洲語(yǔ)字符的識(shí)別體系結(jié)構(gòu)的制作方法

文檔序號(hào):6476983閱讀:750來(lái)源:國(guó)知局

專(zhuān)利名稱(chēng)::用于生成亞洲語(yǔ)字符的識(shí)別體系結(jié)構(gòu)的制作方法用于生成亞洲語(yǔ)字符的識(shí)別體系結(jié)構(gòu)背景用于英文的語(yǔ)音識(shí)別(SR)引擎需要拼寫(xiě)向?qū)?,主要是因?yàn)橐嬖~典中不能夠包括所有或基本上所有合適的名詞,尤其是名字。另一方面,中文字符集可被認(rèn)為是閉合的,因?yàn)樗凶址及ㄔ谠~典中。不必考慮或擔(dān)憂詞匯外的字符。然而,中文SR引擎的主要問(wèn)題是跨多個(gè)不同字符的同音字共享。有大約47,000個(gè)有效的中文字符,但中文中只有大約1600個(gè)不同但固定的音節(jié)。這意味著,如果這些音節(jié)跨不同的字符平均分布,每一音節(jié)可對(duì)應(yīng)于大約23-31個(gè)不同的字符,這些字符中的許多都表示不同的事物。固定音節(jié)是與有效中文字符相關(guān)聯(lián)的音節(jié)集合。例如,音節(jié)"chu"對(duì)應(yīng)于像"出初處……"(其拼音是/chuh/)等字符,但不存在對(duì)應(yīng)于任何有效字符的"chiu"。因?yàn)楣潭ㄒ艄?jié)的有限數(shù)量,所以存在大量的共享同一發(fā)音的字符。以下是共享同一發(fā)音/lih/的54個(gè)字符的一個(gè)示例;并且/lih/的列表仍然不全面力利立麗例莉歷俐勵(lì)厲曆栗笠粒蒞隸儷吏壢另慄戾櫪瀝琍璣痢癘^荔螗釙靂螗釙靈礪鬲鵜麗儷凓勵(lì)歷厲麻歴嚦琍蜊耍悧驚撬……因此,在引擎未能正確識(shí)別一個(gè)詞時(shí),用戶可以嘗試從備選列表中糾正它,或嘗試重復(fù)說(shuō)出所需的詞以供識(shí)別,但這由于以下問(wèn)題而不成功。第一,如果聲學(xué)模型(AM)未正確處理語(yǔ)音音頻或AM對(duì)所需的詞具有比其它詞更低的相關(guān)性分?jǐn)?shù),而其它詞具有更高的語(yǔ)言模型(LM)分?jǐn)?shù),則不管用戶說(shuō)出該詞多少次,輸出可能都不是來(lái)自備選列表的正確的詞。第二,假定發(fā)聲的音頻被AM正確地處理,但如果所需字符在超過(guò)備選項(xiàng)的數(shù)量的列表項(xiàng)中并且未被呈現(xiàn)給用戶,則用戶將不能在不鍵入的情況下獲得該詞。這可能發(fā)生在中文中,尤其是在字符還是數(shù)字或數(shù)的同音4字時(shí),此時(shí)SR引擎還顯示數(shù)的不同格式的ITN(逆文本標(biāo)準(zhǔn)化,如將"twelve"標(biāo)準(zhǔn)化成"12")結(jié)果。第三,即使中文SR引擎不考慮詞匯外字符,但用戶可以通過(guò)不同的字符的組合來(lái)創(chuàng)造新詞。除新詞之外,各詞之間沒(méi)有空間來(lái)標(biāo)記詞邊界。為確定詞邊界,亞洲語(yǔ)言(至少與簡(jiǎn)體中文(CHS)、繁體中文(CHT)、和日文(JPN)相關(guān))需要在引擎或IME(輸入方法編輯器)進(jìn)程中進(jìn)行斷詞。因此,在用戶向中文SR引擎口述諸如人名(該人名很可能是未知的詞)等正確的名詞時(shí),SR正確地處理該名字的可能性很低,除非該名字很常見(jiàn)并且在訓(xùn)練數(shù)據(jù)中出現(xiàn)過(guò)。即使AM和LM完美地工作,用戶仍然可能接收到與所期望的輸出"劉莉"不同的具有諸如"劉麗"等字符的輸出名字(焦點(diǎn)在于第二字符,其中第一字符是姓且第二字符是名),這是由于上述的同音字問(wèn)題,即"麗"和"莉"是同音字但用作不同個(gè)人的名。對(duì)于中文對(duì)話期間的人們的感知而言也是如此,在對(duì)話中第一個(gè)人告訴第二個(gè)人他的名字,而第二個(gè)人將需要問(wèn)第一個(gè)人該名字中確切地使用的是哪些字符。最后,當(dāng)用戶在SR過(guò)程期間嘗試糾正詞中的字符時(shí),通過(guò)選擇字符和/或重復(fù)說(shuō)出字符以確定正確的字符是否將最終出現(xiàn)在備選列表上來(lái)獲得正確的輸出是可能的。通常,在字符不具有許多同音字時(shí),獲得供替換的正確的詞是可能的。然而,這類(lèi)糾正將在單獨(dú)的字符的基礎(chǔ)上完成。在SR中將不采取這一糾正,因?yàn)镾R按詞而非按單個(gè)字符來(lái)學(xué)習(xí)。因此,如果用戶想要在文檔中多次使用這一字符,用戶將需要在每次講出該字符時(shí)都重復(fù)糾正過(guò)程。因此,常規(guī)識(shí)別過(guò)程是麻煩而且低效的。概述以下提出了簡(jiǎn)化概述以便提供對(duì)在此描述的某些新穎實(shí)施例的基本理解。本概述不是詳盡的概覽,并且它不旨在標(biāo)識(shí)關(guān)鍵/重要的元素,也不旨在描繪其范圍。其唯一的目的是以簡(jiǎn)化的形式來(lái)介紹一些概念,作為稍后提出的更為詳細(xì)的描述的序言。所公開(kāi)的體系結(jié)構(gòu)提供用于亞洲語(yǔ)語(yǔ)音識(shí)別算法的拼寫(xiě)模式。這方便確定新詞的邊界以及將新詞添加到詞典中。因此,與其中詞糾正發(fā)生多次的常規(guī)系統(tǒng)不同,基于該拼寫(xiě)模式,詞糾正只發(fā)生一次。具體地,在中文字符的上下文中,拼寫(xiě)模式方便在語(yǔ)音識(shí)別引擎返回不正確的口述字符時(shí)輸入中文字符。使用該拼寫(xiě)模式來(lái)糾正的詞是作為一個(gè)單元來(lái)糾正的并且被當(dāng)作詞。這是因?yàn)榕c例如其中詞邊界很容易識(shí)別的英文單詞不同,亞洲語(yǔ)言中的邊界不清楚。因此,通過(guò)經(jīng)歷拼寫(xiě)模式來(lái)輸入中文字符(在該示例中)減少或消除了后續(xù)識(shí)別處理中對(duì)該詞的誤識(shí)別。所公開(kāi)的拼寫(xiě)模式適用于其中字符具有對(duì)應(yīng)的固定發(fā)聲的簡(jiǎn)體中文、繁體中文、和/或諸如日文等其它亞洲語(yǔ)言。為實(shí)現(xiàn)上述及相關(guān)目的,本文結(jié)合下面的描述和附圖描述某些說(shuō)明性方面。然而,這些方面僅指示了可利用此處公開(kāi)的原理的各種方法中的少數(shù)幾種,且旨在包括所有這些方面及其等效方面。結(jié)合附圖閱讀下面的詳細(xì)描述,則其它優(yōu)點(diǎn)和新穎特征將變得顯而易見(jiàn)。附圖簡(jiǎn)述圖1示出計(jì)算機(jī)實(shí)現(xiàn)的轉(zhuǎn)換系統(tǒng)。圖2示出基于在拼寫(xiě)/糾正過(guò)程期間所學(xué)習(xí)的新詞來(lái)方便詞典共享的系統(tǒng)。圖3示出采用方便自動(dòng)化一個(gè)或多個(gè)功能的推斷組件的系統(tǒng)。圖4示出可由此處公開(kāi)的拼寫(xiě)/糾正體系結(jié)構(gòu)采用的一個(gè)或多個(gè)方法。圖5示出采用詞發(fā)音作為字符規(guī)范方法的系統(tǒng)。圖6示出在用戶期望亞洲語(yǔ)字符/詞作為輸出時(shí)所呈現(xiàn)的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖7示出在用戶期望英文單詞作為輸出時(shí)所呈現(xiàn)的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖8示出所呈現(xiàn)的用于同音字命令處理的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖9示出響應(yīng)于用于同音字糾正的語(yǔ)音激活命令來(lái)呈現(xiàn)的拼寫(xiě)模式對(duì)話框面板的屏幕截圖。圖10示出其中響應(yīng)于所發(fā)聲的索引選擇來(lái)糾正誤識(shí)別的詞并清除列表框的面板。圖11示出所呈現(xiàn)的用于語(yǔ)音發(fā)音的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖12示出所呈現(xiàn)的用于糾正所說(shuō)出的發(fā)音的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖13示出基于對(duì)所說(shuō)出的發(fā)音的糾正來(lái)呈現(xiàn)的具有修訂的同音字列表框的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖14示出在糾正誤識(shí)別的詞時(shí),并且光標(biāo)移動(dòng)到下一字符以對(duì)所說(shuō)出的發(fā)音進(jìn)行處理以使用戶可以在需要時(shí)繼續(xù)對(duì)該下一字符進(jìn)行糾正時(shí)所呈現(xiàn)的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖15示出根據(jù)第二方法將正面、中性、和負(fù)面意義用于字符加權(quán)的系統(tǒng)。圖16示出根據(jù)第三方法按所需字符的子分量的語(yǔ)音輸入來(lái)采用詞分解的系統(tǒng)。圖17示出所呈現(xiàn)的用于通過(guò)平假名的語(yǔ)音/鍵入輸入來(lái)進(jìn)行日語(yǔ)識(shí)別和處理以獲得日文漢字的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖18示出所呈現(xiàn)的用于與獲得日文羅馬字相關(guān)的日語(yǔ)識(shí)別和處理的拼寫(xiě)對(duì)話框面板的屏幕截圖。圖19示出根據(jù)所公開(kāi)的體系結(jié)構(gòu)的識(shí)別語(yǔ)音的方法。圖20示出使用拼寫(xiě)向?qū)?lái)糾正識(shí)別結(jié)果的方法。圖21示出將語(yǔ)音發(fā)音轉(zhuǎn)換成字符的方法。圖22示出在亞洲語(yǔ)和英語(yǔ)中使用拆分命令來(lái)進(jìn)行糾正處理的方法。圖23示出在亞洲語(yǔ)拼寫(xiě)向?qū)е惺褂猛糇置畹姆椒āD24示出將加權(quán)值應(yīng)用于詞意義的方法。圖25示出共享經(jīng)更新的詞典的方法。圖26示出將字符分解用于拼寫(xiě)糾正的方法。圖27A和27B示出基于用于拼寫(xiě)糾正的多個(gè)方法來(lái)進(jìn)行糾正處理的方法。圖28示出可用于執(zhí)行根據(jù)所公開(kāi)的體系結(jié)構(gòu)的糾正處理的計(jì)算系統(tǒng)7的框圖。圖29示出了用于根據(jù)所公開(kāi)的體系結(jié)構(gòu)的糾正處理的示例性計(jì)算環(huán)境的示意性框圖。詳細(xì)描述此處所公開(kāi)的是提供算法、數(shù)據(jù)、以及至少一個(gè)用戶界面(UI)的體系結(jié)構(gòu),該用戶界面包括用于亞洲語(yǔ)語(yǔ)音識(shí)別和獲得新詞/字符或?qū)φ`識(shí)別的字符的糾正的拼寫(xiě)模式。現(xiàn)在參考附圖,附圖中相同的附圖標(biāo)記用于指代在全文中相同的元素。在以下描述中,為解釋起見(jiàn),闡述了眾多具體細(xì)節(jié)以提供對(duì)本發(fā)明的全面理解。然而,顯然,這些新穎實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)現(xiàn)。在其它情況下,以框圖形式示出了公知的結(jié)構(gòu)和設(shè)備以便于描述它們。首先參考附圖,圖1示出了計(jì)算機(jī)實(shí)現(xiàn)的轉(zhuǎn)換系統(tǒng)100。系統(tǒng)100包括接收亞洲語(yǔ)聲音或語(yǔ)音輸入并對(duì)該輸入執(zhí)行識(shí)別處理的語(yǔ)音識(shí)別組件102。在某些情況下,識(shí)別過(guò)程會(huì)輸出不正確的亞洲語(yǔ)字符和/或詞。因此,系統(tǒng)100還包括糾正組件104,該組件用于基于語(yǔ)音識(shí)別組件所輸出的不正確的亞洲語(yǔ)字符/詞和/或新亞洲語(yǔ)字符/詞來(lái)生成正確的字符和/或詞。系統(tǒng)IOO將至少在用于用戶交互的UI、用于檢索英語(yǔ)和亞洲語(yǔ)詞并還用于提供和執(zhí)行不同的命令來(lái)啟動(dòng)各UI面板并與其進(jìn)行交互的拆分拼寫(xiě)面板UI、以及用于捕捉新詞并確定詞邊界的用戶拼寫(xiě)模式的上下文中更詳細(xì)地描述。系統(tǒng)100還在用戶使用發(fā)音通過(guò)語(yǔ)音輸入獲得字符、包含所需字符的詞、所需字符的子分量、通過(guò)同音字列表來(lái)選擇時(shí)進(jìn)行幫助,并隨后從經(jīng)轉(zhuǎn)換的候選中選擇所需字符。提供了包含存儲(chǔ)語(yǔ)音系統(tǒng)中的音素的語(yǔ)音距離信息的數(shù)據(jù)的數(shù)據(jù)存儲(chǔ),并且數(shù)據(jù)被存儲(chǔ)在混淆矩陣表中。該信息幫助用戶快速并容易地糾正誤識(shí)別的發(fā)音,從而減少系統(tǒng)犯同樣錯(cuò)誤的可能性。提供了包含具有每一字符的使用頻率以及字符可以存在于其中的諸如人名、公司名等可能類(lèi)別的數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)。因此,在檢測(cè)到關(guān)鍵詞時(shí),將觸發(fā)對(duì)應(yīng)的類(lèi)別并且在列表中會(huì)將用于該類(lèi)別的字符推得更高。讀取詞8中的關(guān)鍵字符并重新調(diào)整字符列表,以使所需字符在列表頂部出現(xiàn),因?yàn)槠溆嗟募m正也是此處公開(kāi)的方法的一部分。系統(tǒng)100通過(guò)使用包含所需字符的詞來(lái)進(jìn)行語(yǔ)音輸入以方便獲得字符,并還通過(guò)檢查字符的子分量來(lái)以方便獲得字符。系統(tǒng)100的UI處理同音字命令,以獲得正確的詞并避免重新輸入發(fā)音。用戶還可以共享新詞的詞典,并發(fā)送回新詞以供評(píng)估和更新不同的詞典。此外,其它亞洲語(yǔ)語(yǔ)音輸入(例如日文)可以在多個(gè)(例如四個(gè))不同的書(shū)寫(xiě)系統(tǒng)之間切換。圖2示出基于在糾正過(guò)程期間所學(xué)習(xí)的新詞來(lái)方便詞典共享的系統(tǒng)200。系統(tǒng)200包括圖1的語(yǔ)音識(shí)別組件102和拼寫(xiě)/糾正組件104。然而,糾正組件104的輸出饋送回識(shí)別組件102以更新內(nèi)部詞典122。然而,注意,詞典202可以在識(shí)別組件102的外部。如在常規(guī)識(shí)別系統(tǒng)中一樣,系統(tǒng)200還可包括語(yǔ)言模型(LM)204和聲學(xué)模型(AM)206。LM204(或語(yǔ)法文件)包含詞序列的概率集合。AM206基于語(yǔ)音數(shù)據(jù)及其轉(zhuǎn)錄來(lái)以音素的形式表征詞的聲學(xué)行為。AM206基于從語(yǔ)音音頻信號(hào)生成的特征向量來(lái)對(duì)語(yǔ)言的聲音單元進(jìn)行建模。識(shí)別組件102處理從LM204和AM206接收到的輸入以提供最佳輸出。然而,如所示的,在諸如亞洲語(yǔ)言識(shí)別處理等復(fù)雜應(yīng)用程序中,提供正確的結(jié)果并隨后解決不正確的結(jié)果會(huì)是一個(gè)挑戰(zhàn)。因此,在得到經(jīng)糾正的結(jié)果時(shí),更新(或改進(jìn))詞典202是有好處的。這些更新在這樣的復(fù)雜應(yīng)用程序中可能是很重要的。因此,在適當(dāng)?shù)陌踩珯z査就位的情況下,共享組件208方便與其它優(yōu)化或系統(tǒng)和/或詞典供應(yīng)商來(lái)共享諸如詞典202等信息,以分發(fā)新詞典語(yǔ)料庫(kù)。這將在此處更詳細(xì)地描述。圖3示出采用方便自動(dòng)化一個(gè)或多個(gè)功能的推斷組件302的系統(tǒng)300。例如,不僅可以基于用戶(例如用戶簡(jiǎn)檔)還可以基于組件302所學(xué)習(xí)和推理的語(yǔ)音和糾正活動(dòng)來(lái)做出推斷??紤]用戶對(duì)英文遠(yuǎn)遠(yuǎn)比中文更精通,則推斷組件302隨時(shí)間學(xué)習(xí)到用戶通常有與特定中文字符相關(guān)聯(lián)的語(yǔ)音識(shí)別錯(cuò)誤。因此,推斷組件302可以在預(yù)測(cè)到用戶犯同樣錯(cuò)誤的情況下,通過(guò)呈現(xiàn)拼寫(xiě)模式界面對(duì)發(fā)音界面來(lái)自動(dòng)化UI的功能以更有效地幫助該用戶。在另一示例中,可能學(xué)習(xí)到,比起所提供的任何其它模式,用戶通常偏好使用拼寫(xiě)模式。因此,在遇到選擇一種方法來(lái)進(jìn)行糾正時(shí),組件302將自動(dòng)地呈現(xiàn)拼寫(xiě)模式UI。這些只是可以基于學(xué)習(xí)和推理所作出的許多推斷中的幾個(gè)示例,學(xué)習(xí)和推理不僅對(duì)于用戶交互,還對(duì)于往往基于特定輸入準(zhǔn)則而重復(fù)發(fā)生的系統(tǒng)進(jìn)程。推斷組件302可以采用機(jī)器學(xué)習(xí)和推理(MLR)例如來(lái)監(jiān)控、分析、計(jì)算、以及使用所學(xué)習(xí)和推理的結(jié)果。本發(fā)明的體系結(jié)構(gòu)(例如,結(jié)合選擇)可采用各種基于MLR的方案來(lái)實(shí)現(xiàn)其各個(gè)方面。例如,用于確定選擇和呈現(xiàn)哪個(gè)字符或詞中的哪個(gè)字符的過(guò)程可以經(jīng)由自動(dòng)分類(lèi)器系統(tǒng)和進(jìn)程來(lái)促進(jìn)。分類(lèi)器是將輸入屬性向量x=(xl,x2,x3,x4,xn)映射到類(lèi)標(biāo)簽c/a^(x)的函數(shù)。分類(lèi)器也可以輸出輸入屬于一個(gè)類(lèi)的置信度,即f(x)=cowyWe"ce(c/a^W)。這樣的分類(lèi)可采用概率性的和/或其它統(tǒng)計(jì)性的分析(例如,分解成分析效用和成本以最大化對(duì)一人或多人的期望值)來(lái)預(yù)測(cè)或推斷用戶期望自動(dòng)執(zhí)行的動(dòng)作。如此處所使用的,術(shù)語(yǔ)"推斷"和"推論"通常是指從經(jīng)由事件和/或數(shù)據(jù)捕捉的一組觀察結(jié)果來(lái)推理或推斷系統(tǒng)、環(huán)境和/或用戶的狀態(tài)的過(guò)程。例如,推斷可用于標(biāo)識(shí)特定的上下文或動(dòng)作,或可生成狀態(tài)的概率分布。推斷可以是概率性的,即,推斷是基于對(duì)數(shù)據(jù)和事件的考慮的對(duì)所關(guān)注狀態(tài)的概率分布的計(jì)算。推斷也可以指用于從一組事件和/或數(shù)據(jù)組成更高級(jí)事件的技術(shù)。這類(lèi)推斷導(dǎo)致從一組觀察到的事件和/或存儲(chǔ)的事件數(shù)據(jù)中構(gòu)造新的事件或動(dòng)作,而無(wú)論事件是否在相鄰時(shí)間上相關(guān),也無(wú)論事件和數(shù)據(jù)是來(lái)自一個(gè)還是若干個(gè)事件和數(shù)據(jù)源。支持向量機(jī)(SVM)是可采用的分類(lèi)器的一個(gè)示例。SVM通過(guò)在可能的輸入空間中找出以最優(yōu)方式將觸發(fā)輸入事件和非觸發(fā)事件分離開(kāi)來(lái)的超曲面來(lái)操作。直觀上,這使得分類(lèi)對(duì)于接近但不等同于訓(xùn)練數(shù)據(jù)的測(cè)試數(shù)據(jù)正確。可采用其它定向和非定向模型分類(lèi)方法,包括,例如,各種形式的統(tǒng)計(jì)回歸、樸素貝葉斯、貝葉斯網(wǎng)絡(luò)、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、模糊邏輯模型以及表示不同獨(dú)立性模式的其它統(tǒng)計(jì)分類(lèi)模型。如此處所使用的分類(lèi)也包括用于分派排名和/或優(yōu)先級(jí)的方法。如從本說(shuō)明書(shū)中可以容易地理解的,本發(fā)明的體系結(jié)構(gòu)可以使用顯式訓(xùn)練(例如,經(jīng)由一般訓(xùn)練數(shù)據(jù))以及隱式訓(xùn)練(例如,經(jīng)由觀察用戶行為、接收外來(lái)信息)的分類(lèi)器。例如,SVM經(jīng)由分類(lèi)器構(gòu)造器和特征選擇模塊內(nèi)的學(xué)習(xí)或訓(xùn)練階段來(lái)配置。因此,可采用分類(lèi)器來(lái)根據(jù)預(yù)定準(zhǔn)則自動(dòng)學(xué)習(xí)和執(zhí)行多個(gè)功能。推斷組件302可以與識(shí)別組件102、糾正組件104、詞典202、LM204(未示出連接)、AM206和共享組件208進(jìn)行接口,以例如監(jiān)控用戶和系統(tǒng)進(jìn)程并獲得數(shù)據(jù)。在系統(tǒng)300中使用推斷組件302只是采用和連接推斷的多個(gè)不同方式的一個(gè)示例。換言之,可以用后面的附圖中的系統(tǒng)組件的更詳細(xì)說(shuō)明來(lái)采用推斷組件302。圖4示出可由此處公開(kāi)的糾正體系結(jié)構(gòu)采用的一個(gè)或多個(gè)方法400。例如,拼寫(xiě)/糾正組件104可包括詞發(fā)音方法402、詞中的字符方法404、以及字符分解方法406。這些方法400提供至少三種指定字符的方式。可以指定字符的方式包括給出關(guān)于如何用本地音標(biāo)來(lái)發(fā)出該詞的音的信息(例如發(fā)音方法402)。詞中的字符方法404包括給出關(guān)于如何通過(guò)給出其中存在該字符的詞來(lái)寫(xiě)出該字符的信息。例如,如果用戶選擇指定"薰",則用戶可以說(shuō)"薰陶的薰"。這類(lèi)似于在英文中使用"a,asingEEk"。給出關(guān)于如何組成(或分解)字符的信息由分解方法406提供。換言之,用戶可以說(shuō)出字符的組成部分。例如,如果用戶想要指定"李",則用戶可以說(shuō)"木子;李"。所有三種方法(402、404和406)都在此詳細(xì)描述。第一種方法(發(fā)音方法402)可以使用拼寫(xiě)向?qū)?lái)提供,而方法404和406可以直接應(yīng)用而不用向?qū)?。然而,可以理解,所有方?402、404和406)都可以使用向?qū)?lái)實(shí)現(xiàn),以使用戶可以選擇這些方法中的一個(gè)來(lái)進(jìn)行詞糾正。還可以理解,對(duì)術(shù)語(yǔ)"向?qū)?的使用決不旨在被解釋為限制。換言之,可以呈現(xiàn)集中于總體過(guò)程的一小部分的一系列對(duì)話框,而非通??杀徽J(rèn)為是引導(dǎo)用戶提供一個(gè)過(guò)程的向?qū)АT谟脩魢L試以中文字符或詞鍵入時(shí),使用發(fā)音方法402。在某些亞洲11國(guó)家中,使用亞洲語(yǔ)字符的發(fā)音方法是常見(jiàn)的。然而,可以使用除繁體中文OS中的發(fā)音以外的其它輸入方法。給定發(fā)音所提供的方便性,許多用戶在使用鍵盤(pán)鍵入字符時(shí)會(huì)使用發(fā)音(注音)。情況對(duì)于使用簡(jiǎn)體中文OS的中國(guó)大陸用戶而言更是這樣,其中使用拼音(本地發(fā)音系統(tǒng))來(lái)用鍵盤(pán)鍵入字符。臺(tái)灣用戶(使用繁體中文)將鍵入"丁U^"和用于第一音調(diào)的空格鍵,來(lái)得到使用該發(fā)音的詞列表,例如"勳薰勛……",并選擇這些詞中的一個(gè),例如第二個(gè)詞"薰"。相反,中國(guó)大陸用戶可以鍵入"xun"并接收詞列表,諸如"勳薰勛……",并選擇這些詞中的一個(gè),例如第二個(gè)詞"薰"。然而,鍵入花費(fèi)時(shí)間并且可能易于出錯(cuò)。對(duì)臺(tái)灣用戶而言這尤其消耗時(shí)間和勞動(dòng),因?yàn)榉斌w中文的語(yǔ)音系統(tǒng)與中國(guó)大陸中文中使用的26個(gè)字母集合(用于拼音)不同。例如,音標(biāo)看起來(lái)像""夕n匸",并且第一個(gè)符號(hào)"""可被認(rèn)為是/b/聲,但被給出了鍵1(數(shù)字)禾卩!(感嘆號(hào)),而非對(duì)于字母b的鍵盤(pán)鍵。因此用戶需要學(xué)習(xí)每一符號(hào)位于鍵盤(pán)上的哪里。另一方面,中國(guó)大陸使用的拼音有26個(gè)英文字母組成,如果用戶熟悉26個(gè)英文字母在鍵盤(pán)上的位置,則不需要學(xué)習(xí)另一種鍵盤(pán)設(shè)置。拼寫(xiě)向?qū)ㄟ^(guò)允許用戶通過(guò)語(yǔ)音而非鍵入獲得中文詞來(lái)克服這一限制。這在用戶不熟悉音標(biāo)和/或26個(gè)英文字母在鍵盤(pán)上的位置的情況下、或在用戶不頻繁與符號(hào)交互以快速選擇和輸入符號(hào)的情況下尤其有用。第二(即詞中的字符)方法404可比詞發(fā)音方法402更復(fù)雜,因?yàn)樗x的包含該字符的詞可以是任何詞,甚至來(lái)自名人的名字。所公開(kāi)的體系結(jié)構(gòu)將包含中文語(yǔ)言中所使用的所有字符,但可以不包含所有詞,尤其是尚未是訓(xùn)練數(shù)據(jù)的一部分的最新近名人的名字。用戶可以選擇包含所需字符的詞,但該字符可以不是該詞中的第一個(gè)字符。該字符可以出現(xiàn)在該詞的中間或結(jié)尾。例如,用戶可以說(shuō)"薰陶的陶"來(lái)得到最后(或粗體)字符"陶"。為獲得良好的識(shí)別準(zhǔn)確度,對(duì)使用什么類(lèi)型的詞來(lái)指定字符和或者對(duì)哪些詞分配較高加權(quán)或者特別訓(xùn)練哪些詞具有良好的感覺(jué)是合乎需要的。正確地收集和安排數(shù)據(jù)幫助提升SR準(zhǔn)確度。另外,SR的AM越好,來(lái)自該方法的結(jié)果越好。一旦實(shí)現(xiàn)了這些,則采用這一方法404來(lái)糾正誤識(shí)別的中文詞可以比第一方法402更容易,因?yàn)楂@得正確的字符的步驟的數(shù)量少于提供發(fā)音。第三方法406可被用于較少量的一些容易分解的詞。換言之,沒(méi)有大量的可被容易地分解并被廣泛使用的詞。因此,可以在語(yǔ)法(或LM)中列出可分解詞以支持這一方法406。圖5示出采用詞發(fā)音作為字符規(guī)范方法的系統(tǒng)500。如上所示,可以將拼寫(xiě)向?qū)в糜诎l(fā)音方法。為支持用戶提供發(fā)音和選擇正確的字符,向?qū)Р捎迷谧址桶l(fā)音之間進(jìn)行映射的一個(gè)或多個(gè)數(shù)據(jù)文件。另外,提供同音詞的優(yōu)化列表以使用戶可以快速獲得所需字符。以下描述供在語(yǔ)音系統(tǒng)和字符之間進(jìn)行轉(zhuǎn)換的數(shù)據(jù)文件。在該第一示例中,語(yǔ)音系統(tǒng)是以CHS/CHT描述的,連同示例性數(shù)據(jù)文件的概覽。如上所述,CHS使用拼音,而拼音也使用英文的26個(gè)字母,但具有可任選聲調(diào)信息。相反,CHT使用注音,注音是象形符號(hào)而非正規(guī)中文。CHT的注音類(lèi)似于英文的國(guó)際音標(biāo)(IPA)。例如,對(duì)于字符"田",以下給出CHS和CHT的語(yǔ)音表示CHS:tianCHT:亡一弓'圖5的識(shí)別組件102示出多個(gè)亞洲語(yǔ)言引擎502(示為亞洲語(yǔ)言iSR引擎……亞洲語(yǔ)言wSR引擎,其中N是正整數(shù))。引擎502中的第一引擎504使用詞發(fā)音方法402,詞發(fā)音方法402又使用三個(gè)數(shù)據(jù)文件506來(lái)提供數(shù)據(jù)。每一語(yǔ)言引擎502將三個(gè)數(shù)據(jù)文件506用于將發(fā)音轉(zhuǎn)換成字符的過(guò)程。第一數(shù)據(jù)文件508將詞作為索引并將每一個(gè)詞的相關(guān)信息作為值來(lái)存儲(chǔ),該值包括發(fā)音、聲調(diào)、使用頻率、和/或可能的類(lèi)別。第二數(shù)據(jù)文件510將發(fā)音作為索引并將具有該發(fā)音的所有詞作為值,并以基于使用頻率的次序來(lái)存儲(chǔ)。第三數(shù)據(jù)文件512用于存儲(chǔ)音素之間的混淆矩陣信息,以供用戶高效地糾正誤識(shí)別的音素。13如所示的,第一數(shù)據(jù)文件508存儲(chǔ)字符的信息和字符發(fā)音、聲調(diào)、頻率、和/或可能的類(lèi)別。例如,CHS:好hao—3—1—z;hao—4—1—z田tian21nCHT:好廠幺_3—1—z;廠幺—4_1—z田太一弓21n對(duì)于不同詞中的具有不同的發(fā)音的字符,如"好"(該字符在"很好"中用作第三聲;但在"喜好"中用作第四聲)),在一個(gè)行中記錄可能的發(fā)音,各元素由分號(hào)(;)分開(kāi)。根據(jù)最近信息,有大約47035個(gè)有效的中文字符,大量中文字符很少使用并且是整個(gè)歷史積累下來(lái)的。中國(guó)有文化的人現(xiàn)行只使用大約2000個(gè)字符。因此,落入該2000個(gè)現(xiàn)行使用的字符集中的字符可被首先顯示。為知道現(xiàn)行使用的集合中的字符是否顯示在呈現(xiàn)給用戶的列表的頂部或頂部附近,現(xiàn)行使用的字符被標(biāo)記為"1",其它的被標(biāo)記為"2"。出現(xiàn)在諸如人名等特定類(lèi)別中的字符可被給出人名的類(lèi)別碼,例如"n"。系統(tǒng)500還可包括用于跟蹤存儲(chǔ)在第二數(shù)據(jù)文件510中的字符和/或詞的使用頻率的頻率組件514,。該第二數(shù)據(jù)文件510存儲(chǔ)發(fā)音,并以出現(xiàn)在不同詞中的頻率以及該詞或字符的頻率的次序來(lái)存儲(chǔ)與該發(fā)音相關(guān)聯(lián)的字符。第一數(shù)據(jù)文件508存儲(chǔ)詞是否落入2000個(gè)現(xiàn)行使用的字符。該第二數(shù)據(jù)文件510根據(jù)總體活動(dòng)/不活動(dòng)頻率和根據(jù)與其它同音字符相關(guān)的使用頻率中的一個(gè)或兩者來(lái)對(duì)字符進(jìn)行排序。頻率信息可以從現(xiàn)有訓(xùn)練數(shù)據(jù)中獲得。第二數(shù)據(jù)文件510中的次序可以基于對(duì)用戶選擇的學(xué)習(xí)和推理來(lái)調(diào)整。如果第一數(shù)據(jù)文件508中可以指定更多具體頻率信息,則第二數(shù)據(jù)文件510可以從第一數(shù)據(jù)文件508中生成。然而,第二數(shù)據(jù)文件510應(yīng)在用戶簡(jiǎn)檔文件夾中生成并保存,以使第二文件510可被用來(lái)在學(xué)習(xí)了用戶選擇之后保存經(jīng)調(diào)整的次序。以下列表指示發(fā)音和詞頻率。下劃線的詞是很少使用的詞。CHShao—1蒿侔嚆薅迭hao—2豪毫蠔號(hào)嚎貉壕濠蚵鶴MMhao—3好郝怒h(huán)ao—4號(hào)浩耗皓鎬好灝顥涸昊犒皓tianl天添佛夭......tian2田填恬甜汩昀外舌瓚……tian—3舔忝靦殄腆映係碘……tian4瑱掭站CHT廠幺—1蒿偉嚆薅迭廠幺_2豪毫蠔號(hào)嚎貉壕濠蚵鶴MM……廠幺_3好郝怒廠幺—4號(hào)浩耗皓鎬好灝顥涸MJffi:……亡一弓—i天添佛夷……亡一巧_2田填恬甜汩昀外舌瓚……*一弓3舔忝靦殄腆喚掭腆……亡一丐4瑱掭站可以提供上下文無(wú)關(guān)語(yǔ)法(CFG)來(lái)存儲(chǔ)有效音節(jié)。對(duì)于CHS,用戶能夠說(shuō)出"TIAN"來(lái)在CHS語(yǔ)音系統(tǒng)中獲得"tian",并隨后將其轉(zhuǎn)換成使用該發(fā)音的字符列表。CFG包括允許用戶說(shuō)"TIAN"來(lái)在轉(zhuǎn)換成字15符之前接收"tian"的另一選擇。該方法對(duì)雙元音或雙元音加上尾鼻音中的一些進(jìn)行分組,如以下所給出的,<xmlversion="1.0"encoding:"utf-16"><grammarxml:lang="zh-TW"version="l.0"xmlns="http:〃www.w3.org/2001/06/grammar"xmlns:sapi="http:〃schemas/microsoft.com/Speech/2002/06/SRGSExtensions"root-"Greeting"tag-format="semantics-ms/l.0"><mleid="Greeting"scope="public"〉<ori6-of><item><tokensapi:pron="bo_ho—ha—ha_h">ba</token〉</item><item><tokensapi:pron="bo—ho_ha—heh_h">bai</token〉</item><item><tokensapi:pron二"bo_ho_haa—hng—h">bang</token></item></one-of><one-of><item〉<tokensapi:pron="bii—hi_hgeeh—hi—h">ba</token></item><item><tokensapi:pron二"bii_hi—hgeeh_hi_hgaa—heh—h">bai</token></item><item><tokensapi:pron="bii_hi_hgeeh—hi_hgeel—hnn_hjii_hi—h">bang</token></item></onc-of>對(duì)于CHT,在語(yǔ)法中只使用注音中的音素。引擎中所使用的發(fā)音也將在語(yǔ)法中提供以增加SR準(zhǔn)確度。<xmlversion="1.0"encoding-"utf-16"><grammarxml:lang="zh-TW"version="1.0"xmlns="http:〃www.w3.org/2001/06/grammar"xmlns:sapi="http:〃schemas/microsoft.com/Speech/2002/06/SRGSExtensionsroot="Greeting"tag-format="semantics-ms/l()"><ruleid="Greeting"scope="public"><onc-of><item><tokensapi:pron="bo—ho—ha—ha—h">勺丫</token></item><item><tokensapi:pron="bo一ho—ha—heh—h"〉"17勞</token></item><item><tokensapi:pron="bo—ho—haa一hng—h">勺允</token></item>如果發(fā)音被不正確地識(shí)別,則向?qū)г试S用戶糾正發(fā)音。在選擇了要糾正的音素后,向?qū)境雠c誤識(shí)別的音素相近的音素列表,并且該列表可以根據(jù)兩音素之間的距離來(lái)排序,該距離取決于例如吐字的位置、吐字的方式、聲帶振動(dòng)、上下文、和其它本地方言的影響。在臺(tái)灣許多人講國(guó)語(yǔ)和閩南語(yǔ)。來(lái)自閩南語(yǔ)方言的聲音結(jié)構(gòu)以若干方式極大地影響國(guó)語(yǔ)語(yǔ)調(diào)。大多數(shù)人不能區(qū)分"生《尸日(巻舌音)"和"卩虧厶(齒齦音)",而一些人不能區(qū)分"匸(唇齒摩擦音)"與"廠(軟腭摩擦音)"。對(duì)于中國(guó)大陸南方某些方言,/n/和/l/是不可區(qū)分的,并且還影響其它所學(xué)習(xí)的語(yǔ)言的成果。對(duì)最小可區(qū)分音素集合之間的距離給出更短的距離。上下文指的是兩個(gè)音素是否出現(xiàn)在同一上下文中。例如,""(/b/)"和"夕(/ph/)"在上下文方面比"27(/b/)"和"匸(/f/)"更近,因?yàn)檫@些音素后面可跟隨同樣的核元音和尾輔音。<table>tableseeoriginaldocumentpage18</column></row><table>基于CHT中所使用的輔音的這些特征的示例性混淆矩陣表在以下給出。下表是通過(guò)基于吐字的位置、吐字的方式、聲帶振動(dòng)、上下文、以及其它本地方言的影響來(lái)計(jì)算距離獲得的。這一類(lèi)型的混淆矩陣還可以通過(guò)自動(dòng)地比較具有不同音子的將覆蓋吐字的位置、吐字的方式、聲帶振動(dòng)的AM來(lái)生成。混淆矩陣還可以通過(guò)具有不同音子的AM并基于上下文和其它方言的影響來(lái)調(diào)整以得到最終形式來(lái)獲得??梢允褂猛瑯拥姆椒▉?lái)生成CHT的元音和聲調(diào)的矩陣,以及所有其它亞洲語(yǔ)言的輔音和元音。<table>tableseeoriginaldocumentpage18</column></row><table>4143675455436545432門(mén)672378956767874632564344324421力1412434432325621443244211673446234力6784667634《142324323421432432廠432321241212321<12123212T321221蟲(chóng)12124沖122尸14234"P12虧1厶可以向中文和英文拼寫(xiě)模式提供拆分命令,例如以獲得更好的識(shí)別結(jié)果。例如,可以對(duì)"中文拼字(拼寫(xiě))"和"英文拼字"進(jìn)行拆分。這樣做的原因包括以下各項(xiàng)。在使用英文拼寫(xiě)時(shí),可以直接向文本返回英文字母;但在使用中文拼寫(xiě)時(shí),輸出音標(biāo)并隨后將其轉(zhuǎn)換成中文。因此,這兩個(gè)拼寫(xiě)模式的過(guò)程是不同的。英文字母和中文音標(biāo)中的一些是同音的。因19此,拆分兩個(gè)過(guò)程避免了混淆。此外,如果拆分該過(guò)程,則所激活的CFG可以更加簡(jiǎn)單。另外,識(shí)別準(zhǔn)確度會(huì)更高。拆分這兩個(gè)命令使CHS受益最大,因?yàn)镃HS中的音標(biāo)也是相同的26個(gè)英文字母。如果不執(zhí)行拆分,則用于轉(zhuǎn)換成中文字符的時(shí)間將是未知的。此外,如果用戶旨在對(duì)中文使用拼音,則可不執(zhí)行對(duì)有效語(yǔ)音序列的更嚴(yán)格的檢査。以下描述在用戶說(shuō)出命令時(shí)所觸發(fā)和呈現(xiàn)的一系列拼寫(xiě)模式面板(或屏幕截圖)。圖6示出在用戶期望亞洲字符/詞作為輸出時(shí)所呈現(xiàn)的拼寫(xiě)對(duì)話框面板600的屏幕截圖。在用戶說(shuō)出"中文拼字"時(shí),呈現(xiàn)拼寫(xiě)模式面板600,且其包括指示面板600是中文拼寫(xiě)(拼字)面板的標(biāo)題欄602,使用發(fā)音來(lái)獲得字符或同音字命令來(lái)改變字符(注音拼字或諧音換字)604,發(fā)音(注音)606,以及各中文對(duì)話框選擇器同音字(諧音)(H)選擇器608、確定(確定)(0)選擇器610、和取消(取消)(E)選擇器612。在用戶說(shuō)出"英文拼字"時(shí),圖7示出在用戶期望英文單詞作為輸出時(shí)所呈現(xiàn)的拼寫(xiě)模式對(duì)話框面板700的屏幕截圖。面板700用中文示出"拼寫(xiě)(拼字)面板"702、"清晰地拼寫(xiě)單詞"(或吐字清晰)的中文指令(用清晰的聲音拼出文字)704、"再次拼寫(xiě)"的中文指令(再拼字一次)706、以及用中文標(biāo)記的一個(gè)或多個(gè)選擇器確定(確定)選擇器708和取消(取消)選擇器710。面板700還呈現(xiàn)英文字母和/或其它字符(例如@)的經(jīng)索引和排序的列表712。雖然在該實(shí)施例中被示為有某種程度的不同,但面板600和700具有除在一個(gè)中出現(xiàn)而不在另一個(gè)中出現(xiàn)的特征之外的更相似的外觀以提供更一致的用戶體驗(yàn)是合乎需要的。圖8-10呈現(xiàn)與使用同音字糾正的過(guò)程相關(guān)聯(lián)的屏幕截圖。圖8示出所呈現(xiàn)的用于同音字命令處理的拼寫(xiě)對(duì)話框面板800的屏幕截圖。用于獲得作為同音字的正確字符的命令被發(fā)聲。所顯示/識(shí)別的詞作為608中的"諧音(同音字)"來(lái)提供。該語(yǔ)音命令界面可被認(rèn)為比鍵入更高效,因?yàn)榭梢员苊鈱?duì)音標(biāo)的重復(fù)鍵入。換言之,有時(shí)所發(fā)聲的命令被正確地識(shí)別,但用戶想要不同的字符。并非提示用戶重復(fù)發(fā)音,該命令可被處理以輸出同音字列表。使用這一功能,通過(guò)語(yǔ)音來(lái)糾正提供了超過(guò)手動(dòng)輸入(例如鍵入)的改進(jìn)用戶體驗(yàn)。S卩,在用戶通過(guò)鍵入手動(dòng)地輸入發(fā)音并從同音字列表中選擇詞時(shí),該詞將作為底下有虛線的文本來(lái)呈現(xiàn)。在該模式中,用戶仍然可以改變來(lái)自列表的字符。然而,在用戶對(duì)詞確信時(shí),用戶可以選擇回車(chē)(或"確定")選擇器610以在文本中鎖定該詞,以使輸入系統(tǒng)不再?gòu)乃峙涞腖M分?jǐn)?shù)自動(dòng)調(diào)整該詞。因此,一旦在對(duì)話框面板800中鎖定了詞,則如果用戶想要再次改變?cè)撛~,則必須重試音標(biāo)。該語(yǔ)音命令界面通過(guò)識(shí)別"諧音"命令而節(jié)省了手動(dòng)輸入的額外努力。作為第一步驟,用戶通過(guò)說(shuō)"更正1號(hào)字"來(lái)選擇要糾正的詞。隨后加亮第一字符802。用戶隨后可以說(shuō)用于同音字的"諧音"或選擇"諧音"("同音字")選擇器608,以獲得原始中文字符的同音字(H)字符。面板800還以中文呈現(xiàn)對(duì)話框選擇器同音字選擇器608、確定選擇器610和取消選擇器612。注意,可以對(duì)面板800中的任何字符(標(biāo)記為1、2或3的域中)執(zhí)行通過(guò)同音字命令或提供發(fā)音的糾正,其中802是第一字符。然而,候選字符列表將是不同的。來(lái)自同音字命令的候選列表將包含音調(diào)相同或稍微不同的字符。來(lái)自提供發(fā)音的候選列表將包含與用戶給出的發(fā)音精確匹配的字符。如果用戶將采用發(fā)音,則將使第二字符被加亮來(lái)呈現(xiàn)圖8的屏幕截圖,而非如圖IO所示的第一字符被加亮。隨后,在用戶提供了發(fā)音后,呈現(xiàn)圖11的屏幕截圖。圖9示出響應(yīng)于用于同音字糾正的語(yǔ)音激活命令來(lái)呈現(xiàn)的拼寫(xiě)模式對(duì)話框面板900的屏幕截圖。拼寫(xiě)向?qū)еС衷甲址陌l(fā)音,以便在列表框902中呈現(xiàn)經(jīng)索引的同音字符列表。用戶隨后可以通過(guò)說(shuō)出相關(guān)聯(lián)的索引號(hào),如第一候選的"一"或"一號(hào)",或在該情況下點(diǎn)擊字符906來(lái)選擇所需字符。作為響應(yīng),發(fā)音面板900將清除列表框902,用所選字符906替換原始字符802,并且如圖IO的面板1000所示,列表框902已響應(yīng)于所發(fā)聲的索引選擇而被清除。向?qū)щS后將交互移動(dòng)到第二字符1002(第二域中)以進(jìn)行類(lèi)似處理,如以上根據(jù)圖8的字符802(第一域中)所述。繼續(xù)圖10,所發(fā)聲的糾正可以通過(guò)提供發(fā)音來(lái)完成。如果向?qū)形匆苿?dòng)到并加亮第二字符1002,則用戶通過(guò)說(shuō)出"更正二號(hào)字"來(lái)通過(guò)選擇或?qū)Ш降揭m正的詞來(lái)開(kāi)始,以加亮第二字符1002。21圖11示出所呈現(xiàn)的用于語(yǔ)音發(fā)音的拼寫(xiě)對(duì)話框面板1100的屏幕截圖。接著,用戶說(shuō)出用于發(fā)音的"TL4h",該發(fā)音在發(fā)音域1102中被呈現(xiàn)給用戶,并且向?qū)г俅卧诹斜砜?02中提供經(jīng)索引的詞列表。列表框卯2以更頻繁使用的詞在頂部并且較不頻繁使用的詞靠近底部的次序列出候選詞。另外,在系統(tǒng)指示用諸如姓等關(guān)鍵詞來(lái)糾正第一字符802時(shí),系統(tǒng)將檢測(cè)到該關(guān)鍵詞并調(diào)整對(duì)后續(xù)字符候選列表的糾正。在這種情況下,在糾正其余字符時(shí),用于名的字符將提升到候選列表902的頂部。如上所述,用戶隨后可以通過(guò)說(shuō)出相關(guān)聯(lián)的索引號(hào)來(lái)選擇所需字符,諸如與第二候選相關(guān)聯(lián)的"二"或"二號(hào)"以獲得"薰"。此后,所選候選替換舊字符且發(fā)音面板1100將被清除,并且列表框902將從對(duì)話框中移除。如果SR不正確地識(shí)別了發(fā)音,則向?qū)⒒谏鲜龌煜仃噥?lái)顯示最接近的音素。圖12示出所呈現(xiàn)的用于糾正所說(shuō)出的發(fā)音的拼寫(xiě)對(duì)話框面板1200的屏幕截圖。用戶可以通過(guò)說(shuō)來(lái)表達(dá)要糾正的音素以與向?qū)нM(jìn)行交互,例如"更正第一個(gè)音"。第一音素1202隨后將被加亮。音素列表框1204隨后將被呈現(xiàn)為具有以音素距離為次序的音素列表。用戶隨后可以說(shuō)出"〈"(等于拼音中的"qi"),以使第一誤識(shí)別的音素1202被正確的音素"〈"替換,如列表框1204中的經(jīng)索引的"1"。圖13示出基于對(duì)所說(shuō)出的發(fā)音的糾正來(lái)呈現(xiàn)的具有修訂的同音字列表框902的拼寫(xiě)對(duì)話框面板1300的屏幕截圖?;诟淖兊囊羲貋?lái)糾正同音字符列表框902。接著,用戶通過(guò)說(shuō)出相關(guān)聯(lián)的號(hào)碼來(lái)選擇圖14中示出的第一字符1402,如在該情況下是"一"或"一號(hào)"。因此,所選候選替換原始字符且發(fā)音域1102將被清除,并且列表框902將從對(duì)話框中移除。圖14示出在光標(biāo)移動(dòng)到下一字符以對(duì)所說(shuō)出的發(fā)音進(jìn)行處理或在圖13的處理完成時(shí)所呈現(xiàn)的拼寫(xiě)對(duì)話框面板1400的屏幕截圖。如此處所描述的,名字可能需要拼寫(xiě)向?qū)?,因?yàn)槊恳挥脩舨粫?huì)精確知道名字中所使用的字符。因此,提示可以從名字中獲得并提供。例如,在某些情況下,可能只有幾百個(gè)類(lèi)型的姓值得考慮,并且如上所述,已經(jīng)知道該集合是固定的。因此,在選擇總是詞/字符串的第一字符的姓時(shí),列表框中所顯示的字符候選列表將被調(diào)整。例如,對(duì)于使用'fan'的名字,該字符可以是凡、繁、煩、藩、犯等。對(duì)于大多數(shù)字符,用戶將選擇正面或中性意義的名字,在以上前兩個(gè)示例中示出。然而,如果訓(xùn)練數(shù)據(jù)是從報(bào)紙上獲得的(這是大多數(shù)當(dāng)前語(yǔ)言訓(xùn)練系統(tǒng)的情況),該字符可能與具有很高頻率計(jì)數(shù)的最后的意義"犯"相關(guān)聯(lián)。因此,通過(guò)在數(shù)據(jù)文件中提供類(lèi)別信息,詞的列表可以根據(jù)提示來(lái)調(diào)整??杀豢紤]的提示包括但不限于個(gè)人名字(例如姓)、街道名稱(chēng)(例如利用路、街、市和縣)、以及公司/組織名稱(chēng)(例如利用公司和院)。當(dāng)用戶更熟悉或精通在拼寫(xiě)模式中用多個(gè)字符來(lái)選擇詞并且基于有限的字符序列來(lái)正確地解析該詞(以尋找詞邊界)時(shí),以上場(chǎng)景更易于由所公開(kāi)的系統(tǒng)來(lái)處理(或識(shí)別)。如果用戶只從多個(gè)字符的詞中選擇一個(gè)字符,則該系統(tǒng)可能丟失該新詞的詞邊界信息。上述第二方法通過(guò)包含所需字符的詞的語(yǔ)音輸入來(lái)獲得中文字符。圖15示出根據(jù)第二方法將正面、中性、和負(fù)面意義用于字符加權(quán)的系統(tǒng)1500。圖15的識(shí)別組件102示出多個(gè)亞洲語(yǔ)言引擎502,其中第一引擎504使用詞中的字符方法404,該方法又使用數(shù)據(jù)文件1502來(lái)提供數(shù)據(jù)。每一語(yǔ)言引擎502都可以使用數(shù)據(jù)文件1502來(lái)基于詞中的字符方法404獲得字符。第一數(shù)據(jù)文件1504包括正面和中性意義的詞,第二數(shù)據(jù)文件1506包括負(fù)面意義的詞,而第三數(shù)據(jù)文件1508包括詞典中的不是這兩個(gè)數(shù)據(jù)文件(1504和1506)的一部分的其余詞。根據(jù)詞中的字符方法404,和/或除提供發(fā)音來(lái)獲得字符之外,用戶還可以通過(guò)給出包含所需字符的其它詞來(lái)獲得字符。類(lèi)似于"a,asinapple"用戶可以諸如通過(guò)說(shuō)出包含所需字符"薰"的詞"薰陶的薰"指定該字符。"薰陶"是包含所需字符"薰"的詞。詞"的"是指示所需字符是該詞的一部分的所有格形式。為獲得SR識(shí)別準(zhǔn)確度,具有關(guān)于往往用來(lái)指定字符的詞的信息或數(shù)據(jù)是合乎需要的。在許多情況下,往往使用最頻繁使用的詞以及具有正面語(yǔ)義的詞來(lái)指定字符。以下是可以獲得CFG的詞的方式??梢允占值拇笮驼Z(yǔ)料庫(kù),以具有這些名字中通常將使用的字符的列表。此外,該語(yǔ)料庫(kù)應(yīng)當(dāng)是有效字符的小子集。另外,識(shí)別準(zhǔn)確度可以通過(guò)尋找詞的包含該字符的大型語(yǔ)料庫(kù),隨后將這些詞分組到包括正面或中性意義的第一組或文件1504和包括負(fù)面意義的第二組或文件1506來(lái)改進(jìn)。往往使用具有正面或中性意義的詞來(lái)指定名字中使用的字符。系統(tǒng)1500可包括向詞分配加權(quán)數(shù)據(jù)或值的加權(quán)組件1510。隨后可以向正面和中性意義分配較高的加權(quán)值,向負(fù)面意義分配中間加權(quán)值,并向詞典中的不包含通常在名字中使用的字符的其余詞分配較低加權(quán)值。此外,這三個(gè)組中的詞可以使用圖5的頻率組件514以基于詞使用頻率來(lái)排序。該方法例如適用于中文以及日文中的漢字。在UI光標(biāo)處于拼寫(xiě)窗口的頂部(或拆分或中文)面板中的各字符(諸如802、1002和1402中的各字符)中的一個(gè)的上方時(shí),該方法活動(dòng)。即,用戶可以提供發(fā)音或者包含該字符的詞以最終獲得所需字符。上述第三方法406提供詞分解來(lái)獲得中文字符。圖16示出根據(jù)第三方法按所需字符的子分量的語(yǔ)音輸入來(lái)采用詞分解的系統(tǒng)1600。識(shí)別組件102示出多個(gè)亞洲語(yǔ)言引擎502,其中第一引擎504使用字符分解方法406,該方法又利用數(shù)據(jù)文件1602來(lái)提供數(shù)據(jù)。每一語(yǔ)言引擎502都可以使用數(shù)據(jù)文件1602來(lái)基于字符分解方法406獲得字符。第一數(shù)據(jù)文件1604包括可分解字符而第二數(shù)據(jù)文件1606包括字符的組成分量。用戶可以通過(guò)說(shuō)"木子;李"來(lái)指定"李"以通過(guò)提供詞的子分量來(lái)獲得所需字符,其中"木"和"子"是組合形成"李"的子分量符號(hào);"木"是該字符的頂部符號(hào)而"子"是底部符號(hào)。可以理解,可分解并且用戶還普遍使用的字符并不很多。因此,將收集可被分解的所有字符和普遍使用的可分解表達(dá)式并將其包括在語(yǔ)法中。類(lèi)似于第二方法404,在光標(biāo)處于拼寫(xiě)向?qū)姘宓牟鸱置姘宓捻敳棵姘逯械母髯址?諸如802、1002和1402中的各字符)中的一個(gè)的上方時(shí),第三方法406可以活動(dòng)。換言之,用戶可以通過(guò)發(fā)音或包含詞、或子分量來(lái)得到所需字符。系統(tǒng)1600包括用于尋找、處理和存儲(chǔ)流行字符1604并將這些字符分解成組成分量1606的流行性組件1608。簡(jiǎn)要參考圖2,共享組件208允許用戶共享本地詞典,以改進(jìn)其他用24戶的SR準(zhǔn)確度或減少他們的糾正努力。在用戶使用本體系結(jié)構(gòu)的各方面時(shí),該用戶可以"教導(dǎo)"該系統(tǒng),或該系統(tǒng)可以學(xué)習(xí)該用戶的活動(dòng)和/或系統(tǒng)數(shù)據(jù)/參數(shù)(例如,使用圖3的推斷組件302的學(xué)習(xí)和推理能力)。如用戶所指示的,所識(shí)別的詞的概率可以改變,以示出哪些詞被最頻繁地使用。另外,如果詞未出現(xiàn)在圖2的默認(rèn)詞典202中,則用戶可以將其添加到詞典的用戶定義的部分。此時(shí),用戶可以"告訴"語(yǔ)音識(shí)別器102在詞典中的哪里(例如默認(rèn)或用戶定義的)可以找到附加的詞??缍鄠€(gè)用戶共享、加載、以及上傳新詞典的能力方便提供持續(xù)改進(jìn)的分布式語(yǔ)料庫(kù)。換言之,每一用戶將使用心疼或類(lèi)似的詞來(lái)"教導(dǎo)"各個(gè)用戶計(jì)算機(jī)和方法。例如,在組或協(xié)作環(huán)境中,與其他用戶共享用戶定義的詞典是有好處的。例如,在團(tuán)隊(duì)項(xiàng)目的上下文中,隨著用戶用新詞更新相關(guān)聯(lián)的用戶詞典,共享可以將這些新詞傳播給項(xiàng)目團(tuán)隊(duì)的其他成員。共享可以用多種方式來(lái)執(zhí)行,包括在其中在多個(gè)用戶之間共享單個(gè)文件以及批量共享對(duì)逐詞共享的中央位置。除域另一用戶或團(tuán)隊(duì)共享之外,所公開(kāi)的體系結(jié)構(gòu)的共享組件208包括向供應(yīng)商實(shí)體提供關(guān)于語(yǔ)音識(shí)別器102學(xué)習(xí)了什么的反饋,以使供應(yīng)商可以改進(jìn)默認(rèn)詞典的能力。為此,語(yǔ)音識(shí)別器102可包括允許用戶指示向用戶定義的詞典添加的新詞是否可以在用戶系統(tǒng)、項(xiàng)目團(tuán)隊(duì)、禾P/或公司邊界之外共享的機(jī)制。如果允許,則識(shí)別器102可以將該信息發(fā)送到供應(yīng)商,以供審閱并包括在下一公共發(fā)行或更新的默認(rèn)詞典中。然而,如果用戶不允許這一點(diǎn),則不向供應(yīng)商發(fā)送新添加的項(xiàng)??梢园l(fā)送到供應(yīng)商的項(xiàng)的示例是社區(qū)中最近變得流行的新的工業(yè)范圍的詞,而專(zhuān)用詞的示例可以是公司名稱(chēng)或項(xiàng)目的內(nèi)部名稱(chēng)。應(yīng)當(dāng)考慮安全問(wèn)題以確保共享不違反例如知識(shí)產(chǎn)權(quán)規(guī)章、共享的內(nèi)容的范圍、以及共享的決策過(guò)程。所公開(kāi)的體系結(jié)構(gòu)還方便使用和實(shí)現(xiàn)不同亞洲語(yǔ)字符集的命令。例如,日語(yǔ)具有四種不同類(lèi)型的書(shū)寫(xiě)系統(tǒng)平假名、片假名、日文漢字和日文羅馬字。平假名可被認(rèn)為是日文語(yǔ)音系統(tǒng),并且也是有效的書(shū)寫(xiě)系統(tǒng)(類(lèi)似于西班牙語(yǔ),其中用戶寫(xiě)的即是該詞聽(tīng)起來(lái)的)。片假名是較正式的書(shū)寫(xiě)系統(tǒng),其具有到平假名的一對(duì)一映射。日文漢字通常用于書(shū)寫(xiě)名字。類(lèi)似于中文,一組平假名聲音可對(duì)應(yīng)于日文漢字中的多個(gè)同音字。因此,可以采用相同的拼寫(xiě)面板和過(guò)程來(lái)從平假名獲得日文漢字。此外,并非像在中文中一樣提供同音字功能,將給出平假名和片假名的按鈕,以便如果用戶只想要平假名或?qū)?yīng)的片假名,則可以利用在拆分面板方法(圖17中的1708或圖18中的1806)的頂部詞面板中得到詞的語(yǔ)音命令能力或按鈕??梢杂幸粋€(gè)按鈕或選擇器供用戶選擇和/或根據(jù)按鈕名稱(chēng)的語(yǔ)音命令來(lái)將平假名轉(zhuǎn)換成日文羅馬字。因?yàn)橐唤M平假名可以對(duì)應(yīng)于多個(gè)日文羅馬字字符,所以在用戶說(shuō)出例如"口一7字"("日文羅馬字")等平假名發(fā)音以觸發(fā)日文羅馬字轉(zhuǎn)換時(shí),用于列出曰文漢字的同音字的列表框?qū)⒈磺宄⒂萌瘴牧_馬字的結(jié)果來(lái)重新填充。隨后,用戶可以說(shuō)所需日文羅馬字字符前的索引號(hào)來(lái)將該日文羅馬字字符移動(dòng)到頂部詞面板(圖17中的1708或圖18中的1806)。例如,對(duì)于諸如"土",該字符在平假名、片假名、日文漢字、曰文羅馬字等四種書(shū)寫(xiě)系統(tǒng)的輸出如下平假名,6片假名日文羅馬字tsuchi、tuchi、tuti日文漢字土存在共享同一發(fā)音(同一片假名)的其它日文漢字,例如,日文漢字同音字槌、鎚、壌、椎圖17示出所呈現(xiàn)的用于通過(guò)平假名的語(yǔ)音/鍵入輸入來(lái)進(jìn)行日語(yǔ)識(shí)別和處理以獲得日文漢字的拼寫(xiě)對(duì)話框面板1700的屏幕截圖。面板1700包括指示使用平假名的標(biāo)題欄^力、'《入力"冬A)。列表框1704示出日文羅馬字詞列表的日文漢字同音字列表或圖18中的1802。串1706告訴用戶使用平假名作為輸入來(lái)處理到所需書(shū)寫(xiě)系統(tǒng)的轉(zhuǎn)換。詞面板1708存儲(chǔ)輸26入到詞處理器應(yīng)用程序的最終字符。發(fā)音域1710示出所識(shí)別的輸入以供處理。面板1700還包括以下選擇器日文羅馬字(a—7字)(R)1712、平假名(^6力;&)(H)選擇器1714、片假名(力夕力于)(K)選擇器1716、確定(OK)(0)選擇器1718、以及取消(*^>七A)(E)選擇器1720。為獲得日文漢字字符,用戶可以說(shuō)出"O6力;&入力"冬^"("平假名輸入面板")以觸發(fā)向?qū)磳?xiě)面板1700,隨后說(shuō)出",6"(平假名中的"土"),這作為反饋在發(fā)音域1710中呈現(xiàn)給用戶(此后,列表框1704將自動(dòng)地說(shuō)出日文漢字同音字符的列表,每一字符前具有數(shù)字索引)。用戶隨后可以說(shuō)出"l番"("第一個(gè)")來(lái)使列表框1704中的第一個(gè)詞"土"被移動(dòng)到詞面板域1708。列表框1704此后不再展示。用戶隨后可以說(shuō)"確定"來(lái)關(guān)閉拼寫(xiě)面板1700,并且使用當(dāng)前使用的任何文字處理程序來(lái)將詞面板1708中的詞"土"復(fù)制到文檔中。為獲得平假名,用戶可以說(shuō)^力;《入力八°木A"以觸發(fā)拼寫(xiě)面板1700的啟動(dòng)。在用戶說(shuō)出",6"以使",6"呈現(xiàn)在發(fā)音域1710中時(shí),列表框1704將自動(dòng)地生成日文漢字同音字符的列表作為默認(rèn)列表;然而,用戶可以選擇忽略該列表。接著,用戶可以說(shuō)出^力5&"("平假名")并且1710中所識(shí)別的",^"將自動(dòng)地被移動(dòng)到詞面板1708。列表框1704隨后將被移除,因?yàn)椴辉傩枰?。通過(guò)說(shuō)"OK(確定)",用戶使對(duì)話框拼寫(xiě)面板1700關(guān)閉,并且詞面板1708中的詞將被復(fù)制到當(dāng)前打開(kāi)的文檔中。為獲得片假名,用戶可以說(shuō)出^力;^入力"冬A"以觸發(fā)拼寫(xiě)面板1700的啟動(dòng)。在用戶說(shuō)出",6"以使",6"呈現(xiàn)在發(fā)音面板域1710中時(shí),列表框1704將自動(dòng)地生成日文漢字同音字符的列表;然而,用戶可以選擇忽略該列表。接著,用戶可以說(shuō)"力夕力于"("片假名"),并且系統(tǒng)將獲得片假名版本千"(片假名中的"土"),并且該系統(tǒng)將在詞面板1708中直接寫(xiě)f"。隨后可以使列表框1704消失,因?yàn)椴辉傩枰?。用戶可以選擇"OK"來(lái)關(guān)閉拼寫(xiě)面板1700,并且詞面板1708中的詞將經(jīng)由現(xiàn)有文字處理器來(lái)復(fù)制到文檔中。圖18示出所呈現(xiàn)的用于與獲得日文羅馬字相關(guān)的日語(yǔ)識(shí)別和處理的拼寫(xiě)對(duì)話框面板1800的屏幕截圖。為獲得日文羅馬字,用戶可以說(shuō)"^b力、'&入力"木A"以觸發(fā)拼寫(xiě)面板1800來(lái)打開(kāi)。在用戶說(shuō)出",6"以使",6"呈現(xiàn)在發(fā)音面板域1804中時(shí),列表框1802將在列表框1802中自動(dòng)地生成日文漢字同音字符的列表;然而,用戶可以忽略該列表。如果用戶說(shuō)出"a—T字"("日文羅馬字"),則系統(tǒng)會(huì)將",6"轉(zhuǎn)換成曰文羅馬字版本。因?yàn)榇嬖谌瘴牧_馬字版本的多個(gè)候選,所以用日文羅馬字的候選替換列表框1802中的日文漢字候選。用戶隨后可以說(shuō)出"l番"以獲得列表框1802中的第一個(gè)詞,以使"tsuchi"移動(dòng)到詞面板1806。隨后可以使列表框1802消失。如果用戶說(shuō)"OK",則拼寫(xiě)面板1800關(guān)閉,并且詞面板1806中的詞將被復(fù)制到文檔中或當(dāng)前正在使用的文字處理器中。盡管參考如屏幕截圖的各個(gè)附圖示出并描述了向用戶顯示信息的一些方式,但相關(guān)領(lǐng)域的技術(shù)人員可以認(rèn)識(shí)到,可采用各種其它替換方案。術(shù)語(yǔ)"屏幕"、"屏幕截圖"、"網(wǎng)頁(yè)"、"文檔"和"頁(yè)面"在本文中一般可互換使用。頁(yè)面或屏幕作為顯示描述、作為圖形用戶界面或通過(guò)描繪屏幕(例如,無(wú)論是個(gè)人計(jì)算機(jī)、PDA、移動(dòng)電話還是其它合適的設(shè)備)上的信息的其它方法被存儲(chǔ)和/或傳輸,其中要顯示在頁(yè)面上的布局和信息或內(nèi)容被存儲(chǔ)在存儲(chǔ)器、數(shù)據(jù)庫(kù)或另一存儲(chǔ)設(shè)施中。圖19示出根據(jù)所公開(kāi)的體系結(jié)構(gòu)的識(shí)別語(yǔ)音的方法。盡管出于解釋簡(jiǎn)明的目的,此處例如以流圖或流程圖形式示出的一個(gè)或多個(gè)方法被示出并描述為一系列動(dòng)作,但是可以理解和明白,這些方法不受動(dòng)作的次序的限制,因?yàn)楦鶕?jù)本發(fā)明,某些動(dòng)作可以按與此處所示并描述的不同的次序和/或與其它動(dòng)作同時(shí)發(fā)生。例如,本領(lǐng)域技術(shù)人員將會(huì)明白并理解,方法可被替換地表示為一系列相互關(guān)聯(lián)的狀態(tài)或事件,諸如以狀態(tài)圖的形式。此外,并非一方法中所示的所有動(dòng)作都是對(duì)于新穎實(shí)現(xiàn)所必需的。在1900處,語(yǔ)音識(shí)別引擎接收亞洲語(yǔ)語(yǔ)音形式的語(yǔ)音輸入。在1902處,對(duì)亞洲語(yǔ)語(yǔ)音信號(hào)進(jìn)行識(shí)別處理以輸出結(jié)果。在1904處,進(jìn)入拼寫(xiě)/糾正模式來(lái)拼寫(xiě)新詞或糾正結(jié)果。在1906處,基于語(yǔ)音發(fā)音和/或字符選擇來(lái)單遍糾正結(jié)果的拼寫(xiě)。在1908處,隨后將經(jīng)糾正的結(jié)果輸出到文檔或應(yīng)用程序。圖20示出使用拼寫(xiě)向?qū)?lái)糾正識(shí)別結(jié)果的方法。在2000處,識(shí)別引擎接收亞洲語(yǔ)語(yǔ)音輸入。在2002處,對(duì)亞洲語(yǔ)語(yǔ)音信號(hào)進(jìn)行識(shí)別處理,并進(jìn)入糾正模式以糾正結(jié)果的拼寫(xiě)。在2004處,啟動(dòng)拼寫(xiě)向?qū)ё鳛榧m正模式的一部分。在2006處,通過(guò)語(yǔ)音發(fā)音來(lái)將亞洲語(yǔ)字符輸入到向?qū)?。?008處,經(jīng)由向?qū)Щ谡Z(yǔ)音發(fā)音來(lái)糾正拼寫(xiě)。圖21示出將語(yǔ)音發(fā)音轉(zhuǎn)換成字符的方法。在2100處,開(kāi)始為轉(zhuǎn)換過(guò)程準(zhǔn)備數(shù)據(jù)文件。在2102處,創(chuàng)建經(jīng)索引的詞和詞值的數(shù)據(jù)文件,該值包括發(fā)音、音調(diào)、使用頻率、以及類(lèi)別。在2104處,按照使用頻率的次序來(lái)創(chuàng)建經(jīng)索引的發(fā)音和具有發(fā)音作為值的詞的數(shù)據(jù)文件。在2106處,創(chuàng)建音素距離的混淆矩陣的數(shù)據(jù)文件。在2108處,訪問(wèn)數(shù)據(jù)文件以經(jīng)由拼寫(xiě)向?qū)нM(jìn)行發(fā)音處理。圖22示出在亞洲語(yǔ)和英語(yǔ)中使用拆分命令來(lái)進(jìn)行糾正處理的方法。在2200處,呈現(xiàn)亞洲語(yǔ)和英語(yǔ)兩者中的拆分命令。在2202處,進(jìn)行是否要進(jìn)入英文拼寫(xiě)糾正模式的檢査。如果是,則在2204處,進(jìn)入英文拼寫(xiě)模式。在2206處,通過(guò)拼寫(xiě)模式中可用的方法基于語(yǔ)音信號(hào)來(lái)呈現(xiàn)候選字符列表。在2208處,基于所選候選來(lái)拼寫(xiě)新詞或糾正誤識(shí)別的詞。如果在2202處,未進(jìn)入英文拼寫(xiě)模式,則流程去到2210以進(jìn)入亞洲語(yǔ)拼寫(xiě)模式,并如上所述隨后去到2206以繼續(xù)。圖23示出在亞洲語(yǔ)拼寫(xiě)向?qū)е惺褂猛糇置畹姆椒?。?300處,呈現(xiàn)亞洲語(yǔ)和英語(yǔ)兩者中的拆分命令。在2302處,進(jìn)入亞洲語(yǔ)拼寫(xiě)糾正模式。在2304處,接收同音字命令。在2306處,基于目標(biāo)字符的同音字字符來(lái)呈現(xiàn)候選字符的列表。在2308處,基于所選候選來(lái)糾正誤識(shí)別的詞。圖24示出將加權(quán)值應(yīng)用于詞意義的方法。在2400處,開(kāi)始準(zhǔn)備通過(guò)包含所需字符的詞來(lái)進(jìn)行糾正。在2402處,收集名字的大型語(yǔ)料庫(kù)。在2404處,尋找包含名字中的字符的詞。在2406處,將詞分組到正面和中性意義的文件中。在2408處,將詞分組到負(fù)面意義的文件中。在2410處,將高加權(quán)應(yīng)用于正面和中性意義組中的詞。在2412處,將中等加權(quán)應(yīng)用于負(fù)面意義組中的詞。在2414處,將低加權(quán)應(yīng)用于不在這兩組中的詞。在2416處,根據(jù)使用頻率來(lái)對(duì)詞進(jìn)行排序。圖25示出共享經(jīng)更新的詞典的方法。在2500處,進(jìn)入糾正模式。在2502處,跟蹤和記錄糾正模式期間所采用的新詞。在2504處,將新詞輸入到本地詞典中。在2506處,隨后將經(jīng)更新的詞典傳送給其他用戶。在2508處,用戶可以將經(jīng)更新的詞典傳送給供應(yīng)商以更新分發(fā)詞典語(yǔ)料庫(kù)。圖26示出將字符分解用于拼寫(xiě)糾正的方法。在2600處,啟動(dòng)拼寫(xiě)糾正模式。在2602處,用戶說(shuō)出所需字符的子分量符號(hào)。在2604處,該方法循環(huán)通過(guò)子分量和相應(yīng)字符之間的關(guān)系的對(duì)應(yīng)的表。在2606處,如果存在超過(guò)一個(gè)匹配,則呈現(xiàn)子分量的所有可能的字符。在2608處,隨后基于子分量來(lái)選擇候選字符。圖27A和27B示出基于用于拼寫(xiě)糾正的多個(gè)方法來(lái)進(jìn)行糾正處理的方法。在2700處,引擎接收亞洲語(yǔ)語(yǔ)音輸入。在2702處,在UI中呈現(xiàn)所識(shí)別的引擎結(jié)果。在2704處,系統(tǒng)接收進(jìn)入拼寫(xiě)/糾正模式的語(yǔ)音命令(直接輸入新詞)。流程隨后去到2706,在此,為詞上下文處理同樣的和/或其它字符。另選地,流程可以從2702去到2708,在此,系統(tǒng)接收選擇詞來(lái)糾正的語(yǔ)音命令。在2710處,系統(tǒng)接收進(jìn)入拼寫(xiě)模式和選擇并糾正字符的語(yǔ)音命令。如上所述,流程隨后去到2706,在此,為詞上下文處理同樣的和/或其它字符。移到圖27B,在2712處,基于所計(jì)算的上下文來(lái)訪問(wèn)可能的詞列表。例如,上下文可以是個(gè)人名字。在2714處,基于同樣的和/或其它字符來(lái)對(duì)詞列表的字符進(jìn)行排序。在2716處,選擇對(duì)字符進(jìn)行選擇的方法。在2718處,流程可以行進(jìn)到2720,在2720中,選擇在其中以類(lèi)似用法說(shuō)出包含字符的詞的方法。另選地,在2722處,選擇通過(guò)提供所需字符的發(fā)音來(lái)獲得字符的方法。另外,在2724處,選擇在其中按子分量來(lái)說(shuō)出詞以獲得字符的方法?;蛘?,在2726處,選擇說(shuō)出(多個(gè))詞以獲得同音字列表并從該同音字列表中進(jìn)行選擇的方法。在2728處,添加新字符或隨后用所選字符替換拼錯(cuò)的詞中的不正確的字符。在2730處,隨后從用戶接收對(duì)整個(gè)詞正確性的語(yǔ)音確認(rèn)。在2732處,隨后使用正確的字符來(lái)糾正引擎結(jié)果。如在本申請(qǐng)中所使用的,術(shù)語(yǔ)"組件"和"系統(tǒng)"旨在表示計(jì)算機(jī)相關(guān)的實(shí)體,其可以是硬件、硬件和軟件的組合、軟件、或者執(zhí)行中的軟件。例如,組件可以是但不限于,在處理器上運(yùn)行的進(jìn)程、處理器、硬盤(pán)驅(qū)動(dòng)器、多個(gè)(光和/或磁存儲(chǔ)介質(zhì)的)存儲(chǔ)驅(qū)動(dòng)器、對(duì)象、可執(zhí)行代碼、執(zhí)行的線程、程序、和/或計(jì)算機(jī)。作為說(shuō)明,運(yùn)行在服務(wù)器上的應(yīng)用程序和服務(wù)器都可以是組件。一個(gè)或多個(gè)組件可以駐留在進(jìn)程和/或執(zhí)行的線程內(nèi),且組件可以位于一臺(tái)計(jì)算機(jī)內(nèi)上/或分布在兩臺(tái)或更多的計(jì)算機(jī)之間?,F(xiàn)在參考圖28,示出了可用于執(zhí)行根據(jù)所公開(kāi)的體系結(jié)構(gòu)的糾正處理的計(jì)算系統(tǒng)2800的框圖。為了提供用于其各方面的附加上下文,圖28及以下討論旨在提供對(duì)其中可實(shí)現(xiàn)該各方面的合適的計(jì)算系統(tǒng)2800的簡(jiǎn)要概括描述。盡管以上描述是在可在一個(gè)或多個(gè)計(jì)算機(jī)上運(yùn)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中進(jìn)行的,但是本領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到,新穎實(shí)施例也可結(jié)合其它程序模塊和/或作為硬件和軟件的組合來(lái)實(shí)現(xiàn)。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類(lèi)型的例程、程序、組件、數(shù)據(jù)結(jié)構(gòu)等等。此外,本領(lǐng)域的技術(shù)人員可以理解,本發(fā)明的方法可用其它計(jì)算機(jī)系統(tǒng)配置來(lái)實(shí)施,包括單處理器或多處理器計(jì)算機(jī)系統(tǒng)、小型計(jì)算機(jī)、大型計(jì)算機(jī)、以及個(gè)人計(jì)算機(jī)、手持式計(jì)算設(shè)備、基于微處理器的或可編程消費(fèi)電子產(chǎn)品等,其每一個(gè)都可操作上耦合到一個(gè)或多個(gè)相關(guān)聯(lián)的設(shè)備。所示各方面也可以在其中某些任務(wù)由通過(guò)通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備來(lái)執(zhí)行的分布式計(jì)算環(huán)境中實(shí)施。在分布式計(jì)算環(huán)境中,程序模塊可以位于本地和遠(yuǎn)程存儲(chǔ)器存儲(chǔ)設(shè)備中。計(jì)算機(jī)通常包括各種計(jì)算機(jī)可讀介質(zhì)。計(jì)算機(jī)可讀介質(zhì)可以是可由計(jì)算機(jī)訪問(wèn)的任何可用介質(zhì),且包括易失性和非易失性介質(zhì)、可移動(dòng)和不可移動(dòng)介質(zhì)。作為示例而非限制,計(jì)算機(jī)可讀介質(zhì)可以包括計(jì)算機(jī)存儲(chǔ)介質(zhì)和通信介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括以存儲(chǔ)如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移動(dòng)和不可移動(dòng)介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括但不限于RAM、ROM、EEPROM、閃存或者其它存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字視頻盤(pán)(DVD)或其它光盤(pán)存儲(chǔ)、磁帶盒、磁帶、磁盤(pán)存儲(chǔ)或其它磁存儲(chǔ)設(shè)備、或可以用于存儲(chǔ)所需信息并且可以由計(jì)算機(jī)訪問(wèn)的任何其它介質(zhì)。再次參考圖28,用于實(shí)現(xiàn)各方面的示例性計(jì)算系統(tǒng)2800包括計(jì)算機(jī)2802,計(jì)算機(jī)2802包括處理單元2804、系統(tǒng)存儲(chǔ)器2806和系統(tǒng)總線2808。系統(tǒng)總線2808向包括但不限于系統(tǒng)存儲(chǔ)器2806的各系統(tǒng)組件提供到處理單元2804的接口。處理單元2804可以是市場(chǎng)上可購(gòu)買(mǎi)到的各種處理器中的任意一種。雙微處理器和其它多處理器體系結(jié)構(gòu)也可用作處理單元2804。系統(tǒng)總線2808可以是若干種總線結(jié)構(gòu)中的任一種,這些總線結(jié)構(gòu)還可互連到存儲(chǔ)器總線(帶有或沒(méi)有存儲(chǔ)器控制器)、外圍總線、以及使用各類(lèi)市場(chǎng)上可購(gòu)買(mǎi)到的總線體系結(jié)構(gòu)中的任一種的局部總線。系統(tǒng)存儲(chǔ)器2806包括只讀存儲(chǔ)器(ROM)2810和隨機(jī)存取存儲(chǔ)器(RAM)2812?;据斎?輸出系統(tǒng)(BIOS)儲(chǔ)存在諸如ROM、EPROM、EEPROM等非易失性存儲(chǔ)器2810中,其中BIOS包含幫助諸如在啟動(dòng)期間在計(jì)算機(jī)2802內(nèi)的元件之間傳輸信息的基本例程。RAM2812還可包括諸如靜態(tài)RAM等高速RAM來(lái)用于高速緩存數(shù)據(jù)。計(jì)算機(jī)2802還包括內(nèi)置硬盤(pán)驅(qū)動(dòng)器(HDD)2814(例如,EIDE、SATA),該內(nèi)置硬盤(pán)驅(qū)動(dòng)器2814還可被配置成在合適的機(jī)殼(未示出)中外部使用;磁軟盤(pán)驅(qū)動(dòng)器(FDD)2816(例如,從可移動(dòng)磁盤(pán)2818中讀取或向其寫(xiě)入);以及光盤(pán)驅(qū)動(dòng)器2820(例如,從CD-ROM盤(pán)2822中讀取,或從諸如DVD等其它高容量光學(xué)介質(zhì)中讀取或向其寫(xiě)入)。硬盤(pán)驅(qū)動(dòng)器2814、磁盤(pán)驅(qū)動(dòng)器2816和光盤(pán)驅(qū)動(dòng)器2820可分別通過(guò)硬盤(pán)驅(qū)動(dòng)器接口2824、磁盤(pán)驅(qū)動(dòng)器接口2826和光盤(pán)驅(qū)動(dòng)器接口2828來(lái)連接到系統(tǒng)總線2808。用于外置驅(qū)動(dòng)器實(shí)現(xiàn)的接口2824包括通用串行總線(USB)和IEEE1394接口技術(shù)中的至少一種或兩者。驅(qū)動(dòng)器及其相關(guān)聯(lián)的計(jì)算機(jī)可讀介質(zhì)提供了對(duì)數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)、計(jì)算機(jī)可執(zhí)行指令等的非易失性存儲(chǔ)。對(duì)于計(jì)算機(jī)2802,驅(qū)動(dòng)器和介質(zhì)容納適當(dāng)?shù)臄?shù)字格式的任何數(shù)據(jù)的存儲(chǔ)。盡管以上對(duì)計(jì)算機(jī)可讀介質(zhì)的描述涉及HDD、可移動(dòng)磁盤(pán)以及諸如CD或DVD等可移動(dòng)光學(xué)介質(zhì),但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,示例性操作環(huán)境中也可使用可由計(jì)算機(jī)讀取的任何其它類(lèi)型的介質(zhì),諸如zip驅(qū)動(dòng)器、磁帶盒、閃存卡、盒式磁帶等等,并且任何這樣的介質(zhì)可包含用于執(zhí)行所公開(kāi)的體系結(jié)構(gòu)的新穎方法的計(jì)算機(jī)可執(zhí)行指令。多個(gè)程序模塊可存儲(chǔ)在驅(qū)動(dòng)器和RAM2812中,包括操作系統(tǒng)2830、一個(gè)或多個(gè)應(yīng)用程序2832、其它程序模塊2834和程序數(shù)據(jù)2836。所有或部分操作系統(tǒng)、應(yīng)用程序、模塊和/或數(shù)據(jù)也可被高速緩存在RAM2812中。應(yīng)該明白,所公開(kāi)的體系結(jié)構(gòu)可以用市場(chǎng)上可購(gòu)得的各種操作系統(tǒng)或操作系統(tǒng)的組合來(lái)實(shí)施。用戶可以通過(guò)一個(gè)或多個(gè)有線/無(wú)線輸入設(shè)備,例如鍵盤(pán)2838和諸如鼠標(biāo)2840等定點(diǎn)設(shè)備將命令和信息輸入到計(jì)算機(jī)2802中。輸入/輸出設(shè)備可包括話筒/揚(yáng)聲器2837和其它設(shè)備(未示出),例如,IR遙控器、操縱桿、游戲手柄、指示筆、觸摸屏等等。這些和其它輸入設(shè)備通常通過(guò)耦合到系統(tǒng)總線2808的輸入設(shè)備接口2842連接到處理單元2804,但也可通過(guò)其它接口連接,如并行端口、IEEE1394串行端口、游戲端口、USB端口、IR接口等等。監(jiān)視器2844或其它類(lèi)型的顯示設(shè)備也經(jīng)由接口,諸如視頻適配器2846連接至系統(tǒng)總線2808。除了監(jiān)視器2844之外,計(jì)算機(jī)通常包括諸如揚(yáng)聲器、打印機(jī)等其它外圍輸出設(shè)備(未示出)。計(jì)算機(jī)2802可使用經(jīng)由有線和/或無(wú)線通信至一個(gè)或多個(gè)遠(yuǎn)程計(jì)算機(jī),諸如遠(yuǎn)程計(jì)算機(jī)2848的邏輯連接在網(wǎng)絡(luò)化環(huán)境中操作。遠(yuǎn)程計(jì)算機(jī)2848可以是工作站、服務(wù)器計(jì)算機(jī)、路由器、個(gè)人計(jì)算機(jī)、便攜式計(jì)算機(jī)、基于微處理器的娛樂(lè)設(shè)備、對(duì)等設(shè)備或其它常見(jiàn)的網(wǎng)絡(luò)節(jié)點(diǎn),并且通常包括相對(duì)于計(jì)算機(jī)2802描述的許多或所有元件,盡管為簡(jiǎn)明起見(jiàn)僅示出了存儲(chǔ)器/存儲(chǔ)設(shè)備2850。所描繪的邏輯連接包括到局域網(wǎng)(LAN)2852和/或例如廣域網(wǎng)(WAN)2854等更大的網(wǎng)絡(luò)的有線/無(wú)線連接。這一LAN和WAN連網(wǎng)環(huán)境常見(jiàn)于辦公室和公司,并且方便了諸如內(nèi)聯(lián)網(wǎng)等企業(yè)范圍計(jì)算機(jī)網(wǎng)絡(luò),所有這些都可連接到例如因特網(wǎng)等全球通信網(wǎng)絡(luò)。當(dāng)在LAN連網(wǎng)環(huán)境中使用時(shí),計(jì)算機(jī)2802通過(guò)有線和/或無(wú)線通信網(wǎng)絡(luò)接口或適配器2856連接到局域網(wǎng)2852。適配器2856可以方便到LAN2852的有線或無(wú)線通信,并且還可包括其上設(shè)置的用于與無(wú)線適配器2856通信的無(wú)線接入點(diǎn)。當(dāng)在WAN連網(wǎng)環(huán)境中使用時(shí),計(jì)算機(jī)2802可包括調(diào)制解調(diào)器2858,或連接到WAN2854上的通信服務(wù)器,或具有用于通過(guò)WAN2854,諸如通過(guò)因特網(wǎng)建立通信的其它裝置?;?yàn)閮?nèi)置或?yàn)橥庵靡约坝芯€和/或無(wú)線設(shè)備的調(diào)制解調(diào)器2858經(jīng)由串行端口接口2842連接到系統(tǒng)總線2808。在網(wǎng)絡(luò)化環(huán)境中,相對(duì)于計(jì)算機(jī)2802所描述的程序模塊或其部分可以存儲(chǔ)在遠(yuǎn)程存儲(chǔ)器/存儲(chǔ)設(shè)備2850中。應(yīng)該理解,所示網(wǎng)絡(luò)連接是示例性的,并且可以使用在計(jì)算機(jī)之間建立通信鏈路的其它手段。計(jì)算機(jī)2802可用于與操作上設(shè)置在無(wú)線通信中的任何無(wú)線設(shè)備或?qū)嶓w通信,這些設(shè)備或?qū)嶓w例如有打印機(jī)、掃描儀、臺(tái)式和/或便攜式計(jì)算機(jī)、便攜式數(shù)據(jù)助理、通信衛(wèi)星、與無(wú)線可檢測(cè)標(biāo)簽相關(guān)聯(lián)的任何一個(gè)設(shè)備或位置(例如,公用電話亭、報(bào)亭、休息室)以及電話機(jī)。這至少包括Wi-Fi和藍(lán)牙TM無(wú)線技術(shù)。由此,通信可以如對(duì)于常規(guī)網(wǎng)絡(luò)那樣是預(yù)定義結(jié)構(gòu),或者僅僅是至少兩個(gè)設(shè)備之間的自組織(adhoc)通信?,F(xiàn)在參考圖29,示出了用于根據(jù)所公開(kāi)的體系結(jié)構(gòu)的糾正處理的示例性計(jì)算環(huán)境2900的示意性框圖。系統(tǒng)2900包括一個(gè)或多個(gè)客戶機(jī)2902??蛻魴C(jī)2902可以是硬件和/或軟件(例如,線程、進(jìn)程、計(jì)算設(shè)備)。例如,客戶機(jī)2902可容納cookie和/或相關(guān)聯(lián)的上下文信息。系統(tǒng)2900還包括一個(gè)或多個(gè)服務(wù)器2904。服務(wù)器2904也可以是硬件和/或軟件(例如,線程、進(jìn)程、計(jì)算設(shè)備)。服務(wù)器2904可以例如通過(guò)使用本體系結(jié)構(gòu)來(lái)容納線程以執(zhí)行變換。在客戶機(jī)2902和服務(wù)器2904之間的一種可能的通信能夠以適合在兩個(gè)或多個(gè)計(jì)算機(jī)進(jìn)程之間傳輸?shù)臄?shù)據(jù)分組的形式進(jìn)行。數(shù)據(jù)分組可包括例如cookie和/或相關(guān)聯(lián)的上下文信息。系統(tǒng)2900包括可以用來(lái)使客戶機(jī)2902和服務(wù)器2904之間通信更容易的通信框架2906(例如,諸如因特網(wǎng)等全球通信網(wǎng)絡(luò))。通信可經(jīng)由有線(包括光纖)和/或無(wú)線技術(shù)來(lái)促進(jìn)??蛻魴C(jī)2902操作上被連接到可以用來(lái)存儲(chǔ)對(duì)客戶機(jī)2902本地的信息(例如,cookie和/或相關(guān)聯(lián)的上下文信息)的一個(gè)或多個(gè)客戶機(jī)數(shù)據(jù)存儲(chǔ)2908。同樣地,服務(wù)器2904可在操作上連接到可以用來(lái)存儲(chǔ)對(duì)服務(wù)器2904本地的信息的一個(gè)或多個(gè)服務(wù)器數(shù)據(jù)存儲(chǔ)2910。以上所描述的包括所公開(kāi)的體系結(jié)構(gòu)的各示例。當(dāng)然,描述每一個(gè)可以想到的組件和/或方法的組合是不可能的,但本領(lǐng)域內(nèi)的普通技術(shù)人員應(yīng)該認(rèn)識(shí)到,許多其它組合和排列都是可能的。因此,本新穎的體系結(jié)構(gòu)旨在涵蓋所有這些落入所附權(quán)利要求書(shū)的精神和范圍內(nèi)的更改、修改和變化。此外,就在說(shuō)明書(shū)或權(quán)利要求書(shū)中使用術(shù)語(yǔ)"包括"而言,這一術(shù)語(yǔ)旨在以與術(shù)語(yǔ)"包含"在被用作權(quán)利要求書(shū)中的過(guò)渡此時(shí)所解釋的相似的方式為包含性的。權(quán)利要求1.一種計(jì)算機(jī)實(shí)現(xiàn)的轉(zhuǎn)換系統(tǒng)(100),包括用于基于語(yǔ)音輸入來(lái)輸出亞洲語(yǔ)字符的語(yǔ)音識(shí)別組件(102);以及用于基于所述語(yǔ)音識(shí)別組件的不正確的輸出來(lái)生成經(jīng)糾正的輸出的糾正組件(104)。2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述糾正組件包括方便口頭或手動(dòng)地進(jìn)行用戶交互的用于選擇并糾正所述不正確的輸出的拼寫(xiě)向?qū)А?.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述糾正組件接收與使用本地音標(biāo)的詞發(fā)音相關(guān)的信息。4.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述糾正組件接收有關(guān)如何通過(guò)提供所述字符在其中被使用的詞來(lái)書(shū)寫(xiě)詞的信息。5.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述糾正組件接收與如何組成所述字符相關(guān)的信息。6.如權(quán)利要求l所述的系統(tǒng),其特征在于,還包括采用基于概率和/或基于統(tǒng)計(jì)的分析來(lái)預(yù)測(cè)或推斷期望自動(dòng)執(zhí)行的動(dòng)作的推斷組件。7.如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括用于與其他用戶和詞典供應(yīng)商共享經(jīng)更新的詞典的共享組件。8.如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括用于基于意義來(lái)對(duì)詞進(jìn)行加權(quán)的加權(quán)組件。9.如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括用于存儲(chǔ)使用頻率信息的頻率組件,所述糾正組件使用該使用頻率信息來(lái)提供候選字符的排序列表。10.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述亞洲語(yǔ)字符具有中文或日文的書(shū)寫(xiě)形式,該書(shū)寫(xiě)形式包括具有相關(guān)聯(lián)的固定發(fā)音的象形文字。11.一種識(shí)別語(yǔ)音的計(jì)算機(jī)實(shí)現(xiàn)的方法,包括識(shí)別亞洲語(yǔ)語(yǔ)音信號(hào)來(lái)輸出結(jié)果(1902);進(jìn)入拼寫(xiě)/糾正模式以糾正所述結(jié)果的拼寫(xiě)(1904);以及基于語(yǔ)音發(fā)音或字符選擇中的至少一個(gè)來(lái)單遍糾正所述結(jié)果的拼寫(xiě)(l麵)。12.如權(quán)利要求11所述的方法,其特征在于,還包括響應(yīng)于接收到所述亞洲語(yǔ)語(yǔ)音信號(hào)來(lái)自動(dòng)地進(jìn)入所述拼寫(xiě)/糾正模式,其中糾正模式包括接收所述語(yǔ)音發(fā)音的拼寫(xiě)向?qū)А?3.如權(quán)利要求11所述的方法,其特征在于,還包括應(yīng)用存儲(chǔ)用于糾正所述拼寫(xiě)的音素距離的混淆矩陣。14.如權(quán)利要求11所述的方法,其特征在于,還包括使用發(fā)聲的同音命令來(lái)糾正所述拼寫(xiě)。15.如權(quán)利要求11所述的方法,其特征在于,還包括基于將詞分解成諸符號(hào)子分量來(lái)糾正所述拼寫(xiě)。16.如權(quán)利要求11所述的方法,其特征在于,還包括在糾正所述拼寫(xiě)的同時(shí)發(fā)展新詞典,并將所述新詞典傳送給另一用戶。17.如權(quán)利要求11所述的方法,其特征在于,還包括基于所述亞洲語(yǔ)語(yǔ)音信號(hào)的語(yǔ)言來(lái)在多個(gè)書(shū)寫(xiě)系統(tǒng)之間切換。18.如權(quán)利要求11所述的方法,其特征在于,還包括基于包含所述字符的一個(gè)或多個(gè)詞的語(yǔ)音輸入來(lái)選擇該字符。19.如權(quán)利要求11所述的方法,其特征在于,還包括生成候選字符的區(qū)分了優(yōu)先次序的列表,并將所述候選字符作為經(jīng)索引的列表來(lái)呈現(xiàn)以供通過(guò)手動(dòng)地或通過(guò)語(yǔ)音命令中的一種方式來(lái)選擇。20.—種計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng),包括用于識(shí)別亞洲語(yǔ)語(yǔ)音信號(hào)來(lái)輸出結(jié)果的計(jì)算機(jī)實(shí)現(xiàn)的裝置(102);用于進(jìn)入拼寫(xiě)/糾正模式來(lái)糾正所述結(jié)果的拼寫(xiě)的計(jì)算機(jī)實(shí)現(xiàn)的裝置(302);用于執(zhí)行關(guān)鍵字搜索的計(jì)算機(jī)實(shí)現(xiàn)的裝置(502);以及用于基于語(yǔ)音命令和手動(dòng)字符選擇來(lái)單遍糾正所述結(jié)果的拼寫(xiě)的計(jì)算機(jī)實(shí)現(xiàn)的裝置(104)。全文摘要一種用于在亞洲語(yǔ)言語(yǔ)音識(shí)別系統(tǒng)中糾正不正確的識(shí)別結(jié)果的體系結(jié)構(gòu)??梢皂憫?yīng)于接收到語(yǔ)音輸入來(lái)啟動(dòng)一種拼寫(xiě)模式,該拼寫(xiě)模式用于糾正識(shí)別結(jié)果的不正確的拼寫(xiě)或生成新詞。糾正可以通過(guò)語(yǔ)音和/或手動(dòng)選擇和輸入來(lái)獲得。該體系結(jié)構(gòu)方便單遍糾正,而非像常規(guī)系統(tǒng)中那樣多次糾正。使用該拼寫(xiě)模式來(lái)糾正的詞是作為一個(gè)單元來(lái)糾正的并且被當(dāng)作詞。該拼寫(xiě)模式至少適用于亞洲大陸的語(yǔ)言,如簡(jiǎn)體中文、繁體中文、和/或諸如日文等其它亞洲語(yǔ)言。文檔編號(hào)G06F17/28GK101669116SQ200880013543公開(kāi)日2010年3月10日申請(qǐng)日期2008年4月8日優(yōu)先權(quán)日2007年4月26日發(fā)明者A·奇特拉普,K·E·弗里吉,S-Z·郭,T·美和,Y·宮申請(qǐng)人:微軟公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1