亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

自然語言處理系統(tǒng)和詞典登錄系統(tǒng)的制作方法

文檔序號:6455856閱讀:242來源:國知局
專利名稱:自然語言處理系統(tǒng)和詞典登錄系統(tǒng)的制作方法
技術領域
本發(fā)明涉及一種通過使用存儲在詞典中的語言信息對自然語言進 行處理的技術,更具體地涉及一種能夠容易地對詞典進行更新的自然 語言處理系統(tǒng)以及在這樣的系統(tǒng)中使用的詞典登錄系統(tǒng)。
背景技術
諸如假名-日文漢字(kana-kanji)轉換、機器翻譯、話音識別和語 音合成系統(tǒng)之類的自然語言處理系統(tǒng)基本上基于存儲在詞典中的詞和 其中所提供的語言信息進行處理。由此,難以對沒有存儲在詞典中的 詞,即未知詞,進行適當處理。在另一方面,由于自然語言每天都在 發(fā)生變化,所以會出現(xiàn)新詞甚至已知詞的新用法,由此通常難以預先 在詞典中存儲所有這些詞。因此,迄今為止,已經(jīng)通過為用戶提供下
面的詞典功能來處理這一問題,即每個用戶能夠通過所述詞典功能單 獨地登錄每個用戶所需要的詞。
詞典的登錄操作是一項給用戶帶來很大負擔的工作。出于此原因, 已經(jīng)提出了在用戶之間共享每個用戶所登錄的詞典數(shù)據(jù)的方法以便節(jié) 約詞典登錄的成本。
例如,非專利文檔l描述了一種在專用網(wǎng)頁上向公眾發(fā)布已更新詞 典或個體用戶所準備的用戶詞典的方法,由此允許個體用戶對其加以 利用。然而,'該技術存在的問題在于,除非用戶在任意時間監(jiān)視主頁, 否則個體用戶無法直接得知對用戶有用的詞典是否公開發(fā)布。
專利公開l描述了一種技術,其中個體用戶以截取(cross-sectional)
的方式檢查由其他用戶所登錄的詞典數(shù)據(jù),以便提取出在多.個用戶的用戶詞典中共同登錄的詞典數(shù)據(jù),并且在所有用戶的用戶詞典中將所 提取的詞典數(shù)據(jù)反映為該詞典數(shù)據(jù)被共享。
專利公開2描述了一種提供了用于管理與特定技術術語詞典相關 聯(lián)的個體用戶詞典的機制的技術,其中個體用戶以截取的方式檢査由 用戶在個體用戶詞典中登錄的詞典數(shù)據(jù),以提取出在與相同技術術語 詞典相關聯(lián)的多個用戶詞典中登錄的詞典數(shù)據(jù),并且在技術術語詞典 中將所述詞典數(shù)據(jù)反映為該詞典數(shù)據(jù)被共享,由此允許在多個用戶之 間共享所述詞典數(shù)據(jù)。
在以上技術中,如果將自動提取的詞典數(shù)據(jù)登錄到詞典中,其可 能更會導致針對特定用戶的自然語言處理的精度降級。這是由于即使 所提取的數(shù)據(jù)可能對大多數(shù)用戶有用,但是所提取的數(shù)據(jù)并非總是對 另一用戶有用。這還因為包括不需要的詞的詞典數(shù)據(jù)的登錄使得導致
自然語言處理出現(xiàn)錯判的概率增加。因此,專利公開2和專利公開3描 述了立即向個體用戶通知新的詞典數(shù)據(jù)被登錄到共用詞典中并且詢問 用戶是否使用該詞典數(shù)據(jù)的技術。這些技術旨在通過立即向用戶通知 新的詞典數(shù)據(jù)可用并且允許用戶最終判斷是否要使用該詞典數(shù)據(jù)來防 止將不適當?shù)臄?shù)據(jù)混入個體用戶的詞典中。
非專利文獻1 : NEC公司,"TRANSLATION ADAPTER-II CROSSROAD Ver.3 HANDBOOK" , 1999,第134-135頁 專利公開l: JP-3464881B 專利公開2: JP-2003-157257A
傳統(tǒng)技術中的第一問題在于個體用戶難以判斷詞典數(shù)據(jù)是有用的 還是不需要的。這是因為用戶無法判斷用戶當前并不使用的詞的詞典 數(shù)據(jù)在包括可能性的將來是否有用。
第二個問題在于,雖然傳統(tǒng)技術根據(jù)需要向用戶通知詞典數(shù)據(jù)并
10且詢問是否要登錄該詞典數(shù)據(jù),但是該事實本身就妨礙了用戶的動作。 這是因為在傳統(tǒng)技術中執(zhí)行通知和詢問沒有考慮接收通知和詢問的用 戶的時間安排。

發(fā)明內(nèi)容
本發(fā)明的一個目的是提供一種自然語言處理系統(tǒng),其能夠允許用 戶容易地判斷是否存在對個體詞典數(shù)據(jù)的需要。
本發(fā)明的另一個目的是提供一種自然語言處理系統(tǒng),其能夠通知 和詢問是否存在對詞典數(shù)據(jù)的需要而不妨礙用戶的動作。
本發(fā)明提供了一種自然語言處理系統(tǒng),其對輸入數(shù)據(jù)執(zhí)行自然語 言處理,包括登錄候選存儲部分,其中存儲登錄候選詞典數(shù)據(jù);判 斷裝置,將輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)進行比較,以判斷所述 輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;詢問裝置, 如果所述判斷裝置判斷出存在相對應的詞,則所述詢問裝置詢問用戶 是否要將登錄候選詞典數(shù)據(jù)登錄到詞典存儲部分中,以由此接受用戶 的指令;詞典登錄裝置,基于輸入到所述詢問裝置的指令將登錄候選 詞典數(shù)據(jù)登錄在詞典存儲部分中;以及自然語言處理裝置,通過使用 登錄在所述詞典存儲部分中的詞典數(shù)據(jù)對所述輸入數(shù)據(jù)執(zhí)行自然語言 處理。
本發(fā)明提供了一種詞典登錄系統(tǒng),包括登錄候選存儲部分,其 中存儲登錄候選詞典數(shù)據(jù);判斷裝置,將輸入數(shù)據(jù)與所述登錄候選詞 典數(shù)據(jù)進行比較,以由此判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選 詞典數(shù)據(jù)相對應的詞;詢問裝置,如果所述判斷裝置判斷出存在相對 應的詞,則所述詢問裝置詢問用戶是否要將登錄候選詞典數(shù)據(jù)登錄到 詞典存儲部分中,以由此接受用戶的指令;以及詞典登錄裝置,基于 輸入到所述詢問裝置的指令將登錄候選詞典數(shù)據(jù)登錄在詞典存儲部分 中。
11本發(fā)明提供了一種自然語言處理方法,包括將輸入數(shù)據(jù)與存儲 在存儲單元中的登錄候選詞典數(shù)據(jù)進行比較,以由此判斷所述輸入數(shù)
據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;如果判斷出存在相 對應的詞,則詢問用戶是否要將所述登錄候選詞典數(shù)據(jù)登錄到詞典中, 以接受用戶指令;基于輸入指令將登錄候選詞典數(shù)據(jù)登錄在詞典中; 并且通過使用登錄在所述詞典中的詞典數(shù)據(jù)對輸入數(shù)據(jù)執(zhí)行自然語言 處理。
本發(fā)明提供了一種詞典登錄方法,包括將輸入數(shù)據(jù)與存儲在存 儲單元中的登錄候選詞典數(shù)據(jù)進行比較,以由此判斷所述輸入數(shù)據(jù)是
否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;如果判斷出存在相對應 的詞,則詢問用戶是否要將所述登錄候選詞典數(shù)據(jù)登錄到詞典中,以 接收用戶的指令;以及基于所輸入的指令將登錄候選詞典數(shù)據(jù)登錄在 詞典中。
本發(fā)明提供了一種編碼有使中央處理單元(CPU)運行的計算機
可讀程序的記錄介質,所述程序使得CPU執(zhí)行以下處理將登錄候選詞 典數(shù)據(jù)存儲在存儲單元中;將輸入數(shù)據(jù)與登錄候選詞典數(shù)據(jù)進行比較, 由此判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的 詞;如果所述判斷處理判斷出存在相對應的詞,則詢問用戶是否要將 所述登錄候選詞典數(shù)據(jù)登錄到詞典中,以接受用戶的指令;基于在所 述詢問處理中所輸入的指令將登錄候選詞典數(shù)據(jù)登錄在詞典中;以及 通過使用登錄在所述詞典中的詞典數(shù)據(jù)對輸入數(shù)據(jù)執(zhí)行自然語言處 理。
本發(fā)明提供了一種編碼有使中央處理單元(CPU)運行的計算機 可讀程序的記錄介質,所述程序使得CPU執(zhí)行以下處理存儲登錄候選 詞典數(shù)據(jù);將輸入數(shù)據(jù)與登錄候選詞典數(shù)據(jù)進行比較,并判斷所述輸 入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;如果所述判斷處理判斷出存在相對應的詞,則詢問用戶是否要將所述登錄候選詞典 數(shù)據(jù)登錄到詞典中,以接受用戶的指令;以及基于在所述詢問處理中 所輸入的指令將登錄候選詞典數(shù)據(jù)登錄在詞典中。
根據(jù)以下參考附圖所進行的描述,本發(fā)明的以上和其它目的、特 征和優(yōu)勢將變得更加顯而易見。


圖l是示出依據(jù)本發(fā)明第一示例性實施例的自然語言處理系統(tǒng)的 配置的框圖。
圖2是示出圖1的自然語言處理系統(tǒng)的操作的流程圖。 圖3是示出依據(jù)本發(fā)明第二示例性實施例的詞典登錄系統(tǒng)的配置 的框圖。
圖4是示出依據(jù)本發(fā)明第三示例性實施例的計算機系統(tǒng)的配置的 框圖。
圖5是示出登錄候選存儲部分中的數(shù)據(jù)結構的示例的圖。
圖6是示出詞典數(shù)據(jù)的登錄的確認屏幕的示例的圖。
圖7是示出詞典數(shù)據(jù)的登錄的確認屏幕的示例的圖。
具體實施例方式
將參考附圖對根據(jù)本發(fā)明第一示范性實施例的自然語言處理系統(tǒng) IO進行詳細描述。
參考圖l,自然語言處理系統(tǒng)10包括諸如鍵盤和麥克風的輸入單元 1、在程序控制下進行操作的數(shù)據(jù)處理單元2、其中存儲信息的存儲單 元3和諸如顯示單元、打印機和揚聲器的輸出單元4。
存儲單元3包括詞典存儲部分31和登錄候選存儲部分32。詞典存儲 部分31在其中存儲個體用戶的詞典,每個詞典包括詞和對應于所述詞 的語言信息。所述語言信息是后面描述的自然語言處理裝置21參照以
13用于其自己的處理的信息并且包括假名符號、讀取、翻譯、部分語音、 語義信息等。所述登錄候選存儲部分32在其中存儲登錄候選詞典數(shù)據(jù), 其是要在每個用戶詞典中新登錄的詞典數(shù)據(jù)的候選。所述詞典數(shù)據(jù)是 詞典中所登錄的信息的最小單位,并且由詞和對應于所述詞的語言信 息所構成。
數(shù)據(jù)處理單元2包括自然語言處理裝置21、判斷裝置22、詢問裝置 23和詞典登錄裝置24。
自然語言處理裝置21接受來自用戶的輸入,通過使用存儲在詞典 存儲部分31中的用戶詞典對輸入數(shù)據(jù)執(zhí)行自然語言處理,并且輸出處 理的結果。所述自然語言處理裝置21所執(zhí)行的自然語言處理例如是機 器翻譯處理和/或語音合成處理。機器翻譯處理是將所輸入的第一語言 的字符串轉換成第二語言的另一字符串的處理,而語音合成處理是將
所輸入的字符串轉換成音頻信號的處理。自然語言處理裝置21在對所 輸入的數(shù)據(jù)執(zhí)行自然語言處理之前將所輸入的數(shù)據(jù)輸出到判斷裝置 22。自然語言處理裝置21可以具有未知詞檢測功能,并且并非總是將 輸入數(shù)據(jù)輸出到判斷裝置22,而是僅在輸入數(shù)據(jù)中觀察到未知詞時將 輸入數(shù)據(jù)輸出到判斷裝置22,以允許判斷裝置22隨后進行操作。
判斷裝置22將從自然語言處理裝置21輸入的輸入數(shù)據(jù)與存儲在登 錄候選存儲部分32中的詞典數(shù)據(jù)的詞進行比較,以檢查輸入數(shù)據(jù)是否 包括與存儲在登錄候選存儲部分32中的詞典數(shù)據(jù)相對應的詞(此后稱 為"對應詞")。如果在輸入數(shù)據(jù)中找到對應詞,則將與所述對應詞 相對應的登錄候選詞典數(shù)據(jù)(此后稱為"對應詞典數(shù)據(jù)")輸出到詢 問裝置23。如果采用其中判斷裝置22僅在輸入數(shù)據(jù)中找到未知詞時才 執(zhí)行的配置,則所述配置可以是使得在判斷裝置22檢査輸入數(shù)據(jù)中 是否存在對應詞時,僅在包括未知詞的輸入數(shù)據(jù)部分與詞典數(shù)據(jù)中的 詞重疊時才判斷出包括對應詞。
14詢問裝置23在輸出單元4上顯示從判斷裝置22輸入的對應詞典數(shù) 據(jù),由此詢問用戶是否要將對應詞典數(shù)據(jù)登錄在詞典中。如果從輸入 單元l輸入了顯示"要登錄"的輸入,則詢問裝置23將對應的詞典數(shù)據(jù) 輸出到詞典登錄裝置24。另一方面,如果從輸入單元l輸入了顯示無需 登錄的輸入,則控制返回到自然語言處理裝置21。要注意的是,如果 從輸入單元l輸入了顯示無需登錄的輸入,則該配置可以是使得將對 應詞典數(shù)據(jù)以及處于登錄對象之外的信息存儲在登錄候選存儲部分32 中,由此如果稍后將相同的登錄數(shù)據(jù)存儲在登錄候選存儲部分32中, 則將相同的詞典數(shù)據(jù)認為是處于登錄對象之外。
詞典登錄裝置24將從詢問裝置23所輸入的對應詞典數(shù)據(jù)登錄在詞 典中,并且將控制返回到自然語言處理裝置21。
接下來,將參考圖1和圖2的流程圖對自然語言處理系統(tǒng)10的操作 進行詳細描述。
首先, 一旦從輸入單元接收到輸入,自然語言處理裝置21就在執(zhí) 行自然語言處理之前將這樣輸入的輸入數(shù)據(jù)輸出到判斷裝置22。 一旦 從自然語言處理裝置21接收到輸入數(shù)據(jù),判斷裝置22就從登錄候選存 儲部分32中提取出登錄候選詞典數(shù)據(jù)(圖2中的步驟A1)。
接著,檢査是否能夠提取登錄候選詞典數(shù)據(jù)并且如果提取了所述 詞典數(shù)據(jù)則檢查其是否處于登錄對象之外,并接著檢查是否存在要被 登錄在詞典中的詞典數(shù)據(jù)候選(步驟A2)。如果沒有要被登錄的詞典 數(shù)據(jù)候選,則自然語言處理裝置21對輸入數(shù)據(jù)執(zhí)行自然語言處理,并 且將其結果輸出到輸出單元4 (步驟A2中判斷為否,以及步驟AIO)。
如果存在要被登錄的詞典數(shù)據(jù)候選,則判斷裝置22將輸入數(shù)據(jù)與 每個詞典數(shù)據(jù)進行比較(步驟A3和A4)。如果輸入數(shù)據(jù)中沒有對應詞, 則自然語言處理裝置21對輸入數(shù)據(jù)執(zhí)行自然語言處理,并且將其結果
15輸出到輸出單元4 (步驟A4中判斷為否,以及步驟AIO)。
如果輸入數(shù)據(jù)中包括對應詞,則詢問裝置23在輸出單元4上顯示詞 典數(shù)據(jù)(對應詞典數(shù)據(jù)),以詢問用戶是否要將該數(shù)據(jù)登錄在詞典中 (步驟A5)。此后,從輸入單元l接收對該詢問的響應,并且檢查是否 有被通報為處于登錄對象之外的對應詞典數(shù)據(jù)(步驟A6)。如果有被 通報為處于登錄對象之外的對應詞典數(shù)據(jù),則詢問裝置23將詞典數(shù)據(jù) 以及處于登錄對象之外的信息存儲在登錄候選存儲部分32中(步驟 A7)。
此后或者如果在步驟A6沒有被通報為處于登錄對象之外的詞典數(shù) 據(jù),則檢査是否有被通報為要被登錄的對應詞典數(shù)據(jù)(步驟A8)。如 果有被通報為要被登錄的對應詞典數(shù)據(jù),則詞典登錄裝置23將所述詞 典數(shù)據(jù)登錄在詞典中(步驟A9)。
此后或者如果在步驟A8中沒有被通報為要被登錄的對應詞典數(shù) 據(jù),則自然語言處理裝置21通過使用存儲在詞典存儲部分31中的詞典 對輸入數(shù)據(jù)執(zhí)行自然語言處理,并且將其結果輸出到輸出單元4 (步驟 A10)。
接下來,將描述該示例性實施例的優(yōu)點。
在該示例性實施例中,該配置使得與詞典數(shù)據(jù)相關的通知和詢 問僅在被輸入到自然語言處理裝置21的輸入數(shù)據(jù)包括與所要登錄的詞 典數(shù)據(jù)相對應的詞時才執(zhí)行。
因此,用戶根據(jù)用戶所輸入的輸入數(shù)據(jù)的上下文來判斷僅具有使 用可能性的詞典數(shù)據(jù)的可用性,從而容易執(zhí)行是否存在其需要的判斷。 此外,用戶能夠在對用戶所輸入的輸入數(shù)據(jù)執(zhí)行自然語言處理的一系 列工作內(nèi)判斷是否需要詞典數(shù)據(jù),從而能夠判斷是否需要詞典數(shù)據(jù)而不會妨礙動作。
接下來,將參考附圖對根據(jù)本發(fā)明第二示例性實施例的詞典登錄
系統(tǒng)u進行詳細描述。由于詞典登錄系統(tǒng)ii通過自然語言處理系統(tǒng)io
的需要將詞典數(shù)據(jù)登錄在詞典中的一部分配置,所以其與自然語言處 理系統(tǒng)10相同的部分的描述在此將省略并且由相同的附圖標記來相同 它。
參考圖3,詞典登錄系統(tǒng)11包括與自然語言處理裝置21的未知詞檢 測功能相對應的未知詞取得裝置25,代替圖l中的自然語言處理裝置 21。
從輸入單元i輸入的輸入數(shù)據(jù)是諸如事先為詞典登錄處理所準備 的文本之類的數(shù)據(jù),而不是作為自然語言處理的對象的數(shù)據(jù)。
輸出單元4僅被用于詢問是否需要登錄對應詞典數(shù)據(jù),并且用于對 所述詢問進行響應。
接下來,將參考附圖對根據(jù)本發(fā)明第三優(yōu)選實施例的計算機系統(tǒng) 12進行詳細描述。
參考圖4,與本發(fā)明的第一示例性實施例類似,計算機系統(tǒng)12包括 輸入單元l、數(shù)據(jù)處理單元6、存儲單元3和輸出單元4。
自然語言處理程序5被讀入數(shù)據(jù)處理單元6,控制數(shù)據(jù)處理單元6 的操作,并且在存儲單元3中生成詞典存儲部分31和登錄候選存儲部分 32。由于自然語言處理取得程序5的控制,數(shù)據(jù)處理單元6執(zhí)行與第一 示例性實施例中的數(shù)據(jù)處理單元2所進行的處理相同的處理。
詞典登錄處理程序7可以被讀入數(shù)據(jù)處理單元6代替自然語言登錄
17處理程序5,其執(zhí)行與第二示例性實施例中的數(shù)據(jù)處理單元2所進行的 處理相同的處理。
接下來,將參考附圖對本發(fā)明的第一示例進行描述。該示例對應 于本發(fā)明的第一示例性實施例。此后,將特別假設自然語言處理裝置 21執(zhí)行機器翻譯處理的情形。
該示例包括作為輸入單元l的鍵盤、作為數(shù)據(jù)處理單元2的個人計 算機、作為數(shù)據(jù)存儲單元3的磁盤驅動單元以及作為輸出單元4的顯示 器。
所述個人計算機包括起自然語言處理裝置21、判斷裝置22、詢問 裝置23和詞典登錄裝置24的功能的中央處理單元,以及起詞典存儲部 分31和登錄候選存儲部分32的功能的存儲區(qū)域被保護在所述磁盤驅動 單元中。
這里,假設圖5所示的詞典數(shù)據(jù)作為登錄候選存儲在登錄候選存儲 部分32中的情形。在圖5中,以表格形式示出了配置登錄候選的詞典數(shù) 據(jù)的內(nèi)容,其中每行配置單獨的一條詞典數(shù)據(jù)。例如,第一行表示包 括日文"基因"、英文"基因"和語音片斷"名詞"的一條詞典數(shù)據(jù)。 其第四列中存儲了該詞典數(shù)據(jù)是否處于登錄對象之外的信息。這里"-" 意味著還沒有完成其是否處于登錄對象之外的檢查,而"對象之外" 意味著該詞典數(shù)據(jù)在過去通過后面描述的檢査所指定的。更具體地, 圖5示出了 "基因"還沒有被檢查,并且"基因診斷"具有過去傳送是 否需要對其進行登錄的詢問并且接收了作為詢問結果的無需進行登錄 的指令的歷史。
本發(fā)明中的處理在用戶向自然語言處理裝置21輸入了作為處理對 象的輸入數(shù)據(jù)之后開始操作。這里,假設用戶輸入了作為輸入數(shù)據(jù)的 句子"這樣的基因被稱為轉位子"。
18在對輸入數(shù)據(jù)執(zhí)行機器翻譯處理之前,所述中央處理單元從登錄 候選存儲部分32中提取出配置登錄候選的詞典數(shù)據(jù)以由此檢查其內(nèi)
容。例如,通過從圖5所示的登錄候選存儲部分32中提取詞典數(shù)據(jù)并且
檢查示出登錄對象之外的列,斷定"基因診斷"的詞典數(shù)據(jù)處于登錄 對象之外而"基因"和"轉位子"是未檢查的候選。
接下來,中央處理單元將作為自然語言處理對象輸入的詞典數(shù)據(jù)
與從登錄候選存儲部分32中所提取的登錄候選詞典數(shù)據(jù)進行比較,以 檢測輸入數(shù)據(jù)包括字符串(對應詞),即該詞典數(shù)據(jù)中的"轉位子"。 隨后,中央處理單元在輸出單元4上顯示所述詞典數(shù)據(jù)(對應詞典數(shù)據(jù)) "轉位子",以詢問用戶是否要將其進行登錄。
圖6示出了對用戶進行詢問的屏幕的示例。如果用戶選上單選按鈕 51,即"登錄""轉位子",并按壓"執(zhí)行"按鈕54,則中央處理單 元將詞典數(shù)據(jù)"轉位子"登錄在詞典中,并且刪除登錄候選存儲部分 32中的詞典數(shù)據(jù)"轉位子"。另一方面,如果用戶選上單選按鈕52, 即"不登錄",并按壓"執(zhí)行"按鈕54,則所述中央處理單元在登錄 候選存儲部分32中寫入信息,該信息在詞典數(shù)據(jù)"轉位子"中示出"處 于登錄對象之外"的列中表示其處于"對象之外"。如果用戶選擇單 選按鈕53 "保留"或"取消"按鈕55,則既不執(zhí)行詞典登錄也不執(zhí)行 登錄候選存儲部分32的更新。此外,可以添加"臨時使用"按鈕,其 中所述系統(tǒng)進行操作使得所顯示的詞典數(shù)據(jù)不登錄在字典中以不同于 永久數(shù)據(jù)那樣使用它,而是登錄在臨時詞典中以便僅在僅對輸入數(shù)據(jù) 進行自然語言處理時使用它。
圖6示出了被用作指示是否要執(zhí)行登錄的用戶接口的單選按鈕的 示例;然而,可以使用如圖7所示的復選框56。在圖7的情況下,該配 置可以是使得復選框56被選上的詞典數(shù)據(jù)進行與在選擇單選按鈕51 "登錄"的情況下所執(zhí)行的處理類似的處理,而復選框沒有被選上的詞典數(shù)據(jù)則進行與在圖6中選擇單選按鈕52 "不登錄"的情況下所執(zhí)行
的處理類似的處理。
此后,中央處理單元對所輸入的處理對象執(zhí)行翻譯處理并且將其
結構輸出到輸出單元4。
給出了執(zhí)行輸入數(shù)據(jù)與詞典數(shù)據(jù)的比較的示例。然而,該配置可 以是使得首先對輸入數(shù)據(jù)進行自然語言處理,以檢測"轉位子"或其 部分是未知詞,并且隨后僅在判斷出未知詞部分與從登錄候選存儲部 分32提取的詞典數(shù)據(jù)"轉位子"重疊時詢問用戶是否要執(zhí)行登錄。
根據(jù)本實施例的自然語言處理系統(tǒng),由于僅在輸入到所述自然語 言處理裝置的輸入數(shù)據(jù)包括與所要登錄的詞典數(shù)據(jù)相對應的詞時才執(zhí) 行關于詞典數(shù)據(jù)的通知和詢問,所以用戶足以根據(jù)用戶所輸入的輸入 數(shù)據(jù)的上下文來僅判斷具有被用戶使用的可能性的詞典數(shù)據(jù)的可用 性。
因此,用戶能夠容易地判斷是否需要個體詞典數(shù)據(jù)。
此外,由于用戶能夠在執(zhí)行與用戶所輸入的輸入數(shù)據(jù)相關的自然 語言處理的一系列工作內(nèi)判斷是否需要詞典數(shù)據(jù),所以可以執(zhí)行是否 需要登錄的通知和詢問而不會妨礙用戶的動作。
在一個示例性實施例的自然語言處理系統(tǒng)中,配置可以是使得自 然語言處理裝置具有未知詞檢測功能,其判斷輸入數(shù)據(jù)是否包括未知 詞,并且如果所述自然語言處理裝置檢測到輸入數(shù)據(jù)中所包括的未知 詞,則判斷裝置開始操作。
在一個示例性實施例的自然語言處理系統(tǒng)中,配置可以是使得如 果所述自然語言處理裝置檢測到輸入數(shù)據(jù)中所包括的未知詞,則判斷
20裝置將包括所述未知詞的輸入數(shù)據(jù)的部分與登錄候選詞典數(shù)據(jù)進行比 較,以判斷包括未知詞的所述部分中是否存在對應詞。
根據(jù)以上示例性實施例的自然語言處理系統(tǒng),由于僅在輸入數(shù)據(jù) 包括未知詞的關鍵情況下才執(zhí)行關于輸入數(shù)據(jù)中所包括的對應詞的通 知和詢問,所以用戶能夠僅通過對較少數(shù)量的詢問進行響應而獲得未 知詞的詞典登錄的優(yōu)勢。
在一個示例性實施例的自然語言處理系統(tǒng)中,所述自然語言處理 裝置可被配置成僅通過使用登錄在詞典中的詞典數(shù)據(jù)對輸入數(shù)據(jù)執(zhí)行 自然語言處理。
在一個示例性實施例的自然語言處理系統(tǒng)中,所述自然語言處理 裝置可被配置為將第一語言的字符串轉換成第二語言的字符串的機器 翻譯裝置,或者將輸入字符串轉換為音頻信號的語音合成裝置。
根據(jù)該示例性實施例的自然語言處理系統(tǒng),由于僅在用戶所輸入 的輸入數(shù)據(jù)包括與所要登錄的詞典數(shù)據(jù)相對應的詞時才執(zhí)行關于詞典 數(shù)據(jù)的通知和詢問,所以足以使用戶根據(jù)用戶輸入的輸入數(shù)據(jù)的上下 文來僅判斷具有被用戶使用的可能性的詞典數(shù)據(jù)的可用性。
因此,用戶能夠容易地判斷是否需要個體詞典數(shù)據(jù)。
根據(jù)一個示例性實施例的詞典登錄系統(tǒng)可以包括判斷輸入數(shù)據(jù)是 否包括未知詞的未知詞檢測裝置,其中所述判斷裝置在所述未知詞檢 測裝置檢測到輸入數(shù)據(jù)中包括的未知詞時開始操作。
一個示例性實施例的詞典登錄系統(tǒng)可以是使得如果所述未知詞 檢測裝置檢測到輸入數(shù)據(jù)中包括的未知詞,則判斷裝置將包括所述未 知詞的輸入數(shù)據(jù)的部分與登錄候選詞典數(shù)據(jù)進行比較,由此來判斷包括未知詞的所述部分中是否存在對應詞。
根據(jù)以上詞典登錄系統(tǒng),由于僅在輸入數(shù)據(jù)包括未知詞的關鍵情 況下才執(zhí)行關于輸入數(shù)據(jù)中存在的對應詞的通知和詢問,所以用戶能 夠僅通過對較少數(shù)量的詢問進行響應而最大程度地獲得未知詞的詞典 登錄的優(yōu)勢。
在一個示例性實施例的詞典登錄系統(tǒng)中,所述詞典數(shù)據(jù)可以是在 將第一語言的字符串轉換成第二語言的另一字符串的機器翻譯處理中 使用的詞典數(shù)據(jù),或者在將輸入字符串轉換為音頻信號的語音合成處 理中使用的詞典數(shù)據(jù)。
在一個示例性實施例的詞典登錄系統(tǒng)中,所述詞典數(shù)據(jù)可以是在 將輸入的第一語言的字符串轉換成第二語言的另一字符串的機器翻譯 處理中使用的詞典數(shù)據(jù),在將輸入的假名字符串轉換為假名-日文漢字 混合字符串的假名-日文漢字轉換處理中使用的詞典數(shù)據(jù),或者在將輸 入的音頻信號轉換為字符串的話音識別處理中使用的詞典數(shù)據(jù),其中 所述判斷裝置在將輸入數(shù)據(jù)與登錄候選詞典數(shù)據(jù)相比較時可以將輸入 數(shù)據(jù)和作為轉換的結果存儲在所述登錄候選詞典數(shù)據(jù)中的字符串進行 比較,由此判斷是否存在對應詞。
根據(jù)該示例性實施例的自然語言處理方法,僅在用戶輸入的輸入 數(shù)據(jù)包括與所要登錄的詞典數(shù)據(jù)相對應的詞時才執(zhí)行與所述詞典數(shù)據(jù) 相關的通知和詢問,所以足以使用戶根據(jù)用戶輸入的輸入數(shù)據(jù)的上下 文來僅判斷具有被用戶使用的可能性的詞典數(shù)據(jù)的可用性。
因此,用戶能夠容易地判斷是否需要個體詞典數(shù)據(jù)。
此外,由于用戶能夠在對用戶輸入的輸入數(shù)據(jù)執(zhí)行自然語言處理 的一系列工作中判斷是否需要詞典數(shù)據(jù),所以可執(zhí)行對于是否需要詞典數(shù)據(jù)的通知和詢問而不會妨礙用戶的動作。
一個示例性實施例的自然語言處理方法可具有以下配置,其中如 果判斷出輸入數(shù)據(jù)包括未知詞,則在判斷輸入數(shù)據(jù)是否包括未知詞時, 將輸入數(shù)據(jù)與登錄候選詞典數(shù)據(jù)進行比較,由此判斷輸入數(shù)據(jù)中是否 存在對應詞。
在一個示例性實施例的自然語言處理方法中,配置可以是使得 如果判斷出輸入數(shù)據(jù)包括未知詞,則將包括未知詞的輸入數(shù)據(jù)的部分 與登錄候選詞典數(shù)據(jù)進行比較,由此判斷在包括未知詞的所述部分中 是否存在對應詞。
根據(jù)以上示例性實施例的自然語言處理方法,由于僅在輸入數(shù)據(jù) 包括未知詞的關鍵情況下才執(zhí)行關于輸入數(shù)據(jù)中存在的對應詞的通知 和詢問,所以用戶能夠僅通過對較少數(shù)量的詢問進行響應而獲得未知 詞的詞典登錄的優(yōu)勢。
在一個示例性實施例的自然語言處理方法中,自然語言處理可僅 使用存儲在詞典中的詞典數(shù)據(jù)。
在一個示例性實施例的自然語言處理方法中,自然語言處理可以 是將第一語言的字符串轉換成第二語言的另一字符串的機器翻譯處 理,或者將輸入的字符串轉換為音頻信號的語音合成處理。
根據(jù)該示例性實施例的詞典登錄方法,由于僅在用戶輸入的輸入 數(shù)據(jù)包括要登錄的詞典數(shù)據(jù)中的對應詞時才執(zhí)行與所述詞典數(shù)據(jù)相關 的通知和詢問,所以足以使用戶根據(jù)用戶輸入的輸入數(shù)據(jù)的上下文來 僅判斷具有被用戶使用的可能性的詞典數(shù)據(jù)的可用性。
因此,用戶能夠輕易判斷是否需要個體詞典數(shù)據(jù)。
23一個示例性實施例的詞典登錄方法可包括判斷輸入數(shù)據(jù)是否存在 未知詞,并且如果判斷出輸入數(shù)據(jù)包括未知詞,則將輸入數(shù)據(jù)與登錄 候選詞典數(shù)據(jù)進行比較,由此判斷輸入數(shù)據(jù)中是否存在對應詞。
在一個示例性實施例的詞典登錄方法中,可包括如果判斷出輸 入數(shù)據(jù)包括未知詞,則將包括所述未知詞的輸入數(shù)據(jù)的部分與登錄候 選詞典數(shù)據(jù)進行比較,由此判斷在包括所述未知詞的部分中是否存在 對應詞。
根據(jù)以上示例性實施例的詞典登錄方法,由于僅在輸入數(shù)據(jù)包括 未知詞的關鍵情況下才執(zhí)行關于輸入數(shù)據(jù)中存在的對應詞的通知和詢 問,所以用戶能夠僅通過對較少數(shù)量的詢問進行響應而最大程度地獲 得未知詞的詞典登錄的優(yōu)勢。
在一個示例性實施例的詞典登錄方法中,所述詞典數(shù)據(jù)可以是在 將第一語言的字符串轉換成第二語言的另一字符串的機器翻譯處理中 使用的詞典數(shù)據(jù),或者在將輸入字符串轉換為音頻信號的語音合成處 理中使用的詞典數(shù)據(jù)。
在一個示例性實施例的詞典登錄方法中,所述詞典數(shù)據(jù)可以是在 將第一語言的字符串轉換成第二語言的另一字符串的機器翻譯處理中 使用的詞典數(shù)據(jù),在將輸入的假名字符轉換為假名-日文漢字混合字符 串的假名-日文漢字轉換處理中使用的詞典數(shù)據(jù),或者在將輸入的音頻 信號轉換為字符串的話音識別處理中使用的詞典數(shù)據(jù),其中輸入數(shù)據(jù) 與登錄候選詞典數(shù)據(jù)的比較將輸入數(shù)據(jù)和作為轉換的結果存儲在登錄 候選詞典數(shù)據(jù)中的字符串進行比較,由此判斷是否存在對應詞。
在一個示例性實施例的編碼有自然語言處理程序的介質中,計算 機進行操作以使得僅在用戶輸入的輸入數(shù)據(jù)包括要登錄的詞典數(shù)據(jù)中
24的對應詞時才執(zhí)行與所述詞典數(shù)據(jù)相關的通知和詢問,所以足以使用 戶根據(jù)用戶輸入的輸入數(shù)據(jù)的上下文來僅判斷具有被用戶使用的可能 性的詞典數(shù)據(jù)的可用性。
因此,用戶能夠輕易判斷是否需要個體詞典數(shù)據(jù)。
此外,由于用戶能夠在對用戶輸入的輸入數(shù)據(jù)執(zhí)行自然語言處理 的一系列工作中判斷是否需要詞典數(shù)據(jù),所以可執(zhí)行對于是否需要詞 典數(shù)據(jù)的通知和詢問而不會妨礙用戶的動作。
一個示例性實施例的編碼有自然語言處理程序的介質中,配置可 以是使得自然語言處理功能包括判斷在輸入數(shù)據(jù)是否包括未知詞的功 能,并且如果自然語言處理功能判斷出輸入數(shù)據(jù)包括未知詞,則允許 計算機執(zhí)行判斷處理。
一個示例性實施例的編碼有自然語言處理程序的介質可以是使 得如果自然語言處理功能判斷出輸入數(shù)據(jù)包括未知詞,則判斷處理 將包括所述未知詞的輸入數(shù)據(jù)的部分與登錄候選詞典數(shù)據(jù)進行比較, 由此判斷包括所述未知詞的部分中是否包括對應詞。
根據(jù)以上示例性實施例的編碼有自然語言處理程序的介質,由于 僅在輸入數(shù)據(jù)包括未知詞的關鍵情況下才執(zhí)行關于輸入數(shù)據(jù)中存在的 對應詞的通知和詢問,所以用戶能夠僅通過對較少數(shù)量的詢問進行響 應而最大程度地獲得未知詞的詞典登錄的優(yōu)勢。
在一個示例性實施例的編碼有自然語言處理程序的介質中,所述 自然語言處理功能可僅使用登錄在詞典中的詞典數(shù)據(jù)來執(zhí)行自然語言 處理。
在一個示例性實施例的編碼有自然語言處理程序的介質中,所述
25自然語言處理功能可以是將第一語言的字符串轉換成第二語言的另一 字符串的機器翻譯功能,或者將輸入的字符串轉換為音頻信號的語音 合成功能。
根據(jù)該示例性實施例的編碼有詞典登錄程序的介質,計算機進行 執(zhí)行以使得僅在用戶輸入的輸入數(shù)據(jù)包括與要登錄的詞典數(shù)據(jù)相對應 的詞時才執(zhí)行與所述詞典數(shù)據(jù)相關的通知和詢問,所以足以使用戶根 據(jù)用戶輸入的輸入數(shù)據(jù)的上下文來僅判斷具有被用戶使用的可能性的 詞典數(shù)據(jù)的可用性。
因此,用戶能夠輕易判斷個體詞典數(shù)據(jù)的可用性。
在一個示例性實施例的編碼有詞典登錄程序的介質中,配置可以 是使得計算機執(zhí)行判斷輸入數(shù)據(jù)是否包括未知詞的未知詞檢測處理, 以及如果所述未知詞檢測處理判斷出輸入數(shù)據(jù)包括未知詞的情況下執(zhí) 行判斷處理。
在一個示例性實施例的編碼有詞典登錄程序的介質中,配置可以 是使得如果自然語言處理檢測到輸入數(shù)據(jù)中包括的未知詞,則判斷 處理將包括所述未知詞的輸入數(shù)據(jù)的部分與登錄候選詞典數(shù)據(jù)進行比 較,由此判斷包括所述未知詞的部分中是否包括對應詞。
根據(jù)以上示例性實施例的編碼有詞典登錄程序的介質,由于僅在 輸入數(shù)據(jù)包括未知詞的關鍵情況下才執(zhí)行關于輸入數(shù)據(jù)中包括的對應 詞的通知和詢問,所以用戶能夠僅通過對較少數(shù)量的詢問進行響應而 獲得未知詞的詞典登錄的優(yōu)勢。
在一個示例性實施例的編碼有詞典登錄程序的介質中,所述詞典 數(shù)據(jù)可以是在將第一語言的字符串轉換成第二語言的另一字符串的機 器翻譯處理中使用的詞典數(shù)據(jù),或者在將輸入的字符串轉換為音頻信
26號的語音合成處理中使用的詞典數(shù)據(jù)。
在一個示例性實施例的編碼有詞典登錄系統(tǒng)的介質中,所述詞典 數(shù)據(jù)可以是在將第一語言的字符串轉換成第二語言的另一字符串的機 器翻譯處理中使用的詞典數(shù)據(jù),在將輸入的假名字符轉換為假名-日文 漢字混合字符串的假名-日文漢字轉換處理中使用的詞典數(shù)據(jù),或者在 將輸入的音頻信號轉換為字符串的話音識別處理中使用的詞典數(shù)據(jù), 其中輸入數(shù)據(jù)與登錄候選詞典數(shù)據(jù)的比較將輸入數(shù)據(jù)和作為轉換的結 果存儲在登錄候選詞典數(shù)據(jù)中的字符串進行比較,由此判斷是否存在 對應詞。
如之前所描述的,本發(fā)明的優(yōu)選實施例的第一個優(yōu)點在于用戶能 夠輕易判斷是否需要個體詞典數(shù)據(jù)。這是因為僅在用戶輸入到自然語 言處理裝置中的輸入數(shù)據(jù)包括與要登錄的詞典數(shù)據(jù)相對應的詞時才執(zhí) 行關于所述詞典數(shù)據(jù)的通知和詢問。這允許用戶根據(jù)其輸入的輸入數(shù) 據(jù)的上下文來僅判斷具有被用戶使用的可能性的詞典數(shù)據(jù)的可用性。
第二個優(yōu)點在于可執(zhí)行對于是否需要詞典數(shù)據(jù)的通知和詢問而不
會妨礙用戶的動作。這是因為僅在用戶輸入到自然語言處理裝置中的
輸入數(shù)據(jù)包括要登錄的詞典數(shù)據(jù)時才執(zhí)行通知和詢問。這允許用戶在
對用戶輸入的輸入數(shù)據(jù)執(zhí)行自然語言處理的一系列工作中判斷是否需 要詞典數(shù)據(jù)。
本發(fā)明可應用于一種程序,其在計算機中實現(xiàn)將第一語言的字符 串轉換為第二語言的另一字符串的機器翻譯裝置,以及將輸入的字符
串轉換為音頻信號的語音合成裝置。
在以上示例中,示例化了一種配置,其中在用戶輸入作為自然語 言處理的對象的數(shù)據(jù)時開始操作。然而,其還可應用于一種程序,所 述程序用于在計算機上實現(xiàn)一種詞典準備輔助裝置,其通過采用下面的配置幫助準備在自然語言處理中使用的詞典通過輸入不是自然語言處理的直接對象的數(shù)據(jù),諸如具有在將來配置自然語言處理的對象的可能性的文檔,開始操作。此外,其將來可應用于一種程序,所述程序通過采用其中通過輸入作為自然語言處理的結果獲得的文檔而開始操作以將輸入數(shù)據(jù)與作為自然語言處理的結果存儲在詞典數(shù)據(jù)中的字符串進行比較的配置在計算機上實現(xiàn)在諸如機器翻譯處理、假名-曰文漢字轉換處理和話音識別處理之類的自然語言處理中使用的詞典準備輔助裝置。
該申請基于于2006年9月7日提交的日本專利申請No.2006-242519并要求其優(yōu)先權權益,其公開內(nèi)容全文通過引用結合于此。
28
權利要求
1. 一種對輸入數(shù)據(jù)執(zhí)行自然語言處理的自然語言處理系統(tǒng),包括登錄候選存儲部分(32),其中存儲登錄候選詞典數(shù)據(jù);判斷裝置(22),將所述輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)進行比較,以判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;詢問裝置(23),如果所述判斷裝置判斷出存在所述對應詞,則所述詢問裝置(23)詢問用戶是否要將所述登錄候選詞典數(shù)據(jù)登錄到詞典存儲部分(31)中,以由此接受用戶的指令;詞典登錄裝置(24),基于輸入到所述詢問裝置的所述指令將所述登錄候選詞典數(shù)據(jù)登錄在所述詞典存儲部分中;以及自然語言處理裝置(21),通過使用登錄在所述詞典存儲部分中的所述詞典數(shù)據(jù)對所述輸入數(shù)據(jù)執(zhí)行自然語言處理。
2.如權利要求l所述的自然語言處理系統(tǒng),其中 所述自然語言處理裝置(21)包括檢測所述輸入數(shù)據(jù)中包括的未知詞的未知詞檢測功能;以及如果所述自然語言處理裝置檢測到所述輸入數(shù)據(jù)中包括的未知詞,則所述判斷裝置(22)開始操作。
3.如權利要求2所述的自然語言處理系統(tǒng),其中如果所述自然語 言處理裝置(21)檢測到所述輸入數(shù)據(jù)中包括的所述未知詞,則所述 判斷裝置(22)將包括所述未知詞的所述輸入數(shù)據(jù)的部分與所述登錄 候選詞典數(shù)據(jù)進行比較,以由此判斷在包括所述未知詞的所述部分中 是否存在所述對應詞。
4.如權利要求1至3中任一項所述的自然語言處理系統(tǒng),其中所述 自然語言處理裝置(21)通過僅使用登錄在所述詞典存儲部分(31)中的詞典數(shù)據(jù)對所述輸入數(shù)據(jù)執(zhí)行所述自然語言處理。
5. 如權利要求1至4中任一項所述的自然語言處理系統(tǒng),其中所述 自然語言處理裝置(21)包括將第一語言的字符串轉換成第二語言的 另一字符串的機器翻譯裝置,和/或將輸入的字符串轉換為音頻信號的語音合成裝置。
6. —種詞典登錄系統(tǒng),包括登錄候選存儲部分(32),其中存儲登錄候選詞典數(shù)據(jù); 判斷裝置(22),將輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)進行比較,以由此判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;詢問裝置(23),如果所述判斷裝置判斷出存在所述對應詞,則 所述詢問裝置(23)詢問用戶是否要將所述登錄候選詞典數(shù)據(jù)登錄到 詞典存儲部分(31)中,以接受用戶的指令;以及詞典登錄裝置(24),基于輸入到所述詢問裝置的所述指令將所 述登錄候選詞典數(shù)據(jù)登錄在所述詞典存儲部分中。
7. 如權利要求6所述的詞典登錄系統(tǒng),進一步包括檢測所述輸入 數(shù)據(jù)中包括的未知詞的未知詞檢測裝置(25),其中如果所述未知詞檢測裝置檢測到所述輸入數(shù)據(jù)中包括的未知詞, 則所述判斷裝置(22)開始操作。
8. 如權利要求7所述的詞典登錄系統(tǒng),其中如果所述未知詞檢測 裝置(25)檢測到所述輸入數(shù)據(jù)中包括的未知詞,則所述判斷裝置(22) 將包括所述未知詞的所述輸入數(shù)據(jù)的部分與所述登錄候選詞典數(shù)據(jù)進 行比較,以由此判斷包括所述未知詞的所述部分中是否存在所述對應詞。
9. 如權利要求6至8中任一項所述的詞典登錄系統(tǒng),其中所述詞典數(shù)據(jù)包括在將所輸入的第一語言的字符串轉換成第二語 言的另一字符串的機器翻譯處理中使用的詞典數(shù)據(jù),和/或在將輸入的 字符串轉換為音頻信號的語音合成處理中使用的詞典數(shù)據(jù)。
10. 如權利要求6至8中任一項所述的詞典登錄系統(tǒng),其中 所述詞典數(shù)據(jù)包括在將所輸入的第一語言的字符串轉換成第二語言的另一字符串的機器翻譯處理中使用的詞典數(shù)據(jù),在將輸入的假名字符串轉換為假名-日文漢字混合的字符串的假名-日文漢字轉換處理中使用的詞典數(shù)據(jù),和/或在將輸入的音頻信號轉換為字符串的話音識 別處理中使用的詞典數(shù)據(jù);以及在將所述輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)相比較時,所述判斷 裝置(22)將所述輸入數(shù)據(jù)與作為轉換結果存儲在所述登錄候選存儲 部分(31)中的所述登錄候選數(shù)據(jù)的字符串進行比較,以由此判斷是 否存在所述對應詞。
11. 一種自然語言處理方法,包括將輸入數(shù)據(jù)與存儲在存儲單元中的登錄候選詞典數(shù)據(jù)進行比較, 以由此判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;如果判斷出存在所述對應詞,則詢問用戶是否要將所述登錄候選 詞典數(shù)據(jù)登錄到詞典中,以接受用戶的指令;基于所輸入的指令將所述登錄候選詞典數(shù)據(jù)登錄在所述詞典中;以及通過使用登錄在所述詞典中的所述詞典數(shù)據(jù)對所述輸入數(shù)據(jù)執(zhí)行 自然語言處理。
12. 如權利要求ll所述的自然語言處理方法,進一步包括 判斷所述輸入數(shù)據(jù)是否包括未知詞;以及在判斷出所述輸入數(shù)據(jù)包括未知詞后,將包括所述未知數(shù)據(jù)的所 述輸入數(shù)據(jù)的部分與所述登錄候選詞典數(shù)據(jù)進行比較,以由此判斷包括所述未知詞的所述部分中是否存在所述對應詞。
13. 如權利要求12所述的自然語言處理方法,進一步包括在判斷 出所述輸入數(shù)據(jù)包括未知詞后將包括所述未知詞的所述輸入數(shù)據(jù)的部 分與所述登錄候選詞典數(shù)據(jù)進行比較,以由此判斷包括所述未知詞的 所述部分中是否存在所述對應詞。
14. 如權利要求11至13中任一項所述的自然語言處理方法,其中 所述自然語言處理僅使用存儲在所述詞典中的所述詞典數(shù)據(jù)。
15. 如權利要求11至14中任一項所述的自然語言處理方法,其中所述所述自然語言處理包括將第一語言的字符串轉換成第二語言的另 一字符串的機器翻譯處理,和/或將輸入的字符串轉換為音頻信號的語音合成處理。
16. —種詞典登錄方法,包括將輸入數(shù)據(jù)與存儲在存儲單元中的登錄候選詞典數(shù)據(jù)進行比較, 以由此判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的 詞;如果判斷出存在所述對應詞,則詢問用戶是否要將所述登錄候選 詞典數(shù)據(jù)登錄到詞典中,以接受用戶的指令;以及基于所輸入的指令將所述登錄候選詞典數(shù)據(jù)登錄在所述詞典中。
17. 如權利要求16所述的詞典登錄方法,進一步包括 判斷所述輸入數(shù)據(jù)是否包括未知詞;以及如果判斷出所述輸入數(shù)據(jù)包括未知詞,則將包括所述未知詞的所 述輸入數(shù)據(jù)的部分與所述登錄候選詞典數(shù)據(jù)進行比較,以由此判斷包 括所述未知詞的所述部分中是否存在所述對應詞。
18. 如權利要求17所述的詞典登錄方法,其中如果判斷出所述輸入數(shù)據(jù)包括未知詞,則將包括所述未知詞的所述輸入數(shù)據(jù)的部分與所 述登錄候選詞典數(shù)據(jù)進行比較,以由此判斷包括所述未知詞的所述部 分中是否存在所述對應詞。
19.如權利要求16至18中任一項所述的詞典登錄方法,其中所述 詞典數(shù)據(jù)包括在將所輸入的第一語言的字符串轉換成第二語言的另一 字符串的機器翻譯處理中使用的詞典數(shù)據(jù),和/或在將輸入的字符串轉 換為音頻信號的語音合成處理中使用的詞典數(shù)據(jù)。
20.如權利要求16至18中任一項所述的詞典登錄方法,其中所述詞典數(shù)據(jù)包括在將所輸入的第一語言的字符串轉換成第二語 言的另一字符串的機器翻譯處理中使用的詞典數(shù)據(jù),在將所輸入的假 名字符串轉換為假名-日文漢字混合的字符串的假名-日文漢字轉換處 理中使用的詞典數(shù)據(jù),和/或在將輸入的音頻信號轉換為字符串的話音 識別處理中使用的詞典數(shù)據(jù);以及對所述輸入數(shù)據(jù)和所述登錄候選詞典數(shù)據(jù)的所述比較將所述輸入 數(shù)據(jù)和作為轉換結果存儲在所述登錄候詞典數(shù)據(jù)中的字符串進行比 較,以由此判斷是否存在所述對應詞。
21. —種編碼有使得中央處理單元(CPU)進行操作的計算機可讀 程序的記錄介質,所述計算機可讀程序使得所述CPU執(zhí)行以下處理將登錄候選詞典數(shù)據(jù)存儲在存儲單元中; 將輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)進行比較,并且由此判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;如果所述判斷處理判斷出存在所述對應詞,則詢問用戶是否要將所述登錄候選詞典數(shù)據(jù)登錄到詞典中,以接受用戶的指令;基于在所述詢問處理中輸入的指令將所述登錄候選詞典數(shù)據(jù)登錄在所述詞典中;通過使用登錄在所述詞典中的所述詞典數(shù)據(jù)對所述輸入數(shù)據(jù)執(zhí)行 自然語言處理。
22. 如權利要求21所述的介質,其中所述自然語言處理包括判斷所述輸入數(shù)據(jù)是否包括未知詞;以及 如果所述自然語言處理判斷出所述輸入數(shù)據(jù)包括未知詞,則所述 程序使得所述CPU執(zhí)行所述判斷操作。
23. 如權利要求22所述的介質,如果所述自然語言處理判斷出所 述輸入數(shù)據(jù)包括未知詞,則所述判斷處理將包括所述未知詞的所述輸 入數(shù)據(jù)的部分與所述登錄候選詞典數(shù)據(jù)進行比較,以由此判斷包括所 述未知詞的所述部分中是否存在所述對應詞。
24. 如權利要求21至23中任一項所述的介質,其中所述自然語言 處理通過僅使用存儲在所述詞典中的所述詞典數(shù)據(jù)對所述輸入數(shù)據(jù)執(zhí) 行所述自然語言處理。
25. 如權利要求21至24中任一項所述的介質,其中所述自然語言 處理具有將第一語言的字符串轉換成第二語言的另一字符串的機器翻譯功能,和/或將輸入的字符串轉換為音頻信號的語音合成功能。
26. —種編碼有使得中央處理單元(CPU)進行操作的計算機可讀 程序的記錄介質,所述計算機可讀程序使得所述CPU執(zhí)行以下處理存儲登錄候選詞典數(shù)據(jù);將輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)進行比較,并且判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;如果所述判斷處理判斷出存在所述對應詞,則詢問用戶是否要將所述登錄候選詞典數(shù)據(jù)登錄到詞典中,以接受用戶的指令;以及基于在所述詢問處理中輸入的指令將所述登錄候選詞典數(shù)據(jù)登錄在所述詞典中。
27. 如權利要求26所述的介質,進一步使得所述CPU執(zhí)行判斷所述輸入數(shù)據(jù)是否包括未知詞的處理,其中-如果所述未知詞檢測處理檢測到所述輸入數(shù)據(jù)中包括的所述未知詞,則所述程序使得所述CPU執(zhí)行所述判斷處理。
28. 如權利要求27所述的介質,其中,如果所述未知詞檢測處理 檢測出所述輸入數(shù)據(jù)中包括的所述未知詞,則所述判斷處理將包括所 述未知詞的所述輸入數(shù)據(jù)的部分與所述登錄候選詞典數(shù)據(jù)進行比較, 以由此判斷包括所述未知詞的所述部分中是否存在所述對應詞。
29. 如權利要求26至28中任一項所述的介質,其中所述詞典數(shù)據(jù)包括在將所輸入的第一語言的字符串轉換成第二語言的另一字符串的 機器翻譯功能中使用的詞典數(shù)據(jù),和/或在將輸入的字符串轉換為音頻信號的語音合成功能中使用的詞典數(shù)據(jù)。
30. 如權利要求26至28中任一項所述的介質,其中 所述詞典數(shù)據(jù)包括在將所輸入的第一語言的字符串轉換成第二語言的另一字符串的機器翻譯功能中使用的詞典數(shù)據(jù),在將所輸入的假 名字符串轉換為假名-日文漢字混合的字符串的假名-日文漢字轉換功 能中使用的詞典數(shù)據(jù),和/或在將輸入的音頻信號轉換為字符串的話音 識別功能中使用的詞典數(shù)據(jù);以及其中,在將所述輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)進行比較時, 所述判斷處理將所述輸入數(shù)據(jù)與作為轉換結果存儲在所述登錄候選詞 典數(shù)據(jù)中的字符串進行比較,以由此判斷是否存在所述對應詞。
全文摘要
一種自然語言處理系統(tǒng)(10),包括登錄候選存儲部分(32),其中存儲登錄候選詞典數(shù)據(jù);判斷裝置(22),將輸入數(shù)據(jù)與所述登錄候選詞典數(shù)據(jù)進行比較由此判斷所述輸入數(shù)據(jù)是否包括與所述登錄候選詞典數(shù)據(jù)相對應的詞;詢問裝置(23),如果判斷出存在對應詞則詢問用戶是否要將對應的詞典數(shù)據(jù)登錄到詞典存儲部分(31)中以接受用戶的指令;詞典登錄裝置(24),基于所輸入的指令將對應的詞典數(shù)據(jù)登錄在詞典存儲部分中;以及自然語言處理裝置(25),通過使用登錄在所述詞典存儲部分中的詞典數(shù)據(jù)對所述輸入數(shù)據(jù)執(zhí)行自然語言處理。
文檔編號G06F17/22GK101512518SQ20078003334
公開日2009年8月19日 申請日期2007年9月6日 優(yōu)先權日2006年9月7日
發(fā)明者土井伸一, 安藤真一, 定政邦彥 申請人:日本電氣株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1