專利名稱:一種開放式自然語言動態(tài)生成系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及計算機對自然語言的處理技術,特別涉及一種開放式自然語言動態(tài)生成系統(tǒng)。
背景技術:
目前,隨著計算機的普及,人們對智能化人機交互系統(tǒng)、機器翻譯系統(tǒng)及其他特定信息處理系統(tǒng)的需求不斷增多,對系統(tǒng)相關信息進行處理并加以智能化和人性化的呈現(xiàn)成為一個被廣泛關注的領域,而作為人類最基本的信息交流手段之一自然語言的智能化呈現(xiàn),則是該領域中的一個熱點。
現(xiàn)有的智能化人機交互系統(tǒng)中,往往是一對一的方式。一般的情況是用計算機的程序語言實現(xiàn)各種約定好的語言邏輯,這需要完全按照約定好的語言邏輯來編寫程序語言,同時要求在人機交互過程中,必須按照約定好的語言邏輯來輸入自然語言,這種方法實現(xiàn)過程繁瑣且無法適應靈活多變的交互引導需求。
現(xiàn)有的機器翻譯系統(tǒng)中,大多只能按照程序中所描述的語法、語義對翻譯后的詞匯進行重新組合,并形成最終的目標語言。
雖然有極少數(shù)系統(tǒng)在形成目標語言過程中還引入了一定的語言模板概念,給出了固定的語言模板,以填空為基本方式形成目標語言。這樣的固定語言模板,對于簡單的特定業(yè)務或專業(yè)翻譯有一定的成效。但是,固定語言模板只能針對某些特定的業(yè)務或特定的翻譯專業(yè),這就需要對每種要求自然語言呈現(xiàn)的業(yè)務或翻譯的專業(yè)分別進行程序開發(fā),并要求開發(fā)人員具有多種業(yè)務知識和所翻譯專業(yè)的專業(yè)知識,從而造成大量的人力、物力的資源浪費。而且,由于面向的是最終用戶,產品一旦發(fā)布便難以對即定的語法關系及語言模板進行調整,而其要求自然語言呈現(xiàn)的對象卻是一個無限的不確定領域,因此采用固定的語言模板難以生成符合人的表述習慣的自然語言。
發(fā)明內容
有鑒于此,本發(fā)明的目的在于提供一種開放式自然語言動態(tài)生成系統(tǒng),能夠由用戶根據(jù)業(yè)務需求自主地動態(tài)編寫或解析自然語言模板,形成人性化的自然語言。
為達到上述目的,本發(fā)明的技術方案具體是這樣實現(xiàn)的一種開放式自然語言動態(tài)生成系統(tǒng),該系統(tǒng)包含自然語言模板創(chuàng)建模塊,將從動態(tài)信息存儲模塊中提取的信息變量作為信息槽,和根據(jù)不同業(yè)務信息提取的自然語言原形進行組合,創(chuàng)建自然語言模板;動態(tài)信息存儲模塊,用于存儲業(yè)務信息;自然語言模板解析模塊,將從動態(tài)信息存儲模塊中提取的信息值插入自然語言模板的信息槽,生成自然語言輸出。
其中,自然語言模板創(chuàng)建模塊可以進一步包含自然語言模板組合單元,其將自然語言原形中的具體業(yè)務信息用信息槽替換,組合為自然語言模板。自然語言模板創(chuàng)建模塊還可以進一步包含自然語言模板修改單元,由用戶根據(jù)業(yè)務要求通過該修改單元修改自然語言模板的自然語言原形和信息槽。自然語言模板創(chuàng)建模塊駭異包含自然語言模板檢驗單元,檢驗創(chuàng)建的語言模板的完整性和是否符合自然語言模板的編寫格式。同時,自然語言模板創(chuàng)建模塊還可以進一步包含自然語言模板存儲單元,其將生成的自然語言模板以文件形式或數(shù)據(jù)庫記錄形式保存。
動態(tài)信息存儲模塊可以為計算機存儲器或網(wǎng)絡存儲器。
自然語言模板解析模塊可以進一步包含自然語言模板檢驗單元,檢驗自然語言模板創(chuàng)建模塊創(chuàng)建的語言模板的完整性和是否符合自然語言模板的編寫格式。自然語言模板解析模塊還可以進一步包含自然語言輸出單元,其將生成的自然語言由計算機合成為語音通過放音設備輸出;或將該自然語言以文字形式輸出到計算機顯示器上。
因此,本發(fā)明的這種開放式自然語言動態(tài)生成系統(tǒng),為用戶提供了一種簡單、靈活的創(chuàng)建語言模板及對該語言模板進行解析的系統(tǒng),用戶在該系統(tǒng)中不需要編寫任何的代碼便能夠創(chuàng)造出各種靈活的自然語言模板,并在該系統(tǒng)中能夠方便的實現(xiàn)語言模板與相關動態(tài)信息的有機融合,降低了開發(fā)成本,提高了靈活性。
圖1為本發(fā)明系統(tǒng)的應用方式示意圖。
具體實施例方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,下面結合實施例和附圖,對本發(fā)明進一步詳細說明。
參見圖1,圖1為本發(fā)明系統(tǒng)的應用方式示意圖。如圖1所示,本發(fā)明的開放式自然語言動態(tài)生成系統(tǒng)100包含自然語言模板創(chuàng)建模塊101、動態(tài)信息存儲模塊102和自然語言模板解析模塊103。
其中,自然語言模板創(chuàng)建模塊101,包含了一個自然語言模板組合單元,其將從動態(tài)信息存儲模塊中提取的信息變量作為信息槽,并將自然語言原形中的具體業(yè)務信息值用信息槽替換,組合為自然語言模板104。自然語言模板創(chuàng)建模塊101還包含自然語言模板修改單元,用戶可以根據(jù)業(yè)務要求通過該修改單元修改自然語言模板的自然語言原形和信息槽。自然語言模板創(chuàng)建模塊101還包含自然語言模板檢驗單元,檢驗創(chuàng)建的語言模板104的完整性和是否符合自然語言模板的編寫格式。另外,自然語言模板創(chuàng)建模塊101還包含自然語言模板存儲單元,其將生成的自然語言模板以文件形式或數(shù)據(jù)庫記錄形式保存。
動態(tài)信息存儲模塊102,用于存儲業(yè)務動態(tài)信息,該模塊可以是計算機存儲器或網(wǎng)絡存儲器。
自然語言模板解析模塊103,將從動態(tài)信息存儲模塊中提取的信息值插入自然語言模板104的信息槽,生成自然語言輸出。自然語言模板解析模塊103還包含自然語言模板檢驗單元,檢驗自然語言模板創(chuàng)建模塊創(chuàng)建的語言模板104的完整性和是否符合自然語言模板的編寫格式。同時,自然語言模板解析模塊103還包含自然語言輸出單元,其根據(jù)所應用系統(tǒng)的需要將生成的自然語言保存,或將該自然語言由計算機合成為語音通過放音設備輸出,或將該自然語言以文字形式輸出到計算機顯示器上。
總之,自然語言模板創(chuàng)建模塊101主要用于創(chuàng)建一系列可供系統(tǒng)按照靈活的自然語言方式呈現(xiàn)內部動態(tài)信息的自然語言模板104;自然語言模板解析模塊103則對系統(tǒng)所有自然語言模板的呈現(xiàn)提供相應的支持。
由圖1可知,開放式自然語言動態(tài)生成系統(tǒng)100實際上完成了從人性化自然語言中抽象自然語言模板104,然后再將自然語言模板104恢復為與之對應的自然語言的一個循環(huán)過程。在該循環(huán)過程中除了上述兩種語言狀態(tài)及兩大功能模塊之外,其中的動態(tài)信息存儲模塊103主要存儲一些與具體語言模板涉及業(yè)務相關的數(shù)據(jù)信息,并且其內容通常具有動態(tài)和不確定性的特點。
以下結合開放式自然語言動態(tài)生成系統(tǒng)在語音郵件系統(tǒng)中的應用實例,有針對性的對開放式自然語言動態(tài)生成系統(tǒng)的具體應用過程進行說明。這里的語音郵件系統(tǒng)是指通過電話與系統(tǒng)的語音交互來進行郵件讀和寫的系統(tǒng)。
開放式自然語言動態(tài)生成系統(tǒng)在語音郵件系統(tǒng)中的應用,主要是在人機對話過程中,將系統(tǒng)信息以自然語言通過放音設備播放給用戶。
要將系統(tǒng)信息以自然語言通過放音設備播放給用戶,需要在語音郵件系統(tǒng)投入使用之前,在系統(tǒng)中通過開放式自然語言動態(tài)生成系統(tǒng)建立自然語言模板。其具體應用過程為第一步,在使用開放式自然語言動態(tài)生成系統(tǒng)創(chuàng)建自然語言模板之前,首先需要明確當前創(chuàng)建語言模板所需要涉及的業(yè)務范圍,即圖1中的動態(tài)信息存儲模塊中存儲的是哪些業(yè)務動態(tài)信息,在本實施例中,業(yè)務動態(tài)信息是指郵件主題、郵件正文、發(fā)信人等與郵件相關的各種系統(tǒng)原始信息,動態(tài)信息存儲模塊在語音郵件系統(tǒng)中可以是服務器中的存儲器。
第二步,根據(jù)動態(tài)信息存儲模塊中存儲的動態(tài)信息涉及業(yè)務的語言呈現(xiàn)需要,整理提取各種描述系統(tǒng)服務和業(yè)務狀態(tài)的人性化自然語言原形并將其中的信息變量設置為信息槽,如“您現(xiàn)在有五封郵件,一封來自張三、兩封來自李四、兩封來自王五”。其中,總郵件數(shù)“五”設置為信息槽[AllMailNum]、一個用戶發(fā)送的郵件總數(shù)“一”或“兩”設置為信息槽[UserMailNum]、發(fā)送郵件的用戶“張三”、“李四”或“王五”設置為信息槽[UserMailName],即能夠從系統(tǒng)中獲得信息值的信息變量可以設置為信息槽。這些信息變量有些是直接從系統(tǒng)能夠獲得的信息,如郵件來源“張三”等,有些是需要系統(tǒng)經過統(tǒng)計獲得的信息,如郵件的封數(shù)“五”等。這兩類信息共同滿足自然語言原形對系統(tǒng)各種描述的需要,另外有些語言原形如“您現(xiàn)在沒有任何郵件”與系統(tǒng)中保存的系統(tǒng)信息相同,不需要信息槽支持,保留語言原形。
第三步,利用開放式自然語言模板創(chuàng)建模塊,將自然語言原形與信息槽按照創(chuàng)建開放式自然語言模板的規(guī)則,用信息槽替換在自然語言原形中與之對應的詞匯,并最終形成與自然語言原形對應的自然語言模板。另外有些語言原形如“您現(xiàn)在沒有任何郵件”與系統(tǒng)中保存的系統(tǒng)信息相同,不含信息槽,直接用做自然語言模板。如表一所示的兩種不同表述的自然語言模板。由表一可知對于不需要信息槽支持的自然語言模板,如表一中的例二,其保留與自然語言原形完全一樣的詞匯信息。表一中,{}表示其中有重復的內容。
表一自然語言模板生成后,由自然語言模板創(chuàng)建模塊中的檢驗單元來檢驗該模板的完整性和是否符合自然語言模板的編寫格式,檢驗正確后,保存該模板。
這樣生成的自然語言模板,在本實施例中以數(shù)據(jù)庫記錄形式存儲于系統(tǒng)的數(shù)據(jù)庫中,當業(yè)務發(fā)生變化或信息槽需要修改時,通過自然語言模板創(chuàng)建模塊中的自然語言模板修改單元直接修改數(shù)據(jù)庫記錄即可。
在語音郵件系統(tǒng)使用過程中,將系統(tǒng)中的系統(tǒng)信息以人性化描述的自然語言播放給用戶。此時,利用開放式自然語言模板解析模塊將上述過程創(chuàng)建的自然語言模板進行解析,該模塊能夠將該自然語言模板唯一解析為人性化描述的自然語言,為了實現(xiàn)該解析過程,首先需要確定當前自然語言模板所屬的業(yè)務范疇,如表一中例一所示的自然語言模板“您現(xiàn)在有[AllMailNum]封郵件,{[UserMailNum]封來自[UserMailName]、}”屬于語音郵件業(yè)務;其次將開放式自然語言動態(tài)生成系統(tǒng)中動態(tài)信息存儲模塊中存儲的動態(tài)信息相關聯(lián),即調用與郵件服務器相關的接口,實現(xiàn)語音郵件系統(tǒng)與遠程郵件動態(tài)信息之間的信息同步。
具體地說,就是自然語言模板解析模塊,將從動態(tài)信息存儲模塊中提取的信息值插入自然語言模板的信息槽,生成自然語言。自然語言生成后,由自然語言模板解析模塊中的自然語言檢驗單元檢驗自然語言模板的完整性和是否符合自然語言模板的編寫格式。檢驗正確后,保存該自然語言,并由自然語言模板解析模塊中的自然語言輸出單元,將該自然語言由語音郵件系統(tǒng)通過放音設備輸出給用戶,實現(xiàn)對系統(tǒng)信息動態(tài)個性化的呈現(xiàn)。
本發(fā)明的這種開放式自然語言動態(tài)生成系統(tǒng),不僅能夠為用戶提供靈活多樣的自然語言模板,并根據(jù)動態(tài)信息源的動態(tài)信息對其進行智能化的解析,最終形成人性化的自然語言。而且真正實現(xiàn)了自然語言模板創(chuàng)建和解析過程的分離,并將原本需要通過一對一編程實現(xiàn)的煩瑣過程變的非常簡單,不需要通過編程實現(xiàn)各種信息的呈現(xiàn),而只需用戶明確希望呈現(xiàn)的內容和表述方式,然后按照語言模板的編寫規(guī)則,便完成了采用自然語言呈現(xiàn)系統(tǒng)信息的工作。降低了開發(fā)成本,提高了靈活性,具有廣闊的應用前景。
權利要求
1.一種開放式自然語言動態(tài)生成系統(tǒng),其特征在于,該系統(tǒng)包含自然語言模板創(chuàng)建模塊,將從動態(tài)信息存儲模塊中提取的信息變量作為信息槽,和根據(jù)不同業(yè)務信息提取的自然語言原形進行組合,創(chuàng)建自然語言模板;動態(tài)信息存儲模塊,用于存儲業(yè)務信息;自然語言模板解析模塊,將從動態(tài)信息存儲模塊中提取的信息值插入自然語言模板的信息槽,生成自然語言輸出。
2.如權利要求1所述的開放式自然語言動態(tài)生成系統(tǒng),其特征在于所述的自然語言模板創(chuàng)建模塊進一步包含自然語言模板組合單元,其將自然語言原形中的具體業(yè)務信息用信息槽替換,組合為自然語言模板。
3.如權利要求1所述的開放式自然語言動態(tài)生成系統(tǒng),其特征在于所述的自然語言模板創(chuàng)建模塊進一步包含自然語言模板修改單元,由用戶根據(jù)業(yè)務要求通過該修改單元修改自然語言模板的自然語言原形和信息槽。
4.如權利要求1所述的開放式自然語言動態(tài)生成系統(tǒng),其特征在于所述的自然語言模板創(chuàng)建模塊進一步包含自然語言模板檢驗單元,檢驗創(chuàng)建的語言模板的完整性和是否符合自然語言模板的編寫格式。
5.如權利要求1所述的開放式自然語言動態(tài)生成系統(tǒng),其特征在于所述的自然語言模板創(chuàng)建模塊進一步包含自然語言模板存儲單元,其將生成的自然語言模板以文件形式或數(shù)據(jù)庫記錄形式保存。
6.如權利要求1所述的開放式自然語言動態(tài)生成系統(tǒng),其特征在于所述的動態(tài)信息存儲模塊為計算機存儲器或網(wǎng)絡存儲器。
7.如權利要求1所述的開放式自然語言動態(tài)生成系統(tǒng),其特征在于所述的自然語言模板解析模塊進一步包含自然語言模板檢驗單元,檢驗自然語言模板創(chuàng)建模塊創(chuàng)建的語言模板的完整性和是否符合自然語言模板的編寫格式。
8.如權利要求1所述的開放式自然語言動態(tài)生成系統(tǒng),其特征在于所述的自然語言模板解析模塊進一步包含自然語言輸出單元,其將生成的自然語言由計算機合成為語音通過放音設備輸出;或將該自然語言以文字形式輸出到計算機顯示器上。
全文摘要
本發(fā)明公開了一種開放式自然語言動態(tài)生成系統(tǒng),該系統(tǒng)包含自然語言模板創(chuàng)建模塊,將從動態(tài)信息存儲模塊中提取的信息變量作為信息槽,和根據(jù)不同業(yè)務信息提取的自然語言原形進行組合,創(chuàng)建自然語言模板;動態(tài)信息存儲模塊,用于存儲業(yè)務信息;自然語言模板解析模塊,將從動態(tài)信息存儲模塊中提取的信息值插入自然語言模板的信息槽,生成自然語言輸出。用戶在該系統(tǒng)中不需要編寫任何的代碼便能夠創(chuàng)造出各種人性化的自然語言模板,并在該系統(tǒng)中能夠方便的實現(xiàn)語言模板與相關動態(tài)信息的有機融合,降低了開發(fā)成本,提高了靈活性。
文檔編號G06F17/28GK1512398SQ0215924
公開日2004年7月14日 申請日期2002年12月27日 優(yōu)先權日2002年12月27日
發(fā)明者孫久文, 王楠, 孫文彥, 諸光, 任文捷, 劉武, 王江, 申江濤, 高建忠, 王建新 申請人:聯(lián)想(北京)有限公司