亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種自然語言的搜索方法及系統(tǒng)的制作方法

文檔序號:7965274閱讀:216來源:國知局
專利名稱:一種自然語言的搜索方法及系統(tǒng)的制作方法
技術(shù)領域
本發(fā)明涉及搜索技術(shù)領域,特別是關于一種自然語言的搜索方法及系統(tǒng)。
背景技術(shù)
自然語言搜索技術(shù)其實是自然語言理解與搜索技術(shù)相結(jié)合的產(chǎn)物。但是現(xiàn)有實際應用中的大多數(shù)自然語言搜索僅僅是對搜索輸入詞語進行基于詞典的分詞,然后再用分詞出來的關鍵詞對索引文件進行搜索。
分詞主要是針對非英語語系類的語言而言,比如漢語。例如“多么美麗的花?。 币痪湓?,可以依據(jù)漢語詞典對句子進行語義的折分,即分詞成美麗的、花,這些正是語義的主體,也是自然語言搜索需要的關鍵詞。因為對于搜索而言,被搜索內(nèi)容事先已經(jīng)按詞典里的詞條進行索引的創(chuàng)建。所以,在搜索時可能用反向查找的方式就可以找到要搜索的內(nèi)容。
但是,自然語言搜索的關鍵是在自然語言語解上。也就是如何從輸入中找出關鍵詞信息。
下面分別介紹兩種現(xiàn)有技術(shù)中如何找出關鍵詞信息的方法。
一、基于主題森林的應答推理針對特定的業(yè)務,確定其主題樹所涉及的主題,通過與用戶多次交互,最終通過主題信息推理并搜索出用戶所要的信息。
如圖1所示的航班信息,系統(tǒng)通過詢問用戶各個主題日期、出發(fā)城市、到達城市、機型等,再通過這些信息去搜索,返回給用戶確定的航班。
這種方案也可以用在基于手機短消息接入的彩鈴搜索中,那么如果鈴音是歌曲,這種業(yè)務的主題就有鈴音名稱、鈴音的演唱者,可能還會有歌詞片段信息。
現(xiàn)有技術(shù)一的缺點是1)交互次過多,用戶體驗不好;2)對用戶搜索主題要求太嚴,如音樂搜索僅提供歌手就可以進行;3)系統(tǒng)部署復雜,對維護人員要求太高;4)系統(tǒng)容錯功能不足。
二、自然語言分詞搜索這種方法以搜索技術(shù)為主導,對用戶的搜索輸入進行語義分析,配合詞性標注,找出對搜索引擎有意義的關鍵詞。然后再對業(yè)務數(shù)據(jù)的索引文件進行檢索。
如在音樂搜索中輸入“美麗的草園我的家”,那么這處搜索方案就會用“美麗”、“草園”和“家”來進行搜索。結(jié)果可想而知,導致用戶體驗很差。
現(xiàn)有技術(shù)二的缺點是1)沒有理解用戶的語義;2)準確性低。
綜上所述,現(xiàn)有技術(shù)中還沒有一種自然語言的搜索方法能準確、方便地搜索出結(jié)果。而且還沒有容錯機制,一旦用戶輸入錯誤,將無法提供結(jié)果。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的是提供一種自然語言的搜索方法及系統(tǒng),用以解決現(xiàn)有技術(shù)中對自然語言的搜索結(jié)果不準確的問題。
本發(fā)明提供的一種自然語言的搜索方法包括A.為一業(yè)務設定自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;B.針對自然語言搜索輸入的語句,利用自然語言模板對應的正則表達式對所述語句進行匹配過濾,得到元數(shù)據(jù);C.利用元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)庫得到輸出的業(yè)務信息。
步驟A中所述每個自然語言模板包括頭尾模板和主體模板,并且所述正則表達式包括兩部分,每個頭尾模板和主體模板分別對應所述正則表達式中的一部分。
步驟B包括B11、選擇一個頭尾模板,利用該頭尾模板對應的正則表達式以及頭尾模板對所述語句進行匹配過濾,如果匹配過濾成功,得到該語句的主體內(nèi)容,執(zhí)行步驟B13,否則,執(zhí)行步驟B12;B12、判斷頭尾模板是否全部匹配完畢,如果沒有,則執(zhí)行步驟B11,否則,結(jié)束本流程;B13、選擇一個主體模板,利用每個主體模板對應的正則表達式、主體模板對所述主體內(nèi)容進行匹配過濾,如果匹配過濾成功,過濾后的數(shù)據(jù)為元數(shù)據(jù),執(zhí)行步驟C,否則,執(zhí)行步驟B14;B14、判斷主體模板是否全部匹配完畢,如果沒有,則執(zhí)行步驟B13,否則,結(jié)束本流程。
步驟B包括B20、將所述語句作為關鍵詞查找業(yè)務數(shù)據(jù)庫,判斷是否查找到,如果是,則執(zhí)行步驟C,否則,執(zhí)行步驟B21;B21、利用預先配置的頭尾模板對將該語句進行匹配過濾,如果匹配成功,則執(zhí)行步驟B22,否則,執(zhí)行步驟B23;B22、將過濾后得到的主體語句作為關鍵詞查找業(yè)務數(shù)據(jù)庫,判斷是否查找到,如果是,則執(zhí)行步驟C,否則,執(zhí)行步驟B23;B23、利用預先配置的主體模板對主體語句進行匹配過濾,如果匹配成功,則執(zhí)行步驟C,否則,對該語句進行精確查找,結(jié)束本流程。
步驟B11中頭尾模板是從沒有使用的頭尾模板中隨機選擇或按優(yōu)先級信息選擇;步驟B13中主體模板是從沒有使用的主體模板中隨機選擇或按優(yōu)先級信息選擇。
所述優(yōu)先級是按照字符長度來設置的,字符長的優(yōu)先級高。
該方法進一步包括預先設置容錯語句,則步驟C包括判斷業(yè)務數(shù)據(jù)庫中是否含有元數(shù)據(jù)對應的業(yè)務信息,如果有直接獲得該業(yè)務信息,否則,利用容錯語句對元數(shù)據(jù)進行容錯,并利用容錯后的元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)庫,得到輸出的業(yè)務信息。
所述容錯語句是根據(jù)拼音或語義設置;或所述容錯語句是根據(jù)拼音以及容錯前后的相關度對比來確定。
所述容錯語句的個數(shù)為一個或一個以上。
當容錯語句的個數(shù)為一個以上時,步驟C中是隨機選擇一個容錯語句對元數(shù)據(jù)進行容錯;當容錯語句的個數(shù)為一個以上時,步驟C中是利用一個以上容錯語句進行容錯,并輸出每個容錯后的元數(shù)據(jù)對應的業(yè)務數(shù)據(jù)。
本發(fā)明提供的一種自然語言的搜索系統(tǒng)包括自然語言過濾裝置,用于保存元數(shù)據(jù)對應的業(yè)務信息,保存業(yè)務的自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;利用自然語言模板對應的正則表達式對來自自然語言收發(fā)裝置的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)對應的業(yè)務信息輸出給自然語言收發(fā)裝置;自然語言收發(fā)裝置,用于將外部節(jié)點設備的語句發(fā)送給自然語言過濾裝置,將來自自然語言過濾裝置的業(yè)務信息向外部節(jié)點設備輸出。
所述自然語言過濾裝置包括自然語言模板存儲裝置,用于保存業(yè)務的自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;業(yè)務數(shù)據(jù)存儲裝置,用于保存元數(shù)據(jù)對應的業(yè)務信息;
自然語言匹配控制裝置,用于獲取自然語言模板存儲裝置中的自然語言模板對應的正則表達式,對來自自然語言收發(fā)裝置的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)存儲裝置得到的業(yè)務信息輸出給自然語言收發(fā)裝置。
所述自然語言匹配控制裝置中還包括自然語言匹配單元,用于獲取自然語言模板存儲裝置中的自然語言模板對應的正則表達式,對來自自然語言收發(fā)裝置的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)輸出給容錯裝置;容錯裝置,用于查找業(yè)務數(shù)據(jù)存儲裝置中是否含有元數(shù)據(jù)對應的業(yè)務信息,如果有,直接將該業(yè)務信息輸出給自然語言收發(fā)裝置,否則,利用自身保存的容錯語句對元數(shù)據(jù)進行容錯,并利用容錯后的元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)存儲裝置得到對應的業(yè)務信息,再將該業(yè)務信息輸出給自然語言收發(fā)裝置。
本發(fā)明針對具體搜索業(yè)務,采用語言模板的方式來模式匹配自然語言,并且采用漢字拼音和相關度容錯以及同義容錯的方法,得到元數(shù)據(jù),從而提供正確的搜索結(jié)果。
基于上述本發(fā)明的技術(shù)方案,本發(fā)明具有如下優(yōu)點和特點1)使搜索系統(tǒng)能夠識別用戶自然語言的輸入;2)搜索系統(tǒng)具有了容錯、聯(lián)想功能;3)搜索系統(tǒng)具有對于自然語言學習的能力。


圖1為現(xiàn)有技術(shù)中基于主題森林的應答推理的應用實例示意圖;圖2為實現(xiàn)本發(fā)明方法的流程示意圖;圖3為本發(fā)明中利用自然語言模板以及其對應的正則表達式對所述語句進行匹配過濾得到元數(shù)據(jù)的具體流程示意圖;圖4為本發(fā)明應用在彩鈴自然語言搜索的實施例流程示意圖;
圖5為實現(xiàn)本發(fā)明系統(tǒng)的結(jié)構(gòu)示意圖;圖6頭尾模板單元的示意圖;圖7為主體模板單元的示意圖;圖8為鈴音容錯裝置的示意圖;圖9為歌手“同義”容錯裝置示意圖。
具體實施例方式
本發(fā)明針對具體搜索業(yè)務,采用自然語言模板以及該模板對應的正則表達式來匹配自然語言搜索輸入的語句,從而找出元數(shù)據(jù)。元數(shù)據(jù)是指與某一類業(yè)務相關的基礎數(shù)據(jù)信息,如音樂下載業(yè)務中的音樂的名稱,演唱者就是描述音樂的元數(shù)據(jù)。正則表達式是描述一個字符串集合的模式或模板。這個模式?jīng)Q定了什么樣的字符串屬于這個集合,它由文本字符和元字符組成。元字符即為有特殊含義的字符。
參見圖2所示,實現(xiàn)本發(fā)明的方法包括以下步驟步驟201為一業(yè)務設定自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式。
如彩鈴搜索引擎中的自然語言模板單元包括頭尾模板單元和主體模板單元。每個頭尾模板單元包括多個頭尾模板,主體模板單元包括多個主體模板單元。其中,頭尾模板與主體模板可隨意組合,從而識別更多的自然語言搜索輸入。頭尾模板單元和主體模板單元如圖6和圖7所示。
如果搜索輸入的語句為“我想把劉德華唱的忘情水設置為彩鈴”。對應的模板為“我想把……設置為彩鈴”和“*唱的#”。其中,前者為頭尾模板,后者為主體模板,特殊符號“*”和“#”分別代表鈴音音樂的歌手和歌曲名。自然語言模板對應的正則表達式為“^頭+([\\s\\S]+)+體$”。
步驟202針對自然語言搜索輸入的語句,利用自然語言模板對應的正則表達式對所述語句進行匹配過濾,得到元數(shù)據(jù)。
步驟203利用元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)庫得到輸出的業(yè)務信息。
自然語言模板可以包括頭尾模板和主體模板,所述正則表達式包括兩部分,并且分別頭尾模板和主體模板分別對應正則表達式的一部分。利用正則表達式就可以將模式匹配上的自然語言搜索輸入的頭和尾去掉,然后再對主體部分進行主體模板的模式匹配。對于匹配次數(shù)較多的模板,系統(tǒng)為有一個自動優(yōu)化的過程,從而依據(jù)統(tǒng)計規(guī)律提高搜索性能。
參見圖3所示,步驟202中得到元數(shù)據(jù)的具體過程如下步驟301選擇一個頭尾模板,利用該頭尾模板對應的正則表達式對所述語句進行匹配過濾,如果匹配過濾成功,得到該語句的主體內(nèi)容,執(zhí)行步驟303,否則,執(zhí)行步驟302。
步驟302判斷頭尾模板是否全部匹配完畢,如果沒有,則執(zhí)行步驟301否則,結(jié)束本流程。這里,可以從沒有使用的頭尾模板中隨機選擇或按優(yōu)先級信息選擇頭尾模板。并且,可以按照字符長度來設置優(yōu)先級,字符長的優(yōu)先級高。
步驟303選擇一個主體模板,利用每個主體模板對應的正則表達式、對所述主體內(nèi)容進行匹配過濾,如果匹配過濾成功,過濾后的數(shù)據(jù)為元數(shù)據(jù),否則,執(zhí)行步驟304。這里,可以從沒有使用的主體模板中隨機選擇或按優(yōu)先級信息選擇主體模板。
步驟304判斷主體模板是否全部匹配完畢,如果沒有,則執(zhí)行步驟303,否則,結(jié)束本流程。
從上述過程可以看出,在對主體進行模式識別的過程中,系統(tǒng)會將“主體內(nèi)容”、“主體模板”和“主體模板對應正則表達式”三者結(jié)合起來,準確分析出其中的元數(shù)據(jù)。
例如主體內(nèi)容=張惠妹和張雨生的最愛的人傷我最深主體模板=*和*的#
則系統(tǒng)會找出歌手為張惠妹、張雨生;歌曲名為《最愛的人傷我最深》,而不會出現(xiàn)歌手為張惠姝和張雨生的最愛;歌曲名為《人傷我最深》。
另外,主體模板在進行模式匹配的過程中,要遵循模板先長后短的原則。例如“*唱的#*”要在“*的#”之前進行匹配,否則解析出來的元數(shù)據(jù)不準確。
為了提高用戶可用度,本發(fā)明還提供了一種容錯機制。這需要預先設置容錯語句,在步驟203中進行搜索時,需要首先判斷業(yè)務數(shù)據(jù)庫中是否含有元數(shù)據(jù)對應的業(yè)務信息,如果有直接獲得該業(yè)務信息,否則,利用容錯語句對元數(shù)據(jù)進行容錯,并利用容錯后的元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)庫,得到輸出的業(yè)務信息。
當然,容錯語句可以根據(jù)很多容錯機制設置,比如拼音、語義或兩者的結(jié)合等,也可以是根據(jù)拼音以及容錯前后的相關度對比來確定。容錯語句的個數(shù)不限,可以為一個,也可以為多個。
當容錯語句的個數(shù)為一個以上時,在步驟203進行搜索時,可以隨機選擇一個容錯語句對元數(shù)據(jù)進行容錯,也可以利用多個容錯語句進行容錯,并輸出每個容錯后的元數(shù)據(jù)對應的業(yè)務數(shù)據(jù)。
圖8為針對鈴音名的拼音容錯示意。例如,用戶自然語言搜索輸入為“我想找《紅都》”,其實用戶要找的是《紅豆》,而業(yè)務數(shù)據(jù)中卻只有《紅豆(月圓問候版)》。此時,容錯機制會將鈴音名元數(shù)據(jù)“紅都”容錯到“紅豆”,同時,系統(tǒng)在運營初期會將業(yè)務數(shù)據(jù)將一定過濾策略生成“紅豆(月圓問候版)”的真實數(shù)據(jù)“紅豆”。在接下來的關鍵詞查找中就可以找到用戶想要的東西了。
拼音容錯過程中,還需要配合容錯前后的相關度對比來確定容錯結(jié)果。如由于多音字問題,《紅都》的拼音為HONG_DU、HONG_DOU。假如有另一首歌叫《哄逗》,其拼音為HONG_DOU,現(xiàn)在的拼音容錯后,會用另外算法來計算“紅豆”與“紅都”和“哄逗”的相關度,然后返回最有可能的結(jié)果。
在“彩鈴搜索引擎”應用中有針對業(yè)務數(shù)據(jù)“歌手”存在另外一種容錯,即同義容錯,參見圖9所示,這種容錯方式也就是指用戶使用歌手的藝名、所在組合名等其它名稱進行搜索,因此系統(tǒng)通過預先配置部分歌手的別名信息就可以很好地解決此問題。
另外,系統(tǒng)還會記錄下“陌生語言”,供模板維護和優(yōu)化參考。通過此方案可以識別絕大多數(shù)搜索請求,同時對剩下的請求系統(tǒng)會有引導性的提示。
下面以彩鈴自然語言搜索為例對本發(fā)明技術(shù)方案作進一步闡述。
本實施例是針對特定的業(yè)務,通過豐富的自然語言模板實現(xiàn)搜索自然語言的匹配,從而定位其中關鍵詞;通過中文拼音對應表來自動處理關鍵詞的拼音標注,實現(xiàn)同音容錯;通過維護同義詞庫來實現(xiàn)同義匹配,以及同義詞的同音匹配。
參見圖4所示,本實施例實現(xiàn)彩鈴自然語言搜索的具體過程為步驟401~402接收需要搜索輸入的語句,將所述語句作為關鍵詞查找業(yè)務數(shù)據(jù)庫,判斷是否查找到,如果是,則結(jié)束本流程,否則,執(zhí)行步驟403。
步驟403利用預先配置的頭尾模板對將該語句進行匹配過濾,如果匹配成功,則執(zhí)行步驟404,否則,執(zhí)行步驟405。
步驟404將過濾后得到的主體語句作為關鍵詞查找業(yè)務數(shù)據(jù)庫,判斷是否查找到,如果是,則結(jié)束本流程,否則,執(zhí)行步驟405。
步驟405利用預先配置的主體模板對將主體語句進行匹配過濾,如果匹配成功,則執(zhí)行步驟406,否則,執(zhí)行步驟408。
步驟406判斷是否排行,如果是,則取排行鈴音,結(jié)束本流程,否則,執(zhí)行步驟407。
步驟407判斷是否需要精確查找,如果需要,則結(jié)束本流程,否則,執(zhí)行步驟408。
步驟408判斷是否需要全文搜索,如果需要,則結(jié)束本流程,否則,推薦鈴音。
參見圖5所示,本發(fā)明的一種自然語言搜索系統(tǒng)包括自然語言過濾裝置51和自然語言收發(fā)裝置52。
自然語言過濾裝置51,用于保存元數(shù)據(jù)對應的業(yè)務信息,保存業(yè)務的自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;利用自然語言模板對應的正則表達式對來自自然語言收發(fā)裝置52的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)對應的業(yè)務信息輸出給自然語言收發(fā)裝置52。
自然語言收發(fā)裝置52,用于將外部節(jié)點設備的語句發(fā)送給所述自然語言過濾裝置,將來自自然語言過濾裝置的業(yè)務數(shù)據(jù)向外部節(jié)點設備輸出。
所述自然語言過濾裝置51可以包括自然語言模板存儲裝置511、業(yè)務數(shù)據(jù)存儲裝置512以及自然語言匹配控制裝置513。
自然語言模板存儲裝置511,用于保存業(yè)務的自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;業(yè)務數(shù)據(jù)存儲裝置512,用于保存元數(shù)據(jù)對應的業(yè)務信息;自然語言匹配控制裝置513,用于獲取自然語言模板存儲裝置511中的自然語言模板對應的正則表達式,對來自自然語言收發(fā)裝置52的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)存儲裝置512得到的業(yè)務信息輸出給自然語言收發(fā)裝置52。
自然語言匹配控制裝置513中可以包括自然語言匹配單元5131和容錯裝置5132。
自然語言匹配單元5131,用于獲取自然語言模板存儲裝置511中的自然語言模板對應的正則表達式,對來自自然語言收發(fā)裝置52的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)輸出給容錯裝置5132。
容錯裝置5132,用于查找業(yè)務數(shù)據(jù)存儲裝置512中是否含有元數(shù)據(jù)對應的業(yè)務信息,如果有,直接將該業(yè)務信息輸出給自然語言收發(fā)裝置52,否則,利用自身保存的容錯語句對元數(shù)據(jù)進行容錯,并利用容錯后的元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)存儲裝置512得到對應的業(yè)務信息,再將該業(yè)務信息輸出給自然語言收發(fā)裝置52。
顯然,本領域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權(quán)利要求
1.一種自然語言的搜索方法,其特征在于,該方法包括以下步驟A.為一業(yè)務設定自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;B.針對自然語言搜索輸入的語句,利用自然語言模板對應的正則表達式對所述語句進行匹配過濾,得到元數(shù)據(jù);C.利用元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)庫得到輸出的業(yè)務信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟A中所述每個自然語言模板包括頭尾模板和主體模板,并且所述正則表達式包括兩部分,每個頭尾模板和主體模板分別對應所述正則表達式中的一部分。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟B包括B11、選擇一個頭尾模板,利用該頭尾模板對應的正則表達式以及頭尾模板對所述語句進行匹配過濾,如果匹配過濾成功,得到該語句的主體內(nèi)容,執(zhí)行步驟B13,否則,執(zhí)行步驟B12;B12、判斷頭尾模板是否全部匹配完畢,如果沒有,則執(zhí)行步驟B11,否則,結(jié)束本流程;B13、選擇一個主體模板,利用每個主體模板對應的正則表達式、主體模板對所述主體內(nèi)容進行匹配過濾,如果匹配過濾成功,過濾后的數(shù)據(jù)為元數(shù)據(jù),執(zhí)行步驟C,否則,執(zhí)行步驟B14;B14、判斷主體模板是否全部匹配完畢,如果沒有,則執(zhí)行步驟B13,否則,結(jié)束本流程。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟B包括B20、將所述語句作為關鍵詞查找業(yè)務數(shù)據(jù)庫,判斷是否查找到,如果是,則執(zhí)行步驟C,否則,執(zhí)行步驟B21;B21、利用預先配置的頭尾模板對將該語句進行匹配過濾,如果匹配成功,則執(zhí)行步驟B22,否則,將該語句作為主體語句,執(zhí)行步驟B23;B22、將過濾后得到的主體語句作為關鍵詞查找業(yè)務數(shù)據(jù)庫,判斷是否查找到,如果是,則執(zhí)行步驟C,否則,執(zhí)行步驟B23;B23、利用預先配置的主體模板對主體語句進行匹配過濾,如果匹配成功,則執(zhí)行步驟C,否則,對該語句進行精確查找,結(jié)束本流程。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟B11中頭尾模板是從沒有使用的頭尾模板中隨機選擇或按優(yōu)先級信息選擇;步驟B13中主體模板是從沒有使用的主體模板中隨機選擇或按優(yōu)先級信息選擇。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述優(yōu)先級是按照字符長度來設置的,字符長的優(yōu)先級高。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法進一步包括預先設置容錯語句,則步驟C包括判斷業(yè)務數(shù)據(jù)庫中是否含有元數(shù)據(jù)對應的業(yè)務信息,如果有直接獲得該業(yè)務信息,否則,利用容錯語句對元數(shù)據(jù)進行容錯,并利用容錯后的元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)庫,得到輸出的業(yè)務信息。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述容錯語句是根據(jù)拼音或語義設置。
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述容錯語句是根據(jù)拼音以及容錯前后的相關度對比來確定。
10.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述容錯語句的個數(shù)為一個或一個以上。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,當容錯語句的個數(shù)為一個以上時,步驟C中是隨機選擇一個容錯語句對元數(shù)據(jù)進行容錯;當容錯語句的個數(shù)為一個以上時,步驟C中是利用一個以上容錯語句進行容錯,并輸出每個容錯后的元數(shù)據(jù)對應的業(yè)務數(shù)據(jù)。
12.一種自然語言的搜索系統(tǒng),其特征在于,該系統(tǒng)包括自然語言過濾裝置(51),用于保存元數(shù)據(jù)對應的業(yè)務信息,保存業(yè)務的自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;利用自然語言模板對應的正則表達式對來自自然語言收發(fā)裝置(52)的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)對應的業(yè)務信息輸出給自然語言收發(fā)裝置(52);自然語言收發(fā)裝置(52),用于將外部節(jié)點設備的語句發(fā)送給自然語言過濾裝置(51),將來自自然語言過濾裝置(51)的業(yè)務信息向外部節(jié)點設備輸出。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述自然語言過濾裝置(51)包括自然語言模板存儲裝置(511),用于保存業(yè)務的自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;業(yè)務數(shù)據(jù)存儲裝置(512),用于保存元數(shù)據(jù)對應的業(yè)務信息;自然語言匹配控制裝置(513),用于獲取自然語言模板存儲裝置(511)中的自然語言模板對應的正則表達式,對來自自然語言收發(fā)裝置(52)的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)存儲裝置(512)得到的業(yè)務信息輸出給自然語言收發(fā)裝置(52)。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其特征在于,所述自然語言匹配控制裝置(513)中還包括自然語言匹配單元(5131),用于獲取自然語言模板存儲裝置(511)中的自然語言模板對應的正則表達式,對來自自然語言收發(fā)裝置(52)的語句進行匹配過濾得到元數(shù)據(jù),并將元數(shù)據(jù)輸出給容錯裝置(5132);容錯裝置(5132),用于查找業(yè)務數(shù)據(jù)存儲裝置(512)中是否含有元數(shù)據(jù)對應的業(yè)務信息,如果有,直接將該業(yè)務信息輸出給自然語言收發(fā)裝置(52),否則,利用自身保存的容錯語句對元數(shù)據(jù)進行容錯,并利用容錯后的元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)存儲裝置(512)得到對應的業(yè)務信息,再將該業(yè)務信息輸出給自然語言收發(fā)裝置(52)。
全文摘要
本發(fā)明公開了一種自然語言的搜索方法,該方法為為一業(yè)務設定自然語言模板單元,所述自然語言模板單元包括一個以上自然語言模板,每個自然語言模板對應一個正則表達式;針對自然語言搜索輸入的語句,利用自然語言模板以及其對應的正則表達式對所述語句進行匹配過濾,得到元數(shù)據(jù);利用元數(shù)據(jù)搜索業(yè)務數(shù)據(jù)庫得到輸出的業(yè)務信息。同時,本發(fā)明還公開了一種自然語言的搜索系統(tǒng)。應用本發(fā)明,能夠識別用戶自然語言的輸入,具有了容錯、聯(lián)想功能,而且具有對于自然語言學習的能力。
文檔編號H04M3/42GK1908935SQ20061010409
公開日2007年2月7日 申請日期2006年8月1日 優(yōu)先權(quán)日2006年8月1日
發(fā)明者張濤 申請人:華為技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1