亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng)的制作方法

文檔序號:9547241閱讀:419來源:國知局
一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及一種智能交互方法,更具體的說是涉及一種基于互聯(lián)網(wǎng)的智能問答方法。
【背景技術】
[0002]在傳統(tǒng)的智能交互中,智能交互的一般采用模板方式來應對復雜的對話,準確度較低,或者對信息進行各種分詞后進行分析,但一般的分詞結果種類多,準確度較低。

【發(fā)明內容】

[0003]本發(fā)明公開了一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),包括以下步驟:
[0004]A、對用戶發(fā)出的信息進行分詞;
[0005]B、對步驟A所述分詞后的字、詞及詞組是否屬于實體進行識別;
[0006]C、對步驟A所述分詞后的字、詞及詞組進行語義標注分析;
[0007]D、對步驟A所述分詞后的字、詞及詞組進行文本糾錯;
[0008]E、對用戶發(fā)出的信息進行句法分析;
[0009]F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進行權重校正;
[0010]G、對用戶發(fā)出的信息進行上下文處理;
[0011]H、根據(jù)所述步驟B-G的結果,對用戶發(fā)出的信息進行相似度計算,得到閾值;
[0012]1、根據(jù)閾值結果查詢預設知識庫,返回結果給用戶。
[0013]所述步驟C中的語義標注分析包括領域、重要度、同類詞、同義詞、網(wǎng)絡用語。
[0014]所述步驟D中的文本糾錯包括在領域的業(yè)務類詞及詞組進行拼音糾錯;
[0015]所述步驟F中的句法分析采用規(guī)則和標注方法。
【附圖說明】
[0016]圖1-本體及實例化、繼承的實例
[0017]圖2-詞類管理
[0018]圖3-同義詞,權重校正
【具體實施方式】
[0019]本發(fā)明公開了一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),包括以下步驟:
[0020]A、對用戶發(fā)出的信息進行分詞;
[0021]分詞是計算機語言學或人工智能領域的常用技術手段,一般采用“最大匹配分詞法”或“最大概率法分詞”,
[0022]B、對步驟A所述分詞后的字、詞及詞組是否屬于實體進行識別;
[0023]對于實體,是本體的實例化,
[0024]所謂本體,是對概念的一種明確且詳細的說明,是對現(xiàn)實世界的一種描述方法?;蛘哒f,本體實際上就是對特定領域之中某套概念及其相互之間關系的形式化表達。一般包含:
[0025]——具體的本體實例(對象Object)
[0026]——本體的屬性
[0027]——所屬的本體類別。
[0028]本體實例化后,就可以繼承本體的屬性,為其后的語義標注分析做好準備;
[0029]具體來說,如附圖1,對于銀行業(yè)務有很多基礎業(yè)務,所有的基礎業(yè)務就是一種本體,對于某一種具體的本體,比如辦理規(guī)則,營銷活動就是一種對基礎業(yè)務的繼承,其所有的屬性就可以繼承下來。
[0030]C、對步驟A所述分詞后的字、詞及詞組進行語義標注分析;
[0031]對于語義標注分析,包括詞性標注和詞義標注兩個部分:
[0032]對于詞性標注:一般采用隱馬爾科夫模型或者基于轉換的錯誤驅動的磁性標注方法;
[0033]對于詞義標注:一般采用基于互信息的詞義排歧方法或基于詞典的排歧方法;
[0034]對于該步驟,當用戶在機器人前端輸入一個問題,這個問題會首先進行分詞處理,然后根據(jù)分詞的結果進行匹配,因此詞類的建設優(yōu)劣,與機器人的智能程度緊密相連。對詞類的增刪和修改都可在【詞類管理】中實現(xiàn)。
[0035]如圖2,【詞類管理】標簽下有“公用詞類”,“專有詞類”,其中“公用詞類”下為本體類屬性對應的詞類,“專有詞類”下為項目自定義的特有詞類。
[0036]D、對步驟A所述分詞后的字、詞及詞組進行文本糾錯;
[0037]E、對用戶發(fā)出的信息進行句法分析;
[0038]F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進行權重校正;
[0039]如圖3,選擇需要掛入的分類右單擊,在菜單中選擇【新建子分類】,在彈出框內填入類型名稱保存完成。
[0040]本系統(tǒng)中,類別名稱旁邊標注的“ * ” “ # ”分別用來區(qū)分詞類的重要度及相似度, 代表重要,權重較高;“#”代表不相似,相似度很低代表該分類下的詞具有拼音糾錯功能。子分類自動繼承父級分類的設定。
[0041]本系統(tǒng)還會根據(jù)用戶數(shù)據(jù)日志來調整權重。例如:“不”字基于統(tǒng)計學不重要,但經(jīng)過統(tǒng)計分析,“不”字出現(xiàn)及句尾比例較高,其含義完全不同,所以當“不”字出現(xiàn)在句尾時,例如“我能開通彩鈴不”調整“不”字權重。
[0042]G、對用戶發(fā)出的信息進行上下文處理;
[0043]H、根據(jù)所述步驟B-G的結果,對用戶發(fā)出的信息進行相似度計算,得到閾值;
[0044]此外,本系統(tǒng)還可以實現(xiàn)“語義表達式與普通問句的混合運算”,
[0045]例如:一個標準問為:“化妝品標識夸大功效、虛假表示,如何查處? ”
[0046]對應該標準問的語義表達式可分解為:[化妝品|化妝品牌][虛假][標志][懲罰][方法?]
[0047]對應該標準問的某一擴展問為:“化妝品標識標注虛假的信息,對于這種行為工商局采取什么方法懲處”
[0048]假設知識庫內包含上述知識,系統(tǒng)對用戶給出的信息可以進行混合處理。即判斷用戶的問題如貼近于標準問可直接回答;如可分解成語義表達式,則依據(jù)語義表達式回答;如不能分解成語義表達式而貼近于擴展問,則依據(jù)擴展問回答;而非單獨采用上述任意一方式,以獲得最大閾值。即最吻合用戶需求的答案。
[0049]1、根據(jù)閾值結果查詢預設知識庫,返回結果給用戶。
[0050]所述步驟C中的語義標注分析包括領域、重要度、同類詞、同義詞、網(wǎng)絡用語。
[0051]具體來說,經(jīng)過根據(jù)上述方面進行語義標注分析過后,分過的詞的語義準確,歧義基本消除。
[0052]所述步驟D中的文本糾錯包括在領域的業(yè)務類詞及詞組進行拼音糾錯;
[0053]所述步驟E中的句法分析采用規(guī)則和標注方法。
【主權項】
1.一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),所述系統(tǒng)采用以下步驟對用戶信息進行處理:A、對用戶發(fā)出的信息進行分詞;B、對步驟A所述分詞后的字、詞及詞組是否屬于實體進行識別;C、對步驟A所述分詞后的字、詞及詞組進行語義標注分析;D、對步驟A所述分詞后的字、詞及詞組進行文本糾錯;E、對用戶發(fā)出的信息進行句法分析;F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進行權重校正;G、對用戶發(fā)出的信息進行上下文處理;H、根據(jù)所述步驟B-G的結果,對用戶發(fā)出的信息進行相似度計算,得到閾值;1、根據(jù)閾值結果查詢預設知識庫,返回結果給用戶。2.根據(jù)權利要求1所述的一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),其特征在于:所述步驟C中的語義標注分析包括領域、重要度、同類詞、同義詞、網(wǎng)絡用語。3.根據(jù)權利要求1所述的一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),其特征在于:所述步驟D中的文本糾錯包括在領域的業(yè)務類詞及詞組進行拼音糾錯。4.根據(jù)權利要求1所述的一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),其特征在于:所述步驟E中的句法分析采用規(guī)則和標注方法。
【專利摘要】一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),所述系統(tǒng)采用以下步驟對用戶信息進行處理:A、對用戶發(fā)出的信息進行分詞;B、對步驟A所述分詞后的字、詞及詞組是否屬于實體進行識別;C、對步驟A所述分詞后的字、詞及詞組進行語義標注分析;D、對步驟A所述分詞后的字、詞及詞組進行文本糾錯;E、對用戶發(fā)出的信息進行句法分析;F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進行權重校正;G、對用戶發(fā)出的信息進行上下文處理;H、根據(jù)所述步驟B-G的結果,對用戶發(fā)出的信息進行相似度計算,得到閾值;I、根據(jù)閾值結果查詢預設知識庫,返回結果給用戶。
【IPC分類】G06F17/30, G06F17/27
【公開號】CN105302859
【申請?zhí)枴緾N201510603622
【發(fā)明人】李波, 曾永梅, 姚貢之, 朱頻頻
【申請人】上海智臻智能網(wǎng)絡科技股份有限公司
【公開日】2016年2月3日
【申請日】2015年9月21日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1