亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種自然語(yǔ)言語(yǔ)義信息統(tǒng)一編碼方法

文檔序號(hào):6601471閱讀:366來(lái)源:國(guó)知局
專利名稱:一種自然語(yǔ)言語(yǔ)義信息統(tǒng)一編碼方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種自然語(yǔ)言語(yǔ)義信息統(tǒng)一編碼方法,更確切地說(shuō)是涉及一種采用自然語(yǔ)言語(yǔ)義約定客觀規(guī)律實(shí)現(xiàn)的適合于計(jì)算機(jī)自然語(yǔ)言處理的語(yǔ)義統(tǒng)一編碼的方法。
背景技術(shù)
從信息處理基礎(chǔ)技術(shù)角度講,圖象信息、聲音信息數(shù)字編碼技術(shù)已經(jīng)使人類能夠利用計(jì)算機(jī)技術(shù)對(duì)圖象信息、聲音信息進(jìn)行快捷準(zhǔn)確的全球化傳遞。自然語(yǔ)言的字符集統(tǒng)一編碼Unicode已經(jīng)可以實(shí)現(xiàn)對(duì)各種自然語(yǔ)言符號(hào)的快捷準(zhǔn)確的全球化傳遞。但是,自然語(yǔ)言之所以稱為自然語(yǔ)言,是因?yàn)樗男纬苫诿總€(gè)人均擁有的一種基本權(quán)利自由創(chuàng)造語(yǔ)言符號(hào)和自由約定符號(hào)語(yǔ)義。因此,對(duì)自然語(yǔ)言進(jìn)行語(yǔ)義信息編碼,尤其是不同自然語(yǔ)言的語(yǔ)義信息進(jìn)行統(tǒng)一編碼始終未能實(shí)現(xiàn)。
但是,人類進(jìn)行自然語(yǔ)言符號(hào)語(yǔ)義約定具有有以下客觀規(guī)律遞歸約定規(guī)律各種自然語(yǔ)言任意詞匯的語(yǔ)義,包括固定搭配短語(yǔ)和句子的語(yǔ)義,均可用其常用詞匯的語(yǔ)義進(jìn)行語(yǔ)義遞歸約定。(比如,朗曼英語(yǔ)詞典用一千多常用詞匯的語(yǔ)義對(duì)任意詞匯進(jìn)行語(yǔ)義約定。)并且,一種自然語(yǔ)言的常用詞匯語(yǔ)義,可以對(duì)任意其他語(yǔ)言的詞匯進(jìn)行語(yǔ)義約定。(比如,用常用詞匯撰寫各種雙語(yǔ)詞典。)
循環(huán)約定規(guī)律各種自然語(yǔ)言基本詞匯的語(yǔ)義約定規(guī)律為循環(huán)約定。(比如“好表示使人滿意,壞的反義詞”?!案赣H兒子的爸爸?!?并且,基本詞匯與非基本詞匯之間也可進(jìn)行語(yǔ)義循環(huán)約定。(比如美漂亮、美麗、好看、中看)根據(jù)以上自然語(yǔ)言語(yǔ)義約定客觀規(guī)律,我們可以做出如下推論所有自然語(yǔ)言的必要語(yǔ)義信息,是其常用符號(hào)語(yǔ)義的遞歸函數(shù)。
對(duì)各種自然語(yǔ)言常用符號(hào)語(yǔ)義概念的編碼結(jié)果,可對(duì)任意自然語(yǔ)言句子和符號(hào)的語(yǔ)義信息進(jìn)行遞推統(tǒng)一編碼。

發(fā)明內(nèi)容
根據(jù)以上原理,實(shí)現(xiàn)本發(fā)明的技術(shù)方案是這樣的一種自然語(yǔ)言語(yǔ)義信息統(tǒng)一編碼方法,其特征包括以下步驟A、取任意自然語(yǔ)言的語(yǔ)法概念遞歸集進(jìn)行語(yǔ)法信息統(tǒng)一編碼;B、對(duì)各種自染語(yǔ)言常用詞匯符號(hào)的語(yǔ)義項(xiàng)用本語(yǔ)言其他常用符號(hào)以句子形式進(jìn)行語(yǔ)義描述,對(duì)多義符號(hào)的不同義項(xiàng),分別進(jìn)行語(yǔ)義循描述,并根據(jù)常用詞匯符號(hào)語(yǔ)義項(xiàng)的描述結(jié)果,對(duì)不同語(yǔ)言常用符號(hào)語(yǔ)義項(xiàng)匹配成功者給出一級(jí)語(yǔ)義統(tǒng)一編碼;C、建立擴(kuò)展統(tǒng)一編碼模板,取自然語(yǔ)言其它詞匯符號(hào),根據(jù)其不同語(yǔ)義項(xiàng)添入擴(kuò)展統(tǒng)一編碼模板的位置獲得二級(jí)語(yǔ)義統(tǒng)一編碼;D、凡是不能添入一級(jí)語(yǔ)義統(tǒng)一編碼的語(yǔ)義擴(kuò)展統(tǒng)一編碼模板的其他自然語(yǔ)言詞匯符號(hào),或者用已進(jìn)行一、二級(jí)語(yǔ)義統(tǒng)一編碼的相關(guān)語(yǔ)義項(xiàng)以句子形式進(jìn)行語(yǔ)義描述得到三級(jí)語(yǔ)義編碼,或者通過(guò)添入語(yǔ)義擴(kuò)展編碼模板得到三級(jí)語(yǔ)義編碼;E、對(duì)組成固定搭配短語(yǔ)、固定搭配句子的自然語(yǔ)言符號(hào),用已進(jìn)行一、二級(jí)語(yǔ)義統(tǒng)一編碼的詞匯及相關(guān)語(yǔ)義項(xiàng),加語(yǔ)法概念交集以句子形式進(jìn)行語(yǔ)義描述,實(shí)現(xiàn)四級(jí)語(yǔ)義統(tǒng)一編碼。
F、用不同自然語(yǔ)言的詞匯符號(hào)調(diào)用該詞匯符號(hào)的所有語(yǔ)義項(xiàng)及語(yǔ)義統(tǒng)一編碼結(jié)果,自動(dòng)生成不同語(yǔ)言的語(yǔ)法統(tǒng)一編碼詞典、詞匯語(yǔ)義統(tǒng)一編碼詞典、固定搭配短語(yǔ)、固定搭配句子統(tǒng)一編碼辭典。
G、任意自然語(yǔ)言新增詞匯符號(hào)或?qū)σ延蟹?hào)新加義項(xiàng),由用戶調(diào)用語(yǔ)法統(tǒng)一編碼詞典、詞匯語(yǔ)義統(tǒng)一編碼詞典、固定搭配短語(yǔ)、固定搭配句子統(tǒng)一編碼辭典的符號(hào)及相關(guān)語(yǔ)義項(xiàng)進(jìn)行語(yǔ)義描述,以獲得語(yǔ)義統(tǒng)一編碼。
所述步驟A的任意自然語(yǔ)言的語(yǔ)法概念遞歸統(tǒng)一編碼方法包括所述的編碼對(duì)象至少包括語(yǔ)法詞匯、詞匯變形、詞匯排序;所述的語(yǔ)法概念遞歸集至少包括句法成分、時(shí)態(tài)、語(yǔ)態(tài)及語(yǔ)體;所述的語(yǔ)法概念句法遞歸集成分至少包括主句、子句、主語(yǔ)、主語(yǔ)修飾、主語(yǔ)補(bǔ)充、謂詞、謂詞修飾、謂詞補(bǔ)充、賓語(yǔ)、賓語(yǔ)修飾、賓語(yǔ)補(bǔ)充、插入語(yǔ);并且所述的子句句法成分、有句法結(jié)構(gòu)的插入語(yǔ)的句法成分與主句句法成分相同。
所述步驟A的取任意自然語(yǔ)言的語(yǔ)法概念進(jìn)行語(yǔ)義遞歸統(tǒng)一編碼方法還包括定語(yǔ)和狀語(yǔ)遞歸為修飾或補(bǔ)充成分進(jìn)行句法成分編碼;實(shí)際為賓語(yǔ)的形式主語(yǔ)作為賓語(yǔ)進(jìn)行句法成分編碼;需要強(qiáng)調(diào)的句子成分均通過(guò)在相應(yīng)成分區(qū)加用強(qiáng)調(diào)符進(jìn)行編碼。
所述步驟B的不同自然語(yǔ)言詞匯的語(yǔ)義項(xiàng)內(nèi)容包括 同義詞、反義詞、語(yǔ)義描述、詞性、上位語(yǔ)義、應(yīng)用舉例,或者上述內(nèi)容的某一部分。比如漢語(yǔ)表層符號(hào)“好”的語(yǔ)義編碼對(duì)象之一包括“同義詞佳、不錯(cuò)/反義詞壞/語(yǔ)義描述使人滿意的/詞性名詞、形容詞/上位語(yǔ)義評(píng)價(jià)。舉例表現(xiàn)很好”;其中句子連詞和可插入其他內(nèi)容的短語(yǔ)采用專用標(biāo)識(shí)進(jìn)行語(yǔ)義編碼。
所述步驟B的不同自然語(yǔ)言詞匯的語(yǔ)義統(tǒng)一編碼對(duì)象中的上位語(yǔ)義是指語(yǔ)義的種屬關(guān)系分類。比如漢語(yǔ)表層符號(hào)“好”的語(yǔ)義編碼對(duì)象之一“同義詞佳、不錯(cuò)/反義詞壞”和漢語(yǔ)表層符號(hào)“壞”的語(yǔ)義編碼對(duì)象之一“反義詞好”的上位語(yǔ)義均為評(píng)價(jià)。
所述步驟B的對(duì)不同自然語(yǔ)言常用符號(hào)語(yǔ)義項(xiàng)匹配成功者給出一級(jí)語(yǔ)義統(tǒng)一編碼還包括對(duì)不同自然語(yǔ)言常用符號(hào)語(yǔ)義項(xiàng)不能對(duì)齊者,在缺少對(duì)應(yīng)符號(hào)方用常用符號(hào)以句子形式進(jìn)行語(yǔ)義描述,以實(shí)現(xiàn)不同語(yǔ)言常用詞匯語(yǔ)義的強(qiáng)制性對(duì)齊。
所述步驟C的擴(kuò)展統(tǒng)一編碼模板內(nèi)容至少包括縱向坐標(biāo)為近義程度+1、近義程度+2、近義程度-1、近義程度-2,橫向坐標(biāo)為通用語(yǔ)、書面語(yǔ)、口語(yǔ)、俚語(yǔ)、專用語(yǔ)、成語(yǔ)。
所述步驟C的取各自語(yǔ)言其它詞匯符號(hào),通過(guò)添入語(yǔ)義擴(kuò)展統(tǒng)一編碼模板的位置獲得二級(jí)語(yǔ)義統(tǒng)一編碼還包括語(yǔ)義相同、詞性不同的符號(hào),保留符號(hào)原形并給出詞性標(biāo)注,對(duì)“特指”、“特用”詞匯符號(hào)后面所用詞語(yǔ),必須是已獲得語(yǔ)義項(xiàng)統(tǒng)一編碼的詞匯符號(hào);并且對(duì)多義詞不同義項(xiàng),分別進(jìn)行語(yǔ)義二級(jí)編碼。
所述步驟C的取各自語(yǔ)言其它詞匯符號(hào),通過(guò)添入擴(kuò)展統(tǒng)一編碼模板的位置獲得二級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果是指在一級(jí)編碼結(jié)果后加上二級(jí)編碼結(jié)果?;蛘咴偌由稀疤刂?...”的一、二級(jí)語(yǔ)義編碼結(jié)果。
比如,漢語(yǔ)詞匯符號(hào)“佳”的二級(jí)語(yǔ)義編碼結(jié)果之一為在一級(jí)編碼對(duì)象(同義詞佳/不錯(cuò)/;反義詞壞;釋義使人滿意的)的編碼結(jié)果基礎(chǔ)上,加上語(yǔ)體坐標(biāo)“書面語(yǔ)”的編碼結(jié)果。
所述步驟D中取各種自然語(yǔ)言其它非常用詞匯符號(hào)的三級(jí)語(yǔ)義擴(kuò)展統(tǒng)一編碼結(jié)果是指,由三級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果加上描述其語(yǔ)義的一、二級(jí)統(tǒng)一編碼,或者再加上“舅父”的語(yǔ)義擴(kuò)展統(tǒng)一編碼結(jié)果,再加上“特指....”的一、二級(jí)語(yǔ)義編碼結(jié)果構(gòu)成。
具體實(shí)施例方式
下面結(jié)合實(shí)施例和附圖進(jìn)一步說(shuō)明本發(fā)明的技術(shù)方案

圖1是詞匯符號(hào)一級(jí)語(yǔ)義統(tǒng)一編碼及擴(kuò)展統(tǒng)一編碼示意2是詞匯符號(hào)三級(jí)語(yǔ)義統(tǒng)一編碼及擴(kuò)展統(tǒng)一編碼示意3是句法成分統(tǒng)一編碼模板示意圖實(shí)施例1參見圖1,所述步驟B的實(shí)施例如圖1所示,漢語(yǔ)符號(hào)“好”的語(yǔ)義項(xiàng)之一“使人滿意的”和英語(yǔ)符號(hào)”good”的語(yǔ)義項(xiàng)之一Having the right qualities的語(yǔ)義統(tǒng)一編碼結(jié)果為A3/a1。
漢語(yǔ)詞匯符號(hào)“地道”的語(yǔ)義項(xiàng)之一的二級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果由一級(jí)統(tǒng)一編碼結(jié)果與擴(kuò)展統(tǒng)一編碼結(jié)果相加,為A3B1/B3b3.n.adj。
英語(yǔ)符號(hào)nice的語(yǔ)義項(xiàng)之一的二級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果由一級(jí)統(tǒng)一編碼結(jié)果與擴(kuò)展統(tǒng)一編碼結(jié)果相加,為A3a1/B1b1.n.adj。
實(shí)施例2所述步驟B、C的實(shí)施例如果漢語(yǔ)符號(hào)“座”是常用符號(hào),其語(yǔ)義項(xiàng)之一“量詞,專用于較大的固定物體”在英語(yǔ)中沒有語(yǔ)義對(duì)應(yīng)符號(hào),則用英語(yǔ)的常用詞匯及先觀語(yǔ)義項(xiàng)進(jìn)行語(yǔ)義描述“quantifier/of large and solid thing”,以實(shí)現(xiàn)不同語(yǔ)言常用符號(hào)語(yǔ)義的強(qiáng)制性對(duì)齊。
實(shí)施例3參見圖2,
所述步驟D的實(shí)施例漢語(yǔ)符號(hào)“舅父”的三級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果由“叔叔”的三級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果加上描述其語(yǔ)義的一、二級(jí)統(tǒng)一編碼,再加上“舅父”的擴(kuò)展統(tǒng)一編碼結(jié)果,為C11c21(描述其語(yǔ)義的一、二級(jí)統(tǒng)一編碼)B2b1.n,再加上 “特指....”的一級(jí)語(yǔ)義編碼結(jié)果構(gòu)成。
實(shí)施例4所述步驟E的實(shí)施例漢語(yǔ)固定搭配短語(yǔ)“綠竹依依”的語(yǔ)義描述結(jié)果“形容竹子的美態(tài)”的語(yǔ)義統(tǒng)一編碼,由已進(jìn)行一二級(jí)語(yǔ)義統(tǒng)一編碼的詞匯加義項(xiàng)以及通用語(yǔ)法進(jìn)行語(yǔ)義描述。
實(shí)施例5參見圖3,設(shè)主句統(tǒng)一編碼為#A、子句統(tǒng)一編碼為#B、主語(yǔ)統(tǒng)一編碼為*1-1、主語(yǔ)修飾統(tǒng)一編碼為*1-2、主語(yǔ)補(bǔ)充統(tǒng)一編碼為*1-3、謂詞統(tǒng)一編碼為*2-1、謂詞修飾統(tǒng)一編碼為*2-2、謂詞補(bǔ)充統(tǒng)一編碼為*2-3、賓語(yǔ)統(tǒng)一編碼為*3-1、賓語(yǔ)修飾統(tǒng)一編碼為*3-2、賓語(yǔ)補(bǔ)充統(tǒng)一編碼為*3-3。
漢語(yǔ)例句“我昨天好不容易才弄到了誰(shuí)也弄不到的那張光盤?!钡恼湔Z(yǔ)義統(tǒng)一編碼結(jié)果為#A*1-1(漢字符號(hào)“我”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)/#A*2-2(漢字符號(hào)“好不容易”、“才”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)/#A*2-1(漢字符號(hào)“弄到”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果、漢字符號(hào)“了”的“過(guò)去時(shí)態(tài)”統(tǒng)一編碼結(jié)果)/#A*2-3(漢字符號(hào)“昨天”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)/#A*3-2#B*1-1(漢字符號(hào)“誰(shuí)”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)/#A*3-2#B*2-2(漢字符號(hào)“也”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)/#A*3-2#B*2-1(漢字符號(hào)“不能、得到”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)/#A*3-2(漢字符號(hào)“那”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)/#A*3-1(漢字符號(hào)“光盤”的語(yǔ)義項(xiàng)統(tǒng)一編碼結(jié)果)。
實(shí)施例6參見圖3,所述步驟A的實(shí)施例如果上述漢語(yǔ)例句改為“誰(shuí)也弄不到的那張光盤我昨天好不容易弄到了。”則在賓語(yǔ)區(qū)加用強(qiáng)調(diào)符(!)的統(tǒng)一編碼。
實(shí)施例7所述步驟G的實(shí)施例漢語(yǔ)句子“你有吃飯嗎?”的實(shí)際語(yǔ)義是“你已經(jīng)吃過(guò)飯了嗎?”。如果漢語(yǔ)符號(hào)“有”的已進(jìn)行統(tǒng)一編碼義項(xiàng)中沒有“時(shí)態(tài)已經(jīng)”,則用戶則調(diào)用已進(jìn)行語(yǔ)義統(tǒng)一編碼的詞匯符號(hào)“時(shí)態(tài)已經(jīng)”進(jìn)行語(yǔ)義描述,以獲得語(yǔ)義統(tǒng)一編碼。
實(shí)施例8所述步驟F中詞匯語(yǔ)義統(tǒng)一編碼詞典的實(shí)施例漢語(yǔ)表層符號(hào)好(Unicode編碼)義項(xiàng)1同義詞佳、不錯(cuò)/反義詞壞/語(yǔ)義描述使人滿意的/詞性/上位語(yǔ)義(語(yǔ)義統(tǒng)一編碼)義項(xiàng)2同義詞贊許、同意....../詞性/上位語(yǔ)義(語(yǔ)義統(tǒng)一編碼)義項(xiàng)3同義詞友愛、和睦....../詞性/上位語(yǔ)義(語(yǔ)義統(tǒng)一編碼)義項(xiàng)4同義詞容易......./詞性/上位語(yǔ)義(語(yǔ)義統(tǒng)一編碼)義項(xiàng)5同義詞非常、相當(dāng)....../詞性/上位語(yǔ)義(語(yǔ)義統(tǒng)一編碼)實(shí)施例9所述步驟C的句子之間的連詞,如“既然你不喜歡我,那么我也不喜歡你”中的句子連詞“既然......那么”,用專用符號(hào)進(jìn)行語(yǔ)義信息統(tǒng)一編碼;如*{既然}你不喜歡我,*{那么}我也不喜歡你。
實(shí)施例10所述步驟C的可插入其他符號(hào)的短語(yǔ),如“在我們遇到的所有問題中,”的可插入其他符號(hào)的固定搭配短語(yǔ)“在......中”,在獲得語(yǔ)義項(xiàng)統(tǒng)一編碼后,用專用符號(hào)進(jìn)行語(yǔ)義信息統(tǒng)一編碼。如“*[在→我們遇到的所有問題←中]*”。
發(fā)明意義本發(fā)明的意義在于1、利用自然語(yǔ)言符號(hào)語(yǔ)義約定的遞歸、循環(huán)規(guī)律,可用兩為數(shù)以內(nèi)的不同符號(hào)的組合結(jié)果,實(shí)現(xiàn)對(duì)任意自然語(yǔ)言文本的語(yǔ)義信息統(tǒng)一編碼。
2、用戶可以通過(guò)自己熟悉的任意自然語(yǔ)言進(jìn)行人機(jī)交互,利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對(duì)任意自然語(yǔ)言文本的語(yǔ)義信息統(tǒng)一編碼。
3、對(duì)任意自然語(yǔ)言文本的語(yǔ)義信息統(tǒng)一編碼結(jié)果,可利用計(jì)算機(jī)技術(shù)自動(dòng)轉(zhuǎn)換為與原文語(yǔ)義相同的各種其他自然語(yǔ)言文本和譯文語(yǔ)義約定結(jié)果,從而實(shí)現(xiàn)保證語(yǔ)義信息傳遞質(zhì)量的多語(yǔ)通用機(jī)器翻譯。
4、自然語(yǔ)言語(yǔ)義信息統(tǒng)一編碼技術(shù)對(duì)各種基于計(jì)算機(jī)技術(shù)的自然語(yǔ)言信息處理,比如知識(shí)傳播、合同簽訂、語(yǔ)言教學(xué)、文本檢索、文本分類、自動(dòng)文摘技術(shù)的發(fā)展,都可起到十分重要的推動(dòng)作用。
權(quán)利要求
1.一種自然語(yǔ)言語(yǔ)義信息統(tǒng)一編碼方法,其特征在于A、取任意自然語(yǔ)言的語(yǔ)法概念遞歸集進(jìn)行語(yǔ)法信息統(tǒng)一編碼;B、對(duì)各種自然語(yǔ)言常用詞匯符號(hào)的語(yǔ)義項(xiàng),用其他常用符號(hào)以句子形式進(jìn)行語(yǔ)義描述,對(duì)多義符號(hào)的不同義項(xiàng),分別進(jìn)行語(yǔ)義描述,并根據(jù)常用詞匯符號(hào)語(yǔ)義項(xiàng)的描述結(jié)果,對(duì)不同語(yǔ)言語(yǔ)義項(xiàng)匹配成功者給出一級(jí)語(yǔ)義統(tǒng)一編碼;C、建立語(yǔ)義擴(kuò)展統(tǒng)一編碼模板,取各種自然語(yǔ)言非常用詞匯符號(hào),通過(guò)添入擴(kuò)展統(tǒng)一編碼模板的位置獲得二級(jí)語(yǔ)義統(tǒng)一編碼,并且特指對(duì)象、特用于某種情況的詞匯符號(hào)加上特指、特用對(duì)象描述。D、凡是不能添入一級(jí)語(yǔ)義編碼語(yǔ)義擴(kuò)展統(tǒng)一編碼模板的自然語(yǔ)言其他詞匯符號(hào)及符號(hào)語(yǔ)義項(xiàng),或用已進(jìn)行一、二級(jí)語(yǔ)義編碼的詞匯符號(hào)及相關(guān)語(yǔ)義項(xiàng)以句子形式進(jìn)行語(yǔ)義描述,或通過(guò)添入三級(jí)編碼語(yǔ)義擴(kuò)展編碼模板,以獲得三級(jí)語(yǔ)義編碼;E、對(duì)固定搭配短語(yǔ)、固定搭配句子,用已進(jìn)行一、二級(jí)語(yǔ)義編碼的詞匯符號(hào)及相關(guān)語(yǔ)義項(xiàng)加語(yǔ)法概念交集進(jìn)行語(yǔ)義描述,實(shí)現(xiàn)四級(jí)語(yǔ)義統(tǒng)一編碼。F、用不同自然語(yǔ)言的詞匯符號(hào)調(diào)用該詞符號(hào)的所有已獲得語(yǔ)義統(tǒng)一編碼的語(yǔ)義項(xiàng),自動(dòng)生成不同語(yǔ)言的語(yǔ)法統(tǒng)一編碼詞典、詞匯語(yǔ)義統(tǒng)一編碼詞典、固定搭配短語(yǔ)、固定搭配句子統(tǒng)一編碼辭典。G、任意自然語(yǔ)言用戶自主新增詞匯符號(hào)或?qū)σ延蟹?hào)新加語(yǔ)義項(xiàng),均通過(guò)調(diào)用語(yǔ)法統(tǒng)一編碼詞典、詞匯語(yǔ)義統(tǒng)一編碼詞典、固定搭配短語(yǔ)、固定搭配句子統(tǒng)一編碼辭典的符號(hào)及相關(guān)語(yǔ)義項(xiàng)進(jìn)行語(yǔ)義描述,獲得語(yǔ)義統(tǒng)一編碼。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟C的語(yǔ)義擴(kuò)展統(tǒng)一編碼模板內(nèi)容至少包括縱向坐標(biāo)為近義程度+1、近義程度+2、近義程度-1、近義程度-2,橫向坐標(biāo)為通用語(yǔ)、書面語(yǔ)、口語(yǔ)、俚語(yǔ)、專用語(yǔ)、成語(yǔ)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A的取任意自然語(yǔ)言的語(yǔ)法概念遞歸集進(jìn)行統(tǒng)一編碼方法還包括所述的編碼對(duì)象包括語(yǔ)法詞匯、詞匯變形、詞匯排序等各種形式表達(dá)的語(yǔ)法概念;所述的語(yǔ)法概念遞歸集至少包括句法成分、時(shí)態(tài)、語(yǔ)態(tài)、語(yǔ)體;所述的語(yǔ)法概念遞歸集句法成分至少包括主句、子句、主語(yǔ)、主語(yǔ)修飾、主語(yǔ)補(bǔ)充、謂詞、謂詞修飾、謂詞補(bǔ)充、賓語(yǔ)、賓語(yǔ)修飾、賓語(yǔ)補(bǔ)充、插入語(yǔ);并且所述的子句句法成分、有句法結(jié)構(gòu)的插入語(yǔ)的句法成分與主句句法成分結(jié)構(gòu)相同。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A的取任意自然語(yǔ)言的語(yǔ)法概念遞歸集進(jìn)行統(tǒng)一編碼方法還包括定語(yǔ)和狀語(yǔ)遞歸為修飾或補(bǔ)充成分進(jìn)行句法成分編碼;實(shí)際為賓語(yǔ)的形式主語(yǔ)作為賓語(yǔ)進(jìn)行句法成分編碼;需要強(qiáng)調(diào)的句子成分均通過(guò)在相應(yīng)句子成分成分區(qū)加用強(qiáng)調(diào)符進(jìn)行統(tǒng)一編碼。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟B的對(duì)不同語(yǔ)言詞匯符號(hào)語(yǔ)義項(xiàng)匹配成功者給出一級(jí)語(yǔ)義統(tǒng)一編碼方法還包括當(dāng)不同自然語(yǔ)言常用符號(hào)的語(yǔ)義項(xiàng)不能對(duì)齊時(shí),則在缺少對(duì)應(yīng)符號(hào)方用該自然語(yǔ)言常用符號(hào)及相關(guān)語(yǔ)義項(xiàng)以句子形式進(jìn)行語(yǔ)義描述,以保證各種自然語(yǔ)言常用詞匯符號(hào)的語(yǔ)義項(xiàng)對(duì)齊,并獲得相同的語(yǔ)義統(tǒng)一編碼。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟B的語(yǔ)義項(xiàng)內(nèi)容包括同義詞、反義詞、語(yǔ)義描述、詞性、上位語(yǔ)義、應(yīng)用舉例;并且是上述內(nèi)容的某一部分。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟C的取各自語(yǔ)言其它詞匯符號(hào),通過(guò)添入擴(kuò)展統(tǒng)一編碼模板的位置獲得二級(jí)語(yǔ)義統(tǒng)一編碼的方法還包括語(yǔ)義相同、詞性不同的符號(hào),保留符號(hào)原形并給出詞性標(biāo)注,對(duì)“特指”、“特用”詞匯符號(hào)后面所用詞語(yǔ)必須是已被語(yǔ)義統(tǒng)一編碼的詞匯符號(hào)以及相關(guān)語(yǔ)義項(xiàng)。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟C的取各種自然語(yǔ)言其它詞匯符號(hào),通過(guò)添入擴(kuò)展統(tǒng)一編碼模板的位置獲得二級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果,由一級(jí)編碼結(jié)果、語(yǔ)義擴(kuò)展編碼結(jié)果,“特指....”的一、二級(jí)語(yǔ)義編碼結(jié)果構(gòu)成。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟D中取各種自然語(yǔ)言其它非常用詞匯符號(hào)的三級(jí)語(yǔ)義擴(kuò)展統(tǒng)一編碼結(jié)果,由三級(jí)語(yǔ)義統(tǒng)一編碼結(jié)果、描述其語(yǔ)義的一、二級(jí)統(tǒng)一編碼結(jié)果、語(yǔ)義擴(kuò)展統(tǒng)一編碼結(jié)果,特指、專用于....”的一、二級(jí)語(yǔ)義編碼結(jié)果構(gòu)成。
10.根據(jù)權(quán)利要求1和2所述的方法,其特征還在于,對(duì)句子連詞和可插入其他內(nèi)容的短語(yǔ)采用專用標(biāo)識(shí)進(jìn)行語(yǔ)義編碼。
全文摘要
本發(fā)明涉及一種采用自然語(yǔ)言語(yǔ)義約定客觀規(guī)律實(shí)現(xiàn)各種自然語(yǔ)言語(yǔ)義信息統(tǒng)一編碼的方法。此方法可使用戶通過(guò)采用自己熟悉的任意自然語(yǔ)言進(jìn)行人機(jī)交互,實(shí)現(xiàn)對(duì)任意自然語(yǔ)言文本的語(yǔ)義信息統(tǒng)一編碼。其語(yǔ)義信息統(tǒng)一編碼結(jié)果,可利用計(jì)算機(jī)技術(shù)自動(dòng)轉(zhuǎn)換為保證語(yǔ)義信息傳遞質(zhì)量的各種譯文,并且對(duì)各種自然語(yǔ)言處理技術(shù),比如知識(shí)傳播、合同簽訂、語(yǔ)言教學(xué)、文本檢索、自動(dòng)文摘技術(shù)的發(fā)展可起到十分重要的推動(dòng)作用。
文檔編號(hào)G06F17/28GK1417707SQ0215370
公開日2003年5月14日 申請(qǐng)日期2002年12月2日 優(yōu)先權(quán)日2002年12月2日
發(fā)明者劉莎 申請(qǐng)人:劉莎
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1