藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法
【專(zhuān)利摘要】本發(fā)明涉及將少數(shù)民族文字處理成漢語(yǔ)的方法,尤其涉及一種藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法。其包括下列步驟:a)單復(fù)句區(qū)分;b)語(yǔ)義角色標(biāo)記;c)謂詞識(shí)別;d)動(dòng)詞語(yǔ)義分類(lèi);e)句法結(jié)構(gòu)標(biāo)注;f)編輯修訂語(yǔ)義角色標(biāo)注結(jié)果。本發(fā)明提取藏語(yǔ)句法和語(yǔ)義特征,一方面,可以直接利用藏語(yǔ)的語(yǔ)法標(biāo)記,標(biāo)注句子中所表達(dá)的施事、受事、時(shí)間、地點(diǎn)、方式等語(yǔ)義角色信息;另一方面,針對(duì)謂詞的語(yǔ)義角色標(biāo)注結(jié)果,可以反作用于句法解析過(guò)程,減少句法標(biāo)記不能唯一確定的影響,從而提高句處理系統(tǒng)的性能。
【專(zhuān)利說(shuō)明】藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及將少數(shù)民族文字處理成漢語(yǔ)的方法,尤其涉及一種藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法。
【背景技術(shù)】
[0002]藏文信息處理領(lǐng)域研究?jī)?nèi)容百花齊放,在字、詞和短語(yǔ)處理方面陸續(xù)取得了突破,句處理階段的攻關(guān)已經(jīng)開(kāi)始。
[0003]語(yǔ)義分析是計(jì)算語(yǔ)言學(xué)領(lǐng)域最具挑戰(zhàn)性的課題之一,也是制約語(yǔ)言信息技術(shù)大規(guī)模應(yīng)用的主要瓶頸。語(yǔ)義分析就是根據(jù)句子結(jié)構(gòu)和句中實(shí)詞的詞義,推導(dǎo)出句子的實(shí)際語(yǔ)義,這是句處理的主要目標(biāo)。
[0004]語(yǔ)義角色標(biāo)注的任務(wù),就是找出句子中謂詞的相應(yīng)語(yǔ)義角色成分,如:施事、受事、時(shí)間、地點(diǎn)、方式等,這些成分的標(biāo)注對(duì)于理解一個(gè)句子的語(yǔ)義起著重要作用。
[0005]句法分析是根據(jù)給定語(yǔ)法,推導(dǎo)出句子的語(yǔ)法結(jié)構(gòu),一是確定句子所包含的譜系結(jié)構(gòu),一是確定句子的組成成分。句法分析結(jié)果的表達(dá)形式是句法樹(shù)。
[0006]一般的語(yǔ)義角色標(biāo)注方法,是在給定句法樹(shù)的情況下,研究如何應(yīng)用于各種特征作用于機(jī)器學(xué)習(xí)算法。
[0007]傳統(tǒng)的語(yǔ)義角色標(biāo)注研究,一般是在句法處理基礎(chǔ)上進(jìn)行的。但是目前,很難獲得藏語(yǔ)深層句法分析的結(jié)果。現(xiàn)有的藏文句法分析系統(tǒng)在通用領(lǐng)域的表現(xiàn)也不盡如人意。
【發(fā)明內(nèi)容】
[0008]針對(duì)現(xiàn)有技術(shù)上存在的不足,本發(fā)明提供一種藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法。
[0009]為了實(shí)現(xiàn)上述目的,本發(fā)明是通過(guò)如下的技術(shù)方案來(lái)實(shí)現(xiàn):
[0010]一種藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其包括下列步驟:
[0011]a)單復(fù)句區(qū)分:將長(zhǎng)句劃分為若干短句;
[0012]b)語(yǔ)義角色標(biāo)記:格標(biāo)記,包括語(yǔ)法角色成分、名物化或非謂動(dòng)詞組塊標(biāo)記,去除非標(biāo)注內(nèi)容;
[0013]c)謂詞識(shí)別:針對(duì)謂詞特征,確定謂詞所屬的語(yǔ)義結(jié)構(gòu)類(lèi)別是形容詞謂語(yǔ)句或動(dòng)詞謂語(yǔ)句;
[0014]d)動(dòng)詞語(yǔ)義分類(lèi):針對(duì)動(dòng)詞后綴標(biāo)記特征,確定動(dòng)詞語(yǔ)義結(jié)構(gòu)類(lèi)型;
[0015]e)句法結(jié)構(gòu)標(biāo)注:針對(duì)動(dòng)詞語(yǔ)義結(jié)構(gòu)類(lèi)型,利用淺層語(yǔ)義分析,篩選、識(shí)別語(yǔ)義角色,再次對(duì)語(yǔ)義結(jié)構(gòu)類(lèi)型分類(lèi);
[0016]f)編輯修訂語(yǔ)義角色標(biāo)注結(jié)果。
[0017]上述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其步驟b)標(biāo)記在句子里充當(dāng)施事、受事、涉事、領(lǐng)屬、對(duì)象、目的、處所、材料、來(lái)源或工具的語(yǔ)法角色成分,去除語(yǔ)氣詞、指示代詞、不定指示詞、疑問(wèn)代詞、復(fù)數(shù)后綴或敬語(yǔ)語(yǔ)素,不考慮時(shí)態(tài)信息。[0018]上述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其步驟b)中的名物化標(biāo)記包括做事者或方式、方法、情形或手工、手藝、材料、事物或動(dòng)作、有關(guān)事物或習(xí)慣、規(guī)則或態(tài)度、情況或心靈、精神或數(shù)量、標(biāo)準(zhǔn)、地方或時(shí)候或空閑或更迭、輪流或某方面。
[0019]上述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其步驟b)中的所述語(yǔ)法角色為ArgO-5, ArgO表示動(dòng)作的施事,Argl表示動(dòng)作的影響,Arg2_5根據(jù)謂詞確定為不同的語(yǔ)義含義。
[0020]上述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其步驟b)中的所述語(yǔ)法角色成分包括施事主語(yǔ)、領(lǐng)有主語(yǔ)、受事賓語(yǔ)、對(duì)象賓語(yǔ)、結(jié)果賓語(yǔ)、處所賓語(yǔ)、動(dòng)詞謂語(yǔ)和形容詞謂語(yǔ)。
[0021]上述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其步驟c)中所述謂詞包括動(dòng)詞、助動(dòng)詞、動(dòng)詞后綴或語(yǔ)氣詞。
[0022]上述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其步驟c)中所述謂詞包括通格或共同格、受格、施格、領(lǐng)有格、位格、與格、對(duì)象格、從屬格、工具格、從格、結(jié)果格或使役格。
[0023]上述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其步驟d)中動(dòng)詞包括及物動(dòng)詞、不及物動(dòng)詞、自主動(dòng)詞、不自主動(dòng)詞、情態(tài)助動(dòng)詞、性狀動(dòng)詞、動(dòng)作動(dòng)詞、心理動(dòng)詞、感知?jiǎng)釉~、變化動(dòng)詞、趨向動(dòng)詞、述說(shuō)動(dòng)詞、關(guān)系動(dòng)詞、領(lǐng)有動(dòng)詞、存在動(dòng)詞、互動(dòng)動(dòng)詞、使役動(dòng)詞。
[0024]有益效果:
[0025]本發(fā)明提取藏語(yǔ)句法和語(yǔ)義特征,一方面,可以直接利用藏語(yǔ)的語(yǔ)法標(biāo)記,標(biāo)注句子中所表達(dá)的施事、受事、時(shí)間、地點(diǎn)、方式等語(yǔ)義角色信息;另一方面,針對(duì)謂詞的語(yǔ)義角色標(biāo)注結(jié)果,可以反作用于句法解析過(guò)程,減少句法標(biāo)記不能唯一確定的影響,從而提高句處理系統(tǒng)的性能。
【具體實(shí)施方式】
[0026]為使本發(fā)明實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié)合【具體實(shí)施方式】,進(jìn)一步闡述本發(fā)明。
[0027]本發(fā)明其包括下列步驟:
[0028]a)單復(fù)句區(qū)分:將長(zhǎng)句劃分為若干短句;
[0029]b)語(yǔ)義角色標(biāo)記:格標(biāo)記,包括語(yǔ)法角色成分、名物化或非謂動(dòng)詞組塊標(biāo)記,去除非標(biāo)注內(nèi)容;
[0030]根據(jù)藏語(yǔ)的格標(biāo)記和語(yǔ)義角色標(biāo)注需要,明確藏文的語(yǔ)義角色。核心的語(yǔ)義角色為ArgO-5, ArgO表示動(dòng)作的施事(施事格),Argl表示動(dòng)作的影響(結(jié)果格),Arg2_5根據(jù)謂語(yǔ)動(dòng)詞不同會(huì)有不同的語(yǔ)義含義,增加部分附加語(yǔ)義角色,如ArgM-LOC (位格)。
[0031]標(biāo)記在句子里充當(dāng)施事、受事、涉事、領(lǐng)屬、對(duì)象、目的、處所、材料、來(lái)源或工具的語(yǔ)法角色成分,去除語(yǔ)氣詞、指示代詞、不定指示詞、疑問(wèn)代詞、復(fù)數(shù)后綴或敬語(yǔ)語(yǔ)素,不考慮時(shí)態(tài)信息。
[0032]藏語(yǔ)具有豐富的格標(biāo)記,與語(yǔ)義角色標(biāo)注有關(guān)的有三十多種,如:施格、賓格、受益格、同類(lèi)比較格、占有格、目的格等。有的格對(duì)應(yīng)于一種語(yǔ)義角色(如施格);有的格標(biāo)記可能對(duì)應(yīng)于多個(gè)語(yǔ)義角色,或者一個(gè)語(yǔ)義角色對(duì)應(yīng)多種格標(biāo)記,如Argl (結(jié)果格、受益格)等。
[0033]c)謂詞識(shí)別:針對(duì)謂詞特征,確定謂詞所屬的語(yǔ)義結(jié)構(gòu)類(lèi)別是形容詞謂語(yǔ)句或動(dòng)詞謂語(yǔ)句;[0034]謂詞詞性主要區(qū)分形容詞謂語(yǔ)句和動(dòng)詞謂語(yǔ)句,形容詞謂語(yǔ)句根據(jù)句式特征識(shí)另IJ,動(dòng)詞謂語(yǔ)句:與謂語(yǔ)動(dòng)詞相關(guān)的句法標(biāo)記,如時(shí)、體后綴,語(yǔ)氣詞,助動(dòng)詞等。
[0035]d)動(dòng)詞語(yǔ)義分類(lèi):針對(duì)動(dòng)詞后綴標(biāo)記特征,確定動(dòng)詞語(yǔ)義結(jié)構(gòu)類(lèi)型;
[0036]基于動(dòng)詞后綴語(yǔ)義信息的句式分析。
[0037]e)句法結(jié)構(gòu)標(biāo)注:針對(duì)動(dòng)詞語(yǔ)義結(jié)構(gòu)類(lèi)型,利用淺層語(yǔ)義分析,篩選、識(shí)別語(yǔ)義角色,再次對(duì)語(yǔ)義結(jié)構(gòu)類(lèi)型分類(lèi);
[0038]f)編輯修訂語(yǔ)乂角色標(biāo)注結(jié)果.
[0039]本發(fā)明中的標(biāo)注內(nèi)容包括:
[0040]1.句法成份標(biāo)記
[0041]
【權(quán)利要求】
1.一種藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,包括下列步驟: a)單復(fù)句區(qū)分:將長(zhǎng)句劃分為若干短句; b)語(yǔ)義角色標(biāo)記:格標(biāo)記,包括語(yǔ)法角色成分、名物化或非謂動(dòng)詞組塊標(biāo)記,去除非標(biāo)注內(nèi)容; c)謂詞識(shí)別:針對(duì)謂詞特征,確定謂詞所屬的語(yǔ)義結(jié)構(gòu)類(lèi)別是形容詞謂語(yǔ)句或動(dòng)詞謂語(yǔ)句; d)動(dòng)詞語(yǔ)義分類(lèi):針對(duì)動(dòng)詞后綴標(biāo)記特征,確定動(dòng)詞語(yǔ)義結(jié)構(gòu)類(lèi)型; e)句法結(jié)構(gòu)標(biāo)注:針對(duì)動(dòng)詞語(yǔ)義結(jié)構(gòu)類(lèi)型,利用淺層語(yǔ)義分析,篩選、識(shí)別語(yǔ)義角色,再次對(duì)語(yǔ)義結(jié)構(gòu)類(lèi)型分類(lèi); f)編輯修訂語(yǔ)義角色標(biāo)注結(jié)果。
2.根據(jù)權(quán)利要求1所述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,步驟b)標(biāo)記在句子里充當(dāng)施事、受事、涉事、領(lǐng)屬、對(duì)象、目的、處所、材料、來(lái)源或工具的語(yǔ)法角色成分,去除語(yǔ)氣詞、指示代詞、不定指示詞、疑問(wèn)代詞、復(fù)數(shù)后綴或敬語(yǔ)語(yǔ)素,不考慮時(shí)態(tài)信息。
3.根據(jù)權(quán)利要求1所述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,步驟b)中的名物化標(biāo)記包括做事者或方式、方法、情形或手工、手藝、材料、事物或動(dòng)作、有關(guān)事物或習(xí)慣、規(guī)則或態(tài)度、情況或心靈、精神或數(shù)量、標(biāo)準(zhǔn)、地方或時(shí)候或空閑或更迭、輪流或某方面。
4.根據(jù)權(quán)利要求1所述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,步驟b)中的所述語(yǔ)法角色為ArgO-5, ArgO表示動(dòng)作的施事,Argl表示動(dòng)作的影響,Arg2_5根據(jù)謂詞確定為不同的語(yǔ)義含義。
5.根據(jù)權(quán)利要求1所述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,步驟b)中的所述語(yǔ)法角色成分包括施事主語(yǔ)、領(lǐng)有主語(yǔ)、受事賓語(yǔ)、對(duì)象賓語(yǔ)、結(jié)果賓語(yǔ)、處所賓語(yǔ)、動(dòng)詞謂語(yǔ)和形容詞謂語(yǔ)。
6.根據(jù)權(quán)利要求1所述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,步驟c)中所述謂詞包括動(dòng)詞、助動(dòng)詞、動(dòng)詞后綴或語(yǔ)氣詞。
7.根據(jù)權(quán)利要求1所述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,步驟c)中所述謂詞包括通格或共同格、受格、施格、領(lǐng)有格、位格、與格、對(duì)象格、從屬格、工具格、從格、結(jié)果格或使役格。
8.根據(jù)權(quán)利要求1所述的藏語(yǔ)句法和語(yǔ)義角色聯(lián)合標(biāo)注方法,其特征在于,步驟d)中動(dòng)詞包括及物動(dòng)詞、不及物動(dòng)詞、自主動(dòng)詞、不自主動(dòng)詞、情態(tài)助動(dòng)詞、性狀動(dòng)詞、動(dòng)作動(dòng)詞、心理動(dòng)詞、感知?jiǎng)釉~、變化動(dòng)詞、趨向動(dòng)詞、述說(shuō)動(dòng)詞、領(lǐng)有動(dòng)詞、存在動(dòng)詞、互動(dòng)動(dòng)詞、使役動(dòng)詞。
【文檔編號(hào)】G06F17/27GK103440236SQ201310421074
【公開(kāi)日】2013年12月11日 申請(qǐng)日期:2013年9月16日 優(yōu)先權(quán)日:2013年9月16日
【發(fā)明者】邱莉榕 申請(qǐng)人:中央民族大學(xué)