亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

表意構(gòu)件識(shí)別提取和基于表意構(gòu)件的機(jī)譯人校互動(dòng)翻譯方法

文檔序號(hào):6399034閱讀:389來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):表意構(gòu)件識(shí)別提取和基于表意構(gòu)件的機(jī)譯人?;?dòng)翻譯方法
表意構(gòu)件識(shí)別提取和基于表意構(gòu)件的機(jī)譯人校互動(dòng)翻譯方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種自然語(yǔ)言的處理或轉(zhuǎn)換的方法;特別涉及一種表意構(gòu)件識(shí)別提取和基于表意構(gòu)件的機(jī)譯人?;?dòng)翻譯方法。
背景技術(shù)
計(jì)算機(jī)語(yǔ)言文字的信息處理領(lǐng)域,機(jī)器翻譯是技術(shù)難度的至高點(diǎn)。機(jī)器翻譯如《自然語(yǔ)言的計(jì)算機(jī)處理》馮志偉著,上海外語(yǔ)教育出版社1996年10月出版,其中第八章第一節(jié)機(jī)器翻譯中寫(xiě)道:“1964年,美國(guó)ALPAC報(bào)告指出的機(jī)器翻譯遇到的‘語(yǔ)義障礙’至今仍然存在,機(jī)器翻譯技術(shù)至今似乎仍然沒(méi)有突破性的進(jìn)展”?!皺C(jī)器翻譯系統(tǒng)的實(shí)用化和商品化問(wèn)題面臨著嚴(yán)峻的考驗(yàn)”。大眾軟件,2004年第二期,作者王槊,采訪業(yè)界多位專(zhuān)家后報(bào)道,《機(jī)器翻譯,路在何方》一文中指出MT (machine translation) “機(jī)器翻譯技術(shù)本身存在的問(wèn)題是阻礙其發(fā)展的硬傷。目前不僅在中國(guó),整個(gè)世界范圍內(nèi)機(jī)器翻譯技術(shù)都沒(méi)有很大的突破。試圖用機(jī)器通過(guò)有限的規(guī)則和語(yǔ)料提高翻譯準(zhǔn)確性,在短期內(nèi)無(wú)法實(shí)現(xiàn)。在語(yǔ)言智能化研究理論不成熟的情況下,MT軟件研究在技術(shù)上碰到瓶頸,無(wú)法解決一個(gè)單詞在不同語(yǔ)言環(huán)境下的詞義選擇問(wèn)題,同樣也無(wú)法在復(fù)雜多變的語(yǔ)境中正確選擇語(yǔ)法規(guī)則,因此,翻譯水平無(wú)法實(shí)現(xiàn)明顯提高”。這也是為什么現(xiàn)在的機(jī)器翻譯軟件無(wú)法滿足人們的需求,翻譯出來(lái)的結(jié)果往往
令人啼笑皆非的原因......JMCTranslation Memory,翻譯記憶),面向?qū)I(yè)翻譯人員和機(jī)構(gòu)
設(shè)計(jì),要求使用者具備獨(dú)立的翻譯能力。它的原理是基于數(shù)據(jù)庫(kù),將翻譯過(guò)的所有材料以句子為單位存入數(shù)據(jù)庫(kù)。翻譯時(shí)系統(tǒng)自動(dòng)對(duì)電子文檔進(jìn)行分析,100%匹配的句子可以自動(dòng)替換,不足100%匹配的句子可 根據(jù)匹配度提出翻譯建議,新句子完全依靠人工翻譯。最后作者指出:“機(jī)器翻譯技術(shù)本身存在的問(wèn)題是阻礙其發(fā)展的硬傷。目前不僅在中國(guó),整個(gè)世界范圍內(nèi)機(jī)器翻譯技術(shù)都沒(méi)有很大的突破”。外語(yǔ)研究,2007年第五期,作者蘇明陽(yáng),在《翻譯記憶系統(tǒng)的現(xiàn)狀及其啟示》一文中指出翻譯記憶技術(shù)本身的局限,“相同的句子永遠(yuǎn)不需要翻譯第二遍”。然而“現(xiàn)實(shí)中的翻譯活動(dòng)大多缺乏重復(fù)性,只有在某些特定的領(lǐng)域中,文本的重復(fù)才能達(dá)到一定的比例”。湖南醫(yī)科大學(xué)學(xué)報(bào),2010年3月第二期,作者傅彥夫,在《翻譯記憶理論及幾款計(jì)算機(jī)輔助翻譯軟件評(píng)介》一文中回顧并分析了 MT經(jīng)歷了 70多年的發(fā)展,至今譯文質(zhì)量確實(shí)不能令人欣慰。“難怪人們把人工智能能列為二十一世紀(jì)人類(lèi)科技十大難題之一。在這種情況下,采用基于翻譯記憶(MT)技術(shù)的輔助翻譯系統(tǒng)應(yīng)運(yùn)而生”?!胺g記憶軟件一般都提供翻譯記憶、術(shù)語(yǔ)庫(kù)管理、翻譯項(xiàng)目管理、語(yǔ)料庫(kù)加工與應(yīng)用等翻譯工具”。語(yǔ)料庫(kù)加工是使翻譯過(guò)的語(yǔ)料進(jìn)行句對(duì)齊,以雙語(yǔ)或多語(yǔ)語(yǔ)義對(duì)齊后的句對(duì)建庫(kù),稱(chēng)“句庫(kù)”或“記憶庫(kù)”。CN200910002334.1公開(kāi)了一種基于實(shí)例短語(yǔ)的機(jī)器翻譯方法,將基于實(shí)例和基于短語(yǔ)結(jié)合。雖然翻譯粒度比基于字、詞和基于句更為適中,但僅是利用算法臨時(shí)獲得,沒(méi)有人腦校正質(zhì)量難以保證;沒(méi)有建庫(kù),不能累積也不能長(zhǎng)期使用。
現(xiàn)有技術(shù)存在不足,MT①譯文質(zhì)量差;TM②要求操作者具獨(dú)立翻譯能力。本發(fā)明人認(rèn)為:現(xiàn)有技術(shù)存在不足關(guān)鍵在于一味讓電腦模仿人腦,對(duì)語(yǔ)言文字的認(rèn)識(shí)不夠透切。不能站在語(yǔ)際的高度認(rèn)識(shí)語(yǔ)言文字的本質(zhì)是表意;不能根據(jù)表意將不同語(yǔ)言文字進(jìn)行關(guān)聯(lián),更不能將這些關(guān)聯(lián)建庫(kù),長(zhǎng)期使用。沒(méi)有認(rèn)識(shí)和利用“不同語(yǔ)言文字的表意通過(guò)四種共同的表意構(gòu)件實(shí)現(xiàn)”的規(guī)律,自然就不能使語(yǔ)言文字以表意構(gòu)件為單元,在計(jì)算機(jī)內(nèi)、網(wǎng)絡(luò)間進(jìn)行運(yùn)作而難以逾越“語(yǔ)義障礙”;不能以表意構(gòu)件組建數(shù)據(jù)庫(kù)對(duì)機(jī)器翻譯以及其它語(yǔ)言文字信息處理應(yīng)用進(jìn)行支持。在計(jì)算機(jī)語(yǔ)言文字信息處理領(lǐng)域,現(xiàn)有技術(shù)都是面向字符進(jìn)行編碼,以字符內(nèi)碼生成文本;在計(jì)算機(jī)內(nèi)存貯、傳輸,以至不同語(yǔ)言文字間的機(jī)器翻譯,包括支持機(jī)器翻譯的電子詞典、句庫(kù),也都是基于字符。它們③沒(méi)有不同語(yǔ)言文字之間任何表意的關(guān)聯(lián);在從字符、字、詞,成分以至句意的多節(jié)點(diǎn)④處理過(guò)程中無(wú)法反悔地丟失詞義、語(yǔ)意。綜上所述,現(xiàn)有技術(shù)存在著上述四個(gè)不足,早已成為桎梏的四個(gè)技術(shù)問(wèn)題。

發(fā)明內(nèi)容本發(fā)明申請(qǐng)的總體構(gòu)思是:站在語(yǔ)際的高度認(rèn)識(shí)語(yǔ)言文字的本質(zhì)是表意;挖掘不同語(yǔ)言文字的句子可以表達(dá)相同語(yǔ)意。以表意將不同語(yǔ)言文字進(jìn)行關(guān)聯(lián),不同語(yǔ)言文字的表意通過(guò)四種共同的表意構(gòu)件實(shí)現(xiàn)。利用人機(jī)互動(dòng)的方式從多語(yǔ)種句對(duì)語(yǔ)料中識(shí)別提取出這四種表意構(gòu)件;組建表意構(gòu)件數(shù)據(jù)庫(kù)?;诒硪鈽?gòu)件及其數(shù)據(jù)庫(kù)產(chǎn)生機(jī)譯人?;?dòng)翻譯等語(yǔ)意文字信息處理領(lǐng)域的應(yīng)用。以表意將不同語(yǔ)言 文字進(jìn)行關(guān)聯(lián),首先是利用相同內(nèi)容的多語(yǔ)種或雙語(yǔ)文字版本的語(yǔ)料為樣本進(jìn)行識(shí)別提取表意構(gòu)件。識(shí)別提取表意構(gòu)件每輪選取A、B兩種語(yǔ)言文字,第一輪選最具代表性的中文漢語(yǔ)和英文英語(yǔ),進(jìn)行核心的第一輪識(shí)別提?。坏诙嗛_(kāi)始每輪新增一種語(yǔ)言文字,另一種是已經(jīng)識(shí)別提取過(guò)并且表意構(gòu)件達(dá)到足夠多(滿足應(yīng)用)的程度。第二輪開(kāi)始識(shí)別提取的方式與第一輪兩者都空白不同;而是以已經(jīng)識(shí)別提取過(guò)的為模板,識(shí)別提取出新加語(yǔ)種的表意構(gòu)件,添加于與模板句表意構(gòu)件同庫(kù)同記錄的相應(yīng)語(yǔ)種構(gòu)件子段。以表意將不同語(yǔ)言文字進(jìn)行關(guān)聯(lián),進(jìn)一步的措施就是具體識(shí)別提取出多種語(yǔ)言文字共同的表意構(gòu)件,并將它們存貯于相應(yīng)的構(gòu)件庫(kù),使每個(gè)庫(kù)同記錄的不同語(yǔ)種表意構(gòu)件語(yǔ)意相同且相互映射?;诒硪鈽?gòu)件及其數(shù)據(jù)庫(kù)產(chǎn)生機(jī)譯人校互動(dòng)翻譯方法。是基于表意構(gòu)件及其數(shù)據(jù)庫(kù)在語(yǔ)意文字信息處理領(lǐng)域應(yīng)用的一個(gè)實(shí)例;仿此類(lèi)推,還可以開(kāi)發(fā)更多的應(yīng)用。切底改變現(xiàn)有語(yǔ)言文字信息處理基于字符,難以逾越“語(yǔ)義障礙”的現(xiàn)狀。本發(fā)明要解決的技術(shù)問(wèn)題是:本發(fā)明提供一種人機(jī)交互的多語(yǔ)種表意構(gòu)件識(shí)別提取方法,提取表意構(gòu)件;并使不同語(yǔ)言文字的同類(lèi)具體表意構(gòu)件語(yǔ)意相等且相互映射;解決現(xiàn)有技術(shù)基于字符的③沒(méi)有不同語(yǔ)言文字之間任何表意的關(guān)聯(lián)之技術(shù)問(wèn)題。進(jìn)一步提供一種機(jī)譯人?;?dòng)翻譯的方法,解決現(xiàn)有技術(shù)①譯文質(zhì)量差,②要求操作者具獨(dú)立翻譯能力,④處理過(guò)程中無(wú)法反悔地丟失詞義、語(yǔ)意之技術(shù)問(wèn)題。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:一種表意構(gòu)件識(shí)別提取方法,利用相同內(nèi)容的多語(yǔ)種或雙語(yǔ)文字版本的語(yǔ)料作句對(duì)齊后生成雙語(yǔ)句對(duì)庫(kù),其特征是進(jìn)一步根據(jù)不同語(yǔ)言文字的句子可以表達(dá)相同語(yǔ)意,以表意將不同語(yǔ)言文字進(jìn)行關(guān)聯(lián),不同語(yǔ)言文字的表意通過(guò)四種共同的表意構(gòu)件實(shí)現(xiàn),識(shí)別提取出這四種表意構(gòu)件包括如下步驟:S1.讀句配骼102,句子由句骼和句艙兩部分組成,識(shí)別提取表意構(gòu)件每輪選取A、B兩種語(yǔ)言文字,計(jì)算機(jī)讀取雙語(yǔ)句對(duì)庫(kù)一個(gè)AB雙語(yǔ)句對(duì),以當(dāng)前雙語(yǔ)句對(duì)之一查詢句骼庫(kù)進(jìn)行配句骼運(yùn)作,有匹配句骼將雙語(yǔ)句對(duì)套入,并顯示“艙檢測(cè)”、“查配標(biāo)”按鈕,當(dāng)套入后各句艙勻稱(chēng)、無(wú)殘缺、無(wú)堆疊現(xiàn)象且“艙檢測(cè)”按鈕被單擊,為肯定,已有匹配句骼,接續(xù)S3艙檢測(cè),若套入后各句艙不勻稱(chēng)、有殘缺、或有堆疊現(xiàn)象且“查配標(biāo)”按鈕被單擊,為否定,表示對(duì)套入結(jié)果否定需要提取新句骼,系統(tǒng)進(jìn)入查配標(biāo)運(yùn)作,用A語(yǔ)句詞串查詢傳統(tǒng)電子詞典據(jù)B語(yǔ)句是否含有語(yǔ)義對(duì)應(yīng)詞串生成當(dāng)前句對(duì)語(yǔ)意匹配表,艙計(jì)數(shù)N = 0準(zhǔn)備提取新句骼;S2.識(shí)別及標(biāo)注句艙103,機(jī)器以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、以先后為序用N = N+1將它們預(yù)標(biāo)為句艙,預(yù)標(biāo)句艙使骼例比由100%逐步降低,這三種詞串標(biāo)注句艙結(jié)束后,如骼例比高于50%,以所述語(yǔ)意匹配表為據(jù)將無(wú)冠名串或其它語(yǔ)義匹配串在有間隔的前提下逐個(gè)接續(xù)標(biāo)為句艙,接受操作者認(rèn)可、或更正或使用意群對(duì)齊運(yùn)作增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)識(shí)標(biāo)句艙,直至上述識(shí)別及標(biāo)注句艙條件缺失且骼例比在15-50%之間,識(shí)標(biāo)句艙結(jié)束,進(jìn)行句骼格式檢查,整理前述預(yù)標(biāo)為正式標(biāo)注這是第一輪識(shí)別提取的步驟,第二輪識(shí)別提取開(kāi)始不用識(shí)別詞性而是以已標(biāo)語(yǔ)種句為模板識(shí)別、標(biāo)出未標(biāo)語(yǔ)種句的句艙,當(dāng)N = > I時(shí),當(dāng)前句對(duì)移去句艙所剩部分為句骼構(gòu)件,將它們存貯于句骼庫(kù)105相應(yīng)語(yǔ)種構(gòu)件字段,當(dāng)N = 0當(dāng)前句對(duì)為習(xí)語(yǔ)構(gòu)件,習(xí)語(yǔ)構(gòu)件是一些分不出句骼句艙的特殊句對(duì),將它們存貯于習(xí)語(yǔ)庫(kù)104相應(yīng)語(yǔ)種習(xí)語(yǔ)字段,將當(dāng)前雙語(yǔ)句例對(duì)號(hào)入座地套回當(dāng)前句骼成為骼例式備續(xù);S3.艙檢測(cè)及提取艙模106,逐個(gè)句艙檢測(cè),第一輪識(shí)別提取以A語(yǔ)拼音文字句的句艙所含詞串計(jì)數(shù),=> 5個(gè)原有詞串要進(jìn)入組復(fù)詞運(yùn)作,=>原有8個(gè)詞串的以當(dāng)前句艙作“查配標(biāo)”運(yùn)作生成當(dāng)前句艙語(yǔ)意匹配表以備進(jìn)一步提取艙模為有模句艙,提取艙模,以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、預(yù)標(biāo)為艙眼,模例之比由100%逐步降低,若預(yù)標(biāo)完這三種詞串還大于70%,再以無(wú)冠名串或其它語(yǔ)意匹配串在有間隔的前提下在標(biāo)為艙眼,接受操作者認(rèn)可、更正,或使用意群對(duì)齊運(yùn)作增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)預(yù)標(biāo)艙眼,當(dāng)預(yù)標(biāo)條件不存在且模例比在50-70%之間,預(yù)標(biāo)艙眼操作結(jié)束,以英語(yǔ)句艙從左到右為序修改艙眼預(yù)杯為正式標(biāo)注,第二輪提取開(kāi)始不同,是以已標(biāo)語(yǔ)種句艙為模板識(shí)別、標(biāo)出未標(biāo)語(yǔ)種艙眼,當(dāng)艙眼數(shù)N = > I ;當(dāng)前句艙對(duì)移去艙眼所剩部分為艙模構(gòu)件,保存到艙模庫(kù)107相應(yīng)語(yǔ)種艙模字段,繼續(xù)其它句艙的檢測(cè)直到全句對(duì)句艙檢測(cè)完畢;S4.收存意群串108,將當(dāng)前雙語(yǔ)例對(duì)號(hào)入座地套回當(dāng)前提取的句骼,有艙模的句艙再套回相應(yīng)艙模,再逐個(gè)句艙或艙眼搜索,參照語(yǔ)意匹配表,相應(yīng)內(nèi)容在匹配表里A語(yǔ)字段和B語(yǔ)字段不空的記錄是A、B語(yǔ)言文字語(yǔ)意對(duì)齊的,確定為意群串構(gòu)件,將它們逐記錄取出,分別存貯到意群串庫(kù)109同記錄相應(yīng)語(yǔ)種字段內(nèi),當(dāng)前句對(duì)的識(shí)別提取結(jié)束。上述方法中,步驟S2所述以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、標(biāo)注步驟,具體為:機(jī)器查詢當(dāng)前句對(duì)語(yǔ)意匹配表,首先識(shí)別搜索數(shù)量串,如有則同樣將它們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C……”加預(yù)標(biāo),如無(wú)或識(shí)別搜索數(shù)量串完成后,識(shí)別搜索專(zhuān)名串,如有則同樣將它不們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C......”預(yù)標(biāo),如無(wú)或識(shí)別搜索專(zhuān)名串結(jié)束后,識(shí)別搜索冠名串,如有則同樣將它不們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C......”預(yù)標(biāo),如無(wú)或識(shí)別搜索冠名串結(jié)束后,顯示符號(hào)“ I ”且在兩側(cè)分別顯示“一” “一”命令按鈕、計(jì)算并顯示骼例比、以及“ V ”命令按鈕,接受操作者更正或認(rèn)可。上述方法中,步驟S2所述以無(wú)冠名串或其它語(yǔ)意匹配串在有間隔的前提下逐個(gè)接續(xù)標(biāo)為句艙,具體為:當(dāng)骼例比高于50%,以匹配表為據(jù)搜索詞性字段是名詞且A語(yǔ)詞B語(yǔ)詞字段不空的為語(yǔ)意匹配的無(wú)冠名串,或者不是名詞而A語(yǔ)詞B語(yǔ)詞字段不空的為其它語(yǔ)意匹配串,同上且加顯當(dāng)前句對(duì)語(yǔ)意匹配表、“I它|”、“V”、“<n”、“格式檢查”按鈕,并接受操作者使用組復(fù)詞、延 伸詞義、粘帶前引或后隨字詞的意群對(duì)齊方法修改匹配表,增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)預(yù)標(biāo)句艙直至識(shí)標(biāo)句艙條件缺失且骼例比在15-50%之間,識(shí)標(biāo)句艙結(jié)束,然后,進(jìn)行句骼格式檢查,第一輪識(shí)別提取以英語(yǔ)句從左到右為序整理預(yù)標(biāo)艙序號(hào)為正式艙序號(hào),第二輪識(shí)別提取開(kāi)始以已標(biāo)語(yǔ)種句為模板識(shí)別、標(biāo)出未標(biāo)語(yǔ)種句的句艙。上述方法中,所述利用雙語(yǔ)句對(duì)提取出表意構(gòu)件,具體為:每輪識(shí)別提取選AB兩種語(yǔ)言文字,第一輪選中英雙語(yǔ)為優(yōu)選例,其中A語(yǔ)是英文、B語(yǔ)是中文,第二輪開(kāi)始每輪識(shí)別提取新增一種語(yǔ)言文字,另一種為已經(jīng)識(shí)別提取過(guò)的語(yǔ)言文字,A語(yǔ)分配給已經(jīng)識(shí)別提取過(guò)的語(yǔ)言文字,B語(yǔ)分配給新加入的語(yǔ)言文字;第二輪識(shí)別提取開(kāi)始每輪新加一種語(yǔ)言文字;識(shí)別提取過(guò)程先以已識(shí)別句查詢句骼庫(kù)進(jìn)行配句骼運(yùn)作、套入,然后以已識(shí)別提取句為模板,在新增語(yǔ)種句子上識(shí)別出語(yǔ)意相同部分標(biāo)為相同標(biāo)號(hào)的句艙,若有相同重復(fù)部分,以同樣的標(biāo)號(hào)標(biāo)為重復(fù)句艙,重復(fù)句艙適應(yīng)各語(yǔ)種句子的重復(fù)成份,兩語(yǔ)種句子被識(shí)別標(biāo)注的重復(fù)句艙不一定都有、數(shù)量也不一定一致、也不影響句艙標(biāo)出數(shù);含艙模的句艙,同樣以已經(jīng)識(shí)別句的句艙套入艙模作為模板識(shí)別標(biāo)出新加語(yǔ)種句相應(yīng)句艙的艙眼。上述方法中,所述配句骼運(yùn)作具體為:事先按句骼詞串與句艙之空穴生成句骼串表并索引,配句骼時(shí)把句例從左到右英逐單詞中逐字取下搜索句骼串表的骼首字段并存于臨時(shí)表,再逐記錄取出臨時(shí)表內(nèi)容,以句骼詞段查詢句對(duì)例,句骼串的每段都可以在句對(duì)例中查到且次序相同為匹配,再根據(jù)句骼串表取出相應(yīng)語(yǔ)種句骼;所述查配標(biāo)運(yùn)作具體為:機(jī)器利用至少含有詞性、A語(yǔ)詞、B語(yǔ)詞字段的匹配表,先以A語(yǔ)句單詞串為單元切分、依次填入匹配表A語(yǔ)詞字段,隨后逐記錄取出查詢傳統(tǒng)電子詞典,以查得的相應(yīng)B語(yǔ)解釋搜索B語(yǔ)句是否含有,含有且是最長(zhǎng)串填入B語(yǔ)詞字段同時(shí)將其詞性填入詞性字段,無(wú)含有B語(yǔ)詞字段為空;所述意群對(duì)齊運(yùn)作具體為:①以當(dāng)前句對(duì)、句艙為依據(jù),延伸或增補(bǔ)B語(yǔ)解釋填人匹配表B語(yǔ)字段,②粘帶附隨字、詞或字符,③有詞形變化的另作詞條入庫(kù),在匹配表中根據(jù)當(dāng)前句對(duì)句艙參考傳統(tǒng)詞典填入B語(yǔ)解釋?zhuān)芙M復(fù)詞(下款);所述組復(fù)詞運(yùn)作具體為:根據(jù)當(dāng)前句對(duì)、句艙語(yǔ)意判斷,如其一需要原有兩個(gè)詞條或更多詞條合并,語(yǔ)意才等于另一時(shí),前者以將它們相連合并為一個(gè)詞條,稱(chēng)為復(fù)詞,在匹配表作為一個(gè)記錄分別填入AB語(yǔ)字段,添加到意群串庫(kù)之復(fù)詞庫(kù),沒(méi)有這種情況的空運(yùn)作,沒(méi)有改變。上述方法中,基于所獲得的表意構(gòu)件以及相應(yīng)的表意構(gòu)件庫(kù),能產(chǎn)生和支持多種語(yǔ)言文字信息處理的應(yīng)用,機(jī)譯人?;?dòng)翻譯是其應(yīng)用之一;表意構(gòu)件是不同語(yǔ)言文字以表意進(jìn)行關(guān)聯(lián)的具體體現(xiàn),是大小不等形態(tài)結(jié)構(gòu)不同的語(yǔ)義塊,它們也是多種語(yǔ)言文字表意的對(duì)等和統(tǒng)一,表意構(gòu)件包括句骼構(gòu)件、艙模構(gòu)件、意群串構(gòu)件和習(xí)語(yǔ)構(gòu)件四種,貯存它們的句骼庫(kù)、艙模庫(kù)、意群串庫(kù)和習(xí)語(yǔ)庫(kù)是表意構(gòu)件分庫(kù),共同構(gòu)成表意構(gòu)件數(shù)據(jù)庫(kù),四個(gè)分庫(kù)之間相互獨(dú)立,分庫(kù)內(nèi)同記錄的成員語(yǔ)意相同且相互影射;從一個(gè)句對(duì)提取出來(lái)的句骼可以被其它句對(duì)所套用,艙??梢员黄渌渑撍子茫澉浪械木渑搨€(gè)數(shù)、語(yǔ)意內(nèi)容相同,是跨語(yǔ)種的,句艙在具體句骼中的位置、次序和用以填充的意群串是面向各自語(yǔ)言文字的,不跨語(yǔ)種;句骼庫(kù)用以存貯句骼構(gòu)件,有句骼碼、英句骼、中句骼字段,同記錄的各語(yǔ)種句骼字段存貯相應(yīng)語(yǔ)種句骼,它們的語(yǔ)義相同且相互影射,句骼碼是它們語(yǔ)義和庫(kù)中位次的表示;艙模庫(kù)用以存貯艙模構(gòu)件,有艙模碼、英艙模、中艙模字段,同記錄的各語(yǔ)種艙模字段存貯相應(yīng)語(yǔ)種艙模,它們的語(yǔ)義相同,艙模碼是它們語(yǔ)義和庫(kù)中位次的表示;意群庫(kù)用以存貯意群串構(gòu)件,有意群碼、英群串、中群串字段,同記錄的各語(yǔ)種意群串字段存貯相應(yīng)語(yǔ)種意群串,它們的語(yǔ)義相同,意群串碼是它們語(yǔ)義和庫(kù)中位次的表示;習(xí)語(yǔ)庫(kù)用以存貯習(xí)語(yǔ)構(gòu)件,有習(xí)語(yǔ)碼、英習(xí)語(yǔ)、中習(xí)語(yǔ)字段,同記錄的各語(yǔ)種習(xí)語(yǔ)字段存貯相應(yīng)語(yǔ)種習(xí)語(yǔ),它們語(yǔ)義相同,習(xí)語(yǔ)碼是它們語(yǔ)義和庫(kù)中位次的表示;第二輪識(shí)別提取開(kāi)始每輪新加一種語(yǔ)言文字,事先應(yīng)在這四個(gè)分庫(kù)內(nèi)分別增設(shè)新加語(yǔ)種的構(gòu)件字段。本發(fā)明還提供一種基于表意構(gòu)件的機(jī)譯人?;?dòng)翻譯方法,其特征在于,包括如下步驟:S5.讀句配骼、源語(yǔ)句套入202,讀入源語(yǔ)句子,以源語(yǔ)句搜索句骼庫(kù),獲得唯一匹配的源、目語(yǔ)句骼,若有多對(duì)匹配句骼自動(dòng)隱含選取最長(zhǎng)的為唯一匹配句骼,然后將源語(yǔ)句子對(duì)號(hào)入座地套入源語(yǔ)句骼,艙檢測(cè)若是有模句艙再搜索艙模庫(kù)有再套入艙模,使成為源語(yǔ)句骼例結(jié)合形式;S6.句艙或艙眼內(nèi)容轉(zhuǎn)移203,從源語(yǔ)句骼例結(jié)合式中逐個(gè)取出句艙或艙眼內(nèi)容,轉(zhuǎn)移到目語(yǔ)句骼、艙模相應(yīng)的句艙或艙眼里,使之成為源、目語(yǔ)過(guò)渡式;S7.存查得項(xiàng)、預(yù)選給出目語(yǔ)待校句204,逐個(gè)取出源、目語(yǔ)過(guò)渡式中句艙或艙眼的源語(yǔ)詞串,查詢意群串庫(kù),無(wú)詞間間隔的表意文字則以從左到右可能的排列作為詞串查詢意群庫(kù),二者所有查得項(xiàng)存于更正表;利用預(yù)選模塊402選出查得項(xiàng)當(dāng)中最大適配的目語(yǔ)串生成待校句并在更正表中換位到詞串段之首,最后給出301預(yù)選后的保留句艙艙眼標(biāo)志標(biāo)號(hào)的目語(yǔ)待校句和“返回”、“繼后”、“一移”、“移一”、“▲”、“八”、“修辭”命令按鈕以及相應(yīng)的源語(yǔ)參考句;S8.語(yǔ)意校正、自學(xué)習(xí)205,當(dāng)用戶讀到目語(yǔ)待校句和相應(yīng)的源語(yǔ)參考句時(shí)開(kāi)始校正操作,同時(shí)系統(tǒng)的校正模塊借更正表進(jìn)行語(yǔ)意校正運(yùn)作,自學(xué)習(xí)模塊401與之聯(lián)動(dòng),對(duì)校正過(guò)程的人機(jī)互動(dòng)進(jìn)行學(xué)習(xí)、記憶且為預(yù)選模塊提供數(shù)據(jù),當(dāng)當(dāng)前待校句的語(yǔ)意校正運(yùn)作結(jié)束后,接受用戶單擊“返回”按鈕接續(xù)S5運(yùn)作。上述方法中,步驟S8所述及語(yǔ)意校正和校正模塊,其進(jìn)一步的特征是:語(yǔ)意校正有待校句完全正確無(wú)需更正和需要更正兩種情況,無(wú)需更正時(shí)接受用戶單擊“返回”按鈕接續(xù)S5,需要更正的有如下?tīng)顟B(tài)與步驟,更正結(jié)束后再接受單擊“返回”接續(xù)S5:A)不妥詞串的替換302—當(dāng)用戶認(rèn)為待校句某詞串不妥時(shí),單擊它系統(tǒng)搜索更正表,彈出下拉列表給出全部相關(guān)查得項(xiàng)待選,然后以被單擊選中的查得項(xiàng)替換譯句不妥詞串,同時(shí)置換為詞串段之首;B)連續(xù)句艙的切分303——當(dāng)遇到?jīng)]有參照無(wú)法自動(dòng)進(jìn)行切分的連續(xù)句艙給出待切,當(dāng)被單擊后以被單擊點(diǎn)為切分點(diǎn)將兩個(gè)句艙內(nèi)容分開(kāi);C)干預(yù)另選句骼304—當(dāng)遇到句艙和艙眼不勻稱(chēng)、有殘缺、或堆疊之錯(cuò)選句骼表現(xiàn)時(shí),或用戶不認(rèn)可當(dāng)前譯句時(shí)單擊“繼后”按鈕,系統(tǒng)把多對(duì)匹配句骼給出待選,以單擊選取后的句骼重新套入接續(xù)S6繼續(xù)運(yùn)作;D)補(bǔ)加意群串305—當(dāng)不妥詞串另選替換而缺失時(shí),接受用戶使用延伸詞義、粘帶前引或后隨字詞方法補(bǔ)加意群串,以補(bǔ)加串進(jìn)行替換并補(bǔ)加于意群串相應(yīng)語(yǔ)種構(gòu)件字段;E)組選復(fù)串306—當(dāng)不妥詞串另選替換而缺失時(shí),接受用戶使用組復(fù)詞或改選復(fù)詞的方法補(bǔ)加復(fù)詞串,以補(bǔ)加串進(jìn)行替換并補(bǔ)加于意群串的復(fù)詞庫(kù)相應(yīng)語(yǔ)種構(gòu)件字段;F)句艙詞序307—當(dāng)譯句句艙有詞序錯(cuò)誤時(shí),接受用戶單擊其中串,再單擊“一移”或“移一”命令按鈕,將單擊串前移或后移一個(gè)串位;G)編詞替換308—當(dāng)連續(xù)多串不妥,不能用單擊選中時(shí),用拖放操作選中選中串時(shí),然后在編詞替換處填上其它詞串、編輯或?yàn)榭?,再單擊?A ”按鈕時(shí),系統(tǒng)以后者置換前者;H)修辭309—當(dāng)出現(xiàn)不能用上述步驟解決的修辭現(xiàn)象時(shí),接受用戶單擊“修辭”按鈕,然后將當(dāng)前待校句復(fù)制到編輯框,接受用戶使用編輯的方法進(jìn)行修辭操作;I)艙轉(zhuǎn)換310——當(dāng)中譯英時(shí)接受用戶單擊某句艙或艙眼內(nèi)容,搜索更正表所有當(dāng)前句艙或艙眼含有的查得項(xiàng),列表 給出等待用戶多次有序的單擊選取,將它們置換待校句相應(yīng)句艙或艙眼內(nèi)容;J)補(bǔ)量詞311—當(dāng)英譯中時(shí)由于英語(yǔ)無(wú)量詞而中文有量詞因而需要在待校句需要之處補(bǔ)上量詞,接受用戶單擊待校句的需補(bǔ)加處,系統(tǒng)搜索最接近單擊點(diǎn)的數(shù)串后中心名詞,當(dāng)“▲”按鈕同時(shí)被單擊,以中心名詞搜索量詞庫(kù),取出相應(yīng)量詞補(bǔ)加到待校句;如果量詞庫(kù)查無(wú),給出對(duì)話接受輸入給以補(bǔ)加且錄入量詞庫(kù);K)補(bǔ)冠它312-當(dāng)中譯英時(shí)由于中文沒(méi)有而英文有冠詞、動(dòng)詞to/be、to/have
等,這些需要補(bǔ)加,在系統(tǒng)給出保留句艙標(biāo)志標(biāo)號(hào)的目語(yǔ)待校句時(shí),已經(jīng)顯示了 “a/an”、“the”、“t0/be”、“t0/haVe”,當(dāng)它們之一被單擊,待校句也被單擊時(shí),系統(tǒng)將它們之一在待校句被單擊處加上適當(dāng)形式的詞串;以上A-H狀態(tài)步驟與語(yǔ)言文字的種類(lèi)無(wú)關(guān),具共性特點(diǎn),可以出現(xiàn)在多語(yǔ)種之間A譯B或B譯A的雙向翻譯的過(guò)程中;1狀態(tài)步驟與語(yǔ)言文字的種類(lèi)相關(guān),用于無(wú)詞間間隔表意文字的翻譯之中;J_K狀態(tài)步驟與語(yǔ)言文字種類(lèi)密切相關(guān),它們具個(gè)性特點(diǎn)根據(jù)具體語(yǔ)種設(shè)置。上述方法中,步驟S8述及的自學(xué)習(xí)模塊聯(lián)動(dòng),對(duì)校正過(guò)程的人機(jī)互動(dòng)進(jìn)行學(xué)習(xí)、記憶且為預(yù)選模塊提供數(shù)據(jù),如圖4所示,具體為:A、經(jīng)驗(yàn)選詞,在英譯中語(yǔ)意校正運(yùn)作過(guò)程中當(dāng)用戶單擊待校句的不妥詞串后403,系統(tǒng)搜索更正表,列表給出全部相關(guān)查得項(xiàng)待選的同時(shí),將所有相關(guān)待選項(xiàng)以空格相隔生成經(jīng)驗(yàn)串,末尾把相應(yīng)的英詞串附后;當(dāng)用戶選取列表之一置換的同時(shí),用選中詞條和英串查詢“經(jīng)驗(yàn)選詞”庫(kù),查有頻度=頻度+1,查無(wú),將選中詞條移到經(jīng)驗(yàn)串之首且壓棧式存入該庫(kù)405的中解釋字段,英串從經(jīng)驗(yàn)串取下存入英串字段,當(dāng)前句骼號(hào)存入句骼號(hào)字段;B、中文詞序,在 英譯中語(yǔ)意校正運(yùn)作過(guò)程中將生成的中文待校句給出時(shí)備份于“給出句”,當(dāng)測(cè)得用戶使用“一移”或“移一”按鈕移動(dòng)句艙或艙眼詞序時(shí)406,記下被移句艙的艙標(biāo)號(hào)或艙眼號(hào),當(dāng)語(yǔ)意校正結(jié)束,“返回”命令按扭被單擊時(shí)搜索經(jīng)過(guò)移位調(diào)整詞序的句艙或艙眼,是,以句艙為單位將移位前、后結(jié)果分別存于中詞序庫(kù)408的“原序”、“正序”字段,且清除當(dāng)前句艙或艙眼在經(jīng)驗(yàn)選詞庫(kù)405中的相關(guān)記錄;C、艙經(jīng)驗(yàn),在中譯英語(yǔ)意校正的“艙轉(zhuǎn)換”運(yùn)作時(shí)409備存當(dāng)前句艙、艙眼標(biāo)號(hào),當(dāng)“返回”命令按鈕被單擊,將當(dāng)前句所有經(jīng)過(guò)艙轉(zhuǎn)換的轉(zhuǎn)前轉(zhuǎn)后內(nèi)容查艙經(jīng)驗(yàn)庫(kù)411,查有頻度+1 ;查無(wú)壓棧式存入該庫(kù)。上述方法中,步驟S7述及將所有查得項(xiàng)存于更正表,利用預(yù)選模塊402選出查得項(xiàng)當(dāng)中最大適配的目語(yǔ)串生成待校句并在更正表中換位到詞串段之首,如圖4所示,其進(jìn)一步的特征是:更正表至少有詞串段、搜索串、解釋、串首位字段,預(yù)選模塊與語(yǔ)言文字種類(lèi)密切相關(guān);英譯中的預(yù)選412是①用當(dāng)前句艙或艙眼內(nèi)英文詞串查詢“經(jīng)驗(yàn)選詞”庫(kù),查有取出解釋字段內(nèi)容的首條中文詞串為413最大適配的目語(yǔ)串給出,查無(wú)以更正表本詞串段首記錄為最大適配的目語(yǔ)串給出;②用當(dāng)前句艙或艙眼已經(jīng)獲得的中文內(nèi)容414查詢“中詞序”庫(kù)的原序字段,查有以正序字段內(nèi)容替換為最大適配的目語(yǔ)串415給出,查無(wú)不變;中譯英的預(yù)選以源、目語(yǔ)過(guò)渡式中句艙或艙眼的源語(yǔ)內(nèi)容查詢更正表搜索串字段,有全等的以同記錄解釋字段內(nèi)容為最大適配的目語(yǔ)串給出,無(wú)全等時(shí)417的再查詢“艙經(jīng)驗(yàn)”庫(kù)中艙字段,有418以英艙字段內(nèi)容為最大適配的目語(yǔ)串給出,查“艙經(jīng)驗(yàn)”庫(kù)無(wú)以當(dāng)前句艙或艙眼中文內(nèi)容為最大適配的目語(yǔ)串給出;凡預(yù)選模塊選用了更正表某查得項(xiàng)改變了原給出內(nèi)容的,同時(shí)在更正表中將它換位到本詞串段之首。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:1)與傳統(tǒng)機(jī)器翻譯(MT)相比,可以獲得高質(zhì)量譯文的技術(shù)效果;2)與翻譯記憶(TM)相比,可獲得無(wú)需獨(dú)立翻譯能力的人士也可操作,譯文質(zhì)量且與專(zhuān)業(yè)譯員相當(dāng)?shù)募夹g(shù)效果。3)與現(xiàn)有計(jì)算機(jī)語(yǔ)言文字信息處理基于字符相比,本發(fā)明基于表意構(gòu)件更優(yōu)越?,F(xiàn)有電子詞典與紙上詞典一樣,詞條間只有不同語(yǔ)言文字的解釋?zhuān)m合人腦理解與參考;不能用以拆分句子,也不能拼接句子;不適合計(jì)算機(jī)語(yǔ)言文字信息處理。而本發(fā)明的表意構(gòu)件及其數(shù)據(jù)庫(kù),更適合計(jì)算機(jī)語(yǔ)言文字信息處理;可以用以拆分句子,也可以用以拼接句子;并可社會(huì)性積累長(zhǎng)期使用。4)機(jī)譯人?;?dòng)翻譯,在搜索表意構(gòu)件數(shù)據(jù)庫(kù)給出待校目語(yǔ)句的過(guò)程中,諸如一詞多義的所有解釋都備份于更正表,一但人工智能不力產(chǎn)生偏差,操作者可以簡(jiǎn)捷另選置換。這種有益效果的獲得,在當(dāng)今人工智能不夠完善、正處成熟過(guò)程之中來(lái)說(shuō)意義重大,也是譯文質(zhì)量的保證之一。

圖1表意構(gòu)件識(shí)別提取流程圖;圖2機(jī)譯人?;?dòng)翻譯流程圖;圖3語(yǔ)意校正模塊流程圖;圖4自學(xué)習(xí)模塊和預(yù)選模塊流程示意具體實(shí)施方式下文參照附圖、利用實(shí)施例將本發(fā)明的內(nèi)容進(jìn)一步說(shuō)明如下:一、一種表意構(gòu)件識(shí)別提取方法一種表意構(gòu)件識(shí)別提取方法,面向多語(yǔ)種相同語(yǔ)意的雙語(yǔ)句對(duì),利用軟件方法,人機(jī)交互進(jìn)行句對(duì)齊操作,將語(yǔ)意相同的A、B雙語(yǔ)分別存貯在句對(duì)庫(kù)的A語(yǔ)字段和B語(yǔ)字段(該部分與現(xiàn)有技術(shù)翻譯記憶相似)。本申請(qǐng)對(duì)于表意構(gòu)件提取的樣本,要求規(guī)范,取課文、范文、專(zhuān)業(yè)參考資料等發(fā)表文章或作品。操作原則是:表意構(gòu)件識(shí)別提取的操作者以及句對(duì)整理的語(yǔ)義對(duì)齊者。不能修改被操作句對(duì)內(nèi)容。下文結(jié)合附圖1,表意構(gòu)件提取流程,以中英雙語(yǔ)為例,將本表意構(gòu)件提取方法進(jìn)一步說(shuō)明如下。如附圖1所示,本方法分如下四大步驟:(一)、讀句配骼102:這里將涉及的具特別意義的概念定義及提要如下:句子一在語(yǔ)言文字里,表達(dá)完整語(yǔ)意的基本單位為句子;不同語(yǔ)言文字的句子可以表達(dá)相同的語(yǔ)意。句子可分為句骼、句艙兩部分,一個(gè)句骼至少包含一個(gè)句艙。
句骼——移去句艙后句子的剩下部分為句骼。句骼是句子的骨骼和框架;它出自一類(lèi)句子的抽象,在句子中相對(duì)穩(wěn)定,體現(xiàn)句子基本語(yǔ)意及類(lèi)屬;構(gòu)成該類(lèi)句子基本結(jié)構(gòu)框架部分。句骼體現(xiàn)句子基本語(yǔ)意及類(lèi)屬是面向全人類(lèi)的、跨語(yǔ)種的;而其基本結(jié)構(gòu)框架是面向具體自然語(yǔ)言。句艙——鑲嵌在句骼這個(gè)基本結(jié)構(gòu)框架上的那些靈活的常替換部分為句艙。句艙接受句骼的選擇和制約;句艙可用意群串填充或替換,形成豐富多彩的、具體的句子。句艙個(gè)數(shù)、其語(yǔ)意內(nèi)容是面向全人類(lèi)的、跨語(yǔ)種的;但其在句骼基本結(jié)構(gòu)框架中的位置、次序和用以填充的意群串是面向具體自然語(yǔ)言的。小習(xí)語(yǔ)——過(guò)于簡(jiǎn)短不足以分出句骼、句艙,或因語(yǔ)種、習(xí)俗而難以比對(duì)分出句骼、句艙的為小習(xí)語(yǔ);它們是一類(lèi)特殊的句子。因語(yǔ)種、習(xí)俗而難以分出句骼、句艙的如一個(gè)和尚挑水喝,二個(gè)和尚抬水喝,三個(gè)和尚沒(méi)水喝。”;“one boy is a boy, two boys half a boy, three boys no boy.”;“兵不厭詐”;“There can never be too much deception in war.” 等等;沒(méi)有詞義相等的詞串,難以挖去或標(biāo)注出句艙。中文還有的成語(yǔ)、俗語(yǔ)、謗語(yǔ)、歇后語(yǔ)等是小習(xí)語(yǔ)。句骼和句艙好比填空題,句骼是題干,句艙是題空。它們好比數(shù)學(xué)公式;句艙是變量,句骼是算式。句艙由意群統(tǒng)領(lǐng)的意群串填充或組成。但句艙的大小有較大差別。最小的句艙只包含一個(gè)意群串;最大的句艙可以包含一個(gè)從句或分句。句艙分為簡(jiǎn)單句艙和復(fù)雜句艙兩類(lèi)。當(dāng)向雙語(yǔ)句對(duì)庫(kù)101讀入一個(gè)句對(duì)之后,需要為句對(duì)匹配句骼,有句骼且套入后各句艙和艙眼勻稱(chēng)、無(wú)殘缺、無(wú)堆疊現(xiàn)象的跳過(guò);無(wú)匹配句骼的句對(duì)才需要提取句骼。首先進(jìn)行配句骼運(yùn)作。配句骼事先按句骼詞串與句艙之空穴生成句骼串表并索弓丨,例如句豁“IknoW+[l]+got crush on+[2]+, +[3]+you could+[4]+.”、“我知道+[I]+喜歡上+ [2]+了,+[3]+你+[4] +看?!钡仁怪蔀榫澉涝~串 “I know...got crush on...,...youcould....”、“我知道...喜歡上...了,...你...看?!保缓途澉来a、骼首共同制表索引。句骼詞串被句艙分割成句骼詞段如“Ikn0W”、“g0tcrUSh0n”、“,”、“you could”、' ”;“我知道”、“喜歡上”、“了,”、“你”、“看?!?注意“”與“got crush on”等同也是一個(gè)句骼詞段。配句骼運(yùn)作——事先按句骼詞串與句艙之空穴生成句骼串表并索引,配句骼時(shí)把句例從左到右英逐單詞中逐字取下搜索句骼串表的骼首字段(英含句骼詞串第一個(gè)單詞或符號(hào);中含第一個(gè)字或標(biāo)點(diǎn)符號(hào))并存于臨時(shí)表,再逐記錄取出臨時(shí)表內(nèi)容,以句骼詞段查詢句對(duì)例,句骼串的每段都可以在句對(duì)例中查到且次序相同為匹配句骼,再根據(jù)句骼串表的句骼碼字段取出相應(yīng)語(yǔ)種句骼。配句骼運(yùn)作搜索到匹配句骼,將當(dāng)前句對(duì)例套入并顯示給出“艙檢測(cè)”和“查配標(biāo)”按鈕,當(dāng)操作者讀到后認(rèn)為各句艙和艙眼勻稱(chēng)、無(wú)殘缺、無(wú)堆疊現(xiàn)象(這是一個(gè)意外的收獲,一瞥便知語(yǔ)意合適與否)且語(yǔ)意正確時(shí)單擊“艙檢測(cè)”按鈕,表示認(rèn)可,系統(tǒng)接續(xù)艙檢測(cè)步驟。如果不是這樣,不認(rèn)可,單擊“查配標(biāo)”按鈕,系統(tǒng)進(jìn)入查配標(biāo)運(yùn)作,用A語(yǔ)詞串查詢傳統(tǒng)電子詞典看B語(yǔ)句是否含有生成當(dāng)前句對(duì)語(yǔ)意匹配表。查配標(biāo)運(yùn)作一查配標(biāo)運(yùn)作機(jī)器利用含有詞性、A語(yǔ)詞、B語(yǔ)詞字段的匹配表,先以A語(yǔ)句子單詞串為單元切分、依次填入匹配表A語(yǔ)詞字段,隨后逐記錄取出查詢傳統(tǒng)電子詞典,以查得的相應(yīng)B語(yǔ)解釋搜索B語(yǔ)句是否含有,含有且是最長(zhǎng)串填入B語(yǔ)詞字段同時(shí)將其詞性填入詞性字段,無(wú)含有B語(yǔ)詞字段為空。這就作好了識(shí)別標(biāo)注句艙的準(zhǔn)備,將N = O,句艙計(jì)數(shù)器清零。(二)、自動(dòng)識(shí)別并標(biāo)注句艙103:下文將涉及的具特別意義的概念定義及提要如下:簡(jiǎn)單句艙一以拼音文字計(jì)不超過(guò)5個(gè)原有詞串;或除不表意虛詞外不超過(guò)三個(gè)意群串的句艙為簡(jiǎn)單句艙。重復(fù)句艙——句艙內(nèi)容、標(biāo)號(hào)完全相同的句艙為重復(fù)句艙,在句對(duì)當(dāng)中,兩句的重復(fù)句艙數(shù)量位置不一定相等。連續(xù)句艙——前后兩個(gè)句艙相連,中間缺乏間隔詞串(或字符)的為連續(xù)句艙;在句對(duì)中嚴(yán)卡,僅僅允許2連;兩個(gè)句子任何哪個(gè)出現(xiàn)3連必須返工重新操作。復(fù)雜句艙一大于簡(jiǎn)單句艙的為復(fù)雜句艙,其中含有艙模的句艙稱(chēng)有模句艙,通常等于大于8個(gè)原有詞串;介于簡(jiǎn)單句艙和有模句艙之間常常含有復(fù)詞串為組串句艙。艙模和艙眼一進(jìn)一步剖析復(fù)雜句艙;得出如同框架結(jié)構(gòu)部分稱(chēng)艙模;鑲嵌在艙模框架結(jié)構(gòu)上的可替換部分稱(chēng)艙眼。句艙和艙眼是上、下位概念;但簡(jiǎn)單句艙和艙眼的大小相等。自動(dòng)識(shí)別面向上述匹配表,自動(dòng)識(shí)別的內(nèi)容特征如下:數(shù)量串:凡表示“數(shù)”和“量”的中英詞串收錄于數(shù)量表,表中有英數(shù)、中數(shù)、計(jì)算值、詞性等字段;其中詞性含有“計(jì)算串”、“數(shù)位串”、“基數(shù)”、“序數(shù)”、“量”等;如果需要計(jì)算,將數(shù)串從左至右以單詞切下, 查該表詞性標(biāo)有“計(jì)算串”的以計(jì)算值加入結(jié)果數(shù)A ;其中如果是數(shù)位串,將它與結(jié)果數(shù)A相剩;操作完成加入結(jié)果數(shù)B。判斷是否數(shù)量串據(jù)該表已登錄的識(shí)別為數(shù)量串。在匹配表數(shù)串之后如果是名詞并且數(shù)量表有登錄識(shí)別為量詞,二者合并為數(shù)量串。專(zhuān)名串:利用英文首字母大寫(xiě)入手,排外其它大寫(xiě)情況識(shí)別為專(zhuān)名串;冠名串:利用英文冠詞識(shí)別,冠后跟隨名詞,或者插有形容詞的“冠形名”者識(shí)別為誕名串;無(wú)冠名串:無(wú)冠詞引帶而詞性字段是名詞,且A語(yǔ)詞、B語(yǔ)解釋字段不空識(shí)別為語(yǔ)意相等的無(wú)冠名串;其它匹配串:其它詞類(lèi),只要它們的A語(yǔ)詞、B語(yǔ)解釋字段不空的識(shí)別為語(yǔ)意相等的其它匹配串。續(xù)上:機(jī)器以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、以先后為序用N = N+1將它們預(yù)標(biāo)為句艙。自動(dòng)識(shí)別預(yù)標(biāo)句艙的運(yùn)作,例如句對(duì)例:“In Hengtung County, its per_mu_grain_yield surpassed800j in inl970,double that beforel965.
衡東縣在1970年每畝產(chǎn)量超過(guò)800斤,是1965年以前的兩倍?!睓C(jī)器查詢當(dāng)前句對(duì)語(yǔ)意匹配表,首先搜索識(shí)別數(shù)量串,有、將它不們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C……”預(yù)標(biāo);本例有3對(duì)數(shù)量串,預(yù)標(biāo)為“A、B、C” 3個(gè)句艙,例如:
“In Hengtung County, its p er~mu_gra i n_y i eId surpassed A{800j in}inB{1970}, double that before C{1965}.
衡東縣在B{1970年}每畝產(chǎn)量超過(guò)A{800斤},是(:{1965年}以前的兩倍?!睙o(wú)或識(shí)別搜索完全句數(shù)量串后識(shí)別搜索專(zhuān)名串,有、同樣將它不們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C……”預(yù)標(biāo);本例有I對(duì)專(zhuān)名串,接續(xù)預(yù)標(biāo)為句艙“D”例如:“In D{Hengtung County}, its per~mu_grain_yieId surpassed A{800jin}inB{1970}, double that before C{1965}.
D{衡東縣}在B {1970年}每畝產(chǎn)量超過(guò)A{800斤},是C{1965年}以前的兩倍?!睙o(wú)或識(shí)別搜索完全句專(zhuān)名串后識(shí)別搜索冠名串,有、同樣將它不們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C……”預(yù)標(biāo)。本例無(wú);無(wú)或識(shí)別搜索完全句冠名串后顯示符號(hào)“ I ”且在兩側(cè)分別顯示“一”、“一”命令按鈕、計(jì)算并顯示骼例比、以及“ V ”命令按鈕,接受操作者更正或認(rèn)可;同時(shí)顯示骼例比為“64%”;本例因沒(méi)有達(dá)到15-50%的指標(biāo),需要繼續(xù)識(shí)別標(biāo)注句艙;接受操作者單擊“ V”按鈕,繼續(xù)識(shí)別標(biāo)注。以上是雙語(yǔ)依次同時(shí)識(shí)別數(shù)量串、專(zhuān)名串、冠名串;這三種詞串識(shí)別之后,計(jì)算骼例比,連同預(yù)標(biāo)結(jié)果,一些命令按鈕一同顯示給出。如果需要更正可以接受用戶(即操作者,下同)更正,無(wú)需更正而骼例比超標(biāo),如同本例,則繼續(xù)識(shí)別標(biāo)注。如果骼例比高于15-50%,以匹配表為據(jù)搜索詞性字段是名詞且A語(yǔ)詞B語(yǔ)詞字段不空的為語(yǔ)意匹配的無(wú)冠名串,或者不是名詞而A語(yǔ)詞B語(yǔ)詞字段不空的為其它語(yǔ)意匹配串。同上且加顯當(dāng)前句對(duì)語(yǔ)意匹配表、“I手I”、“V”、“<n”、“格式檢查”按鈕。本例繼續(xù)識(shí)別無(wú)冠名串和其它語(yǔ)意匹配串,注意,現(xiàn)在開(kāi)始是每識(shí)別預(yù)標(biāo)一個(gè)句艙即暫停,等待交互認(rèn)可或更正。如本例從左向右搜索無(wú)冠名串,有“per-mu_grain_yield”、“每畝產(chǎn)量”, 且與前、后的己標(biāo)句艙都有詞串相隔,因而進(jìn)一步預(yù)標(biāo)句艙“E”,如:“In D{Hengtung County}, its E{per-mu_grain_yield}surpassed A{800jin}inB{1970}, double that before C{1965}.
D{衡東縣}在B{1970年}E{每畝產(chǎn)量}超過(guò)A{800斤},是C{1965年}以前的
兩倍?!?待續(xù))這時(shí)骼例比為“42%”已經(jīng)達(dá)標(biāo),但沒(méi)有=< 15%由操作者根據(jù)語(yǔ)意情況可結(jié)束識(shí)別,單擊“格式檢查”按鈕;也可再識(shí)別預(yù)標(biāo)單擊“ V ”按鈕;也可以使用其它命令按鈕進(jìn)行更正。更正操作和上述顯示的命令按鈕相關(guān)聯(lián),邏列如下:“一 I — ”按鈕:當(dāng)待校句被單擊在單擊點(diǎn)插入顯示“ I ”然后判別“一”、“一”按鈕是否被單擊;當(dāng)“一”被單擊,將“ I ”左邊的詞串左移,如果“ I ”在句艙內(nèi)則將其左邊詞串移出句艙;如果“ I ”在句艙外則將其左邊詞串移入句艙。當(dāng)“一”被單擊,將“ I ”右邊的詞串右移,如果“ I ”在句艙內(nèi)則將其右邊詞串移出句艙;如果“ I ”在句艙外則將其右邊詞串移入句艙。借此更正句艙內(nèi)容的多寡?!?V ”按鈕:認(rèn)可當(dāng)前識(shí)別已預(yù)標(biāo)句艙,繼續(xù)識(shí)別預(yù)標(biāo)新句艙。“|手|”按鈕:手工標(biāo)識(shí)句艙,同時(shí)在A、B語(yǔ)待校句各單擊欲標(biāo)句艙的首尾,然后單擊“I手I”按鈕,將它們?cè)兕A(yù)標(biāo)一對(duì)句艙,自動(dòng)修改骼例比?!?lt; n ”按鈕:每次單擊反悔最后識(shí)別預(yù)標(biāo)的句艙,還原到最后預(yù)標(biāo)前狀態(tài)以及骼例比;可重復(fù)直到完全刪去?!案袷綑z查”按鈕:結(jié)束當(dāng)前句對(duì)的更正操作,進(jìn)行格式檢查運(yùn)作。格式檢查進(jìn)行返工性檢測(cè)、標(biāo)注格式檢測(cè)、正式標(biāo)注三個(gè)步驟,具體運(yùn)作如下:1.返工性檢查:句骼限長(zhǎng)英句<=200字符;中<=150字符(2字節(jié)一漢字計(jì));連續(xù)句艙限2個(gè)句艙相連。一但發(fā)現(xiàn)句骼超長(zhǎng)或3個(gè)句艙相連即刻報(bào)告;立即返工。2.標(biāo)注格式檢測(cè):上文述及的自動(dòng)識(shí)別句艙預(yù)標(biāo)是以下文的“句骼句艙標(biāo)注規(guī)則”進(jìn)行的。這里標(biāo)注格式檢查也是根據(jù)這個(gè)規(guī)則進(jìn)行檢測(cè)。有不符之處,能自動(dòng)修改的自動(dòng)修改;不能自動(dòng)修改的提示用戶修改。檢測(cè)完成之后,搜索是否有A、B語(yǔ)句子同時(shí)同號(hào)連續(xù)句艙,有給出對(duì)話框獲得操作者認(rèn)可后合并為一個(gè)句艙。同時(shí)同號(hào)連續(xù)句艙,如A、B語(yǔ)句子都含有“C、D”或“D、C”相連的句艙應(yīng)交互后合并(當(dāng)然由操作者決定)。然后,進(jìn)入下一步驟。3.正式標(biāo)注中、英文是第一個(gè)識(shí)別比對(duì)提取的語(yǔ)種對(duì),也是核心雙語(yǔ)對(duì)。依英句從左到右升序編排;句艙標(biāo)號(hào)以“1、2、3……”正式標(biāo)注。第三個(gè)語(yǔ)種開(kāi)始以已經(jīng)標(biāo)注句為樣本復(fù)制,識(shí)別標(biāo)注;不需要預(yù)標(biāo)。句骼句艙標(biāo)注規(guī)則:①句骼含句骼詞、句艙、標(biāo)點(diǎn)符號(hào)三種成份;句艙與其它兩種成份之間,句艙與句艙之間須以“ + ”相隔;標(biāo)點(diǎn)符號(hào)的標(biāo)注等同句骼詞。如:[I] +dared not+ [2] + [3] +, much less+[4] + [5]+.
[I]+不相信+[2] + [3]+不會(huì)來(lái)。②標(biāo)點(diǎn)符號(hào)等同句骼詞。句末、句中符號(hào)英有空格隔開(kāi);中無(wú)。如:hearing+[I]+, they immediately+[2] +.
聽(tīng)到了+[1]+,他們立刻+[2]+。③英句骼詞首不大寫(xiě)(“I”例外),句骼中部可以大寫(xiě),包括不規(guī)則詞、詞尾變化等(應(yīng)與例句一致)。如:no+[I]+and No+[2]+any more+.再不要+[I]+,不要+[2]+。did you+[l]+, or Did+[2]+ 是您+[I]+,還是+[2] + [l]+ I did not know whether to send+[I]+ [2]+or not.我不知道+[I]+是否要以+ [2]+發(fā)出。④所有緊縮式無(wú)論在句骼或句例中都轉(zhuǎn)換成展開(kāi)形式;“Aren,t” 轉(zhuǎn)換成 “Are not” ;“ aren t ”轉(zhuǎn)換成“are not”等。⑤句艙編號(hào),中英文是第一個(gè)語(yǔ)種對(duì),依英句從左到右升序編排;中文以及隨后語(yǔ)種均據(jù)語(yǔ)意與之相應(yīng)。分句骼式和骼例式兩種款式,前者用方括號(hào),后者用花括號(hào):a)在句骼式中如句骼263:英文句豁:[I]+couldnot afford+[2]+, not to speak of+[3]+.
中文句骼:[I] +不能維持+ [2] +,更不要說(shuō)+ [3] +。
b)在骼例式中,僅句艙標(biāo)號(hào)位置稍有區(qū)別,如句骼263的骼例式為:I{at_that_time they}could not afford2{the ordinary comforts of I i fe},not tospeak of3{luxuries}.
1{那時(shí)他們}不能維持2 {普通的生活},更不要說(shuō)5 {奢侈品了 }。⑥重復(fù)句艙的句艙標(biāo)號(hào)、句艙內(nèi)容相同;語(yǔ)種間不一定對(duì)應(yīng);標(biāo)注也一樣。如:Whatl{he}has once heardl{he}2{never forgets}.
凡是1{他}聽(tīng)到過(guò)的,再也2{不會(huì)忘記}。⑦艙模標(biāo)注與句骼標(biāo)注一致,也有相應(yīng)兩種款式;艙模號(hào)置園括號(hào)“0”內(nèi),位于本句艙之首。如下例:Thel{nsherman}consents to return2 {the feather suit}, on conditionthat3{(00205)I[fairy]2[dance]and3[play heavenly music]for him}.
在3{(00205) 1[仙女]為他2[跳舞]并3[演奏天上樂(lè)曲]}的條件下,1{漁夫}答應(yīng)歸還2 {羽衣}。⑧上述用以標(biāo)注的園括號(hào)、方括號(hào)和花括號(hào)中英及其它文種都使用單字節(jié)續(xù)前:當(dāng)前句對(duì)例識(shí)別句艙,標(biāo)注全部完成。如:“Inl{Hengtung County}, its2{per-mu_grain_yield}surpassed3{800j in}in4{1970}, double that before5{1965}.
1{衡東縣}在4{1970年}2{每畝產(chǎn)量}超過(guò)3 {800斤},是5 {1965年}以前的
兩倍?!北纠龝和?再舉一例后接續(xù))。

當(dāng)前句對(duì)例識(shí)別句艙,預(yù)標(biāo)句艙有部份內(nèi)容還未涉及,再舉例說(shuō)明如下:例如讀入句對(duì)“for three years,there is been a running fight between theTory and Labour members of the Housing Committee about rai sing counci I hohouse rents.”、“3年來(lái),住房供給委員會(huì)的保守黨成員和工黨成員就提高社團(tuán)房租事宜互相進(jìn)行了追擊戰(zhàn)?!比缟鲜鲎詣?dòng)依次同時(shí)識(shí)別數(shù)量串、專(zhuān)名串、冠名串;其中有提示:“冠名串‘running’不匹配! ”;當(dāng)這三種詞串識(shí)別預(yù)標(biāo)句艙之后,顯示骼例比為59%,預(yù)標(biāo)結(jié)果:“for A{three years}, there is been a running fight between B{the Tory}and C{Labour members}of D{the Housing Committee}about raising council houserents.” ;“八{(lán)3年}來(lái),D{住房供給委員會(huì)}的B{保守黨成員}和C{工黨成員}就提高社團(tuán)房租事宜互相進(jìn)行了追擊戰(zhàn)?!北纠霈F(xiàn)上例未曾涉及的內(nèi)容:同上且加顯當(dāng)前句對(duì)語(yǔ)意匹配表、“ I手I ”、“V”、“<n”按鈕;接受操作者使用組復(fù)詞、延伸詞義、粘帶前引或后隨字詞方法等意群對(duì)齊方法修改匹配表,增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)預(yù)標(biāo)句艙。數(shù)、專(zhuān)、冠三種詞串識(shí)別預(yù)標(biāo)中有提示“冠名串‘running’不匹配! ”;看匹配表,語(yǔ)種A中的“running”相應(yīng)的語(yǔ)種B字段為空所以還未匹配;查傳統(tǒng)電子詞典“running”的解釋有:“n,奔跑;賽跑;運(yùn)轉(zhuǎn);轉(zhuǎn)動(dòng);流出;adj,奔跑的;不斷的;連接的;流動(dòng)的;賽跑的”。它們都在搜索B語(yǔ)句中不含有而沒(méi)有匹配。根據(jù)當(dāng)前句對(duì)例的語(yǔ)意,它表達(dá)了“追擊”之意;是“奔跑”、“賽跑”的詞義延伸。符合“意群對(duì)齊”的操作要求(詳后)。所以在語(yǔ)種B字段增補(bǔ)“追擊”(詞性字段填入“t”示其它補(bǔ)加詞類(lèi),下同)^“running”、“追擊”匹配成為意群串。然而冠名串“a running fight”與“追擊戰(zhàn)”匹配;被識(shí)別預(yù)標(biāo)為句艙“E”;骼例比為48%。如:“for A {three years}, there is been E{a running fight}between B {the Tory}and C{Labour members}of D{the Housing Committee}about raising council houserents.” ;“八{(lán)3年}來(lái),D{住房供給委員會(huì)}的B{保守黨成員}和C{工黨成員}就提高社團(tuán)房租事宜互相進(jìn)行了 E{追擊戰(zhàn)}?!笨淳鋵?duì)的后部一大段,沒(méi)有句艙,同時(shí)骼例比48% ;可以繼續(xù)識(shí)別預(yù)標(biāo)句艙。因而看匹配表,后的“raising courcil house rents”與“提高社團(tuán)房租事宜”其中由于“council”未能匹配。傳統(tǒng)詞典它有“n,參議會(huì);顧問(wèn)班子;理事會(huì);討論會(huì)議;立法班子;委員會(huì);政務(wù)會(huì);議員”等詞義;在這里表達(dá)了 “社團(tuán)”之意,是原有詞串的詞義延伸。符合“意群對(duì)齊”的操作要求。所以在語(yǔ)種B字段增補(bǔ)“社團(tuán)”解釋?zhuān)划?dāng)用戶單擊“ V ”按鈕,繼續(xù)自動(dòng)識(shí)別、預(yù)標(biāo)為:for A{three years}, there is been E{a running fight}between B{the Tory}and C{Labour members}of D{the Housing Committee}about F{raising council houserents}.
々{3年}來(lái),D{住房供給委員會(huì)}的B{保守黨成員}和(:{工黨成員}就F{提高社團(tuán)房租事宜}互相進(jìn)行了 E{追擊戰(zhàn)}。這時(shí)骼例比為26%;句艙分布合理(艙間間隔一般為1-5串的)。識(shí)別預(yù)標(biāo)結(jié)束;搜索接受“格式檢查”按鈕被單擊。進(jìn)行格式檢查運(yùn)作。然后正式標(biāo)注為:fori{three years}, there i s been2{a running fight}between3{the Tory}and4{Labour members }of5{the Housing Committee}about6{raising council houserents}.
1{3年}來(lái),5{住房供給委員會(huì)}的3{保守黨成員}和4{工黨成員}就6 {提高社團(tuán)房租事宜}互相進(jìn)行了 2{追擊戰(zhàn)}。上為列舉了兩個(gè)句對(duì)例子,都在正式標(biāo)注后暫停。這里接續(xù):續(xù)上句對(duì)例I,正式標(biāo)注后為:I{In Hengtung County},2 {its per-mu grain_yield}surpassed3{800j in}in4{1970}, double that before5{1965}.
1{衡東縣}在4 {1970}年2{畝產(chǎn)量}超過(guò)3 {800斤},是5 {1965}年以前的兩倍。此時(shí)句艙數(shù)=5,符合“N = > I”的要求;然后移去句艙內(nèi)容所剩部分為句骼構(gòu)件,如:In+[I]+, its+ [2] +surpassed+ [3] +in+ [4] +, double that before+[5]+.
[I] + 在 +[4] + [2] + 超過(guò) +[3] +,是 +[5] + 以如的兩倍。將句骼構(gòu)件分別存貯于句骼庫(kù)相應(yīng)語(yǔ)種構(gòu)件字段;這里如將英文句骼“In+[1]+,its+ [2] +surpassed+ [3] +in+ [4] +, double that before+[5]+.”存忙于句豁庫(kù)的“英句豁”字段;將中文句骼“ [I]+在+[4] + [2]+超過(guò)+[3]+,是+[5]+以前的兩倍?!贝尜A于句骼庫(kù)的“中句骼”字段。下文XXXX構(gòu)件存貯于XXXX庫(kù)相應(yīng)語(yǔ)種構(gòu)件字段如此類(lèi)推。句骼庫(kù)105有“英句骼”、“中句骼”、“俄句骼”等多語(yǔ)種句骼字段,分別存貯相應(yīng)語(yǔ)種句骼;同記錄的多語(yǔ)種句骼語(yǔ)意相同。第二輪語(yǔ)意比對(duì)提取句骼以已標(biāo)語(yǔ)種句為模板識(shí)另IJ、標(biāo)注句艙,獲得新加語(yǔ)種句骼后,以已標(biāo)語(yǔ)種句骼搜索句骼庫(kù),在相同記錄與新加語(yǔ)種相應(yīng)的字段存入。續(xù)上句對(duì)例2,正式標(biāo)注后為:fori{three}years, there is been2{a running fight}between3 {the Tory}and4{Labour}members of5{the Housing Committee}about6{raising council houserents}.
I {3}年來(lái),5{住房供給委員會(huì)}的3{保守黨}成員和4{工黨}成員就6{提高社團(tuán)房租事宜}互相進(jìn)行了 2{追擊戰(zhàn)}。此時(shí)句艙數(shù)=6,符合“N = > I”的要求;然后移去句艙內(nèi)容所剩部分為句骼構(gòu)件,如:for+[l]+, there is been + [2] +between +[3] +and +[4] +membersof+[5]+about+[6]+.
[I] +來(lái),[5]+的+[3] +成員和+[4] +成員就+[6]+互相進(jìn)行了 +[6]+。如同上例,將它們分別存入句骼庫(kù)同一記錄的“英句骼”、“中句骼”字段。句對(duì)例3:many things grow in the garden that were never sown there.
有心栽花花不發(fā),無(wú)心插柳柳成蔭。配句骼運(yùn)作沒(méi)有匹配句骼;然而進(jìn)入查配標(biāo)運(yùn)作。查配標(biāo)運(yùn)作后的匹配表有12記錄,語(yǔ)種A字段依次是英 語(yǔ)句 各單詞和句號(hào);語(yǔ)種B字段全空。查配標(biāo)沒(méi)有匹配串。再進(jìn)入識(shí)別、標(biāo)注句艙運(yùn)作,沒(méi)有可標(biāo)句艙。符合N = 0 ;為小習(xí)語(yǔ)構(gòu)件;將它們分別存貯于習(xí)語(yǔ)庫(kù)同一記錄的“英習(xí)語(yǔ)”、“中習(xí)語(yǔ)”字段。習(xí)語(yǔ)庫(kù)104有“英習(xí)語(yǔ)”、“中習(xí)語(yǔ)”、“俄習(xí)語(yǔ)”等多語(yǔ)種習(xí)語(yǔ)字段,分別存貯相應(yīng)語(yǔ)種習(xí)語(yǔ);同記錄的多語(yǔ)種習(xí)語(yǔ)語(yǔ)意相同。第二輪語(yǔ)意比對(duì)提取的習(xí)語(yǔ)以已標(biāo)語(yǔ)種句為模板識(shí)別、標(biāo)注習(xí)語(yǔ),獲得新加語(yǔ)種習(xí)語(yǔ)后,以已標(biāo)語(yǔ)種習(xí)語(yǔ)搜索習(xí)語(yǔ)庫(kù),在相同記錄與新加語(yǔ)種相應(yīng)的字段存入。識(shí)別、標(biāo)注句艙步驟完成,已獲得的句骼構(gòu)件,小習(xí)語(yǔ)構(gòu)件分別存貯于句骼庫(kù)、習(xí)語(yǔ)庫(kù)。(三)、艙檢測(cè)、提取艙模圖106:依次逐個(gè)句艙檢測(cè),第一輪比對(duì)以英語(yǔ)句艙所含詞串計(jì)數(shù),小于原有8個(gè)詞串的句艙視需要組復(fù)詞,不需組復(fù)詞的跳過(guò)。等于大于原有8個(gè)詞串的以當(dāng)前句艙作查配標(biāo)運(yùn)作生成當(dāng)前句艙語(yǔ)意匹配表以備進(jìn)一步提取艙模為有模句艙。如當(dāng)前例:I{the American}2{economic}system is, organized around3{a basicallyprivate-enterprise},4{market-oriented economy}in which5{consumers}largelydetermine6{what shall be produced}by7{spending their money in the marketplacefor those goods and services that they want most}.
1{美國(guó)的}2{經(jīng)濟(jì)}是以3{基本的私有企業(yè)}和4{市場(chǎng)導(dǎo)向經(jīng)濟(jì)}為架構(gòu)的,在這種2 {經(jīng)濟(jì)}中,5{消費(fèi)者}很大程度上通過(guò)7 {在市場(chǎng)上為那些他們最想要的貨物和服務(wù)付費(fèi)}來(lái)決定6 {什么應(yīng)該被制造出來(lái)}。依次逐個(gè)句艙檢測(cè),1-6號(hào)句艙都沒(méi)有超過(guò)8個(gè)原有串;句艙7 {spending theirmoney in the marketplace for those goods and services that they want most}超過(guò)8個(gè)原有詞串,作查配標(biāo)運(yùn)作生成當(dāng)前句艙語(yǔ)意匹配表以備進(jìn)一步提取艙模為有模句艙。提取艙模,也以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、預(yù)標(biāo)為艙眼,例如當(dāng)前艙被標(biāo)注為:spending their money in A[the marketplace]for those goods and servicesthat they want most在A[市場(chǎng)上]為那些他們最想要的貨物和服務(wù)付費(fèi)這時(shí)模例比81%;大于50-70%,再以無(wú)冠名串或其它語(yǔ)意匹配串在有間隔的前提下逐個(gè)標(biāo)為艙眼,操作者除認(rèn)可更正外,還可以使用組復(fù)詞、延伸詞義、粘帶前引或后隨字詞等意群對(duì)齊的方法修改匹配表,增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)預(yù)標(biāo)艙眼B。spending their money in A [the marketplace]for those B [goods andservices]that they want most在A[市場(chǎng)上]為那些他們最想要的B [貨物和服務(wù)]付費(fèi)這時(shí)模例比65% ;模例比在50-70%之間;看語(yǔ)意需要,可以結(jié)束也可以再預(yù)標(biāo)句艙C:spending their money in A [the marketplace]for those B [goods andservices]that C[they want most]在A[市場(chǎng)上]為那些C[他們最想要]的B[貨物和服務(wù)]付費(fèi)這時(shí)模例比53% ;低于50-70%不能再標(biāo),反悔還原。標(biāo)眼結(jié)束,以英語(yǔ)句艙從左到右為序修改艙眼預(yù)標(biāo)為正式標(biāo)注,例如當(dāng)前句艙正式標(biāo)注為:spending their money ini [the marketplace] for those2 [goods andservices]that3[they want most]在I [市場(chǎng)上]為那些他們最想要的2 [貨物和服務(wù)]付費(fèi)當(dāng)前句艙提取艙模含有艙眼數(shù)=2;符合艙模N = > I條件。將艙眼內(nèi)容移去所剩部分為艙模構(gòu)件。如:spending their money in+[I]+for those+[2]+that+[3]在+[I]+為那些+[3]+的+[2]+付費(fèi)將當(dāng)前提取所得艙模保存到艙模庫(kù)107相應(yīng)語(yǔ)種構(gòu)件字段。艙模庫(kù)107有“英艙模”、“中艙模”、“俄艙模”等多語(yǔ)種艙模字段,分別存貯相應(yīng)語(yǔ)種艙模;同記錄的多語(yǔ)種艙模語(yǔ)意相同。第二輪語(yǔ)意比對(duì)提取的艙模以已標(biāo)語(yǔ)種句為模板識(shí)別、標(biāo)注艙模,獲得新加語(yǔ)種艙模后,以己標(biāo)語(yǔ)種艙模搜索艙模庫(kù),在相同記錄與新加語(yǔ)種相應(yīng)的字段存入。繼續(xù)其它句艙的檢測(cè)直到全句對(duì)句艙檢測(cè)完畢。當(dāng)前艙模是當(dāng)前句對(duì)例最后一個(gè)句艙,因而全句對(duì)句艙檢測(cè)完畢,當(dāng)前句艙套回當(dāng)前艙模,全句對(duì)的骼例式如下:I{the American}2{economic}system is, organized around3{a basicallyprivate-enterprise},4{market-oriented economy}in which5{consumers}largelydetermine6{what shall be produced}by7{(2301)spending their money ini[themarketplace]for those2[goods and services]that3[they wantmost]}.
1{美國(guó)的}2{經(jīng)濟(jì)}是以3{基本的私有企業(yè)}和4{市場(chǎng)導(dǎo)向經(jīng)濟(jì)}為架構(gòu)的,在這種2{經(jīng)濟(jì)}中,5{消費(fèi)者}很大程度上通過(guò)7 {(2301)在I[市場(chǎng)上]為那些3[他們最想要]的2 [貨物和服務(wù)]付費(fèi)}來(lái)決定6 {什么應(yīng)該被制造出來(lái)}。(四)、收存意群串108:這里將涉及的具特別意義的概念定義及提要如下意群一意群是自然語(yǔ)言的字、詞、詞組或短語(yǔ)之“意”的對(duì)等和統(tǒng)一;是人類(lèi)思維活動(dòng)的基本單元。意群無(wú)語(yǔ)種之限,屬于全人類(lèi);也隨人類(lèi)社會(huì)發(fā)展而代謝著。意群串一意群在語(yǔ)言文字里相應(yīng)的表示稱(chēng)意群文字串,簡(jiǎn)稱(chēng)意群串。拼音文字的意群串分單串、復(fù)串兩種;只含有一個(gè)原有詞串的為單串;由兩個(gè)或兩個(gè)以上原有詞串組成,并用“”相連為復(fù)串。意群對(duì)齊一意群對(duì)齊方法是利用意群的跨語(yǔ)種特征,將多語(yǔ)種的字、詞、詞組或短語(yǔ)等在當(dāng)前句對(duì)實(shí)例支持下進(jìn)行語(yǔ)義對(duì)齊,對(duì)齊之后它們便成為意群串,就有資格存貯于意群串庫(kù)。主要有如下一些方法:①組復(fù)詞一根據(jù)當(dāng)前句對(duì)、句艙語(yǔ)意判斷,如其一需要原有兩個(gè)詞條或更多詞條合并,語(yǔ)意才等于另一時(shí),前者以將它們相連合并為一個(gè)詞條,稱(chēng)為復(fù)詞。或者說(shuō):當(dāng)兩個(gè)或兩個(gè)以上原有詞串的總語(yǔ)義不能由詞串義相加獲得的以”相連成復(fù)詞(復(fù)串):knew_nothing_about_it 一無(wú)所知compel Ied_to_go 非去不可Late_at_night 深夜works_little 工作懶散其中“works little” “工作懶散”,雖然“works”有“工作”之義,但“ little”沒(méi)有“懶散”之意;它們的總語(yǔ)義不能由詞串義相加獲得,以“_”相連,組為復(fù)詞。②依照當(dāng)前句對(duì)例、延伸或增補(bǔ)詞義Nothing can bel{wholly beautiful}that is not2{useful}.
凡是未經(jīng)2 {應(yīng)用的}就不可能I {完美}。其中"useful"詞義有“有用的、有幫手的、有益的”;在該句對(duì)確實(shí)表達(dá)了 “應(yīng)用的”語(yǔ)義;同時(shí)“應(yīng)用的” 和“有用的”詞義接近,增補(bǔ)或延伸詞義項(xiàng)“應(yīng)用的”。I{She}was2{strong}, for allI{she}was so3{small}.
1{她}雖然3{瘦小},但很2{結(jié)實(shí)}。其中“small小的”,據(jù)該句對(duì)例增補(bǔ)“瘦小”詞義項(xiàng)。③不改變?cè)凶?、單詞的前提下加減串長(zhǎng)度,便于拼接I ask you to teach me every other day.我請(qǐng)你每隔一天來(lái)教我。其中"teach" v有“講授、教授”詞義;減詞串長(zhǎng)為“教”,增加“教”詞義項(xiàng)。④粘帶附隨詞串如“good好”粘帶成“好處、好事、好心”等。如“word詞”粘帶成“詞兒”等。⑤詞形變化另作詞條錄入于庫(kù)(分詞,比較級(jí)等表達(dá)的語(yǔ)意,增加詞條和相應(yīng)詞義)。
been增補(bǔ)“還是、怎么樣”詞義;puniShed增補(bǔ)“受處分”詞義;意群對(duì)齊方法與配句骼運(yùn)作、查配標(biāo)運(yùn)作一樣重要,也是本技術(shù)方法不可或缺的內(nèi)容之一。意群串庫(kù)與傳統(tǒng)的詞典、電子詞典有重合之處,原有詞匯基本上都被收錄;不同之處就與意群對(duì)齊相關(guān),有詞形變化的詞匯以新詞條登錄,意群對(duì)齊使得相對(duì)詞條數(shù)量增力口,并為可拼接貢獻(xiàn)很大。其中復(fù)詞,術(shù)語(yǔ)都能被涵蓋。續(xù)前;參照經(jīng)上述識(shí)別、句艙標(biāo)注后的語(yǔ)意匹配表,將句艙或艙眼中已經(jīng)語(yǔ)意對(duì)等的雙語(yǔ)詞串確定為意群串,逐對(duì)存貯于意群串庫(kù)109相應(yīng)語(yǔ)種構(gòu)件字段。當(dāng)前句對(duì)的比對(duì)提取結(jié)束,接續(xù)SI ;讀句配骼。以句艙和艙眼標(biāo)號(hào)為序,逐對(duì)句艙或艙眼搜索,參照語(yǔ)意匹配表,相應(yīng)內(nèi)容在匹配表里A語(yǔ)字段和B語(yǔ)字段不空的記錄是A、B語(yǔ)言文字語(yǔ)意對(duì)等的,已經(jīng)成為意群串,將它們逐記錄取出,分別存貯到意群串庫(kù)109同記錄相應(yīng)語(yǔ)種字段內(nèi)。如經(jīng)上述處理后的骼例式句對(duì)例:I{dyslexia}first was recognized in2{Europe}and3{the United_States}morethan4{80years}ag0.
4{80多年}以前在2{歐洲}和3{美國(guó)}第一次發(fā)現(xiàn)I {讀寫(xiě)困難癥}。逐對(duì)句艙或艙眼搜索,參照語(yǔ)意匹配表,相應(yīng)內(nèi)容在匹配表里A語(yǔ)字段和B語(yǔ)字段不空的記錄是A、B語(yǔ)言文字語(yǔ)意對(duì)等的。例如其中“dyslexia讀寫(xiě)困難癥”、“Europe歐洲”、“UnitecLStates美國(guó)”、“years多年”,它們是意群在不同語(yǔ)言文字里的表示,是自然語(yǔ)言的字、詞、詞組或短語(yǔ)之“意”的對(duì)等和統(tǒng)一;所以是意群串,即意群串構(gòu)件。然后逐記錄(逐對(duì))將它們保存到意群串庫(kù)109相應(yīng)語(yǔ)種構(gòu)件字段。意群串庫(kù)109由于拼首文字的意群串分單串、復(fù)串兩種;有相應(yīng)的單串庫(kù)和復(fù)串庫(kù)。表意文字據(jù)語(yǔ)義隨拼音文字的串被存放在單串庫(kù)或復(fù)串庫(kù);存入前先搜索,查無(wú)再加入免重。單串庫(kù)有“英單串”、“中單串”、“俄單串”等多語(yǔ)種單串字段,分別存貯相應(yīng)語(yǔ)種意群?jiǎn)未煌涗浀亩嗾Z(yǔ)種單串語(yǔ)意相同。如“dyslexia讀寫(xiě)困難癥”、“Europe歐洲”等等。復(fù)串庫(kù)有“英復(fù)串”、“中復(fù)串”、“俄復(fù)串”等多語(yǔ)種復(fù)串字段,分別存貯相應(yīng)語(yǔ)種意群復(fù)串;同記錄的多語(yǔ)種復(fù)串語(yǔ)意相同。如“United_States美國(guó)”、“ lose_touch_with互不來(lái)往”、“strike_a_balance衡量得失”等等。第二輪語(yǔ)意比對(duì)提取的意群串以已標(biāo)語(yǔ)種句為模板,獲得新加語(yǔ)種意群串后,以已標(biāo)語(yǔ)種意群串搜索單串庫(kù)或復(fù)串庫(kù),在相同記錄與新加語(yǔ)種相應(yīng)的單串或復(fù)串字段存入。當(dāng)前句對(duì)例的句艙、艙眼內(nèi),所有語(yǔ)意匹配(語(yǔ)意對(duì)齊)后的意群串,貯存于意群串庫(kù)之后,當(dāng)前句對(duì)例語(yǔ)意比對(duì)提取表意構(gòu)件結(jié)束,接續(xù)步驟(一)、讀句配骼;讀入下一個(gè)句對(duì)例,繼續(xù)上述運(yùn)作。上文表意構(gòu)件提取方法是以中英雙語(yǔ)為例、面向雙語(yǔ)句對(duì)庫(kù)進(jìn)行。進(jìn)行語(yǔ)意比對(duì)、識(shí)別、提取若干表意構(gòu)件。每輪比對(duì)、識(shí)別、提取工作選取A、B兩個(gè)語(yǔ)種;語(yǔ)種A分配給拼音文字或已經(jīng)比對(duì)、識(shí)別、提取過(guò)的語(yǔ)種。語(yǔ)種B分配給表意文字,也可分配給拼音文字或新加入的語(yǔ)種。第一輪比對(duì)、識(shí)別、提取工作取中英雙語(yǔ)句對(duì),為核心對(duì);A語(yǔ)種是英語(yǔ),B語(yǔ)種是漢語(yǔ)。從第二輪開(kāi)始,每輪增加一個(gè)新語(yǔ)種,另一個(gè)必須是已經(jīng)經(jīng)過(guò)比對(duì)、識(shí)別、提取過(guò)的語(yǔ)種。然而,第二輪開(kāi)始,比對(duì)、識(shí)別、提取工作的運(yùn)作有所不同。是以已經(jīng)經(jīng)過(guò)比對(duì)、識(shí)另IJ、提取過(guò)的A語(yǔ)為模板,進(jìn)行識(shí)別、標(biāo)注句艙,獲取句骼等。例例如第二輪新加語(yǔ)種是俄語(yǔ)為語(yǔ)種B ;語(yǔ)種A是已經(jīng)經(jīng)過(guò)比對(duì)、識(shí)別、提取的中文漢語(yǔ)。取中俄句對(duì):約翰象亨利一樣努力工作嗎?Pa 6 O T a eT^iKOHTaKyc epHOKaKTeHJiH 然而以中文句搜索句骼庫(kù),獲得匹配句骼“ [I]+象+[4]+ —樣+[3] + [2]+嗎? ” ;將中文句例套入成為骼例式,如:1{約翰}象4{亨利} 一樣3{努力}2{工作}嗎?接著根據(jù)相應(yīng)查配標(biāo)運(yùn)作后的匹配表,逐句艙取出,如取出句艙I的“約翰”,通過(guò)匹配表找到俄語(yǔ)相應(yīng)的“ P a 6 0 T a e T ”,將它標(biāo)注為句艙1,如:
l{Pa SoTa eTjfliKOHTaKyc epHO KaKTeHJTH 同樣的方法取出句艙4的“亨利”,通過(guò)匹配表找到俄語(yǔ)相應(yīng)的“reHJTH”,將它標(biāo)注為句艙4,如:l{Pa60TaeT}JIiKOHTaKyc e pho k a k4{T eHJin} 同樣的方法取出句艙3的“努力”,通過(guò)匹配表找到俄語(yǔ)相應(yīng)的“ y c e p H 0 ”,將它標(biāo)注為句艙 3, $P:l{Pa 6 0 T a e t},H;>koht a K3{y c e pho}KaK4{reHJTH} 最后取出句艙2的 “工作”,通過(guò)匹配表找到俄語(yǔ)相應(yīng)的“JI* O H”,將它標(biāo)注為句艙2,如:l{Pa 6 o t a e t } 2 { JI * o h } t a k 3 { y c e pho}KaK4{reHJTH} 然而移去句艙所剩部分為句骼構(gòu)件。獲得新語(yǔ)種俄語(yǔ)句骼: “ [I] + [2] + T a K + [3] + KaK+ [4] + ”利用A語(yǔ)句骼“ [I] +象+ [4] + —樣+ [3] + [2] +嗎? ”查詢句骼庫(kù),然后在A語(yǔ)句骼所在記錄的“俄句骼”字段,填入新得的俄文句骼“[1] + [2]+t a k+[3] + k a K+[4]+ ”。當(dāng)前句骼庫(kù)的“英、中、俄”三個(gè)語(yǔ)種句骼分別是:Does+[I]+[2]+as+[3]+as+[4]+ [I] +象+[4]+ —樣+[3] + [2]+嗎 [I] + [2] + t a k+[3] + k a k + [4] + 其它表意構(gòu)件的比對(duì)、識(shí)別、提取如此類(lèi)推。在上文所述表意構(gòu)件提取方法的運(yùn)作過(guò)程中,提取出句骼、艙模、意群串、小習(xí)語(yǔ)四種表意構(gòu)件,被分別存貯在相應(yīng)的句骼庫(kù)、艙模庫(kù)、意群串庫(kù)、習(xí)語(yǔ)庫(kù)里面。它們的特征是:I)句骼構(gòu)件是移去句艙后留下的句子的骨骼和框架部分,句骼庫(kù)用以存貯句骼構(gòu)件,有句骼碼、英句骼、中句骼、俄句骼字段,同記錄的各語(yǔ)種句骼字段存貯相應(yīng)語(yǔ)種句骼,它們的語(yǔ)義相同,句骼碼是它們語(yǔ)義和位次的表示。同記錄的各語(yǔ)種句骼,它們的語(yǔ)義相同決定于每輪比對(duì)、識(shí)別、提取利用一個(gè)語(yǔ)種對(duì),第二輪開(kāi)始,每次增加一個(gè)語(yǔ)種,句骼庫(kù)增設(shè)相應(yīng)語(yǔ)種構(gòu)件字段;比對(duì)、識(shí)別、提取出來(lái)的新句骼存放到相應(yīng)語(yǔ)種構(gòu)件字段,如此的比對(duì)、識(shí)別、提取方法以及軟件運(yùn)作保證同記錄的表意構(gòu)件語(yǔ)義相同。加之?dāng)?shù)據(jù)庫(kù)的特點(diǎn),使得同記錄的各成分之間互相影射,包括各語(yǔ)種構(gòu)件字段以及句骼碼,只要搜索到其中之一,就可以取出相應(yīng)語(yǔ)種構(gòu)件字段內(nèi)容。2)艙模構(gòu)件是移去艙眼后留下的句艙的骨骼和框架部分,艙模庫(kù)用以存貯艙模構(gòu)件,有艙模碼、英艙模、中艙模、俄艙模字段,同記錄的各語(yǔ)種艙模字段存貯相應(yīng)語(yǔ)種艙模,它們的語(yǔ)義相同,艙模碼是它們語(yǔ)義和位次的代表。艙模庫(kù)具句骼庫(kù)相同的同記錄語(yǔ)種構(gòu)件字段語(yǔ)義相同且相互影射的特征。3)意群串構(gòu)件是填充句艙或艙眼的成分,意群庫(kù)用以存貯意群串構(gòu)件,有意群碼、英群串、中群串、俄群串字段,同記錄的各語(yǔ)種意群串字段存貯相應(yīng)語(yǔ)種意群串,它們的語(yǔ)義相同,意群串碼是它們語(yǔ)義和位次的代表。意群串庫(kù)也具句骼庫(kù)相同的同記錄語(yǔ)種構(gòu)件字段語(yǔ)義相同且相互影射的特征。4)小習(xí)語(yǔ)構(gòu)件是一類(lèi)不能劃分出句骼句艙的特殊句子,習(xí)語(yǔ)庫(kù)用以存貯小習(xí)語(yǔ)構(gòu)件,有習(xí)語(yǔ)碼、英習(xí)語(yǔ)、中習(xí)語(yǔ)、俄習(xí)語(yǔ)字段,同記錄的各語(yǔ)種習(xí)語(yǔ)字段存貯相應(yīng)語(yǔ)種習(xí)語(yǔ),它們的語(yǔ)義相同,習(xí)語(yǔ)碼是它們語(yǔ)義和位次的表示。習(xí)語(yǔ)庫(kù)也具句骼庫(kù)相同的同記錄語(yǔ)種構(gòu)件字段語(yǔ)義相同且相互影射的特征。5)表意構(gòu)件是不同語(yǔ)言文字以表意進(jìn)行關(guān)聯(lián)的具體體現(xiàn),是大小不等形態(tài)結(jié)構(gòu)不同的語(yǔ)義塊,它們也是多種語(yǔ)言文字表意的對(duì)等和統(tǒng)一。同時(shí),表意構(gòu)件是大小不等結(jié)構(gòu)不同的可以拆卸、組裝、拼接的語(yǔ)義塊。包括句骼構(gòu)件、艙模構(gòu)件、意群串構(gòu)件和小習(xí)語(yǔ)構(gòu)件四種;有相應(yīng)的句骼庫(kù)、艙模庫(kù)、意群串庫(kù)和習(xí)語(yǔ)庫(kù),它們共同構(gòu)成表意構(gòu)件數(shù)據(jù)庫(kù),四庫(kù)之間相互獨(dú)立。6)第二輪開(kāi)始的識(shí)別提取,事先應(yīng)在上述這四個(gè)庫(kù)內(nèi)分別增設(shè)新語(yǔ)種的構(gòu)件字段。7)以表意構(gòu)件及其數(shù)據(jù)庫(kù)支持語(yǔ)言文字信息處理;可以獲得不同語(yǔ)言文字之間以表意進(jìn)行關(guān)聯(lián)的信息;利于語(yǔ)言文字信息處理逾越“語(yǔ)義障礙”的有益效果??梢灾С终Z(yǔ)言文字信息處理多種場(chǎng)合。用形象化語(yǔ)言描述,句骼構(gòu)件如同汽車(chē)底盤(pán),給駕駛室、車(chē)輪、動(dòng)力系統(tǒng)、供油系統(tǒng)等等留有恰到好處的空間和接洽件。艙模構(gòu)件如同駕駛室,里面還包括其它小系統(tǒng)和部件。意群串構(gòu)件如同車(chē)輪、其它種種小系統(tǒng)、集合件、組件等等;可以裝配的任何需要的部位。小習(xí)語(yǔ)則是一類(lèi)特殊的、僅具基本車(chē)特性的它種車(chē),以至人力車(chē)、手推車(chē)等等。二、一種基于表意構(gòu)件的機(jī)譯人?;?dòng)翻譯方法:結(jié)合附圖2,機(jī)譯人?;?dòng)翻譯流程圖,以英譯中為例,將本機(jī)譯人?;?dòng)翻譯方法進(jìn)一步說(shuō)明如下。讀入源語(yǔ)待譯文件201,存于緩存區(qū)。隨后進(jìn)入如下四大模塊步驟:(一)、讀句、配骼、源語(yǔ)句套入202,讀入源語(yǔ)句子,以源語(yǔ)句搜索句骼庫(kù),進(jìn)入如同上文的配句骼運(yùn)作:例如讀入源語(yǔ)一個(gè)待譯句子:Oliver Twist was born in workhouse ;there were no aunts,no sisters,nocousins,no grand—mothers.
把當(dāng)前句例從左到右英逐單詞中逐字取下搜索句骼串表(含骼首、句骼、句骼碼字段)的骼首字段(英含句骼詞串第一個(gè)單詞或符號(hào);中含第一個(gè)字)并存于臨時(shí)表,再逐記錄取出臨時(shí)表內(nèi)容,以句骼詞段查詢句對(duì)例,句骼串的每段都可以在句對(duì)例中查到且次序相同為匹配句骼,再根據(jù)句骼串表的句骼碼字段取出相應(yīng)語(yǔ)種句骼。句骼碼以句骼庫(kù)標(biāo)志碼加記錄號(hào)組成;其它索引表類(lèi)推。如本例再根據(jù)句骼碼字段到句骼構(gòu)件庫(kù)取出源、目語(yǔ)句骼如下:“[l]+was born in+[2]+ ;there were no+[3]+,no+[4]+,no+[5]+,no+[6]+.,,“ [I] + 出生于 + [2] + ;沒(méi)有 + [3] +,沒(méi)有 + [4] +,沒(méi)有 + [5] +,沒(méi)有 + [6] +?!比缓髮⒃凑Z(yǔ)句子對(duì)號(hào)入座地套入源語(yǔ)句骼,所謂對(duì)號(hào)入座如該例第一個(gè)句骼詞段“wasborn in”與句例中的相應(yīng)段“was born in”對(duì)號(hào),句豁詞段“;there were no”與句例中的相應(yīng)段“ ;there were no”對(duì)號(hào)等等如“黑體”部分:
[I]+was born in+[2]+; there were no+[3]+,no+[4] +, no+[5]+, no+[6]+.0liver Twist was born in workhouse ; there were no aunts,no sisters, no cousins,no grand—mothers.
句例中的相應(yīng)段之外部分(斜體)分別入座到相應(yīng)句艙去(即成為骼例式),如“ O/imr7Vi對(duì)”入座到句艙[I]入座到句艙[2]入座到句艙[3];
等,使成為源語(yǔ)句骼例結(jié)合形式。如:
I {Oliver Twist} was born in 2{workhouse} ; there were no 3{aunts} , no 4{sisters},no 5 {cousins} , no 6{grand—mothers} 將源語(yǔ)句子對(duì)號(hào) 入座地套入源語(yǔ)句骼后,進(jìn)行艙檢測(cè),若是有模句艙再搜索艙模庫(kù)、套入艙模并納入句骼,使成為源語(yǔ)句骼例結(jié)合形式。該步驟結(jié)束。( 二)、句艙或艙眼內(nèi)容轉(zhuǎn)移203,從源語(yǔ)句的骼例式中逐個(gè)取出句艙或艙眼內(nèi)容,轉(zhuǎn)移到目語(yǔ)句骼相應(yīng)的句艙或艙眼里,使之成為源、目語(yǔ)過(guò)渡式:用前面含有模句艙之例,其源語(yǔ)的骼例式如:I{the American}2{economic}system is, organized around3{a basicallyprivate-enterprise},4{market-oriented economy}in which5{consumers}largelydetermine6{what shall be produced}by7{(2301)spending their money ini[themarketplace]for those2[goods and services]that3[they want most]}.
目語(yǔ)句骼相應(yīng)的句艙或艙模如:{1}⑵是以{3}和{4}為架構(gòu)的,在這種⑵中,{5}很大程度上通過(guò)7 {(2301)在[I]為那些[3]的[2]付費(fèi)}來(lái)決定{6}。然后從源語(yǔ)句的骼例式中逐個(gè)取出句艙或艙眼內(nèi)容,轉(zhuǎn)移到目語(yǔ)句骼相應(yīng)的句艙或艙眼里。如取出句艙I的內(nèi)容“theAmerican”,轉(zhuǎn)移到目語(yǔ)句骼相應(yīng)的句艙I “{I}”里;取出句艙2的內(nèi)容“economic”,轉(zhuǎn)移到目語(yǔ)句骼相應(yīng)的句艙2 “⑵”里;……;取出句艙7中艙眼I的內(nèi)容“the marketplace”,轉(zhuǎn)移到目語(yǔ)句骼相應(yīng)句艙7的相應(yīng)艙眼I “[I]”里,等等如此類(lèi)推。使之成為源、目語(yǔ)過(guò)渡式如:I{the American}2{economic}是以 3 {a basically private-enterprise}和4 {market-oriented economy}為架構(gòu)的,在這種 2 {economic}中,5 {consumers}很大程度上通過(guò)7 {(2301)在I [the marketplace]為那些3 [他們最想要]的2 [goods andservices]付費(fèi)}來(lái)決定 6 {what shall be produced}。如此,使之成為源、目語(yǔ)過(guò)渡式。該步驟結(jié)束。(三)、存查得項(xiàng)、預(yù)選、給出目語(yǔ)待校句204,逐個(gè)取出目語(yǔ)過(guò)渡式中句艙或艙眼的源語(yǔ)詞串,查詢意群串庫(kù),無(wú)詞間間隔的表意文字則以從左到右可能的排列作為詞串查詢意群庫(kù),二者所有查得項(xiàng)存于更正表。更正表至少有詞串段、搜索串、解釋、串首位字段。續(xù)上例,如取出“American”,查詢意群串庫(kù),獲得“美國(guó)”、“美國(guó)人”、“美洲人”、“美國(guó)的”、“美洲的”;“American”存入搜索串字段;“美國(guó)”、“美國(guó)人”等存入解釋字段;詞串段字段填I(lǐng) ;串首位字段填8 (包括空格居第8個(gè)字符位)。共有5個(gè)解釋?zhuān)?個(gè)記錄。再取出“economic”并存入搜索串字段,查詢意群串庫(kù),獲得“經(jīng)濟(jì)的”、“經(jīng)濟(jì)學(xué)的”、“產(chǎn)供銷(xiāo)的”等并存入解釋字段(更正表又增加了 3個(gè)記錄);詞串段字段填2(它們是第2段);串首位字段填22;以下如此類(lèi)推。利用預(yù)選模塊402搜索,若有改選記錄的將其在更正表中換位到詞串段之首。如上例,機(jī)器運(yùn)作到預(yù)選模塊之前目語(yǔ)句為(注意斜體字):1 {美國(guó)} 2 {經(jīng)濟(jì)}是以3 {基本上私有企業(yè)}和4 {市場(chǎng)導(dǎo)向經(jīng)濟(jì)}為架構(gòu)的,在這種2 {經(jīng)濟(jì)}中,5 {消費(fèi)者}很大程度上通過(guò)7 {(2301)在1 [市場(chǎng)上]為那些3[他們 想要 最的2 [貨物和服務(wù)]付費(fèi)}來(lái)決定6 {什么應(yīng)該被制造出來(lái)}。預(yù)選模塊402之中要搜索經(jīng)驗(yàn)選詞庫(kù)405 (含英串、中解釋字段)和中文詞序庫(kù)408 (含原序、更正序字段);其中句艙I “American”在經(jīng)驗(yàn)選詞庫(kù)405記錄有改選“美國(guó)的”的記錄;這時(shí)更正表“美國(guó)的”處第4個(gè)記錄,是第I個(gè)詞串段,該段首是“美國(guó)”,因而將“美國(guó)的”置換“美國(guó)”(因最后給出的只是段首記錄)。類(lèi)似,句艙3中的“basically”有改選“基本的”的記錄;句艙7的艙眼3內(nèi)容在中詞序庫(kù)408有更正序?yàn)椤八齻冏钕胍钡挠涗?;然而,?jīng)預(yù)選模塊運(yùn)作后,相應(yīng)句艙、艙眼自動(dòng)更正之后,預(yù)選后的保留句艙艙眼標(biāo)志標(biāo)號(hào)的目語(yǔ)待校句;顯示待校句416,如:1{美國(guó)的}{經(jīng)濟(jì)}是以3{基本的私有企業(yè)}和4{市場(chǎng)導(dǎo)向經(jīng)濟(jì)}為架構(gòu)的,在這種2{經(jīng)濟(jì)}中,5{消費(fèi)者}很大程度上通過(guò)7{(2301)在1[市場(chǎng)上]為那些3[他們 最,想要]的2 [貨物和服務(wù)]付費(fèi)}來(lái)決定6 {什么應(yīng)該被制造出來(lái)}。相應(yīng)的源語(yǔ)參考句如:l{theAmerican} 2 {economic} system is, organizedaround3 {abasically private-enterprise},4{market-oriented economy}inwhich5{consumers}largely determine6{what shall be produced}by7{(2301)spendingtheir money ini [the marketplace]for those2[goods and services]that they wantmost}.
顯示給出待校句同時(shí),顯示“返回”、“繼后”、“←移”、“移→”、“ ▲”、“∧”、“修辭”命
令按鈕以及相應(yīng)的源語(yǔ)參考句;作好接受用戶更正操作的準(zhǔn)備。本模塊步驟結(jié)束。以上(一)到(三)模塊步驟都在計(jì)算機(jī)全自動(dòng)狀態(tài)下完成,也就是本方法名稱(chēng)“一種機(jī)譯人?;?dòng)翻譯方法”的“機(jī)譯”部分;接著,下文模塊步驟(四)是“人?!辈糠?,人校之中也是互動(dòng)、交互,確保獲得快捷簡(jiǎn)便的使用效果。(四)、語(yǔ)意校正,自學(xué)習(xí)205;又如圖3語(yǔ)意校正模塊流程圖所示,上文模塊步驟運(yùn)作后,給出了目語(yǔ)待校句、按鈕以及源語(yǔ)參考句301,為語(yǔ)意校正作好了準(zhǔn)備。當(dāng)用戶讀到目語(yǔ)待校句和相應(yīng)的源語(yǔ)參考句后開(kāi)始校正操作,系統(tǒng)的校正模塊借更正表進(jìn)行語(yǔ)意校正運(yùn)作,自學(xué)習(xí)模塊401聯(lián)動(dòng),對(duì)校正過(guò)程的人機(jī)互動(dòng)進(jìn)行學(xué)習(xí)、記憶且為預(yù)選模塊提供數(shù)據(jù)。下文根據(jù)實(shí)例進(jìn)一步說(shuō)明如下:A)不妥詞串的替換302:例如,當(dāng)用戶讀到的待校句及相應(yīng)的源語(yǔ)參考如:“如果你I {買(mǎi)到那一棟房子},你是否將在3 {那里}渡過(guò)2 {你的晚年} ”“if youl {buy that home} , will you spend2 {the_rest_of_your_life} 3{there} ”當(dāng)用戶認(rèn)為待校句某詞串“那一”不妥時(shí),單擊它系統(tǒng)搜索更正表,彈出下拉列表給出全部相關(guān)查得項(xiàng)待選。根據(jù)被擊詞串,及其所在待校句的字符位置數(shù)查詢搜索串、串首位字段,符合記錄以下拉列表給出;如“那個(gè)、由于、那、那么”等等。當(dāng)列表某項(xiàng)被用戶單擊,例如“那”被單擊,以“那”置換待校句當(dāng)前不妥詞串“那個(gè)”;并在更正表中將“那”和“那個(gè)” 2記錄內(nèi)容換位;由于“那”、“那個(gè)”不等長(zhǎng),還要修改以后記錄“串首位”字段之值。當(dāng)“返回”按鈕被單擊,將上述更正相關(guān)信息記錄于經(jīng)驗(yàn)選詞庫(kù)備預(yù)選模塊搜索使用;最后返回,進(jìn)行下一句的翻譯運(yùn)作。B)連續(xù)句艙的切分303——當(dāng)遇到?jīng)]有參照無(wú)法自動(dòng)進(jìn)行切分的連續(xù)句艙給出、等待操作者干預(yù),例如連續(xù)句艙含2個(gè)詞串,兩個(gè)句艙各取其一,自動(dòng)切分。又例如兩個(gè)句艙相連,其中之一又是重復(fù)句艙,參考重復(fù)句艙的另一個(gè),將連續(xù)句艙內(nèi)容劃出與重復(fù)句艙相同部分,剩下部分即屬于連續(xù)句艙之中的另一個(gè)。例如待譯句“When will he go there, tomorrow or some_other_day ” 運(yùn)作時(shí)半途停下,出現(xiàn)連續(xù)句艙“I {2 {he go there}”,沒(méi)有參照無(wú)法自動(dòng)切分;所以顯示“連續(xù)句艙,請(qǐng)單擊切分點(diǎn):”:“I {2 {he go there} ” 以及如下信息:when willl{2{he go there},3{tomorrow}or4{some_other_day} [I] +什么時(shí)候 +[2]+,+[3]+還是+[4]+ 顯然,應(yīng)將“he go there”切分為“he”, “go there” ;分別被放到[I] +什么時(shí)候+ [2]中去。當(dāng)“he gothere”被單擊后以被單擊點(diǎn)為切分點(diǎn)將兩個(gè)句艙內(nèi)容分開(kāi);成為:“when willl {he} 2 {go there}, 3 {tomorrow} or4 {some_other day} ,,繼續(xù)運(yùn)作。C)干預(yù)另選句骼304—當(dāng)遇到句艙和艙眼不勻稱(chēng)、有殘缺、或堆疊之錯(cuò)選句骼表現(xiàn)時(shí),或用戶不認(rèn)可當(dāng)前譯句時(shí)單擊“繼后”按鈕,系統(tǒng)把多對(duì)匹配句骼給出待選,以單擊選取后的句骼重新套入接續(xù)S6繼續(xù)運(yùn)作;例如待譯句:I went to see_my_doctor for a check-up yesterday.
自動(dòng)給出待校句為:我去看I {我去了 ■請(qǐng)醫(yī)生的■體格檢查昨天}。I{I went to see_my_d octor for a check-up yesterday}.
參考句全部?jī)?nèi)容堆疊到一個(gè)句艙;起碼的“句子有句骼、句艙兩個(gè)部分”都不支持;自動(dòng)選句骼有誤,“繼后”按鈕接受到用戶單擊;把多對(duì)匹配句骼給出待選;當(dāng)用戶另選一個(gè)句骼后,繼續(xù)運(yùn)作給出待校句以及相應(yīng)源語(yǔ)參考句為:3{昨天}我去I {請(qǐng)醫(yī)生}作了 2 { ■體格檢查}。Iwent toI{see_my_doctor}for2{a check-up}3{yesterday}.
根據(jù)上述命令按鈕被用戶單擊由判別和后續(xù)313接續(xù)相應(yīng)后續(xù)運(yùn)作。D)補(bǔ)加意群串305——當(dāng)不妥詞串另選替換而缺失時(shí),接受用戶使用延伸詞義、粘帶前引或后隨字詞等意群對(duì)齊方法補(bǔ)加意群串,以補(bǔ)加串進(jìn)行替換并補(bǔ)加于意群串相應(yīng)語(yǔ)種構(gòu)件字段。例如待譯句:·
Now doctors have di scovered a cause of u I cers.
自動(dòng)給出的待校句為:I {現(xiàn)在doctors}發(fā)現(xiàn)了一種導(dǎo)致2 {潰瘍}的原因。當(dāng)用戶單擊“doctors”時(shí)更正表中找不到待選項(xiàng);當(dāng)用戶選中查詞典時(shí)給出“doctors是名復(fù)或動(dòng)3”提示。本方法規(guī)定,凡有詞形變化的作為新詞登錄。然而接受用戶輸入“醫(yī)生們”為“doctors”和“醫(yī)生們”補(bǔ)加為意群串,存入意群串庫(kù)。同時(shí)待譯句更換成:1{現(xiàn)在醫(yī)生們}發(fā)現(xiàn)了一種導(dǎo)致2{潰瘍}的原因。根據(jù)上述命令按鈕被用戶單擊由判別和后續(xù)313接續(xù)相應(yīng)后續(xù)運(yùn)作。E)組選復(fù)串306——當(dāng)不妥詞串另選替換而缺失時(shí),接受用戶使用組復(fù)詞或改選復(fù)詞的方法補(bǔ)加復(fù)詞串,以補(bǔ)加串進(jìn)行替換并補(bǔ)加于意群串的復(fù)詞庫(kù)相應(yīng)語(yǔ)種構(gòu)件字段;例如待譯句:It usually happens before eating or during the night.
自動(dòng)給出的待校句和相應(yīng)源語(yǔ)句參考為:它通常出現(xiàn)在I {以前吃飯}或2 {在...的期間■夜晚}。it usually happensI{before eating}or2{during the night}.
當(dāng)用戶單擊這兩個(gè)句艙之一詞串時(shí),更正表列出的備選項(xiàng)用戶沒(méi)有選取,而是用拖放方法選中“before eating”接受用戶使用組復(fù)詞的方法將它們組成復(fù)串“飯前”,這里更換且補(bǔ)加于復(fù)詞庫(kù)。接著用戶又用拖放方法選中“during the night”自動(dòng)查詢復(fù)詞有“duringthe night夜里”給出;接受用戶單擊選用,這時(shí)的待校句更正為:它通常出現(xiàn)在1{飯前}或2{夜里}。根據(jù)上述命令按鈕被用戶單擊由判別和后續(xù)313接續(xù)相應(yīng)后續(xù)運(yùn)作。F)句艙詞序307——當(dāng)譯句句艙有詞序錯(cuò)誤時(shí),接受用戶單擊其中串,再單擊“一移”或“移一”命令按鈕,將單擊串前移或后移一個(gè)串位;例如待譯句:Doctors have been able to help lessen the pain of ulcers.
自動(dòng)給出的待校句和相應(yīng)源語(yǔ)句參考為:1{醫(yī)生們}早已能夠幫助2 {減輕■疼痛的潰瘍}。I{Doctors}have been able to help2{lessen the pain of ulcers}.
如果用戶單擊“疼痛”,再連續(xù)2次單擊“移一”按鈕,右移2次,待校句變成:1{醫(yī)生們}早已能夠幫助2{減輕■的潰瘍疼痛}。
接著用戶單擊“的”后單擊“移一”按鈕,待校句更正為:1{醫(yī)生們}早已能夠幫助2 {減輕■潰瘍的疼痛}。當(dāng)用戶單擊“返回”按鈕時(shí),先判別用戶使用“一移”或“移一”按鈕移動(dòng)了詞序,啟動(dòng)自學(xué)習(xí)模塊,將當(dāng)前移動(dòng)過(guò)的句艙,移前、移后內(nèi)容保存到“中詞序”庫(kù)。然后返回。G)編詞替換308——當(dāng)連續(xù)多串不妥,不能用單擊選中時(shí),用拖放操作選中選中串后,然后在編詞替換處填上其它詞串、編輯或?yàn)榭?,再單擊?Λ ”按鈕時(shí),系統(tǒng)以后者置換前者。例如待譯句:Alfred Herman, he shared thel91INobel Peace Prize for his work towardworld peace.
自動(dòng)給出的待校句和相應(yīng)源語(yǔ)句參考為:I {阿爾弗雷德赫爾曼},因2 {他}為4 {世界和平}所做的貢獻(xiàn),獲得3 {19兒諾貝爾 Peace Prize}。I{Alfred Herman},2{he}shared3{thel911Nobel Peace Prize}for his worktoward4{world peace}.
當(dāng)用戶認(rèn)為“諾貝爾Peace Prize” ;并用拖放操作選中,系統(tǒng)將它們顯示于“選中串”和“編詞替換”字樣下的文本框;接受編輯為“年諾貝爾和平獎(jiǎng)”。當(dāng)“Λ”按鈕補(bǔ)單擊,以后者替換前者,更正待校句為:I {阿爾弗雷德赫爾曼},因2 {他}為4 {世界和平}所做的貢獻(xiàn),獲得3 {1911年諾貝爾和平獎(jiǎng)}。 根據(jù)上述命令按鈕被用戶單擊由判別和后續(xù)313接續(xù)相應(yīng)后續(xù)運(yùn)作。H)修辭309—當(dāng)出現(xiàn)不能用所列其它步驟處理的修辭現(xiàn)象時(shí),接受用戶單擊“修辭”按鈕,然后將當(dāng)前待校句復(fù)制到編輯框,接受用戶使用編輯的方法進(jìn)行修辭操作。例如待譯句或經(jīng)其它所列步驟處理后的修辭現(xiàn)象時(shí),如:Dickens’ language, at once rich colourful and varied, is like fine andsensitive musical instrument.
自動(dòng)給出的待校句和相應(yīng)源語(yǔ)句參考為:I {狄更斯的語(yǔ)言}既2{豐富多采}又3{變化多端},很象4 {精美而動(dòng)人的音樂(lè)的工具}。I(Dickensj language}, at once2{rich colourful}and3{varied},is like4{fineand sensitive musical instrument}.
當(dāng)用戶單擊“修辭”按鈕時(shí),將當(dāng)前待校句復(fù)制到編輯框,接受用戶使用編輯的方法進(jìn)行修辭操作。操作后的目語(yǔ)待校句為:I {狄更斯的語(yǔ)言}既2{豐富多采}又3{變化多端},很象4{精美而動(dòng)人的樂(lè)器}?!胺祷亍泵畎粹o除上文所述功能外,它在返回之前還會(huì)掃描專(zhuān)為修辭所設(shè)的編輯框;當(dāng)該編輯框不空時(shí),取該框內(nèi)容返回;要不取待校句返回。J)補(bǔ)量詞311—當(dāng)英譯中時(shí)由于英語(yǔ)無(wú)量詞而中文有量詞因而需要在待校句需要之處補(bǔ)上量詞,接受用戶單擊待校句的需補(bǔ)加處,系統(tǒng)搜索最接近單擊點(diǎn)的數(shù)串后中心名詞,當(dāng)“▲”按鈕同時(shí)被單擊,以中心名詞搜索量詞庫(kù),取出相應(yīng)量詞補(bǔ)加到待校句;如果量詞庫(kù)查無(wú),給出對(duì)話接受輸入給以補(bǔ)加并錄入量詞庫(kù)。例如待譯句:On Apri 124,1970,China successful Iy launched i ts first man-made earthsatellite.
自動(dòng)給出的待校句和相應(yīng)源語(yǔ)句參考為:1 {在四月24},2 {1970,中國(guó)}成功發(fā)射了 3 {第一人造地球衛(wèi)星}。1 {on April24},2 {1970, China}successfully launched its3{first man-madeearth satellite}.
當(dāng)用戶把數(shù)字串或數(shù)串之后的中心名詞利用拖放操作選中。例如用戶選中“人造地球衛(wèi)星”;系統(tǒng)將它們顯示于“選中串”和“編詞替換”下;當(dāng)用戶單擊命令按鈕“▲”時(shí),以中心名詞(這里是“衛(wèi)星”)搜索量詞庫(kù),取出相應(yīng)量詞,“顆”補(bǔ)加到待校句;這時(shí)的待校句變成:2 {1970}年1{在四月24},3 {中國(guó)}成功發(fā)射了 4 {第一顆人造地球衛(wèi)星}。如果量詞庫(kù)查無(wú),給出對(duì)話提示:“查無(wú);可在編詞替換下以‘量/名’形式加入?!比缭摾斎搿邦w/衛(wèi)星”即可。根據(jù)上述命令按鈕被用戶單擊由判別和后續(xù)313接續(xù)相應(yīng)后續(xù)運(yùn)作。以上A-H狀態(tài)步驟與語(yǔ)言文字的種類(lèi)無(wú)關(guān),具共性特點(diǎn),可以出現(xiàn)在多語(yǔ)種雙向翻譯之間;如英譯中或中譯英的雙向翻譯的過(guò)程中。J狀態(tài)步驟與語(yǔ)言文字種類(lèi)密切相關(guān),用于英譯中或其它語(yǔ)種譯成中文時(shí)使用。下文還有1、K狀態(tài)步驟與語(yǔ)言文字的種類(lèi)相關(guān)。I狀態(tài)步驟用于無(wú)詞間間隔表意文字的翻譯之中,例如中譯英洱狀態(tài)步驟用于中譯英。1-K都具個(gè)性特點(diǎn)根據(jù)具體語(yǔ)種設(shè)置。上文以英譯中為例說(shuō)明;下文Ι、κ出現(xiàn)在中譯英過(guò)程中。所以下文以相應(yīng)中譯英實(shí)例說(shuō)明:I)艙轉(zhuǎn)換310——當(dāng)中譯英時(shí)接受用戶單擊某句艙或艙眼內(nèi)容,搜索更正表所有當(dāng)前句艙或艙眼含有的查得項(xiàng),列表給出等待用戶多次有序的單擊選取,將它們置換待校句相應(yīng)句艙或艙眼內(nèi)容;例如待譯句:“理論在本質(zhì)上是對(duì)認(rèn)識(shí)了的現(xiàn)實(shí)的一種抽象和符號(hào)化的表達(dá)?!弊詣?dòng)給出的待校句和相應(yīng)源語(yǔ)句參考為:1 {essentially}, a2 {theory} is an3 {abstract}, 4 {符號(hào)化的表達(dá)} of what isconceived to be5{real ity}.
2 {理論}在I {本質(zhì)上}是對(duì)認(rèn)識(shí)了的5 {現(xiàn)實(shí)}的一種3 {抽象}和4 {符號(hào)化的表達(dá)}。待校句有4個(gè)句艙;其中3個(gè)句艙都已經(jīng)譯成英文;僅句艙4還保留著源語(yǔ)句艙內(nèi)容“4{符號(hào)化的表達(dá)}”當(dāng)用戶單擊該艙內(nèi)容“符號(hào)化的表達(dá)”時(shí),由于查詢意群庫(kù)生成更正表的過(guò)程中,無(wú)詞間間隔的表意文字從左到右可能的排列作為詞串查詢意群庫(kù),所有查得項(xiàng)存于更正表?!胺?hào)化的表達(dá)”被分為“符號(hào)”、“符號(hào)化”、“符號(hào)化的”、“的”、“表達(dá)”等中文詞串,查得項(xiàng)包含它們以及它們的相關(guān)英文解釋。供用戶根據(jù)英文習(xí)慣依次選取。這里用戶應(yīng)先選取“symbolic符號(hào)化的”;再選取“representation表達(dá)”;然而當(dāng)前句艙處理完畢,當(dāng)前待校句為:I{essentially},a2{theory}is an3{abstract},4{symbolic representation}ofwhat i s conceived to be5{reality}.
不管有無(wú)其它更正;系統(tǒng)都檢測(cè)上述命令按鈕和給出的相關(guān)框、表是否被用戶單擊來(lái)判別后續(xù)313,接續(xù)相應(yīng)后續(xù)運(yùn)作。K)補(bǔ)冠它312-當(dāng)中譯英時(shí)由于中文沒(méi)有冠詞、動(dòng)詞to/be、to/have區(qū)分等,在
中譯英時(shí),這些需要補(bǔ)加;在系統(tǒng)給出保留句艙標(biāo)志標(biāo)號(hào)的目語(yǔ)待校句時(shí),已經(jīng)顯示了 “a/an”、“the”、“t0/be”、“t0/haVe”、“###”,當(dāng)它們之一被單擊(“###”除外是結(jié)束標(biāo)志),待校句也被單擊時(shí),系統(tǒng)將它們之一在待校句被單擊處加上適當(dāng)形式的詞串;例如待譯句:我們累了,這是有目共睹的。自動(dòng)給出的待校句和相應(yīng)源語(yǔ)句參考為:1{我們累了 },as anyone can see.
1{我們累了 },這是有目共睹的。系統(tǒng)以“我們累了”可能排列查詢意群串庫(kù),將所有查得項(xiàng)保存于更正表備用戶選取。這里用戶會(huì)選取“we我們”和“tired累了” ;這時(shí)的待校句變成:I {we tired}, as anyone can see.
這樣的顯然不符合英語(yǔ)的要求。用戶會(huì)單擊“補(bǔ)冠它”下方列出的“a/an the to/be to/have###”其中的“to/be”;并且再單擊“we tired”中間的空格。系統(tǒng)判定這里需要“補(bǔ)冠它”操作,并且根據(jù)“to/be”的要求,這里應(yīng)插入動(dòng)詞“are”;然而當(dāng)前待校句變成為:I {we are tired},as anyone can see.
不管有無(wú)其它更正;系統(tǒng)都檢測(cè)上述命令按鈕和給出的相關(guān)框、表是否被用戶單擊來(lái)判別后續(xù)313,接續(xù)相應(yīng)后續(xù)運(yùn)作。上文邏列并說(shuō)明了需要更正的狀態(tài)步驟。還有一種情況,給出的待校句完全正確,操作者沒(méi)有單擊任何上述按鈕以及相關(guān)給出顯示的頁(yè)面控件,就單擊“返回”按鈕;即給出的待校句完全正確,無(wú)需更正的情況;這種情況并且會(huì)越用越多。需要補(bǔ)充說(shuō)明的是,上文所提及的待校句都是以保留了句艙、艙眼標(biāo)志、標(biāo)號(hào)的目語(yǔ)待校句形式給出的。當(dāng)“返回”命令按鈕被單擊返回,這些句艙、艙眼標(biāo)志、標(biāo)號(hào)以及不需要的空格都將棄去,與傳統(tǒng)方式一樣:如:“1 {we are tired}, as anyone can see.”;“ 2 {1970}年I {在四月24},3 {中國(guó)}成功發(fā)射了 4 {第一顆人造地球衛(wèi)星}?!钡鹊茸兂?“we are tired, as anyone can see.
在1970年四月24日,中國(guó)成功發(fā)射了第一顆人造地球衛(wèi)星?!钡鹊确祷?;給出到譯文框,以至最后生成目標(biāo)譯文輸出206。實(shí)施本發(fā)明所產(chǎn)生的軟件系統(tǒng)可以在現(xiàn)有的中型、小型、微、巨型計(jì)算機(jī),筆記本電腦、掌上電腦等單獨(dú)的或者相連成網(wǎng)的計(jì)算機(jī)上運(yùn)行實(shí)施??梢栽诟鞣N計(jì)算機(jī)網(wǎng)絡(luò),特別是在因特網(wǎng)上運(yùn)行實(shí)施。還可以在諸如“個(gè)人數(shù)字助理”,PDA(PerSonal DigitalAssistant),平板電腦、手機(jī)等裝置上運(yùn)行實(shí)施。本發(fā)明實(shí)施后的產(chǎn)品,可以應(yīng)用于需要和其它語(yǔ)種的人們進(jìn)行交流的工作、 學(xué)習(xí)、休閑、旅游等等場(chǎng)合;可以用于家庭、機(jī)關(guān)、學(xué)校以及各行各業(yè)涉及外文的場(chǎng)合。
權(quán)利要求
1.一種表意構(gòu)件識(shí)別提取方法,利用相同內(nèi)容的多語(yǔ)種或雙語(yǔ)文字版本的語(yǔ)料作句對(duì)齊后生成雙語(yǔ)句對(duì)庫(kù),其特征是進(jìn)一步根據(jù)不同語(yǔ)言文字的句子可以表達(dá)相同語(yǔ)意,以表意將不同語(yǔ)言文字進(jìn)行關(guān)聯(lián),不同語(yǔ)言文字的表意通過(guò)四種共同的表意構(gòu)件實(shí)現(xiàn),識(shí)別提取出這四種表意構(gòu)件包括如下步驟:句配骼102,句子由句骼和句艙兩部分組成,識(shí)別提取表意構(gòu)件每輪選取A、B兩種語(yǔ)言文字,計(jì)算機(jī)讀取雙語(yǔ)句對(duì)庫(kù)一個(gè)AB雙語(yǔ)句對(duì),以當(dāng)前雙語(yǔ)句對(duì)之一查詢句骼庫(kù)進(jìn)行配句骼運(yùn)作,有匹配句骼將雙語(yǔ)句對(duì)套入,并顯示“艙檢測(cè)”、“查配標(biāo)”按鈕, 當(dāng)套入后各句艙勻稱(chēng)、無(wú)殘缺、無(wú)堆疊現(xiàn)象且“艙檢測(cè)”按鈕被單擊,為肯定,已有匹配句骼,接續(xù)S3艙檢測(cè), 若套入后各句艙不勻稱(chēng)、有殘缺、或有堆疊現(xiàn)象且“查配標(biāo)”按鈕被單擊,為否定,表示對(duì)套入結(jié)果否定需要提取新句骼,系統(tǒng)進(jìn)入查配標(biāo)運(yùn)作,用A語(yǔ)句詞串查詢傳統(tǒng)電子詞典據(jù)B語(yǔ)句是否含有語(yǔ)義對(duì)應(yīng)詞串生成當(dāng)前句對(duì)語(yǔ)意匹配表,艙計(jì)數(shù)N = 0準(zhǔn)備提取新句骼;別及標(biāo)注句艙103,機(jī)器以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、以先后為序用N = N+1將它們預(yù)標(biāo)為句艙,預(yù)標(biāo)句艙使骼例比由100%逐步降低,這三種詞串標(biāo)注句艙結(jié)束后, 如骼例比高于50%,以所述語(yǔ)意匹配表為據(jù)將無(wú)冠名串或其它語(yǔ)義匹配串在有間隔的前提下逐個(gè)接續(xù)標(biāo)為句艙,接受操作者認(rèn)可、或更正或使用意群對(duì)齊運(yùn)作增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)識(shí)標(biāo)句艙, 直至上述識(shí)別及標(biāo)注句艙條件缺失且骼例比在15-50%之間,識(shí)標(biāo)句艙結(jié)束,進(jìn)行句骼格式檢查,整理前述預(yù)標(biāo)為正式標(biāo)注這是第一輪識(shí)別提取的步驟,第二輪識(shí)別提取開(kāi)始不用識(shí)別詞性而是以已標(biāo)語(yǔ)種句為模板識(shí)別、標(biāo)出未標(biāo)語(yǔ)種句的句艙, 當(dāng)N = >1時(shí),當(dāng)前句對(duì)移去句艙所剩部分為句骼構(gòu)件,將它們存貯于句骼庫(kù)105相應(yīng)語(yǔ)種構(gòu)件字段,當(dāng)N = 0當(dāng)前句對(duì)為習(xí)語(yǔ)構(gòu)件,習(xí)語(yǔ)構(gòu)件是一些分不出句骼句艙的特殊句對(duì),將它們存貯于習(xí)語(yǔ)庫(kù)104相應(yīng)語(yǔ)種習(xí)語(yǔ)字段, 將當(dāng)前雙語(yǔ)句例對(duì)號(hào)入座地套回當(dāng)前句骼成為骼例式備續(xù);檢測(cè)及提取艙模106,逐個(gè)句艙檢測(cè),第一輪識(shí)別提取以A語(yǔ)拼音文字句的句艙所含詞串計(jì)數(shù),=> 5個(gè)原有詞串要進(jìn)入組復(fù)詞運(yùn)作, = >原有8個(gè)詞串的以當(dāng)前句艙作“查配標(biāo)”運(yùn)作生成當(dāng)前句艙語(yǔ)意匹配表以備進(jìn)一步提取艙模為有模句艙, 提取艙模,以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、預(yù)標(biāo)為艙眼,模例之比由100%逐步降低,若預(yù)標(biāo)完這三種詞串還大于70%,再以無(wú)冠名串或其它語(yǔ)意匹配串在有間隔的前提下在標(biāo)為艙眼,接受操作者認(rèn)可、更正,或使用意群對(duì)齊運(yùn)作增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)預(yù)標(biāo)艙眼, 當(dāng)預(yù)標(biāo)條件不存在且模例比在50-70%之間,預(yù)標(biāo)艙 眼操作結(jié)束,以英語(yǔ)句艙從左到右為序修改艙眼預(yù)杯為正式標(biāo)注,第二輪提取開(kāi)始不同,是以已標(biāo)語(yǔ)種句艙為模板識(shí)別、標(biāo)出未標(biāo)語(yǔ)種艙眼, 當(dāng)艙眼數(shù)N = > 1 ;當(dāng)前句艙對(duì)移去艙眼所剩部分為艙模構(gòu)件,保存到艙模庫(kù)107相應(yīng)語(yǔ)種艙模字段, 繼續(xù)其它句艙的檢測(cè)直到全句對(duì)句艙檢測(cè)完畢;S4.收存意群串108,將當(dāng)前雙語(yǔ)例對(duì)號(hào)入座地套回當(dāng)前提取的句骼,有艙模的句艙再套回相應(yīng)艙模,再逐個(gè)句艙或艙眼搜索,參照語(yǔ)意匹配表,相應(yīng)內(nèi)容在匹配表里A語(yǔ)字段和B語(yǔ)字段不空的記錄是A、B語(yǔ)言文字語(yǔ)意對(duì)齊的,確定為意群串構(gòu)件,將它們逐記錄取出,分別存貯到意群串庫(kù)109同記錄相應(yīng)語(yǔ)種字段內(nèi),當(dāng)前句對(duì)的識(shí)別提取結(jié)束。
2.根據(jù)權(quán)利要求1所述的表意構(gòu)件識(shí)別提取方法,其特征在于:S2所述以數(shù)量串、專(zhuān)名串、冠名串雙語(yǔ)同時(shí)依次識(shí)別、標(biāo)注步驟,具體為: 機(jī)器查詢當(dāng)前句對(duì)語(yǔ)意匹配表,首先識(shí)別搜索數(shù)量串,如有則同樣將它們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C......”加預(yù)標(biāo), 如無(wú)或識(shí)別搜索數(shù)量串完成后,識(shí)別搜索專(zhuān)名串,如有則同樣將它不們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C……”預(yù)標(biāo), 如無(wú)或識(shí)別搜索專(zhuān)名串結(jié)束后,識(shí)別搜索冠名串,如有則同樣將它不們?cè)贏、B語(yǔ)句子中同時(shí)據(jù)N = N+1以“A、B、C……”預(yù)標(biāo), 如無(wú)或識(shí)別搜索冠名串結(jié)束后,顯示符號(hào)“ I ”且在兩側(cè)分別顯示“一” “一”命令按鈕、計(jì)算并顯示骼例比、以及“ V ”命令按鈕,接受操作者更正或認(rèn)可。
3.根據(jù)權(quán)利要求1所述的表意構(gòu)件識(shí)別提取方法,其特征在于:S2所述以無(wú)冠名串或其它語(yǔ)意匹配串在有間隔的前提下逐個(gè)接續(xù)標(biāo)為句艙,具體為:當(dāng)骼例比高于50%,以匹配表為據(jù)搜索詞性字段是名詞且A語(yǔ)詞B語(yǔ)詞字段不空的為語(yǔ)意匹配的無(wú)冠名串,或者不是名詞而A語(yǔ)詞B語(yǔ)詞字段不空的為其它語(yǔ)意匹配串,同上且加顯當(dāng)前句對(duì)語(yǔ)意匹配表、“它n “V”、“< n ”、“格式檢查”按鈕,并接受操作者使用組復(fù)詞、延伸詞義、粘帶前引或后隨字詞的意群對(duì)齊方法修改匹配表,增補(bǔ)語(yǔ)意匹配詞串,繼續(xù)預(yù)標(biāo)句艙直至識(shí)標(biāo)句艙條件缺失且骼例比在15-50%之間,識(shí)標(biāo)句艙結(jié)束, 然后,進(jìn)行句骼格式檢查,第一輪識(shí)別提取以英語(yǔ)句從左到右為序整理預(yù)標(biāo)艙序號(hào)為正式艙序號(hào),第二輪識(shí)別提取開(kāi)`始以已標(biāo)語(yǔ)種句為模板識(shí)別、標(biāo)出未標(biāo)語(yǔ)種句的句艙。
4.根據(jù)權(quán)利要求1所述的表意構(gòu)件識(shí)別提取方法,其特征在于: 所述利用雙語(yǔ)句對(duì)提取出表意構(gòu)件,具體為:每輪識(shí)別提取選AB兩種語(yǔ)言文字,第一輪選中英雙語(yǔ)為優(yōu)選例,其中A語(yǔ)是英文、B語(yǔ)是中文,第二輪開(kāi)始每輪識(shí)別提取新增一種語(yǔ)言文字,另一種為已經(jīng)識(shí)別提取過(guò)的語(yǔ)言文字,A語(yǔ)分配給已經(jīng)識(shí)別提取過(guò)的語(yǔ)言文字,B語(yǔ)分配給新加入的語(yǔ)言文字;第二輪識(shí)別提取開(kāi)始每輪新加一種語(yǔ)言文字; 識(shí)別提取過(guò)程先以已識(shí)別句查詢句骼庫(kù)進(jìn)行配句骼運(yùn)作、套入,然后以已識(shí)別提取句為模板,在新增語(yǔ)種句子上識(shí)別出語(yǔ)意相同部分標(biāo)為相同標(biāo)號(hào)的句艙,若有相同重復(fù)部分,以同樣的標(biāo)號(hào)標(biāo)為重復(fù)句艙,重復(fù)句艙適應(yīng)各語(yǔ)種句子的重復(fù)成份,兩語(yǔ)種句子被識(shí)別標(biāo)注的重復(fù)句艙不一定都有、數(shù)量也不一定一致、也不影響句艙標(biāo)出數(shù); 含艙模的句艙,同樣以已經(jīng)識(shí)別句的句艙套入艙模作為模板識(shí)別標(biāo)出新加語(yǔ)種句相應(yīng)句艙的艙眼。
5.根據(jù)權(quán)利要求1所述的表意構(gòu)件識(shí)別提取方法,其特征在于: 所述配句骼運(yùn)作具體為:事先按句骼詞串與句艙之空穴生成句骼串表并索引,配句骼時(shí)把句例從左到右英逐單詞中逐字取下搜索句骼串表的骼首字段并存于臨時(shí)表,再逐記錄取出臨時(shí)表內(nèi)容,以句骼詞段查詢句對(duì)例,句骼串的每段都可以在句對(duì)例中查到且次序相同為匹配,再根據(jù)句骼串表取出相應(yīng)語(yǔ)種句骼;所述查配標(biāo)運(yùn)作具體為:機(jī)器利用至少含有詞性、A語(yǔ)詞、B語(yǔ)詞字段的匹配表,先以A語(yǔ)句單詞串為單元切分、依次填入匹配表A語(yǔ)詞字段,隨后逐記錄取出查詢傳統(tǒng)電子詞典,以查得的相應(yīng)B語(yǔ)解釋搜索B語(yǔ)句是否含有,含有且是最長(zhǎng)串填入B語(yǔ)詞字段同時(shí)將其詞性填入詞性字段,無(wú)含有B語(yǔ)詞字段為空; 所述意群對(duì)齊運(yùn)作具體為:①以當(dāng)前句對(duì)、句艙為依據(jù),延伸或增補(bǔ)B語(yǔ)解釋填人匹配表B語(yǔ)字段,②粘帶附隨字、詞或字符,③有詞形變化的另作詞條入庫(kù),在匹配表中根據(jù)當(dāng)前句對(duì)句艙參考傳統(tǒng)詞典填入B語(yǔ)解釋?zhuān)芙M復(fù)詞(下款); 所述組復(fù)詞運(yùn)作具體為:根據(jù)當(dāng)前句對(duì)、句艙語(yǔ)意判斷,如其一需要原有兩個(gè)詞條或更多詞條合并,語(yǔ)意才等于另一時(shí),前者以將它們相連合并為一個(gè)詞條,稱(chēng)為復(fù)詞,在匹配表作為一個(gè)記錄分別填入AB語(yǔ)字段,添加到意群串庫(kù)之復(fù)詞庫(kù),沒(méi)有這種情況的空運(yùn)作,沒(méi)有改變。
6.根據(jù)權(quán)利要求1所述的表意構(gòu)件識(shí)別提取方法,其特征在于: 表意構(gòu)件包括句骼構(gòu) 件、艙模構(gòu)件、意群串構(gòu)件和習(xí)語(yǔ)構(gòu)件四種,貯存它們的句骼庫(kù)、艙模庫(kù)、意群串庫(kù)和習(xí)語(yǔ)庫(kù)是表意構(gòu)件分庫(kù),共同構(gòu)成表意構(gòu)件數(shù)據(jù)庫(kù),四個(gè)分庫(kù)之間相互獨(dú)立,分庫(kù)內(nèi)同記錄的成員語(yǔ)意相同且相互影射; 從一個(gè)句對(duì)提取出來(lái)的句骼可以被其它句對(duì)所套用,艙??梢员黄渌渑撍子茫澉浪械木渑搨€(gè)數(shù)、語(yǔ)意內(nèi)容相同,是跨語(yǔ)種的,句艙在具體句骼中的位置、次序和用以填充的意群串是面向各自語(yǔ)言文字的,不跨語(yǔ)種; 句骼庫(kù)用以存貯句骼構(gòu)件,有句骼碼、英句骼、中句骼字段,同記錄的各語(yǔ)種句骼字段存貯相應(yīng)語(yǔ)種句骼,它們的語(yǔ)義相同且相互影射,句骼碼是它們語(yǔ)義和庫(kù)中位次的表示; 艙模庫(kù)用以存貯艙模構(gòu)件,有艙模碼、英艙模、中艙模字段,同記錄的各語(yǔ)種艙模字段存貯相應(yīng)語(yǔ)種艙模,它們的語(yǔ)義相同,艙模碼是它們語(yǔ)義和庫(kù)中位次的表示; 意群庫(kù)用以存貯意群串構(gòu)件,有意群碼、英群串、中群串字段,同記錄的各語(yǔ)種意群串字段存貯相應(yīng)語(yǔ)種意群串,它們的語(yǔ)義相同,意群串碼是它們語(yǔ)義和庫(kù)中位次的表示; 習(xí)語(yǔ)庫(kù)用以存貯習(xí)語(yǔ)構(gòu)件,有習(xí)語(yǔ)碼、英習(xí)語(yǔ)、中習(xí)語(yǔ)字段,同記錄的各語(yǔ)種習(xí)語(yǔ)字段存貯相應(yīng)語(yǔ)種習(xí)語(yǔ),它們語(yǔ)義相同,習(xí)語(yǔ)碼是它們語(yǔ)義和庫(kù)中位次的表示; 第二輪識(shí)別提取開(kāi)始每輪新加一種語(yǔ)言文字,事先應(yīng)在這四個(gè)分庫(kù)內(nèi)分別增設(shè)新加語(yǔ)種的構(gòu)件字段。
7.一種基于表意構(gòu)件的機(jī)譯人校互動(dòng)式翻譯方法,其特征在于,包括如下步驟:句配骼、源語(yǔ)句套入202,讀入源語(yǔ)句子,以源語(yǔ)句搜索句骼庫(kù),獲得唯一匹配的源、目語(yǔ)句骼,若有多對(duì)匹配句骼自動(dòng)隱含選取最長(zhǎng)的為唯一匹配句骼,然后將源語(yǔ)句子對(duì)號(hào)入座地套入源語(yǔ)句骼,艙檢測(cè)若是有模句艙再搜索艙模庫(kù)有再套入艙模,使成為源語(yǔ)句骼例結(jié)合形式;艙或艙眼內(nèi)容轉(zhuǎn)移203,從源語(yǔ)句骼例結(jié)合式中逐個(gè)取出句艙或艙眼內(nèi)容,轉(zhuǎn)移到目語(yǔ)句骼、艙模相應(yīng)的句艙或艙眼里,使之成為源、目語(yǔ)過(guò)渡式;查得項(xiàng)、預(yù)選給出目語(yǔ)待校句204,逐個(gè)取出源、目語(yǔ)過(guò)渡式中句艙或艙眼的源語(yǔ)詞串,查詢意群串庫(kù),無(wú)詞間間隔的表意文字則以從左到右可能的排列作為詞串查詢意群庫(kù),二者所有查得項(xiàng)存于更正表;利用預(yù)選模塊402選出查得項(xiàng)當(dāng)中最大適配的目語(yǔ)串生成待校句并在更正表中換位到詞串段之首,最后給出301預(yù)選后的保留句艙艙眼標(biāo)志標(biāo)號(hào)的目語(yǔ)待校句和“返回”、“繼后”、“一移”、“移一”、“ ▲”、“Λ”、“修辭”命令按鈕以及相應(yīng)的源語(yǔ)參考句; S8.語(yǔ)意校正、自學(xué)習(xí)205,當(dāng)用戶讀到目語(yǔ)待校句和相應(yīng)的源語(yǔ)參考句時(shí)開(kāi)始校正操作,同時(shí)系統(tǒng)的校正模塊借更正表進(jìn)行語(yǔ)意校正運(yùn)作,自學(xué)習(xí)模塊401與之聯(lián)動(dòng),對(duì)校正過(guò)程的人機(jī)互動(dòng)進(jìn)行學(xué)習(xí)、記憶且為預(yù)選模塊提供數(shù)據(jù),當(dāng)當(dāng)前待校句的語(yǔ)意校正運(yùn)作結(jié)束后,接受用戶單擊“返回”按鈕接續(xù)S5運(yùn)作。
8.根據(jù)權(quán)利要求7所述的機(jī)譯人校互動(dòng)式翻譯的方法,其中S8述及語(yǔ)意校正和校正模塊,其進(jìn)一步的特征是: 語(yǔ)意校正有待校句完全正確無(wú)需更正和需要更正兩種情況,無(wú)需更正時(shí)接受用戶單擊“返回”按鈕接續(xù)S5,需要更正的有如下?tīng)顟B(tài)與步驟,更正結(jié)束后再接受單擊“返回”接續(xù)S5: A)不妥詞串的替換302—當(dāng)用戶認(rèn)為待校句某詞串不妥時(shí),單擊它系統(tǒng)搜索更正表,彈出下拉列表給出全部相關(guān)查得項(xiàng)待選,然后以被單擊選中的查得項(xiàng)替換譯句不妥詞串,同時(shí)置換為詞串段之首; B)連續(xù)句艙的切分303——當(dāng)遇到?jīng)]有參照無(wú)法自動(dòng)進(jìn)行切分的連續(xù)句艙給出待切,當(dāng)被單擊后以被單擊點(diǎn)為切分點(diǎn)將兩個(gè)句艙內(nèi)容分開(kāi); C)干預(yù)另選句骼304——當(dāng)遇到句艙和艙眼不勻稱(chēng)、有殘缺、或堆疊之錯(cuò)選句骼表現(xiàn)時(shí),或用戶不認(rèn)可當(dāng)前譯句時(shí)單擊“繼后”按鈕,系統(tǒng)把多對(duì)匹配句骼給出待選,以單擊選取后的句骼重新套入接續(xù)S6繼續(xù)運(yùn)作; D)補(bǔ)加意群串305——當(dāng)不妥詞串另選替換而缺失時(shí),接受用戶使用延伸詞義、粘帶前引或后隨字詞方法補(bǔ)加意群串,以補(bǔ)加串進(jìn)行替換并補(bǔ)加于意群串相應(yīng)語(yǔ)種構(gòu)件字段; E)組選復(fù)串306—當(dāng)不妥詞串另選替換而缺失時(shí),接受用戶使用組復(fù)詞或改選復(fù)詞的方法補(bǔ)加復(fù)詞串,以補(bǔ)加串進(jìn)行替換并補(bǔ)加于意群串的復(fù)詞庫(kù)相應(yīng)語(yǔ)種構(gòu)件字段; F)句艙詞序307—當(dāng)譯句句艙有詞序錯(cuò)誤時(shí),接受用戶單擊其中串,再單擊“一移”或“移一”命令按鈕,將單擊串前移或后移一個(gè)串位; G)編詞替換308——當(dāng)連續(xù)多串不妥,不能用單擊選中時(shí),用拖放操作選中選中串時(shí),然后在編詞替換處填上其它詞串、編輯或?yàn)榭眨賳螕簟?Λ ”按鈕時(shí),系統(tǒng)以后者置換前者; H)修辭309—當(dāng)出現(xiàn)不能用上述步驟解決的修辭現(xiàn)象時(shí),接受用戶單擊“修辭”按鈕,然后將當(dāng)前待校句復(fù)制到編輯框,接受用戶使用編輯的方法進(jìn)行修辭操作; I)艙轉(zhuǎn)換310——當(dāng)中譯英時(shí)接受用戶單擊某句艙或艙眼內(nèi)容,搜索更正表所有當(dāng)前句艙或艙眼含有的查得項(xiàng),列表給出等待用戶多次有序的單擊選取,將它們置換待校句相應(yīng)句艙或艙眼內(nèi)容; J)補(bǔ)量詞311—當(dāng)英譯中時(shí)由于英語(yǔ)無(wú)量詞而中文有量詞因而需要在待校句需要之處補(bǔ)上量詞,接受用戶單擊待校句的需補(bǔ)加處,系統(tǒng)搜索最接近單擊點(diǎn)的數(shù)串后中心名詞,當(dāng)“▲”按鈕同時(shí)被單擊,以中心名詞搜索量詞庫(kù),取出相應(yīng)量詞補(bǔ)加到待校句;如果量詞庫(kù)查無(wú),給出對(duì)話接受輸入給以補(bǔ)加且錄入量詞庫(kù); K)補(bǔ)冠它312—當(dāng)中譯英時(shí)由于中文沒(méi)有而英文有冠詞、動(dòng)詞to/be、to/have等,這些需要補(bǔ)加,在系統(tǒng)給出保留句艙標(biāo)志標(biāo)號(hào)的目語(yǔ)待校句時(shí),已經(jīng)顯示了“a/an”、“the”、“t0/be”、“t0/haVe”,當(dāng)它們之一被單擊,待校句也被單擊時(shí),系統(tǒng)將它們之一在待校句被單擊處加上適當(dāng)形式的詞串; 以上A-H狀態(tài)步驟與語(yǔ)言文字的種類(lèi)無(wú)關(guān),具共性特點(diǎn),可以出現(xiàn)在多語(yǔ)種之間A譯B或B譯A的雙向翻譯的過(guò)程中;1狀態(tài)步驟與語(yǔ)言文字的種類(lèi)相關(guān),用于無(wú)詞間間隔表意文字的翻譯之中J-K狀態(tài)步驟與語(yǔ)言文字種類(lèi)密切相關(guān),它們具個(gè)性特點(diǎn)根據(jù)具體語(yǔ)種設(shè)置。
9.根據(jù)權(quán)利要求7所述的機(jī)譯人?;?dòng)式翻譯的方法,其中S8述及的自學(xué)習(xí)模塊聯(lián)動(dòng),對(duì)校正過(guò)程的人機(jī)互動(dòng)進(jìn)行學(xué)習(xí)、記憶且為預(yù)選模塊提供數(shù)據(jù),其特征是: A、經(jīng)驗(yàn)選詞,在英譯中語(yǔ)意校正運(yùn)作過(guò)程中當(dāng)用戶單擊待校句的不妥詞串后403,系統(tǒng)搜索更正表,列表給出全部相關(guān)查得項(xiàng)待選的同時(shí),將所有相關(guān)待選項(xiàng)以空格相隔生成經(jīng)驗(yàn)串,末尾把相應(yīng)的英詞串附后; 當(dāng)用戶選取列表之一置換的同時(shí),用選中詞條和英串查詢“經(jīng)驗(yàn)選詞”庫(kù),查有頻度=頻度+1,查無(wú),將選中詞條移到經(jīng)驗(yàn)串之首且壓棧式存入該庫(kù)405的中解釋字段,英串從經(jīng)驗(yàn)串取下存入英串字段,當(dāng)前句骼號(hào)存入句骼號(hào)字段; B、中文詞序,在英譯中語(yǔ)意校正運(yùn)作過(guò)程中將生成的中文待校句給出時(shí)備份于“給出句”,當(dāng)測(cè)得用戶使用“一移”或“移一”按鈕移動(dòng)句艙或艙眼詞序時(shí)406,記下被移句艙的艙標(biāo)號(hào)或艙眼號(hào),當(dāng)語(yǔ)意校正結(jié)束,“返回”命令按扭被單擊時(shí)搜索經(jīng)過(guò)移位調(diào)整詞序的句艙或艙眼,是,以句艙為單位將移位前、后結(jié)果分別存于中詞序庫(kù)408的“原序”、“正序”字段,且清除當(dāng)前句艙或艙眼在經(jīng)驗(yàn)選詞庫(kù)405中的相關(guān)記錄; C、艙經(jīng)驗(yàn),在中譯英語(yǔ)意校正的“艙轉(zhuǎn)換”運(yùn)作時(shí)409備存當(dāng)前句艙、艙眼標(biāo)號(hào),當(dāng)“返回”命令按鈕被單擊,將當(dāng)前句所有經(jīng)過(guò)艙轉(zhuǎn)換的轉(zhuǎn)前轉(zhuǎn)后內(nèi)容查艙經(jīng)驗(yàn)庫(kù)411,查有頻度+1 ;查無(wú)壓棧式存入該庫(kù)。
10.根據(jù)權(quán)利要求7所述的`機(jī)譯人?;?dòng)式翻譯的方法,其中S7述及將所有查得項(xiàng)存于更正表,利用預(yù)選模塊402選出查得項(xiàng)當(dāng)中最大適配的目語(yǔ)串生成待校句并在更正表中換位到詞串段之首,其進(jìn)一步的特征是: 更正表至少有詞串段、搜索串、解釋、串首位字段,預(yù)選模塊與語(yǔ)言文字種類(lèi)密切相關(guān); 英譯中的預(yù)選412是①用當(dāng)前句艙或艙眼內(nèi)英文詞串查詢“經(jīng)驗(yàn)選詞”庫(kù),查有取出解釋字段內(nèi)容的首條中文詞串為413最大適配的目語(yǔ)串給出,查無(wú)以更正表本詞串段首記錄為最大適配的目語(yǔ)串給出;②用當(dāng)前句艙或艙眼已經(jīng)獲得的中文內(nèi)容414查詢“中詞序”庫(kù)的原序字段,查有以正序字段內(nèi)容替換為最大適配的目語(yǔ)串415給出,查無(wú)不變; 中譯英的預(yù)選以源、目語(yǔ)過(guò)渡式中句艙或艙眼的源語(yǔ)內(nèi)容查詢更正表搜索串字段,有全等的以同記錄解釋字段內(nèi)容為最大適配的目語(yǔ)串給出,無(wú)全等時(shí)417的再查詢“艙經(jīng)驗(yàn)”庫(kù)中艙字段,有418以英艙字段內(nèi)容為最大適配的目語(yǔ)串給出,查“艙經(jīng)驗(yàn)”庫(kù)無(wú)以當(dāng)前句艙或艙眼中文內(nèi)容為最大適配的目語(yǔ)串給出; 凡預(yù)選模塊選用了更正表某查得項(xiàng)改變了原給出內(nèi)容的,同時(shí)在更正表中將它換位到本詞串段之首。
全文摘要
本發(fā)明提供一種表意構(gòu)件識(shí)別提取方法及其機(jī)譯人?;?dòng)式翻譯方法,其中的表意構(gòu)件識(shí)別提取方法為利用相同內(nèi)容的多語(yǔ)種或雙語(yǔ)文字版本的語(yǔ)料作句對(duì)齊后生成雙語(yǔ)句對(duì)庫(kù),以表意將不同語(yǔ)言文字進(jìn)行關(guān)聯(lián),不同語(yǔ)言文字的表意通過(guò)四種共同的表意構(gòu)件實(shí)現(xiàn),識(shí)別提取出這四種表意構(gòu)件包括讀句配骼、識(shí)別及標(biāo)注句艙、艙檢測(cè)及提取艙模和收存意群串。本發(fā)明還提供了基于表意構(gòu)件的機(jī)譯人校互動(dòng)式翻譯方法,包括讀句配骼、源語(yǔ)句套入、句艙或艙眼內(nèi)容轉(zhuǎn)移、存查得項(xiàng)、預(yù)選給出目語(yǔ)待校句以及語(yǔ)意校正、自學(xué)習(xí)。本發(fā)明解決了現(xiàn)有技術(shù)存在的譯文質(zhì)量差,要求操作者具獨(dú)立翻譯能力,處理過(guò)程中無(wú)法反悔地丟失詞義、語(yǔ)意之技術(shù)問(wèn)題。
文檔編號(hào)G06F17/27GK103106195SQ20131004205
公開(kāi)日2013年5月15日 申請(qǐng)日期2013年1月21日 優(yōu)先權(quán)日2013年1月21日
發(fā)明者劉樹(shù)根 申請(qǐng)人:劉樹(shù)根
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1