本發(fā)明涉及領(lǐng)域計(jì)算機(jī)領(lǐng)域,尤其涉及一種生成標(biāo)注庫(kù)的方法和裝置。
背景技術(shù):
近年來(lái),統(tǒng)計(jì)機(jī)器翻譯(Statistical Machine Translation,SMT)領(lǐng)域取得了巨大發(fā)展。在SMT領(lǐng)域中,代詞具有非常重要的作用。然而,在日語(yǔ)和漢語(yǔ)等語(yǔ)言中,代詞省略是極為常見(jiàn)的現(xiàn)象,但在英語(yǔ)等語(yǔ)言中,代詞作為句子成分又必不可少。這導(dǎo)致從代詞易省略語(yǔ)言到代詞不易省略語(yǔ)言翻譯時(shí),大部分缺失的代詞將很難翻譯正確。因此,將代詞自動(dòng)生成方法可以有效輔助統(tǒng)計(jì)機(jī)器翻譯完成代詞易省略語(yǔ)言到代詞不易省略語(yǔ)言翻譯過(guò)程中的代詞缺失問(wèn)題,使得譯文更符合目標(biāo)語(yǔ)言的語(yǔ)法結(jié)構(gòu),從而帶來(lái)譯文質(zhì)量的提升。
代詞自動(dòng)生成的工作中包括代詞的指代消解,該代詞的指代消解指的是篇章中確定代詞指向哪個(gè)名詞短語(yǔ)的問(wèn)題。目前,一種常用的指代消解方法是采用有監(jiān)督方法,該有監(jiān)督方法指的是需要機(jī)器學(xué)習(xí)模型來(lái)學(xué)習(xí)特征和標(biāo)注的句法結(jié)構(gòu)的操作判定。具體來(lái)說(shuō),首先生成人工標(biāo)注的語(yǔ)料庫(kù),在該人工標(biāo)注的語(yǔ)料庫(kù)中,人為地將句子中所缺失的代詞補(bǔ)上并對(duì)所補(bǔ)上的代詞進(jìn)行標(biāo)注。這樣,在該有監(jiān)督方法中機(jī)器能夠根據(jù)所填補(bǔ)的代詞來(lái)學(xué)習(xí)填補(bǔ)代詞的位置和所填補(bǔ)代詞的特征,以使得機(jī)器能夠自動(dòng)填補(bǔ)語(yǔ)句中所缺失的代詞。然而,只有當(dāng)人工標(biāo)注的語(yǔ)料庫(kù)中的數(shù)據(jù)量足夠大時(shí),才能夠保證有監(jiān)督方法的正確性。然而,目前人工標(biāo)注的語(yǔ)料庫(kù)中的數(shù)據(jù)嚴(yán)重欠缺,生成數(shù)據(jù)量足夠大的人工標(biāo)注的語(yǔ)料庫(kù)需要非常大的人力。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例第一方面提供了一種生成標(biāo)注庫(kù)的方法,包括:
確定雙語(yǔ)平行語(yǔ)料庫(kù)中的源語(yǔ)句和目標(biāo)語(yǔ)句,所述源語(yǔ)句和所述目標(biāo)語(yǔ)句為在句子級(jí)別互為翻譯的語(yǔ)料;
將所述目標(biāo)語(yǔ)句和所述源語(yǔ)句進(jìn)行對(duì)齊;
當(dāng)?shù)谝惶囟ㄔ~在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的源特定詞時(shí),獲取第一候選集 合,所述第一特定詞為所述目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的詞,所述源特定詞為所述第一特定詞在所述源語(yǔ)句中的翻譯,所述第一候選集合中包括與所述第一特定詞互為翻譯的候選源特定詞;
根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合,所述候選位置集合包括所述源語(yǔ)句中可能缺失所述源特定詞的位置;
根據(jù)預(yù)置語(yǔ)言概率模型獲取第二候選集合中各語(yǔ)句的正確概率,所述第二候選集合包括將所述第一候選集合中的候選源特定詞填補(bǔ)到所述候選位置集合中的位置后形成的候選源語(yǔ)句;
生成標(biāo)注庫(kù),所述標(biāo)注庫(kù)包括新源語(yǔ)句,所述新源語(yǔ)句為根據(jù)所述第二候選集合中各語(yǔ)句的正確概率確定的候選源語(yǔ)句。
結(jié)合第一方面,在第一方面的第一種實(shí)現(xiàn)方式中,所述根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合,包括:
采用啟發(fā)式搜索算法根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合。
結(jié)合第一方面,在第一方面的第二種實(shí)現(xiàn)方式中,所述新源語(yǔ)句包括所述第二候選集合中概率最大的預(yù)置數(shù)值個(gè)語(yǔ)句。
結(jié)合第一方面,在第一方面的第三種實(shí)現(xiàn)方式中,所述獲取第一候選集合,之前還包括:
查找所述目標(biāo)語(yǔ)句中屬于所述第一詞類(lèi)的所有第一特定詞;
對(duì)每一個(gè)所述第一特定詞,判斷所述第一特定詞在所述源語(yǔ)句中是否存在對(duì)應(yīng)的翻譯;
所述獲取第一候選集合,包括:
將在所述源語(yǔ)句中不存在對(duì)應(yīng)的翻譯的至少部分第一特定詞的翻譯語(yǔ)料添加到所述第一候選集合中。
結(jié)合第一方面,在第一方面的第四種實(shí)現(xiàn)方式中,所述方法還包括:
對(duì)所述標(biāo)注庫(kù)進(jìn)行有監(jiān)督學(xué)習(xí),訓(xùn)練出基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的序列標(biāo)注模型,所述序列標(biāo)注模型包括Elman-type遞歸神經(jīng)網(wǎng)絡(luò);
在單語(yǔ)語(yǔ)料庫(kù)中獲取第一語(yǔ)句,根據(jù)所述序列標(biāo)注模型預(yù)測(cè)所述第一語(yǔ)句的缺失特定詞的位置以及判定所述特定詞的類(lèi)型,其中,所述單語(yǔ)語(yǔ)料庫(kù) 中的語(yǔ)料和所述源語(yǔ)句屬于同一種語(yǔ)言,所述特定詞為所述第一語(yǔ)句中屬于所述第一詞類(lèi)的詞;
根據(jù)所述特定詞的類(lèi)型獲取候選特定詞集合;
根據(jù)預(yù)置語(yǔ)言概率模型獲取第一語(yǔ)句候選集合中各語(yǔ)句的正確概率,所述第一語(yǔ)句候選集合包括將所述候選特定詞集合中的候選特定詞填補(bǔ)到所述缺失特定詞的位置后形成的候選語(yǔ)句;
根據(jù)所述正確概率從所述第一候選集合中挑選候選語(yǔ)句作為增添所述特定詞后的第一語(yǔ)句。
本發(fā)明實(shí)施例第二方面提供了一種生成標(biāo)注庫(kù)的裝置,包括:
確定模塊,用于確定雙語(yǔ)平行語(yǔ)料庫(kù)中的源語(yǔ)句和目標(biāo)語(yǔ)句,所述源語(yǔ)句和所述目標(biāo)語(yǔ)句為在句子級(jí)別互為翻譯的語(yǔ)料;
對(duì)齊模塊,用于將所述目標(biāo)語(yǔ)句和所述源語(yǔ)句進(jìn)行對(duì)齊;
第一獲取模塊,用于當(dāng)?shù)谝惶囟ㄔ~在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的源特定詞時(shí),獲取第一候選集合,所述第一特定詞為所述目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的詞,所述源特定詞為所述第一特定詞在所述源語(yǔ)句中的翻譯,所述第一候選集合中包括與所述第一特定詞互為翻譯的候選源特定詞;
第二獲取模塊,用于根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合,所述候選位置集合包括所述源語(yǔ)句中可能缺失所述源特定詞的位置;
第三獲取模塊,用于根據(jù)預(yù)置語(yǔ)言概率模型獲取第二候選集合中各語(yǔ)句的正確概率,所述第二候選集合包括將所述第一候選集合中的候選源特定詞填補(bǔ)到所述候選位置集合中的位置后形成的候選源語(yǔ)句;
生成模塊,用于生成標(biāo)注庫(kù),所述標(biāo)注庫(kù)包括新源語(yǔ)句,所述新源語(yǔ)句為根據(jù)所述第二候選集合中各語(yǔ)句的正確概率確定的候選源語(yǔ)句。
結(jié)合第二方面,在第二方面的第一種實(shí)現(xiàn)方式中,所述第二獲取模塊具體用于采用啟發(fā)式搜索算法根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合。
結(jié)合第二方面,在第二方面的第二種實(shí)現(xiàn)方式中,所述新源語(yǔ)句包括所述第二候選集合中概率最大的預(yù)置數(shù)值個(gè)語(yǔ)句。
結(jié)合第二方面,在第二方面的第三種實(shí)現(xiàn)方式中,所述生成標(biāo)注庫(kù)的裝置還包括:
查找模塊,用于在獲取第一候選集合之前,查找所述目標(biāo)語(yǔ)句中屬于所述第一詞類(lèi)的所有第一特定詞;
判斷模塊,用于對(duì)每一個(gè)所述第一特定詞,判斷所述第一特定詞在所述源語(yǔ)句中是否存在對(duì)應(yīng)的翻譯;
所述第一獲取模塊具體用于將在所述源語(yǔ)句中不存在對(duì)應(yīng)的翻譯的至少部分第一特定詞的翻譯語(yǔ)料添加到所述第一候選集合中。
結(jié)合第二方面,在第二方面的第四種實(shí)現(xiàn)方式中,所述生成標(biāo)注庫(kù)的裝置還包括:
學(xué)習(xí)模塊,用于對(duì)所述標(biāo)注庫(kù)進(jìn)行有監(jiān)督學(xué)習(xí),訓(xùn)練出基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的序列標(biāo)注模型,所述序列標(biāo)注模型包括Elman-type遞歸神經(jīng)網(wǎng)絡(luò);
第四獲取模塊,用于在單語(yǔ)語(yǔ)料庫(kù)中獲取第一語(yǔ)句,根據(jù)所述序列標(biāo)注模型預(yù)測(cè)所述第一語(yǔ)句的缺失特定詞的位置以及判定所述特定詞的類(lèi)型,其中,所述單語(yǔ)語(yǔ)料庫(kù)中的語(yǔ)料和所述源語(yǔ)句屬于同一種語(yǔ)言,所述特定詞為所述第一語(yǔ)句中屬于所述第一詞類(lèi)的詞;
第五獲取模塊,用于根據(jù)所述特定詞的類(lèi)型獲取候選特定詞集合;
第六獲取模塊,用于根據(jù)預(yù)置語(yǔ)言概率模型獲取第一語(yǔ)句候選集合中各語(yǔ)句的正確概率,所述第一語(yǔ)句候選集合包括將所述候選特定詞集合中的候選特定詞填補(bǔ)到所述缺失特定詞的位置后形成的候選語(yǔ)句;
挑選模塊,用于根據(jù)所述正確概率從所述第一候選集合中挑選候選語(yǔ)句作為增添所述特定詞后的第一語(yǔ)句。
從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):
本發(fā)明中,源語(yǔ)句所屬的語(yǔ)言為易缺失第一詞類(lèi)的語(yǔ)言,通過(guò)利用雙語(yǔ)平行語(yǔ)料庫(kù)中雙語(yǔ)的對(duì)應(yīng)關(guān)系,將互為翻譯語(yǔ)料的目標(biāo)語(yǔ)句和源語(yǔ)句進(jìn)行對(duì)齊,當(dāng)目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的第一特定詞在源語(yǔ)句中找不到對(duì)應(yīng)的翻譯(也即源特定詞)時(shí),則可以確定源語(yǔ)句中缺失與該第一特定詞對(duì)應(yīng)的源特定詞,而根據(jù)該兩個(gè)語(yǔ)句的對(duì)應(yīng)關(guān)系可確定出源語(yǔ)句中可能缺失源特定詞的位置集合;由于第一特定詞為確定的,第一特定詞的翻譯可在一個(gè)小集合中 挑選,因此將該小集合中的各翻譯和源語(yǔ)句中可能缺失第一特定詞的位置任意組合,以形成多個(gè)候選源語(yǔ)句,并通過(guò)語(yǔ)言概率模型來(lái)計(jì)算各候選源語(yǔ)句的正確概率,以挑選出正確的候選源語(yǔ)句作為填補(bǔ)空缺第一特定詞后的新源語(yǔ)句;整個(gè)過(guò)程均由機(jī)器翻譯完成,無(wú)需人工標(biāo)注語(yǔ)料庫(kù),采用該方法能夠以較低耗費(fèi)自動(dòng)生成代詞標(biāo)注語(yǔ)料。
附圖說(shuō)明
圖1為本發(fā)明的生成標(biāo)注庫(kù)的方法的一個(gè)實(shí)施例的流程示意圖;
圖2為目標(biāo)語(yǔ)句和源語(yǔ)句的一個(gè)具體實(shí)施例的對(duì)應(yīng)關(guān)系圖;
圖3為本發(fā)明的生成標(biāo)注庫(kù)的裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
圖4為本發(fā)明的生成標(biāo)注庫(kù)的方法的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
圖5為本發(fā)明的生成標(biāo)注庫(kù)的方法的另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)“第一”、“第二”、“第三”“第四”等是用于區(qū)別不同的對(duì)象,而不是用于描述特定順序。此外,術(shù)語(yǔ)“包括”和“具有”以及它們?nèi)魏巫冃?,意圖在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒(méi)有限定于已列出的步驟或單元,而是可選地還包括沒(méi)有列出的步驟或單元,或可選地還包括對(duì)于這些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
請(qǐng)參閱圖1,圖1為本發(fā)明實(shí)施例提供的生成標(biāo)注庫(kù)的方法的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。如圖1所示,本實(shí)施例的生成標(biāo)注庫(kù)的方法包括:
101、確定雙語(yǔ)平行語(yǔ)料庫(kù)中的源語(yǔ)句和目標(biāo)語(yǔ)句,所述源語(yǔ)句和所述目標(biāo)語(yǔ)句為在句子級(jí)別互為翻譯的語(yǔ)料。
本實(shí)施例中,雙語(yǔ)平行語(yǔ)料庫(kù)中包括互為翻譯的兩種語(yǔ)料,為描述方便,本文中稱(chēng)其中一種語(yǔ)料為目標(biāo)語(yǔ)語(yǔ)料,稱(chēng)另一種語(yǔ)料為源語(yǔ)語(yǔ)料,其中,源 語(yǔ)語(yǔ)料為相對(duì)于目標(biāo)語(yǔ)語(yǔ)料在使用中更容易省略某一種詞類(lèi)的語(yǔ)言。為描述方便,下文稱(chēng)該易省略的詞類(lèi)為第一詞類(lèi)。
舉例來(lái)說(shuō),該目標(biāo)語(yǔ)語(yǔ)料可以為英文,該源語(yǔ)語(yǔ)料為漢語(yǔ)、日語(yǔ)或者捷克語(yǔ)。該第一詞類(lèi)為代詞或者連接詞,在此不作限制。雙語(yǔ)平行語(yǔ)料庫(kù)中包括句子級(jí)別的語(yǔ)料,或者還包括詞語(yǔ)級(jí)別、段落級(jí)別、文檔級(jí)別中的至少一種級(jí)別的語(yǔ)料,在此不作限制。
本實(shí)施例中的目標(biāo)語(yǔ)句和源語(yǔ)句可以是雙語(yǔ)平行語(yǔ)料庫(kù)中任意一對(duì)在句子級(jí)別互為翻譯的語(yǔ)料。
102、將所述目標(biāo)語(yǔ)句和所述源語(yǔ)句進(jìn)行對(duì)齊。
在對(duì)目標(biāo)語(yǔ)句和源語(yǔ)句進(jìn)行對(duì)齊處理時(shí),首先要將目標(biāo)語(yǔ)句和源語(yǔ)句進(jìn)行預(yù)處理,也即將目標(biāo)語(yǔ)句和源語(yǔ)句分別切割成各自所屬語(yǔ)言的基本粒度。例如,當(dāng)目標(biāo)語(yǔ)語(yǔ)料為英文時(shí),對(duì)目標(biāo)語(yǔ)句進(jìn)行標(biāo)記解析(tokenize),當(dāng)源語(yǔ)語(yǔ)料為中文時(shí),對(duì)源語(yǔ)句進(jìn)行分詞。對(duì)語(yǔ)言的預(yù)處理為SMT領(lǐng)域中的現(xiàn)有技術(shù),在此不再贅述。進(jìn)行預(yù)處理后,建立目標(biāo)語(yǔ)句和源語(yǔ)句中詞的對(duì)應(yīng)關(guān)系。生成的詞語(yǔ)對(duì)應(yīng)關(guān)系具體形式為:x:y,其中x和y為正整數(shù),表示目標(biāo)語(yǔ)句中第x個(gè)詞語(yǔ)和源語(yǔ)句中第y個(gè)詞語(yǔ)對(duì)應(yīng)。
實(shí)際應(yīng)用中,一般采用開(kāi)源對(duì)齊工具(如GIZA++)來(lái)對(duì)目標(biāo)語(yǔ)句和源語(yǔ)句進(jìn)行對(duì)齊處理。具體如何進(jìn)行對(duì)齊處為現(xiàn)有技術(shù),在此不再贅述。
103、當(dāng)?shù)谝惶囟ㄔ~在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的源特定詞時(shí),獲取第一候選集合,所述第一特定詞為所述目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的詞,所述源特定詞為所述第一特定詞在所述源語(yǔ)句中的翻譯,所述第一候選集合中包括與所述第一特定詞互為翻譯的候選源特定詞。
當(dāng)?shù)谝惶囟ㄔ~在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的翻譯時(shí),查找所述源語(yǔ)句中缺失與所述第一特定詞對(duì)應(yīng)的第一特定詞。本實(shí)施例中,確定第一特定詞在源語(yǔ)句中沒(méi)有對(duì)應(yīng)的翻譯的方法有多種。
例如,將所述目標(biāo)語(yǔ)句和所述源語(yǔ)句進(jìn)行對(duì)齊后,查找目標(biāo)語(yǔ)句中所有候選詞,該候選詞為目標(biāo)語(yǔ)句在源語(yǔ)句中沒(méi)有對(duì)應(yīng)的翻譯的詞,然后從候選詞中挑選出至少部分屬于第一詞類(lèi)的詞,那么該詞為在源語(yǔ)句中沒(méi)有對(duì)應(yīng)的翻譯的第一特定詞。
又例如,首先在目標(biāo)語(yǔ)句中查找出所有屬于第一詞類(lèi)的詞為第一特定詞,然后依次判斷各第一特定詞在源語(yǔ)句中是否存在對(duì)應(yīng)的翻譯,并從中挑選出至少部分不存在對(duì)應(yīng)的翻譯的第一特定詞。
挑選出在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的翻譯的第一特定詞后,由于第一特定詞是已知的,那么第一特定詞的翻譯也是確定的。將該第一特定詞的所有翻譯添加到第一候選集合中,所述第一候選集合中的元素為第一特定詞的候選詞。
以第一詞類(lèi)為代詞舉例來(lái)說(shuō),若第一特定詞為“my”,那么將第一特定詞的翻譯“我的”作為候選詞添加到第一候選集合中。若第一特定詞為“your”,那么將第一特定詞的翻譯“你的”和“你們的”分別作為候選詞都添加到第一候選集合中。
實(shí)際應(yīng)用中,目標(biāo)語(yǔ)句中可能出現(xiàn)至少兩個(gè)在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的翻譯的第一特定詞,這種情況中,將該至少兩個(gè)第一特定詞的翻譯全部添加到第一候選集合中。
104、根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合,所述位置集合包括所述源語(yǔ)句中可能缺失所述源特定詞的位置。
每確定一個(gè)翻譯語(yǔ)料已添加到第一候選集合中的第一特定詞后,可以根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系確定該第一特定詞對(duì)應(yīng)的源特定詞可能填補(bǔ)在源語(yǔ)句中的所有候選位置,并將該候選位置全部添加到候選位置集合中。
本實(shí)施例中,根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系確定該第一特定詞對(duì)應(yīng)的源特定詞可能填補(bǔ)在源語(yǔ)句中的所有候選位置的方法有多種??蛇x的,可采用啟發(fā)式搜索算法根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系確定源特定詞在源語(yǔ)句中的所有候選位置。
為方便理解,下面以源語(yǔ)句中所缺失的詞類(lèi)(即第一詞類(lèi))為代詞為例對(duì)“如何采用啟發(fā)式搜索算法根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系確定源特定詞在源語(yǔ)句中的所有候選位置”進(jìn)行說(shuō)明。如圖2所示,圖2為目標(biāo)語(yǔ)句和源語(yǔ)句的對(duì)應(yīng)關(guān)系圖。圖2所示實(shí)施例中,目標(biāo)語(yǔ)句為“I've been preparing for that my entire life”,源語(yǔ)句為“我已經(jīng)準(zhǔn)備了一輩子”。對(duì)源語(yǔ)句 分詞后得到的結(jié)果為“我”“已經(jīng)”“準(zhǔn)備”“了”“一輩子”。從圖中的對(duì)應(yīng)關(guān)系可以看出,源語(yǔ)句中缺失了目標(biāo)語(yǔ)句中的代詞“my”對(duì)應(yīng)的翻譯。通過(guò)圖中的對(duì)角線上“my”前后已經(jīng)確定的對(duì)齊信息(“preparing-準(zhǔn)備”和“l(fā)ife-一輩子”),可以確定“my”對(duì)應(yīng)的源特定詞在源語(yǔ)句中的兩個(gè)候選位置,其中一個(gè)候選位置為在源語(yǔ)句中“了”的前面,另一候選位置為在源語(yǔ)句中“了”的后面。
在目標(biāo)語(yǔ)句中出現(xiàn)翻譯語(yǔ)料已添加到第一候選集合中的第一特定詞的數(shù)量為至少兩個(gè)的情況中,將該至少兩個(gè)第一特定詞分別對(duì)應(yīng)的源特定詞的所有候選位置全部添加到該候選位置集合中。
105、根據(jù)預(yù)置語(yǔ)言概率模型獲取第二候選集合中各語(yǔ)句的正確概率,所述第二候選集合包括將所述第一候選集合中的候選源特定詞填補(bǔ)到所述候選位置集合中的位置后形成的候選源語(yǔ)句。
在獲取到第一候選集合和候選位置集合后,對(duì)第一候選集合中的任意一個(gè)候選源特定詞和候選位置集合中的任意一個(gè)候選位置進(jìn)行組合,以在源語(yǔ)句中該候選位置處填補(bǔ)該候選源特定詞,形成候選源語(yǔ)句。若第一候選集合中的元素?cái)?shù)量為m,候選位置集合中的元素?cái)?shù)量為n,那么可形成m×n個(gè)候選源語(yǔ)句。為描述方便,將該m×n個(gè)候選源語(yǔ)句形成的集合稱(chēng)為第二候選集合。
根據(jù)預(yù)置語(yǔ)言概率模型對(duì)第二候選集合中的每一個(gè)候選源語(yǔ)句的正確概率進(jìn)行計(jì)算。具體的,該預(yù)置語(yǔ)言概率模型可以是N元文法模型或者基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,在此不作限制。
106、生成標(biāo)注庫(kù),所述標(biāo)注庫(kù)包括新源語(yǔ)句,所述新源語(yǔ)句為根據(jù)所述第二候選集合中各語(yǔ)句的正確概率確定的候選源語(yǔ)句。
計(jì)算出第二候選集合中各候選源語(yǔ)句的正確概率后,根據(jù)該正確概率從大至小依次對(duì)各候選源語(yǔ)句進(jìn)行排序。將正確概率最大的候選源語(yǔ)句添加到標(biāo)注庫(kù)中。
可選的,將原源語(yǔ)句、正確概率最大的N個(gè)候選源語(yǔ)句以及該N個(gè)候選源語(yǔ)句的正確概率均添加到標(biāo)注庫(kù)中,其中N為預(yù)置數(shù)值。這樣可以增加標(biāo)注庫(kù)的魯棒性。
本實(shí)施例中,源語(yǔ)句所屬的語(yǔ)言為易缺失第一詞類(lèi)的語(yǔ)言,通過(guò)利用雙語(yǔ)平行語(yǔ)料庫(kù)中雙語(yǔ)的對(duì)應(yīng)關(guān)系,將互為翻譯語(yǔ)料的目標(biāo)語(yǔ)句和源語(yǔ)句進(jìn)行對(duì)齊,當(dāng)目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的第一特定詞在源語(yǔ)句中找不到對(duì)應(yīng)的翻譯時(shí),則可以確定源語(yǔ)句中缺失與該第一特定詞對(duì)應(yīng)的源特定詞,而根據(jù)該兩個(gè)語(yǔ)句的對(duì)應(yīng)關(guān)系可確定出源語(yǔ)句中可能缺失源特定詞的位置集合;由于第一特定詞為確定的,第一特定詞的翻譯可在一個(gè)小集合中挑選,因此將該小集合中的各翻譯和源語(yǔ)句中可能缺失第一特定詞的位置任意組合,以形成多個(gè)候選源語(yǔ)句,并通過(guò)語(yǔ)言概率模型來(lái)計(jì)算各候選源語(yǔ)句的正確概率,以挑選出正確的候選源語(yǔ)句作為填補(bǔ)空缺第一特定詞后的新源語(yǔ)句;整個(gè)過(guò)程均由機(jī)器完成,無(wú)需人工標(biāo)注語(yǔ)料庫(kù),采用該方法能夠以較低耗費(fèi)自動(dòng)生成代詞標(biāo)注語(yǔ)料。
本實(shí)施例中,獲取到生成的標(biāo)注庫(kù)后,可對(duì)該標(biāo)注庫(kù)進(jìn)行有監(jiān)督學(xué)習(xí),以訓(xùn)練出第一詞類(lèi)生成系統(tǒng)(例如代詞生成系統(tǒng)),進(jìn)而將該第一詞類(lèi)生成系統(tǒng)運(yùn)用到機(jī)器翻譯系統(tǒng)中。
具體的,對(duì)標(biāo)注庫(kù)中已經(jīng)標(biāo)注的語(yǔ)料,將該語(yǔ)料轉(zhuǎn)換成序列形式。以第一詞類(lèi)生成系統(tǒng)為代詞生成系統(tǒng)為例,對(duì)每個(gè)語(yǔ)句中的每個(gè)詞,該詞被貼上無(wú)代詞缺失、缺失人稱(chēng)代詞、缺失物主代詞和缺失反身代詞中的其中一種標(biāo)簽,用于表示該詞的左邊位置或者右邊位置上無(wú)代詞缺失、缺失人稱(chēng)代詞、缺失物主代詞或者缺失反身代詞。然后通過(guò)提取該語(yǔ)料庫(kù)的一系列特征來(lái)訓(xùn)練分類(lèi)模型。最終根據(jù)該分類(lèi)模型來(lái)自動(dòng)標(biāo)注其他缺失代詞的語(yǔ)句。
可選的,本實(shí)施例中,對(duì)語(yǔ)料庫(kù)進(jìn)行有監(jiān)督學(xué)習(xí)后訓(xùn)練出基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的序列標(biāo)注模型?;谏疃壬窠?jīng)網(wǎng)絡(luò)架構(gòu)的序列標(biāo)注模型的一個(gè)優(yōu)勢(shì)在于不需要人工來(lái)提取語(yǔ)料中的“一系列特征”,避免了復(fù)雜的特征選擇過(guò)程,只要將句子輸入該序列標(biāo)注模型中,該序列標(biāo)注模型會(huì)自動(dòng)學(xué)習(xí)到需要的特征。
具體的,所述基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的序列標(biāo)注模型包括Elman-type遞歸神經(jīng)網(wǎng)絡(luò)。該Elman-type遞歸神經(jīng)網(wǎng)絡(luò)包括第一公式和第二公式,所述第一公式為ht=s(Uwt+Wht-1),第二公式為yt=g(Vht)。其中,s(·)為sigmoid公式,g(·)為softmax公式,U、W和V為層之間相應(yīng)的權(quán)重,wt為輸入的句 子序列中的第t個(gè)詞;輸出的yt為所缺失的第一詞類(lèi)的類(lèi)型。舉例來(lái)說(shuō),第一詞類(lèi)為代詞時(shí),輸出的yt為標(biāo)簽集{NULL,PE,PO,RE}中的其中一個(gè),其中NULL表示無(wú)代詞缺失,PE表示缺失人稱(chēng)代詞,PO表示缺失物主代詞,RE表示缺失反身代詞。
在第一公式和第二公式中,U、W和V分別對(duì)應(yīng)的權(quán)重為神經(jīng)網(wǎng)絡(luò)模型在標(biāo)注數(shù)據(jù)上自動(dòng)訓(xùn)練得到的結(jié)果,此為現(xiàn)有技術(shù),在此不再贅述。該yt表示yt=g(Vht)中的ht在第一公式中的所用的自變量wt對(duì)應(yīng)的第t個(gè)詞的右邊位置是否缺失代詞的預(yù)測(cè)結(jié)果。
這樣,在需要對(duì)一個(gè)單語(yǔ)語(yǔ)料庫(kù)中的語(yǔ)句進(jìn)行填補(bǔ)代詞時(shí),從該單語(yǔ)語(yǔ)料庫(kù)中獲取一個(gè)語(yǔ)句(為描述方便,下文中稱(chēng)該語(yǔ)句為第一語(yǔ)句),其中,所述單語(yǔ)語(yǔ)料庫(kù)中的語(yǔ)料和所述源語(yǔ)句屬于同一種語(yǔ)言。依次將第一語(yǔ)句中的各個(gè)詞輸入所述第一公式和第二公式進(jìn)行計(jì)算,計(jì)算得到的yt為該詞的右邊位置是否缺失代詞的預(yù)測(cè)結(jié)果。這樣,可最終確定該第一語(yǔ)句中分別缺失人稱(chēng)代詞、缺失物主代詞和缺失反身代詞的所有位置。也即預(yù)測(cè)到第一語(yǔ)句中缺失特定詞的位置以及該特定詞的類(lèi)型。該特定詞為所述第一語(yǔ)句中屬于所述第一詞類(lèi)的詞。舉例來(lái)說(shuō),當(dāng)?shù)谝辉~類(lèi)為代詞時(shí)該特定詞的類(lèi)型為人稱(chēng)代詞、物主代詞或反身代詞。
根據(jù)所述特定詞的類(lèi)型獲取候選特定詞集合。當(dāng)特定詞的類(lèi)型確定時(shí),該特定詞的候選特定詞集合也可以確定。例如,當(dāng)特定詞的類(lèi)型為物主代詞時(shí),該特定詞的候選特定詞集合為{我的(my)、你的(your)、我們的(our)、你們的(your)、他們的(their)、它的(its)、它們的(their)、她們的(their)}。
將所述候選特定詞集合中的代詞填補(bǔ)到所述代詞缺失位置后形成的語(yǔ)句添加到第一語(yǔ)句候選集合中,根據(jù)預(yù)置語(yǔ)言概率模型獲取第一語(yǔ)句候選集合中各語(yǔ)句的正確概率,根據(jù)所述正確概率從所述第一候選集合中挑選候選語(yǔ)句作為增添所述特定詞后的第一語(yǔ)句。具體的,該預(yù)置語(yǔ)言概率模型可以是N元文法模型或者基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,在此不作限制。
計(jì)算出第一語(yǔ)句候選集合中各語(yǔ)句的正確概率后,根據(jù)該正確概率從大至小依次對(duì)各語(yǔ)句進(jìn)行排序。將正確概率最大的語(yǔ)句確定為增添所述特定詞后的第一語(yǔ)句。
可選的,將原第一語(yǔ)句、第一語(yǔ)句候選集合中正確概率最大的M個(gè)語(yǔ)句以及該M個(gè)語(yǔ)句的正確概率均保留到代詞生成系統(tǒng)中,其中M為預(yù)置數(shù)值。這樣可以增加代詞生成系統(tǒng)的魯棒性。
當(dāng)然,上述描述中以第一詞類(lèi)為代詞為例,實(shí)際應(yīng)用中上述方法在第一詞類(lèi)為其他詞類(lèi)的情況中也適用。
上面對(duì)本發(fā)明的生成標(biāo)注庫(kù)的方法進(jìn)行了描述,下面對(duì)本發(fā)明的生成標(biāo)注庫(kù)的裝置進(jìn)行描述,該生成標(biāo)注庫(kù)的裝置用于執(zhí)行上述所描述的生成標(biāo)注庫(kù)的方法。
請(qǐng)參閱圖3,圖3為本發(fā)明的生成標(biāo)注庫(kù)的裝置的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。本發(fā)明的生成標(biāo)注庫(kù)的裝置300包括:
確定模塊301,用于確定雙語(yǔ)平行語(yǔ)料庫(kù)中的源語(yǔ)句和目標(biāo)語(yǔ)句,所述源語(yǔ)句和所述目標(biāo)語(yǔ)句為在句子級(jí)別互為翻譯的語(yǔ)料;
對(duì)齊模塊302,用于將所述目標(biāo)語(yǔ)句和所述源語(yǔ)句進(jìn)行對(duì)齊;
第一獲取模塊303,用于當(dāng)?shù)谝惶囟ㄔ~在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的源特定詞時(shí),獲取第一候選集合,所述第一特定詞為所述目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的詞,所述源特定詞為所述第一特定詞在所述源語(yǔ)句中的翻譯,所述第一候選集合中包括與所述第一特定詞互為翻譯的候選源特定詞;
第二獲取模塊304,用于根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合,所述候選位置集合包括所述源語(yǔ)句中可能缺失所述源特定詞的位置;
第三獲取模塊305,用于根據(jù)預(yù)置語(yǔ)言概率模型獲取第二候選集合中各語(yǔ)句的正確概率,所述第二候選集合包括將所述第一候選集合中的候選源特定詞填補(bǔ)到所述候選位置集合中的位置后形成的候選源語(yǔ)句;
生成模塊306,用于生成標(biāo)注庫(kù),所述標(biāo)注庫(kù)包括新源語(yǔ)句,所述新源語(yǔ)句為根據(jù)所述第二候選集合中各語(yǔ)句的正確概率確定的候選源語(yǔ)句。
本實(shí)施例中,源語(yǔ)句所屬的語(yǔ)言為易缺失第一詞類(lèi)的語(yǔ)言,生成標(biāo)注庫(kù)的裝置通過(guò)利用雙語(yǔ)平行語(yǔ)料庫(kù)中雙語(yǔ)的對(duì)應(yīng)關(guān)系,將互為翻譯語(yǔ)料的目標(biāo)語(yǔ)句和源語(yǔ)句進(jìn)行對(duì)齊,當(dāng)目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的第一特定詞在源語(yǔ)句中找不到對(duì)應(yīng)的翻譯時(shí),則可以確定源語(yǔ)句中缺失與該第一特定詞對(duì)應(yīng)的源 特定詞,而根據(jù)該兩個(gè)語(yǔ)句的對(duì)應(yīng)關(guān)系可確定出源語(yǔ)句中可能缺失源特定詞的位置集合;由于第一特定詞為確定的,第一特定詞的翻譯可在一個(gè)小集合中挑選,因此將該小集合中的各翻譯和源語(yǔ)句中可能缺失第一特定詞的位置任意組合,以形成多個(gè)候選源語(yǔ)句,并通過(guò)語(yǔ)言概率模型來(lái)計(jì)算各候選源語(yǔ)句的正確概率,以挑選出正確的候選源語(yǔ)句作為填補(bǔ)空缺第一特定詞后的新源語(yǔ)句;整個(gè)過(guò)程均由機(jī)器完成,無(wú)需人工標(biāo)注語(yǔ)料庫(kù),采用該方法能夠以較低耗費(fèi)自動(dòng)生成代詞標(biāo)注語(yǔ)料。
可選的,所述第二獲取模塊304具體用于采用啟發(fā)式搜索算法根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合。
可選的,所述新源語(yǔ)句包括所述第二候選集合中概率最大的預(yù)置數(shù)值個(gè)語(yǔ)句。
可選的,所述生成標(biāo)注庫(kù)的裝置300還包括:
查找模塊307,用于在獲取第一候選集合之前,查找所述目標(biāo)語(yǔ)句中屬于所述第一詞類(lèi)的所有第一特定詞;
判斷模塊308,用于對(duì)每一個(gè)所述第一特定詞,判斷所述第一特定詞在所述源語(yǔ)句中是否存在對(duì)應(yīng)的翻譯;
所述第一獲取模塊303具體用于將在所述源語(yǔ)句中不存在對(duì)應(yīng)的翻譯的至少部分第一特定詞的翻譯語(yǔ)料添加到所述第一候選集合中。
可選的,如圖4所示,所述生成標(biāo)注庫(kù)的裝置還包括:
學(xué)習(xí)模塊401,用于對(duì)所述標(biāo)注庫(kù)進(jìn)行有監(jiān)督學(xué)習(xí),訓(xùn)練出基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的序列標(biāo)注模型,所述序列標(biāo)注模型包括Elman-type遞歸神經(jīng)網(wǎng)絡(luò);
第四獲取模塊402,用于在單語(yǔ)語(yǔ)料庫(kù)中獲取第一語(yǔ)句,根據(jù)所述序列標(biāo)注模型預(yù)測(cè)所述第一語(yǔ)句的缺失特定詞的位置以及判定所述特定詞的類(lèi)型,其中,所述單語(yǔ)語(yǔ)料庫(kù)中的語(yǔ)料和所述源語(yǔ)句屬于同一種語(yǔ)言,所述特定詞為所述第一語(yǔ)句中屬于所述第一詞類(lèi)的詞;
第五獲取模塊403,用于根據(jù)所述特定詞的類(lèi)型獲取候選特定詞集合;
第六獲取模塊404,用于根據(jù)預(yù)置語(yǔ)言概率模型獲取第一語(yǔ)句候選集合中各語(yǔ)句的正確概率,所述第一語(yǔ)句候選集合包括將所述候選特定詞集合中的候選特定詞填補(bǔ)到所述缺失特定詞的位置后形成的候選語(yǔ)句;
挑選模塊405,用于根據(jù)所述正確概率從所述第一候選集合中挑選候選語(yǔ)句作為增添所述特定詞后的第一語(yǔ)句。
請(qǐng)參閱圖5,圖5為本發(fā)明的生成標(biāo)注庫(kù)的裝置的另一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。本實(shí)施例中,生成標(biāo)注庫(kù)的裝置500包括存儲(chǔ)器501、一個(gè)或多個(gè)處理器502以及一個(gè)或多個(gè)程序,其中所述一個(gè)或多個(gè)程序被存儲(chǔ)在所述存儲(chǔ)器501中并被配置為被所述一個(gè)或多個(gè)處理器502執(zhí)行。在本發(fā)明的一些實(shí)施例中,存儲(chǔ)器501和一個(gè)或多個(gè)處理器502可通過(guò)總線或其它方式連接,其中,圖5中以通過(guò)總線504連接為例。
所述處理器調(diào)用所述一個(gè)或多個(gè)程序,執(zhí)行以下操作:
確定雙語(yǔ)平行語(yǔ)料庫(kù)中的源語(yǔ)句和目標(biāo)語(yǔ)句,所述源語(yǔ)句和所述目標(biāo)語(yǔ)句為在句子級(jí)別互為翻譯的語(yǔ)料;
將所述目標(biāo)語(yǔ)句和所述源語(yǔ)句進(jìn)行對(duì)齊;
當(dāng)?shù)谝惶囟ㄔ~在所述源語(yǔ)句中沒(méi)有對(duì)應(yīng)的源特定詞時(shí),獲取第一候選集合,所述第一特定詞為所述目標(biāo)語(yǔ)句中屬于第一詞類(lèi)的詞,所述源特定詞為所述第一特定詞在所述源語(yǔ)句中的翻譯,所述第一候選集合中包括與所述第一特定詞互為翻譯的候選源特定詞;
根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合,所述候選位置集合包括所述源語(yǔ)句中可能缺失所述源特定詞的位置;
根據(jù)預(yù)置語(yǔ)言概率模型獲取第二候選集合中各語(yǔ)句的正確概率,所述第二候選集合包括將所述第一候選集合中的候選源特定詞填補(bǔ)到所述候選位置集合中的位置后形成的候選源語(yǔ)句;
生成標(biāo)注庫(kù),所述標(biāo)注庫(kù)包括新源語(yǔ)句,所述新源語(yǔ)句為根據(jù)所述第二候選集合中各語(yǔ)句的正確概率確定的候選源語(yǔ)句。
可選的,所述根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合,包括:
采用啟發(fā)式搜索算法根據(jù)所述源語(yǔ)句和所述目標(biāo)語(yǔ)句之間的對(duì)齊關(guān)系獲取候選位置集合。
可選的,所述新源語(yǔ)句包括所述第二候選集合中概率最大的預(yù)置數(shù)值個(gè)語(yǔ)句。
可選的,所述處理器在獲取第一候選集合之前,還執(zhí)行以下操作:
查找所述目標(biāo)語(yǔ)句中屬于所述第一詞類(lèi)的所有第一特定詞;
對(duì)每一個(gè)所述第一特定詞,判斷所述第一特定詞在所述源語(yǔ)句中是否存在對(duì)應(yīng)的翻譯;
所述處理器在獲取第一候選集合時(shí),具體用于執(zhí)行以下操作:
將在所述源語(yǔ)句中不存在對(duì)應(yīng)的翻譯的至少部分第一特定詞的翻譯語(yǔ)料添加到所述第一候選集合中。
可選的,所述處理器還用于執(zhí)行以下操作:
對(duì)所述標(biāo)注庫(kù)進(jìn)行有監(jiān)督學(xué)習(xí),訓(xùn)練出基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的序列標(biāo)注模型,所述序列標(biāo)注模型包括Elman-type遞歸神經(jīng)網(wǎng)絡(luò);
在單語(yǔ)語(yǔ)料庫(kù)中獲取第一語(yǔ)句,根據(jù)所述序列標(biāo)注模型預(yù)測(cè)所述第一語(yǔ)句的缺失特定詞的位置以及判定所述特定詞的類(lèi)型,其中,所述單語(yǔ)語(yǔ)料庫(kù)中的語(yǔ)料和所述源語(yǔ)句屬于同一種語(yǔ)言,所述特定詞為所述第一語(yǔ)句中屬于所述第一詞類(lèi)的詞;
根據(jù)所述特定詞的類(lèi)型獲取候選特定詞集合;
根據(jù)預(yù)置語(yǔ)言概率模型獲取第一語(yǔ)句候選集合中各語(yǔ)句的正確概率,所述第一語(yǔ)句候選集合包括將所述候選特定詞集合中的候選特定詞填補(bǔ)到所述缺失特定詞的位置后形成的候選語(yǔ)句;
根據(jù)所述正確概率從所述第一候選集合中挑選候選語(yǔ)句作為增添所述特定詞后的第一語(yǔ)句。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng),裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,裝置或單元的間接耦合 或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述,以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。