亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

增量語(yǔ)言翻譯方法和系統(tǒng)的制作方法

文檔序號(hào):6432746閱讀:323來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):增量語(yǔ)言翻譯方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明總地涉及一種用于翻譯語(yǔ)言的計(jì)算機(jī)實(shí)施的方法、數(shù)據(jù)處理系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品。更具體地,本發(fā)明涉及翻譯用來(lái)構(gòu)造數(shù)據(jù)處理系統(tǒng)的數(shù)據(jù)庫(kù)的選擇部分。
背景技術(shù)
近幾十年的貿(mào)易已經(jīng)促生了多邊貿(mào)易。因此各國(guó)之間流通著復(fù)雜的機(jī)械和媒介。 雖然許多工業(yè)化國(guó)家具有為了商業(yè)目的而采用英語(yǔ)的相當(dāng)多的人口,但是許多領(lǐng)域(例如教育)依賴(lài)于要以顧客的語(yǔ)言銷(xiāo)售并且由文檔和其他幫助來(lái)支持的設(shè)備。這種情況給信息技術(shù)設(shè)備的銷(xiāo)售者和維護(hù)者帶來(lái)了特有的困難。每當(dāng)機(jī)器和輔助設(shè)備以修改的特征更新時(shí),制造商所在國(guó)家的用戶(hù)能得到該修改特征的時(shí)間與客戶(hù)所在國(guó)家的用戶(hù)能利用該特征的時(shí)間之間可能發(fā)生延遲。發(fā)生這種延遲可能是由于新特征出現(xiàn)在包括顯示的或說(shuō)出的(經(jīng)揚(yáng)聲器)語(yǔ)言的用戶(hù)接口中。這種機(jī)器的總體功能可能已經(jīng)被翻譯成客戶(hù)的語(yǔ)言。但是,一個(gè)新特征可能增加20%新的和/或改變的單詞到已經(jīng)在這種設(shè)備的先前版本支持軟件中翻譯的語(yǔ)言的已有全部詞匯(corpus)。因此,更新的信息可能依賴(lài)于對(duì)設(shè)備的修改的有針對(duì)性的翻譯。重要的是,找到一種方法來(lái)將已翻譯的特征與未翻譯的特征分開(kāi)有利于解決上述問(wèn)題。

發(fā)明內(nèi)容
本發(fā)明提供一種計(jì)算機(jī)實(shí)施的方法、系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品,用于識(shí)別和翻譯部分翻譯的數(shù)據(jù)的一個(gè)子集。修改成分選擇器(revisedcomponent selector)在數(shù)據(jù)庫(kù)中提取包括多個(gè)英語(yǔ)關(guān)鍵字和翻譯語(yǔ)言值的翻譯文件,包含未翻譯的關(guān)鍵字作為擴(kuò)展標(biāo)記語(yǔ)言 (XML)文件。修改成分選擇器確定XML文件中是否存在XML不支持的字符。響應(yīng)于XML文件中存在XML不支持的字符這一確定結(jié)果,修改成分選擇器第一次濾出XML不支持的字符, 以形成結(jié)果文件。修改成分選擇器從結(jié)果文件第二次濾出已翻譯的數(shù)據(jù),以形成一未翻譯的文件。修改成分選擇器選擇數(shù)據(jù)的一個(gè)子集。響應(yīng)于選擇,修改成分選擇器第三次濾出不包括在該子集中的任何數(shù)據(jù),以形成一可翻譯的文件。修改成分選擇器發(fā)送該可翻譯的文件到翻譯中心以便翻譯。


據(jù)信能表征本發(fā)明的新特征在后附的權(quán)利要求中闡述。但是,本發(fā)明本身以及優(yōu)選的使用模式和它們的進(jìn)一步目標(biāo)和優(yōu)點(diǎn)將通過(guò)參考下面的結(jié)合附圖的示意性實(shí)施例的詳細(xì)說(shuō)明被更好地理解。在附圖中圖1是根據(jù)本發(fā)明示意性實(shí)施例的數(shù)據(jù)處理系統(tǒng)的方框圖;圖2A是根據(jù)本發(fā)明示意性實(shí)施例的數(shù)據(jù)處理系統(tǒng)網(wǎng)絡(luò)的方框圖;圖2B是根據(jù)本發(fā)明示意性實(shí)施例的數(shù)據(jù)處理系統(tǒng)網(wǎng)絡(luò)的替代設(shè)置的方框圖;圖3A是根據(jù)本發(fā)明示意性實(shí)施例的可以為中間數(shù)據(jù)類(lèi)型的XML文件;
圖;3B是根據(jù)本發(fā)明示意性實(shí)施例的未翻譯的文件;圖3C是根據(jù)本發(fā)明示意性實(shí)施例的緊湊文件(compact file);圖4是根據(jù)本發(fā)明示意性實(shí)施例的修改成分選擇器處的步驟流程圖;圖5是翻譯中心處的步驟的流程圖。
具體實(shí)施例方式現(xiàn)在參考附圖特別是參考圖1,顯示了數(shù)據(jù)處理系統(tǒng)的方框圖,其中可以實(shí)施示意性實(shí)施例的各方面。數(shù)據(jù)處理系統(tǒng)100是計(jì)算機(jī)的一個(gè)例子,實(shí)施本發(fā)明的過(guò)程的代碼或指令可以位于其中。在顯示的例子中,數(shù)據(jù)處理系統(tǒng)100利用一中樞體系結(jié)構(gòu)(hub architecture),包含北橋和存儲(chǔ)器控制器中樞(NB/MCH) 102、南橋和輸入/輸出(I/O)控制器中樞(SB/ICH) 104。處理器106、主存儲(chǔ)器108和圖形處理器110連接到北橋和存儲(chǔ)器控制器中樞102。圖形處理器110可以經(jīng)例如加速圖形端口(AGP)連接到NB/MCH。在所示的例子中,經(jīng)總線(xiàn)138和140,局域網(wǎng)(LAN)適配器112連接到南橋和I/ 0控制器中樞104及音頻適配器116、鍵盤(pán)和鼠標(biāo)適配器120、調(diào)制解調(diào)器122、只讀存儲(chǔ)器 (ROM) 124、硬盤(pán)驅(qū)動(dòng)器(HDD) 126、⑶-ROM驅(qū)動(dòng)器130、通用串行總線(xiàn)(USB)端口和其它通信端口 132,PCI/PCIe設(shè)備134連接到南橋和I/O控制器中樞104。PCI/PCIe設(shè)備可以包括例如以太網(wǎng)適配器、加入式(add-in)卡和筆記本電腦用的PC卡。PCI使用卡總線(xiàn)控制器, 而PCIe不用。ROMlM可以是例如閃速二進(jìn)制輸入/輸出系統(tǒng)(BIOS)。硬盤(pán)驅(qū)動(dòng)器1 和 CD-ROM驅(qū)動(dòng)器130可以使用例如集成驅(qū)動(dòng)器電子(IDE)或者串行高級(jí)技術(shù)附加(SATA)接口。超級(jí)1/0 (SIO)設(shè)備136可以被連接到南橋和1/0控制器中樞104。操作系統(tǒng)在處理器106上運(yùn)行,協(xié)調(diào)和控制圖1中的數(shù)據(jù)處理系統(tǒng)100內(nèi)的各種部件。操作系統(tǒng)可以是商業(yè)上可以獲得的操作系統(tǒng),例如Microsoft Windows XP。Microsoft和Windows是微軟公司在美國(guó)、其他國(guó)家的商標(biāo),或者同時(shí)是美國(guó)和其他國(guó)家的商標(biāo)。面向?qū)ο蟮木幊滔到y(tǒng),例如Java 編程系統(tǒng),可以與該操作系統(tǒng)結(jié)合運(yùn)行,并從 Java 程序或數(shù)據(jù)處理系統(tǒng)100上執(zhí)行的應(yīng)用程序提供對(duì)該操作系統(tǒng)的調(diào)用。Java 是Sim Microsystem公司在美國(guó)、其他國(guó)家的商標(biāo),或者同時(shí)是美國(guó)和其他國(guó)家的商標(biāo)。用于操作系統(tǒng)、面向?qū)ο蟮木幊滔到y(tǒng)、和應(yīng)用程序或程序的指令位于存儲(chǔ)設(shè)備 (例如硬盤(pán)驅(qū)動(dòng)器126)上,也可以裝載到主存儲(chǔ)器108中以便處理器106執(zhí)行。本發(fā)明的過(guò)程可以由處理器106利用計(jì)算機(jī)實(shí)現(xiàn)的指令來(lái)實(shí)施,這些指令可以位于存儲(chǔ)器(例如主存儲(chǔ)器108、只讀存儲(chǔ)器124),或者可以位于一個(gè)或多個(gè)外設(shè)中。本領(lǐng)域的技術(shù)人員將會(huì)理解,圖1中的硬件可以根據(jù)具體實(shí)施情況而改變。除了圖1所示的硬件之外或者替代圖1所示的硬件,可以使用諸如閃存、等同的非易失性存儲(chǔ)器等的其他內(nèi)部硬件或外部設(shè)備。此外,示意性實(shí)施例的過(guò)程可以應(yīng)用到多處理器數(shù)據(jù)處理系統(tǒng)。在某些示例中,數(shù)據(jù)處理系統(tǒng)100可以是個(gè)人數(shù)字助手(PDA),它配置有閃存來(lái)提供非易失性存儲(chǔ)器,用于存儲(chǔ)操作系統(tǒng)文件和/或用戶(hù)生成的數(shù)據(jù)??偩€(xiàn)系統(tǒng)可以由一個(gè)或多個(gè)總線(xiàn)構(gòu)成,例如系統(tǒng)總線(xiàn)、1/0總線(xiàn)和PCI總線(xiàn)。當(dāng)然,總線(xiàn)系統(tǒng)可以利用任何類(lèi)型的通信構(gòu)造或體系結(jié)構(gòu)來(lái)實(shí)施,該通信構(gòu)造或體系結(jié)構(gòu)提供附連到該構(gòu)造或體系結(jié)構(gòu)的不同部件或設(shè)備之間的數(shù)據(jù)傳送。通信單元可以包括用于發(fā)送和接收數(shù)據(jù)的一個(gè)或多個(gè)設(shè)備,例如調(diào)制解調(diào)器或網(wǎng)絡(luò)適配器。存儲(chǔ)器可以是例如主存儲(chǔ)器108或者在北橋和存儲(chǔ)器控制器中樞102中的高速緩存器。處理單元可以包括一個(gè)或多個(gè)處理器或CPU。圖1所示的例子不是旨在隱含體系結(jié)構(gòu)限制。例如,數(shù)據(jù)處理系統(tǒng)100除了可以采用PDA形式之外,也可以是平板電腦、膝上型電腦或者電話(huà)設(shè)備。這里使用的術(shù)語(yǔ)是用于說(shuō)明特定實(shí)施例的目的,而不是用于限定本發(fā)明。如這里所用,單數(shù)形式“一”、“一種”和“該”旨在也包括復(fù)數(shù)形式,除非上下文清楚地表明其他意思。還要理解,本說(shuō)明書(shū)中使用的術(shù)語(yǔ)“包括”指明所述特征、整數(shù)、步驟、操作、元素和/或部件的存在,但是不排除一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元素、部件和/或它們的群組的存在或附加。下面的權(quán)利要求中的所有裝置或步驟加功能元素的相應(yīng)結(jié)構(gòu)、材料、動(dòng)作和等同物旨在包括用于結(jié)合具體要求保護(hù)的其他元素執(zhí)行的功能的任何結(jié)構(gòu)、材料或動(dòng)作。提供本發(fā)明的說(shuō)明書(shū)僅用于示例和說(shuō)明的目的,而不用于窮舉或?qū)⒈景l(fā)明限定到所公開(kāi)的形式。對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō)顯然可以做出多種修改和變化而不脫離本發(fā)明的精神和范圍。選擇和說(shuō)明的實(shí)施例是為了更好地解釋本發(fā)明的原理和實(shí)際應(yīng)用,以及使本領(lǐng)域的技術(shù)人員理解具有各種修改的本發(fā)明的各種實(shí)施例適用于所構(gòu)想的特定應(yīng)用。本領(lǐng)域的技術(shù)人員可以理解,本發(fā)明的各方面可以具體實(shí)施為一種系統(tǒng)、方法或者計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明的各方面可以采用完全硬件實(shí)施例的形式、完全軟件實(shí)施例的形式(包括固件、駐留軟件、微碼等)或者組合了軟件和硬件方面的實(shí)施例,這里都可以總地稱(chēng)為“電路”、“模塊”或“系統(tǒng)”。此外,本發(fā)明的各方面可以采用計(jì)算機(jī)程序產(chǎn)品的形式,嵌入在具有計(jì)算機(jī)可讀程序碼的一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中。可以使用一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任何組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是但不限于例如電子的、磁的、光的、電磁的、紅外的或半導(dǎo)體系統(tǒng)、裝置或設(shè)備,或者是前述的任何適當(dāng)組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮盡列表)將包括以下具有一個(gè)或多個(gè)導(dǎo)線(xiàn)的電子連接、便攜式計(jì)算機(jī)盤(pán)、硬盤(pán)、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦可編程只讀存儲(chǔ)器(EPR0M或閃存)、光纖、便攜式緊致盤(pán)只讀存儲(chǔ)器(CD-ROM)、光存儲(chǔ)設(shè)備、磁存儲(chǔ)設(shè)備或者前述的任何適當(dāng)組合。在本文件的上下文中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何有形的介質(zhì),可以包含或存儲(chǔ)由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用的程序或者與指令執(zhí)行系統(tǒng)、 裝置或設(shè)備相關(guān)聯(lián)的程序。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以包括具有嵌入其中的計(jì)算機(jī)可讀程序碼的傳播數(shù)據(jù)信號(hào),例如在基帶中或者作為載波的一部分。這樣的傳播信號(hào)可以采取多種形式之一,包括但不限于電磁、光學(xué)的或者它們的任何適當(dāng)組合。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以是并非計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)并且可以傳遞、傳播或者輸送程序以便由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或者與其結(jié)合的任何計(jì)算機(jī)可讀介質(zhì)。嵌入在計(jì)算機(jī)可讀介質(zhì)上的程序碼可以利用任何適當(dāng)?shù)慕橘|(zhì)傳送,包括但是不限于無(wú)線(xiàn)、有線(xiàn)、光纖電纜、RF等或前述的任何適當(dāng)組合。執(zhí)行本發(fā)明各方面的操作的計(jì)算機(jī)程序碼可以以一種或多種編程語(yǔ)言的任何組合形式來(lái)寫(xiě),這些語(yǔ)言包括面向?qū)ο蟮木幊陶Z(yǔ)言(例如Java,Smalltalk,C++或類(lèi)似語(yǔ)言) 和傳統(tǒng)的過(guò)程編程語(yǔ)言(例如“C”編程語(yǔ)言或類(lèi)似的編程語(yǔ)言)。程序碼可以完全地在用戶(hù)計(jì)算機(jī)上執(zhí)行,部分地在用戶(hù)的計(jì)算機(jī)上執(zhí)行,作為單獨(dú)的軟件包執(zhí)行、部分地在用戶(hù)的計(jì)算機(jī)上部分地在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行,或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在后面的情況下,遠(yuǎn)程計(jì)算機(jī)可以經(jīng)任何類(lèi)型的網(wǎng)絡(luò)連接到用戶(hù)的計(jì)算機(jī),包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN),或者可以連接到外部計(jì)算機(jī)(例如經(jīng)使用互聯(lián)網(wǎng)服務(wù)供應(yīng)商的互聯(lián)網(wǎng))。下面參考根據(jù)本發(fā)明的實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖說(shuō)明本發(fā)明的各方面。應(yīng)理解,流程圖和/或方框圖的每個(gè)方框以及流程圖和/或方框圖中方框的組合可以由計(jì)算機(jī)程序指令實(shí)施。這些計(jì)算機(jī)程序指令可以提供到通用計(jì)算機(jī)、專(zhuān)用計(jì)算機(jī)或者其他可編程數(shù)據(jù)處理裝置的處理器以產(chǎn)生一機(jī)器,使得這些指令(這些指令經(jīng)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理裝置的處理器執(zhí)行)產(chǎn)生用于實(shí)施流程圖和/或方框圖的一個(gè)或多個(gè)方框中指定的功能/動(dòng)作的手段。這些計(jì)算機(jī)程序指令也可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中,該介質(zhì)可以指示計(jì)算機(jī)、 其他可編程數(shù)據(jù)處理裝置或者其他設(shè)備以特殊方式工作,使得存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令產(chǎn)生一種制造品,該制造品包括實(shí)施流程圖和/或方框圖的一個(gè)或多個(gè)方框中指定的功能/動(dòng)作的指令。計(jì)算機(jī)程序指令也可以加載到計(jì)算機(jī)、其他可編程數(shù)據(jù)處理裝置或其他設(shè)備上, 以使得一系列操作步驟在計(jì)算機(jī)、其他可編程裝置或其他設(shè)備上執(zhí)行,來(lái)產(chǎn)生計(jì)算機(jī)實(shí)施的過(guò)程,使得在計(jì)算機(jī)上或者其他可編程裝置上執(zhí)行的指令提供執(zhí)行流程圖和/或方框圖的一個(gè)或多個(gè)方框中指定的功能/動(dòng)作的過(guò)程。示意性實(shí)施例允許從數(shù)據(jù)庫(kù)或其他存儲(chǔ)設(shè)備選擇文件。這些文件可以具有翻譯成目標(biāo)語(yǔ)言的術(shù)語(yǔ)以及尚未翻譯的術(shù)語(yǔ)的混合,如可能在設(shè)置為在數(shù)據(jù)處理系統(tǒng)中執(zhí)行的軟件的二次發(fā)布過(guò)程中發(fā)生的。示意性實(shí)施例可以更窄地選擇未翻譯的術(shù)語(yǔ)以及上下文信息。這種選擇可以消除這種文件的包括超過(guò)文件內(nèi)容的50%的已翻譯的片段。此外,某些示意性的實(shí)施例可以提供向?qū)谋?guiding text)來(lái)標(biāo)識(shí)元素的開(kāi)始和結(jié)束,例如由可擴(kuò)展標(biāo)記語(yǔ)言(XML)標(biāo)簽界定的,以便凸顯或者以其他方式加強(qiáng)到未翻譯術(shù)語(yǔ)的導(dǎo)航或者在其中的導(dǎo)航。其他的示意性實(shí)施例可以傳送這種修改或產(chǎn)生的文件到翻譯中心、收集所得到的已翻譯的文件、并將這樣的文件輸入到設(shè)備和軟件制造商的文檔合作數(shù)據(jù)庫(kù)(document collaboration database),以便快速部署。因此,可以為偏好與制造商的語(yǔ)言不同的語(yǔ)言的用戶(hù)加速部署。圖2A是根據(jù)本發(fā)明示意性實(shí)施例的數(shù)據(jù)處理系統(tǒng)網(wǎng)絡(luò)的方框圖。服務(wù)管理用戶(hù)接口服務(wù)器200是設(shè)備制造商和訓(xùn)練材料使用的數(shù)據(jù)處理系統(tǒng),來(lái)組織用于構(gòu)建這樣的設(shè)備、訓(xùn)練材料等的草稿文件。文檔合作數(shù)據(jù)庫(kù)201是例如在制造商制造的IT設(shè)備中使用的文檔和文件的存儲(chǔ)設(shè)備。數(shù)據(jù)庫(kù)是文件或者對(duì)象的數(shù)據(jù)存儲(chǔ)器,存儲(chǔ)方式允許計(jì)數(shù)、分類(lèi)和編輯這些文件或?qū)ο?。?shù)據(jù)庫(kù)的結(jié)構(gòu)可以對(duì)于每個(gè)文件或文檔包括元數(shù)據(jù),以及提供版本控制。文件和文檔可以作為純文本文件、XML文件或者任何其他合適的格式存儲(chǔ)。文件和文檔的某些例子由它們的數(shù)據(jù)內(nèi)容舉例說(shuō)明。例如,某些文件可以是Java腳本、配置文件、CSS文件、HTML文件等。如先前說(shuō)明的,每個(gè)這樣的文件可以取決于其他文件用于進(jìn)一步的功能,例如執(zhí)行軟件可以取決于庫(kù)或者包含文件,以便當(dāng)公共庫(kù)耦合到數(shù)據(jù)處理系統(tǒng)時(shí)可以向額外的線(xiàn)程提供功能,該額外線(xiàn)程執(zhí)行如此參考該公共庫(kù)的文件中的指令。
7
文檔合作數(shù)據(jù)庫(kù)是文檔的存儲(chǔ)設(shè)備,可以包含樣式表和其他呈現(xiàn)(rendering)指令,或者根據(jù)計(jì)算機(jī)編譯器或者翻譯器組織的功能文本。這樣的文檔可以是配置文件,可以與計(jì)算機(jī)指令相互操作以修改計(jì)算機(jī)的功能。這樣的配置文件也可以包括呈現(xiàn)到用戶(hù)接口的文本的描述符。這種文件的格式可以按照目前可以得到的XML標(biāo)準(zhǔn)。此外,該格式可以基本符合XML標(biāo)準(zhǔn),雖然該配置文件的某些部分可以是文字文本和標(biāo)簽界定的其他字符, 該標(biāo)簽可以是XML。網(wǎng)絡(luò)203可以用來(lái)允許向文檔合作數(shù)據(jù)庫(kù)201和從其傳送文件和文檔。修改成分選擇器205和翻譯中心207可以合作并經(jīng)網(wǎng)絡(luò)203交換數(shù)據(jù)。修改成分選擇器205可以被操作來(lái)基于用戶(hù)輸入的項(xiàng)目名稱(chēng)從文檔合作數(shù)據(jù)庫(kù)201選擇文件和文檔。修改成分選擇器可以是圖1的數(shù)據(jù)處理系統(tǒng)100。項(xiàng)目名稱(chēng)是產(chǎn)品的名稱(chēng),可以由在該產(chǎn)品內(nèi)運(yùn)行的特征來(lái)修改。項(xiàng)目名稱(chēng)可以對(duì)應(yīng)于一個(gè)名稱(chēng),該名稱(chēng)可以是制造商的內(nèi)部商業(yè)秘密,該秘密匹配于在發(fā)布銷(xiāo)售之前保持于制造狀態(tài)的通??傻玫降陌l(fā)布內(nèi)容。該通??傻玫降陌l(fā)布內(nèi)容可以包括具有軟件指令、配置文件、庫(kù)和根據(jù)優(yōu)選語(yǔ)言以及制造商的記憶規(guī)則以通用方式形成的數(shù)據(jù)結(jié)構(gòu)的文件。因此,構(gòu)成項(xiàng)目?jī)?nèi)容的文件和文檔可以包括適于向用戶(hù)呈現(xiàn)或顯示的字符串。字符串是對(duì)應(yīng)于字符集的字節(jié)列表,字符集例如為Unicode、用于信息交換的美國(guó)標(biāo)準(zhǔn)碼(ASCII)或者任何其他的被認(rèn)可的字符集。字符串可以包括非標(biāo)準(zhǔn)字符。非標(biāo)準(zhǔn)字符是XML標(biāo)準(zhǔn)不支持的字符。XML不支持的字符是根據(jù)所有XML標(biāo)準(zhǔn)被指定為無(wú)效的字符。XML不支持的字符的一個(gè)例子是OxlA。 XML不支持的字符是不可解析的字符。不可解析的字符不能單獨(dú)基于XML規(guī)范的規(guī)則來(lái)解析。字符串能夠以英語(yǔ)來(lái)建立。但是,為有助于項(xiàng)目的國(guó)際化,這樣的字符串可以設(shè)置為文件內(nèi)的三元組。三元組是一個(gè)文件或文檔內(nèi)相互關(guān)聯(lián)的至少三個(gè)字符串。每個(gè)字符串能夠以例如逗號(hào)分隔的文件格式、XML格式、或?qū)⒁粋€(gè)字符串鏈接到其他兩個(gè)字符串的任何其他格式來(lái)形成。翻譯中心207可以是執(zhí)行軟件的產(chǎn)品中所使用的文本的翻譯的源,該軟件以某種語(yǔ)言呈現(xiàn)提示和其他信息??梢杂稍诮K端211上工作的人員來(lái)進(jìn)行翻譯。終端提供用戶(hù)接口來(lái)收集用戶(hù)輸入,以便翻譯例如緊湊文件中的至少某些術(shù)語(yǔ),該緊湊文件可以從修改成分選擇器205傳送到翻譯中心。用戶(hù)輸入是由人例如使用鍵盤(pán)輸入的信息。修改成分選擇器205可以提供手段來(lái)通過(guò)從終端209接收用戶(hù)輸入來(lái)控制處理器上執(zhí)行的軟件的執(zhí)行。終端可以使用對(duì)話(huà)框、文本編輯器和在終端內(nèi)執(zhí)行的其他用戶(hù)接口來(lái)收集用戶(hù)輸入。終端可以是數(shù)據(jù)處理系統(tǒng)。此外,系統(tǒng)管理者可以進(jìn)行輸入,該輸入可以用于設(shè)置子集規(guī)則,根據(jù)該子集規(guī)則分類(lèi)包含潛在翻譯目標(biāo)的屬性。子集規(guī)則將在下面參考圖4做進(jìn)一步解釋。用戶(hù)輸入可以提供用戶(hù)屬性,用戶(hù)屬性可以用于識(shí)別向其授予了特征訪問(wèn)權(quán)的用戶(hù),因此這些屬性是與要翻譯的特征相關(guān)聯(lián)的屬性。圖2B是根據(jù)本發(fā)明示意性實(shí)施例的數(shù)據(jù)處理系統(tǒng)網(wǎng)絡(luò)的替代設(shè)置的方框圖。類(lèi)似于圖2A,數(shù)據(jù)處理系統(tǒng)的替代網(wǎng)絡(luò)249包括服務(wù)管理用戶(hù)接口 250、文檔合作數(shù)據(jù)庫(kù)251、 網(wǎng)絡(luò)253、修改成分選擇器255和翻譯中心257。但是,與圖2A不同,替代網(wǎng)絡(luò)249可以依賴(lài)于翻譯中心257的自動(dòng)功能來(lái)翻譯發(fā)送到翻譯中心257的緊湊文件和其他數(shù)據(jù)。換句話(huà)說(shuō),翻譯中心257可以不依賴(lài)于用戶(hù)審閱緊湊文件的所呈現(xiàn)的版本。類(lèi)似地,修改成分選擇器255可以不需要進(jìn)一步的輸入來(lái)設(shè)置找到具有文件訪問(wèn)權(quán)的用戶(hù)的規(guī)則。因此,可以不需要終端來(lái)設(shè)置特定規(guī)則(ad hoc criteria)以確定針對(duì)新特征的用戶(hù)設(shè)置,該新特征可能依賴(lài)于存儲(chǔ)在文檔合作數(shù)據(jù)庫(kù)中的屬性。圖3A是根據(jù)本發(fā)明示意性實(shí)施例可以為中間數(shù)據(jù)類(lèi)型的XML文件。雖然文件300 利用XML協(xié)議被格式化,但是它可以包含XML不支持的字符。XML不支持的字符可以在兩個(gè)XML標(biāo)簽之間的字符串中,例如字符串341、343、345和347。XML文件300可以是用戶(hù)輸入的主題所選擇的翻譯文件。翻譯文件是含有至少一個(gè)三元組的文件,其中該三元組至少包括對(duì)象名稱(chēng)、關(guān)鍵字和翻譯標(biāo)記(translation token)。翻譯文件可以是部分翻譯的數(shù)據(jù)。換句話(huà)說(shuō),部分翻譯的數(shù)據(jù)可以意味著在一組屬性中,一個(gè)或多個(gè)屬性缺少關(guān)鍵字的任何翻譯,或者缺少關(guān)鍵字的某些翻譯。用戶(hù)輸入的主題可以是項(xiàng)目名稱(chēng),對(duì)于該項(xiàng)目名稱(chēng), 可以依賴(lài)各種文件或文檔來(lái)向該項(xiàng)目的特征提供完全功能。用戶(hù)輸入的主題可以是文件名稱(chēng)。XML文件300可以由多個(gè)屬性構(gòu)成,每個(gè)屬性與一個(gè)對(duì)象相關(guān)聯(lián)。對(duì)象可以是提供關(guān)于術(shù)語(yǔ)在設(shè)備內(nèi)的使用方式的上下文信息的字段,該設(shè)備通過(guò)使用軟件來(lái)控制。對(duì)象名稱(chēng)是該對(duì)象的名稱(chēng)、或者是使用該對(duì)象的上下文。Accountdefaults 355是該對(duì)象的一個(gè)例子。對(duì)象名稱(chēng)和屬性名稱(chēng)的組合可以用作由輸入程序使用的識(shí)別符。輸入程序依賴(lài)于這樣的識(shí)別符,可以正確地將新翻譯的數(shù)據(jù)添加到文檔合作數(shù)據(jù)庫(kù)。換句話(huà)說(shuō),對(duì)象名稱(chēng)和屬性名稱(chēng)可以指定翻譯應(yīng)用到數(shù)據(jù)庫(kù)表內(nèi)的哪個(gè)記錄之內(nèi)。屬性340可以包括多個(gè)關(guān)鍵字。關(guān)鍵字是耦合到欄描述符的、以制造商的工作人員的優(yōu)選語(yǔ)言所寫(xiě)的術(shù)語(yǔ)。關(guān)鍵字可以是英語(yǔ)關(guān)鍵字。英語(yǔ)關(guān)鍵字是基本上以英語(yǔ)寫(xiě)的關(guān)鍵字?!盎旧弦杂⒄Z(yǔ)”意思是一個(gè)術(shù)語(yǔ)使用英文字典中的單詞、英語(yǔ)的常見(jiàn)拼寫(xiě)錯(cuò)誤、技術(shù)字典中的單詞和講英語(yǔ)者使用的詞匯,包括縮寫(xiě)和簡(jiǎn)寫(xiě)。英語(yǔ)關(guān)鍵字包括例如“注釋/組類(lèi)型” 341、“標(biāo)題/組類(lèi)型” 343,以及其他。應(yīng)理解,英語(yǔ)關(guān)鍵字可以是單獨(dú)的短語(yǔ),沒(méi)有“欄 (column) ”來(lái)區(qū)分關(guān)鍵字,只要該關(guān)鍵字在文檔合作數(shù)據(jù)庫(kù)中是唯一的。替代地,在一些情況下,英語(yǔ)關(guān)鍵字還可以包括屬性名稱(chēng)和對(duì)象名稱(chēng),這些情況中這種附加數(shù)據(jù)可以使英語(yǔ)關(guān)鍵字唯一。圖;3B是根據(jù)本發(fā)明示意性實(shí)施例的未翻譯的文件。未翻譯的文件是基于例如XML 文件的一個(gè)文件,但是它已經(jīng)被過(guò)濾為僅僅包含缺少到目標(biāo)語(yǔ)言的翻譯的對(duì)象或記錄。在未翻譯的文件350的情況下,目標(biāo)語(yǔ)言是法語(yǔ),由“FR”表示。處理步驟可以識(shí)別包括對(duì)應(yīng)于該目標(biāo)語(yǔ)言的翻譯標(biāo)記的對(duì)象。在未翻譯的文件350的例子中,翻譯標(biāo)記是占位符“null”。 占位符是一個(gè)字符串,該字符串被選擇用于向翻譯者或其他實(shí)體通知一個(gè)位置,用來(lái)放置關(guān)鍵字的相應(yīng)翻譯??梢允褂锰娲恼嘉环?,只要它們與在制造商的產(chǎn)品中使用的字符串的類(lèi)型是不同的,特別是與可以與這樣的產(chǎn)品串行使用的軟件不同。圖3C是根據(jù)本發(fā)明示意性實(shí)施例的緊湊文件。緊湊文件370包括未翻譯的文件的內(nèi)容,但是緊湊文件包括附加的注釋?zhuān)@些注釋被包括在開(kāi)始注釋標(biāo)簽和結(jié)束注釋標(biāo)簽之間。附加的注釋是用于表示哪些TEXT標(biāo)簽要翻譯的人為物(artifact)。當(dāng)文件通過(guò)翻譯工具,例如在翻譯中心被查看時(shí),注釋所包圍的標(biāo)簽可以被濾出,以便翻譯者可以?xún)H集中于需要翻譯的術(shù)語(yǔ)。附加的注釋?zhuān)鐬椤癝TART NON-TRANSLATABLE" 371和“END NON-TRANSLATABLE”373。每個(gè)這樣的注釋可以由例如開(kāi)始注釋標(biāo)簽“< !―”和結(jié)束注釋標(biāo)簽“一> !”包括。這樣的注釋和標(biāo)簽可以有利于翻譯中心處的特定偏好和操作。例如, 依賴(lài)于文本處理器的翻譯中心(例如Vim)可以執(zhí)行這種附加注釋的內(nèi)容上的全面搜索,以便快速在關(guān)鍵字和占位符中導(dǎo)航。圖4是在根據(jù)本發(fā)明示意性實(shí)施例的修改成分選擇器處執(zhí)行的步驟的流程圖。初始地,修改成分選擇器可以從文檔合作數(shù)據(jù)庫(kù)提取翻譯文件(步驟401)。接下來(lái),修改成分選擇器可以確定該翻譯文件中是否有XML不支持的字符(步驟40 。如果有XML不支持的字符,修改成分選擇器可以濾出該XML不支持的字符(步驟40;3)。步驟403可以產(chǎn)生結(jié)果文件。翻譯文件中先前存在的所有無(wú)效XML字符或者XML不支持的字符都被從該結(jié)果文件中去除,在這個(gè)意義上來(lái)說(shuō),結(jié)果文件符合XML。接下來(lái),或者在步驟402做出否定確定之后,修改成分選擇器可以確定該翻譯文件中是否有已翻譯的術(shù)語(yǔ)(步驟404)。如果有,則修改成分選擇器可以濾出該已翻譯的術(shù)語(yǔ)(步驟40 。濾出已翻譯的術(shù)語(yǔ)的過(guò)程可以包括從該文件中去除屬性,以便產(chǎn)生未翻譯的文件,例如圖3B中的未翻譯的文件350。步驟405之后或者步驟404的否定輸出之后,修改成分選擇器可能已經(jīng)獲得了未翻譯的文件。接下來(lái),修改成分選擇器可以用附加的注釋來(lái)格式化該未翻譯的文件。如先前說(shuō)明的,可以提供該附加的注釋作為使翻譯中心的工作流流水線(xiàn)化的一種方式。因此,步驟 406中修改成分選擇器動(dòng)作的結(jié)果是,該修改成分選擇器可以獲得一個(gè)緊湊文件,例如圖 3C中的緊湊文件370。接下來(lái),修改成分選擇器可以確定它是否可以獲得定義術(shù)語(yǔ)的一個(gè)子集的用戶(hù)屬性(步驟407)。用戶(hù)屬性是用于匹配一組用戶(hù)的規(guī)則或者其他字符串,以便確定該用戶(hù)是否有對(duì)某些項(xiàng)目、基于項(xiàng)目的軟件或者從這樣的軟件開(kāi)發(fā)的內(nèi)容的訪問(wèn)權(quán)。用戶(hù)屬性的一個(gè)例子可以是與一個(gè)或多個(gè)用戶(hù)相關(guān)聯(lián)的安全組。用戶(hù)屬性的另一例子可以是用戶(hù)的作業(yè)描述。換句話(huà)說(shuō),用戶(hù)屬性可以用于確定需要知道或使用軟件的一組用戶(hù)。如果修改成分選擇器做出了肯定的確定,則該修改成分選擇器可以確定用戶(hù)屬性是否足夠用來(lái)自動(dòng)進(jìn)行子集確定(步驟408)。安全組形式的用戶(hù)屬性足以自動(dòng)進(jìn)行子集確定,這里例如至少一個(gè)用戶(hù)被分配到該安全組。因此,步驟408可以允許修改成分選擇器來(lái)響應(yīng)該安全組的系統(tǒng)管理者輸入或者識(shí)別正確用戶(hù)的其他方法。安全組的對(duì)于例如對(duì)話(huà)框的唯一入口不會(huì)降低下述步驟409的自動(dòng)化特性。結(jié)果是,在步驟408處做出肯定確定之后,到達(dá)步驟409。因此,修改成分選擇器可以自動(dòng)地確定要翻譯的緊湊文件的子集規(guī)則(步驟409)。這個(gè)步驟可以通過(guò)確定用戶(hù)屬性(規(guī)則)所匹配的至少一個(gè)用戶(hù)使用哪些三元組來(lái)執(zhí)行。換句話(huà)說(shuō),如果一個(gè)新的軟件特征依賴(lài)于翻譯文件,但是該特征本身對(duì)于步驟409選擇的用戶(hù)群來(lái)說(shuō)是不可訪問(wèn)的,那么支持這個(gè)特征的該緊湊文件的所有屬性被從該子集排除。因此,步驟409可以基于分配的或者以其他方式與屬性相關(guān)聯(lián)的用戶(hù)產(chǎn)生規(guī)則。替代地,步驟408處的否定結(jié)果可以導(dǎo)致系統(tǒng)管理者人工地確定子集規(guī)則(步驟 410)。子集規(guī)則是用來(lái)識(shí)別三元組中的屬性,以用于為翻譯選擇屬性,同時(shí)從文件中排除非匹配屬性的規(guī)則。因此,可以準(zhǔn)備文件來(lái)提交到翻譯中心。例如,子集規(guī)則可以是應(yīng)用于每個(gè)用戶(hù)的姓氏的常規(guī)的表示“\w * eau”,以便定位或者匹配偏好法語(yǔ)用戶(hù)接口的用戶(hù)。替代地,子集規(guī)則可以是將可由用戶(hù)訪問(wèn)的特征,如在自動(dòng)化的子集規(guī)則確定中。
接下來(lái),或者在步驟409或410之后,修改成分選擇器可以使用自動(dòng)確定的子集規(guī)則或者人工確定的子集規(guī)則來(lái)濾出不匹配該子集規(guī)則的數(shù)據(jù)(步驟411)。該子集規(guī)則至少包括與該屬性有關(guān)的規(guī)則。屬性本身可以是三元組,如以上說(shuō)明的。結(jié)果是,可以確定緊湊文件的子集,該子集將需要翻譯的屬性縮小為僅僅是滿(mǎn)足該子集規(guī)則的用戶(hù)所使用的那些屬性。換句話(huà)說(shuō),緊湊文件的屬性的子集形成了可翻譯的文件。選擇該子集規(guī)則的過(guò)程可以包括兩個(gè)子步驟。首先,基于用戶(hù)屬性選擇緊湊文件的某些部分。其次,基于用戶(hù)屬性濾出不匹配XML標(biāo)簽和相應(yīng)內(nèi)容。這些子步驟減小了數(shù)據(jù)子集,并形成了可翻譯的文件。當(dāng)濾出基于用戶(hù)屬性時(shí),該濾出稱(chēng)為“用戶(hù)訪問(wèn)濾出”。修改成分選擇器可以傳送或發(fā)送該可翻譯的文件或緊湊文件到翻譯中心進(jìn)行翻譯(步驟412)。該翻譯中心可以分別是例如圖2B或2C中的翻譯中心207或翻譯中心257。 然后處理過(guò)程可以結(jié)束。圖5是根據(jù)本發(fā)明示意性實(shí)施例的由修改成分選擇器執(zhí)行的過(guò)程的流程圖。初始地,修改成分選擇器可以確定它是否接收到來(lái)自翻譯中心的已翻譯的文件(步驟50幻。如果沒(méi)有接收到已翻譯的文件,則修改成分選擇器可以反復(fù)執(zhí)行步驟502。響應(yīng)于從翻譯中心接收到已翻譯的文件,修改成分選擇器可以將該已翻譯的文件輸入到文檔合作數(shù)據(jù)庫(kù),例如圖2A的文檔合作數(shù)據(jù)庫(kù)201。輸入過(guò)程可以包括在數(shù)據(jù)庫(kù)中對(duì)應(yīng)于由對(duì)象名稱(chēng)、屬性名稱(chēng)和/或欄所識(shí)別的已翻譯的數(shù)據(jù)將新記錄關(guān)聯(lián)起來(lái)。示意性實(shí)施例允許對(duì)于翻譯者的有針對(duì)性的依賴(lài),以某些上下文支持信息提供最少的材料。此外,實(shí)施例可以清除可能損害在要翻譯的術(shù)語(yǔ)中間導(dǎo)航的附加干擾。再有,對(duì)于不存在業(yè)務(wù)個(gè)案來(lái)授予用戶(hù)訪問(wèn)權(quán)的特征的術(shù)語(yǔ)來(lái)說(shuō),這些術(shù)語(yǔ)可以通過(guò)應(yīng)用用戶(hù)屬性來(lái)形成縮小要翻譯的術(shù)語(yǔ)數(shù)量的規(guī)則而被類(lèi)似地濾出。如上所述的這種過(guò)濾和減小方法和裝置可以允許在產(chǎn)品新的特征被發(fā)布之后很快就進(jìn)行翻譯,并且允許針對(duì)用戶(hù)當(dāng)前需要或者被授權(quán)使用的特征進(jìn)行翻譯。這樣,翻譯中心的輸出可以更及時(shí)地用于市場(chǎng)。信息的快速流通、信息被修飾來(lái)匹配用戶(hù)的語(yǔ)言偏好,可以切實(shí)地回報(bào)設(shè)備和系統(tǒng)的用戶(hù),以及向依賴(lài)這些用戶(hù)的客戶(hù)提供先進(jìn)的服務(wù)。如上面示意性實(shí)施例中教導(dǎo)的特征翻譯,可以通過(guò)縮短向市場(chǎng)提供產(chǎn)品以及升級(jí)這種產(chǎn)品的循環(huán)時(shí)間而給大量人群帶來(lái)切實(shí)的益處。圖中的流程圖和方框圖顯示了根據(jù)本發(fā)明的各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)施方式的結(jié)構(gòu)、功能和操作。這方面,流程圖或方框圖中的每個(gè)方框可以代表代碼的一個(gè)模塊、片段或部分,包括用于實(shí)施規(guī)定邏輯功能的一個(gè)或多個(gè)可執(zhí)行指令。應(yīng)當(dāng)注意,在某些替代實(shí)施方式中,方框中注明的功能可以不按圖中標(biāo)明的順序發(fā)生。例如, 相繼示出的兩個(gè)方框?qū)嶋H上可以基本同時(shí)被執(zhí)行,或者這些方框有時(shí)可以相反的順序被執(zhí)行,這取決于所涉及的功能。還應(yīng)注意,方框圖和/或流程圖中的每個(gè)方框、方框圖和/或流程圖中的方框的組合可以由執(zhí)行規(guī)定的功能或動(dòng)作的基于專(zhuān)用硬件的系統(tǒng)來(lái)實(shí)施,或者由專(zhuān)用硬件和計(jì)算機(jī)指令的組合來(lái)實(shí)施。本發(fā)明可以采取完全硬件實(shí)施例的形式、完全軟件實(shí)施例的形式或者包含硬件和軟件元素這二者的實(shí)施例的形式。在優(yōu)選實(shí)施例中,本發(fā)明在軟件中實(shí)施,包括但不限于固件、駐留軟件、微代碼等。此外,本發(fā)明可以采取計(jì)算機(jī)程序產(chǎn)品的形式,從計(jì)算機(jī)可用的或計(jì)算機(jī)可讀的介質(zhì)可以對(duì)其進(jìn)行訪問(wèn),該介質(zhì)提供程序代碼,由計(jì)算機(jī)或任何指令執(zhí)行系統(tǒng)使用或者與計(jì)算機(jī)或者任何指令執(zhí)行系統(tǒng)相關(guān)聯(lián)。為說(shuō)明目的,計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)可以是任何有形的可以包含、存儲(chǔ)、傳遞、傳播或傳送該程序的裝置,該程序由指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或者與指令執(zhí)行系統(tǒng)、裝置或設(shè)備相關(guān)聯(lián)。介質(zhì)可以是電子的、磁的、光的、電磁的、紅外的或者半導(dǎo)體系統(tǒng)(或裝置或設(shè)備) 或者傳播介質(zhì)。計(jì)算機(jī)可讀的介質(zhì)的例子包括半導(dǎo)體或固態(tài)存儲(chǔ)器、磁帶、可移動(dòng)計(jì)算機(jī)盤(pán)、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、硬磁盤(pán)和光盤(pán)。光盤(pán)的當(dāng)前的例子包括緊致盤(pán)只讀存儲(chǔ)器(CD-ROM)、緊致盤(pán)-讀/寫(xiě)(CD-R/W)和DVD。適合于存儲(chǔ)和/或執(zhí)行程序代碼的數(shù)據(jù)處理系統(tǒng)將包括至少一個(gè)經(jīng)系統(tǒng)總線(xiàn)直接或間接耦合到存儲(chǔ)器元件的一個(gè)處理器。存儲(chǔ)器元件可以包括程序代碼實(shí)際執(zhí)行期間使用的本地存儲(chǔ)器、大容量存儲(chǔ)裝置和高速緩存器,這些裝置提供了至少某些程序代碼的暫時(shí)存儲(chǔ),以便減少執(zhí)行期間必須從大容量存儲(chǔ)裝置取代碼的次數(shù)。輸入/輸出或I/O設(shè)備(包括但不限于鍵盤(pán)、顯示器、指向設(shè)備等)可以直接或經(jīng)中間I/O控制器被耦合到該系統(tǒng)。網(wǎng)絡(luò)適配器也可以耦合到該系統(tǒng),以便使能該數(shù)據(jù)處理系統(tǒng)經(jīng)中間的私人或公共網(wǎng)絡(luò)耦合到其他的數(shù)據(jù)處理系統(tǒng)或者遠(yuǎn)程打印機(jī)或存儲(chǔ)設(shè)備。調(diào)制解調(diào)器、電纜調(diào)制解調(diào)器和以太網(wǎng)卡只是幾個(gè)當(dāng)前可用的網(wǎng)絡(luò)適配器類(lèi)型。本發(fā)明的說(shuō)明書(shū)僅僅為了示例和說(shuō)明的目的做了闡述,而不用于窮盡或?qū)⒈景l(fā)明限制于所公開(kāi)的形式。對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō)顯然可以有各種的修改和變化。選擇和說(shuō)明的實(shí)施例其目的在于更好地解釋本發(fā)明的原理、實(shí)際應(yīng)用,以及使本領(lǐng)域的技術(shù)人員理解適合于所構(gòu)想的特別用途的具有多種改變的本發(fā)明的多種實(shí)施例。
1權(quán)利要求
1.一種用于識(shí)別和翻譯部分翻譯的數(shù)據(jù)的子集的計(jì)算機(jī)實(shí)施方法,該方法包括由計(jì)算機(jī)在數(shù)據(jù)庫(kù)中提取包括多個(gè)英語(yǔ)關(guān)鍵字和翻譯語(yǔ)言值的翻譯文件,包括未翻譯的關(guān)鍵字作為XML文件;由計(jì)算機(jī)確定該XML文件中是否存在XML不支持的字符;響應(yīng)于確定該XML文件中存在XML不支持的字符,由計(jì)算機(jī)第一次濾出該XML不支持的字符來(lái)形成結(jié)果文件;由計(jì)算機(jī)從該結(jié)果文件第二次濾出已翻譯的數(shù)據(jù),來(lái)形成未翻譯的文件; 選擇子集規(guī)則;響應(yīng)于選擇,第三次濾出不匹配該子集規(guī)則的任何數(shù)據(jù)來(lái)形成可翻譯的文件;以及發(fā)送該可翻譯的文件到翻譯中心以進(jìn)行翻譯。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施方法,其中,所述關(guān)鍵字基本上是英語(yǔ)的。
3.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施方法,還包括 從該翻譯中心接收已翻譯的文件;以及將該已翻譯的文件輸入到該數(shù)據(jù)庫(kù)中。
4.根據(jù)權(quán)利要求3所述的計(jì)算機(jī)實(shí)施方法,還包括由計(jì)算機(jī)用附加的注釋格式化所述未翻譯的文件,其中,所述附加的注釋被包括在開(kāi)始注釋標(biāo)簽和結(jié)束注釋標(biāo)簽之內(nèi)。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)實(shí)施方法,其中,選擇子集包括在該XML文件中選擇對(duì)應(yīng)于不具有翻譯的術(shù)語(yǔ)的占位符。
6.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施方法,其中,所述第三次濾出還包括確定用戶(hù)輸入提供用戶(hù)屬性,其中該用戶(hù)屬性能夠被用于定義未翻譯的屬性到該用戶(hù)屬性;以及其中選擇子集規(guī)則是響應(yīng)于確定該用戶(hù)輸入提供用戶(hù)屬性而進(jìn)行的。
7.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)施方法,其中,第一次濾出、第二次濾出和第三次濾出是由計(jì)算機(jī)執(zhí)行的。
8.一種用于識(shí)別和翻譯部分翻譯的數(shù)據(jù)的子集的計(jì)算機(jī)系統(tǒng),該系統(tǒng)包括 處理器、計(jì)算機(jī)可讀存儲(chǔ)器和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì);第一程序指令,在數(shù)據(jù)庫(kù)中提取包括多個(gè)英語(yǔ)關(guān)鍵字和翻譯語(yǔ)言值的翻譯文件,包括未翻譯的關(guān)鍵字作為XML文件;第二程序指令,確定該XML文件中是否存在XML不支持的字符; 第三程序指令,響應(yīng)于確定該XML文件中包含XML不支持的字符,濾出XML不支持的字符來(lái)形成結(jié)果文件;第四程序指令,從該結(jié)果文件濾出已翻譯的數(shù)據(jù),來(lái)形成未翻譯的文件; 第五程序指令,選擇子集規(guī)則;第六程序指令,響應(yīng)于選擇,濾出不匹配該子集規(guī)則的任何數(shù)據(jù)來(lái)形成可翻譯的文件;以及第七程序指令,發(fā)送該可翻譯的文件到翻譯中心以進(jìn)行翻譯,其中該第一、第二、第三、 第四、第五、第六和第七程序指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上以便由處理器經(jīng)計(jì)算機(jī)可讀存儲(chǔ)器來(lái)執(zhí)行。
9.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),其中,所述關(guān)鍵字基本上是英語(yǔ)的。
10.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)系統(tǒng),還包括第八程序指令,從該翻譯中心接收已翻譯的文件;以及第九程序指令,將該已翻譯的文件輸入到該數(shù)據(jù)庫(kù)中,其中該第八和第九程序指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上以便由處理器經(jīng)計(jì)算機(jī)可讀存儲(chǔ)器來(lái)執(zhí)行。
11.根據(jù)權(quán)利要求10所述的計(jì)算機(jī)系統(tǒng),還包括第十程序指令,由計(jì)算機(jī)用附加的注釋來(lái)格式化未翻譯的文件,其中該附加的注釋被包括在開(kāi)始注釋標(biāo)簽和結(jié)束注釋標(biāo)簽之間,其中該第十程序指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上以便由處理器經(jīng)計(jì)算機(jī)可讀存儲(chǔ)器來(lái)執(zhí)行。
12.一種用于識(shí)別和翻譯部分翻譯的語(yǔ)言數(shù)據(jù)的計(jì)算機(jī)實(shí)施方法,該方法包括由計(jì)算機(jī)提取由用戶(hù)輸入的主題選擇的翻譯文件,該文件具有多個(gè)包括對(duì)象名稱(chēng)、關(guān)鍵字和翻譯標(biāo)記的三元組,其中該翻譯標(biāo)記是占位符;由計(jì)算機(jī)確定該翻譯文件中是否存在非標(biāo)準(zhǔn)字符;其中響應(yīng)于確定翻譯文件中存在非標(biāo)準(zhǔn)字符,由計(jì)算機(jī)濾出該非標(biāo)準(zhǔn)字符來(lái)形成結(jié)果文件;由計(jì)算機(jī)從該結(jié)果文件中濾出已翻譯的數(shù)據(jù),來(lái)形成未翻譯的文件;由計(jì)算機(jī)用附加注釋來(lái)格式化該未翻譯的文件;選擇子集規(guī)則;響應(yīng)于選擇,由計(jì)算機(jī)濾出不匹配該子集規(guī)則的任何數(shù)據(jù),來(lái)形成可翻譯的文件;以及發(fā)送該可翻譯的文件到翻譯中心進(jìn)行翻譯。
13.根據(jù)權(quán)利要求12所述的計(jì)算機(jī)實(shí)施方法,還包括從該翻譯中心接收已翻譯的文件,其中該已翻譯的文件是XML文件;以及將該已翻譯的文件輸入到文檔合作數(shù)據(jù)庫(kù)。
14.根據(jù)權(quán)利要求13所述的計(jì)算機(jī)實(shí)施方法,其中,非標(biāo)準(zhǔn)字符相對(duì)于XML規(guī)范的規(guī)則來(lái)說(shuō)為不可解析的字符。
15.根據(jù)權(quán)利要求14所述的計(jì)算機(jī)實(shí)施方法,其中,所述XML規(guī)范是XML1.1。
16.根據(jù)權(quán)利要求13所述的計(jì)算機(jī)實(shí)施方法,其中該翻譯中心是數(shù)據(jù)處理系統(tǒng),被構(gòu)造用于自動(dòng)翻譯可翻譯文件中的術(shù)語(yǔ)。
17.根據(jù)權(quán)利要求13所述的計(jì)算機(jī)實(shí)施方法,其中該翻譯中心獲得用戶(hù)輸入來(lái)翻譯該翻譯文件的至少某些術(shù)語(yǔ)。
18.根據(jù)權(quán)利要求12所述的計(jì)算機(jī)實(shí)施方法,其中該占位符是字符串,并且其中該用戶(hù)輸入的主題是文件名稱(chēng)。
19.根據(jù)權(quán)利要求12所述的計(jì)算機(jī)實(shí)施方法,其中該翻譯文件具有的對(duì)應(yīng)于已翻譯術(shù)語(yǔ)的術(shù)語(yǔ)比不對(duì)應(yīng)于相應(yīng)翻譯的術(shù)語(yǔ)更多。
全文摘要
本發(fā)明涉及增量語(yǔ)言翻譯方法和系統(tǒng)。修改成分選擇器在數(shù)據(jù)庫(kù)中提取包含多個(gè)英語(yǔ)關(guān)鍵字和翻譯語(yǔ)言值的翻譯文件,包括未翻譯的關(guān)鍵字作為XML文件。修改成分選擇器提取多個(gè)英語(yǔ)關(guān)鍵字和翻譯語(yǔ)言值,并確定XML文件中是否存在XML不支持的字符。響應(yīng)于確定XML文件中存在XML不支持的字符,修改成分選擇器第一次濾出XML不支持的字符以形成一結(jié)果文件。修改成分選擇器從該結(jié)果文件中第二次濾出翻譯的數(shù)據(jù)以形成未翻譯的文件。修改成分選擇器選擇數(shù)據(jù)的一個(gè)子集。響應(yīng)于選擇,修改成分選擇器第三次濾出不包含在該子集中的任何數(shù)據(jù)以形成可翻譯的文件。修改成分選擇器發(fā)送該可翻譯的文件到翻譯中心進(jìn)行翻譯。
文檔編號(hào)G06F17/28GK102402505SQ20111026610
公開(kāi)日2012年4月4日 申請(qǐng)日期2011年9月9日 優(yōu)先權(quán)日2010年9月10日
發(fā)明者F·F·摩根, S·J·舒洛瑟, S·V·懷特·伊格, 陳彥甫 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1