亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng)及其方法

文檔序號:6580817閱讀:179來源:國知局
專利名稱:依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng)及其方法
技術領域
本發(fā)明涉及一種翻譯系統(tǒng)及其方法,特別涉及一種依據(jù)語言單元的詞性建立類別 的翻譯系統(tǒng)及其方法。
背景技術
翻譯軟件會對輸入的來源資料進行分析,然后將屬于第一語言的來源資料翻譯為 屬于第二語言的目標資料,基本上這是一種自然語言理解的應用,也是自然語言處理技術 的一項主要目標。目前的翻譯軟件大多是先將來源資料中所包含的單詞進行翻譯后,再以預定的排 列方式排列翻譯后的資料,如此便可以將屬于第一語言的來源資料轉變?yōu)閷儆诘诙Z言的 目標資料,但是翻譯軟件所翻出來的目標資料通常沒有辦法直接理解,例如來源資料為「我 在一家公司上班」時,翻譯軟件翻譯產(chǎn)生的目標資料為「I go to work at a company」,明 顯的,使用者還需要自行解讀后才可以獲得其所需要的目標資料。另外,目前的翻譯軟件 也無法將意思相同,且組成相似的來源資料翻譯出相同的目標資料,例如來源資料為「狗追 樹」時,翻譯軟件產(chǎn)生的目標資料為「Dog chasing the tree」,來源資料為「狗追趕樹」時, 翻譯軟件產(chǎn)生的目標資料為「Tree chasing a dog」,來源資料為「狗追趕著樹」時,翻譯軟 件產(chǎn)生的目標資料為「The dog to catch up with the tree」,這將造成使用者無法獲得正 確的目標資料。綜上所述,可知現(xiàn)有技術中長期以來一直存在翻譯技術無法將來源資料準確的翻 譯為目標資料的問題,因此有必要提出改進的技術手段,來解決此一問題。

發(fā)明內(nèi)容
有鑒于現(xiàn)有技術存在無法準確進行翻譯的問題,本發(fā)明遂提供一種依據(jù)語言單元 的詞性建立類別的翻譯系統(tǒng)及其方法,其中本發(fā)明所提供的依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng),至少包含輸入模塊, 用以輸入屬于第一語言的一來源資料;模型建立模塊,其中更包含語言剖析單元,用以將 來源資料剖析為復數(shù)語言單元;詞性判斷單元,用以判斷各語言單元的第一詞性;第一類 別建立單元,用以分別建立包含詞性屬性及第一語義屬性的各第一類別,及用以將各語言 單元的語義分別設定為各第一類別所包含的第一語義屬性,其中,各第一類別所包含的詞 性屬性與各第一詞性相同;句型判斷單元,用以依據(jù)各第一詞性的排列順序判斷來源資料 的一句型;一模型解除模塊,其中更包含詞性產(chǎn)生單元,用以依據(jù)句型產(chǎn)生以特定順序排 列的復數(shù)第二詞性;第二類別建立單元,用以依據(jù)各第二詞性分別建立包含詞性屬性的各 第二類別,其中,各第二類別所包含的詞性屬性與各第二詞性相同;語意查找單元,用以依 據(jù)各第一類別包含的第一語義屬性查找第二語言中的相同的語義,使第二類別建立單元將 語意查找單元所查找出的各語義分別設定為各第二類別的第二語義屬性;語義組合單元, 用以依據(jù)各第二詞性的排列順序,排列各第二類別,及用以組合以排序的各第二類別包含的第二語義屬性所記錄的各語義為目標資料;輸出模塊,用以輸出目標資料。本發(fā)明所提供的依據(jù)語言單元的詞性建立類別的翻譯方法,其步驟至少包括輸 入屬于第一語言的來源資料;剖析來源資料為復數(shù)語言單元;判斷各語言單元的第一詞 性;分別建立包含詞性屬性的各第一類別,各第一類別所包含的詞性屬性與各第一詞性相 同;分別設定各語言單元的語義為各第一類別所包含的第一語義屬性;依據(jù)各第一詞性的 排列順序判斷來源資料的句型;依據(jù)來源資料的句型產(chǎn)生以特定順序排列的復數(shù)第二詞 性;依據(jù)各第二詞性分別建立包含詞性屬性的各第二類別,各第二類別所包含的詞性屬性 與各第二詞性相同;依據(jù)各第一類別包含的第一語義屬性查找第二語言中的相同的語義; 分別設定各語義為各第二類別的第二語義屬性;依據(jù)各第二詞性的排列順序排列各第二類 別;組合以排序的各第二類別包含的第二語義屬性所記錄的各語義為目標資料;輸出目標 資料。本發(fā)明所提供的系統(tǒng)與方法如上,與現(xiàn)有技術之間的差異在于本發(fā)明通過將來源 資料剖析為語言單元后,依據(jù)各個語言單元對應第一語言的第一詞性,判斷出來源資料的 句型并建立相對應的第一類別,之后在依據(jù)來源資料的句型產(chǎn)生對應第二語言的第二詞性 后,依據(jù)第二詞性的排列順序,組合相對應的第二類別中所記錄的語義為目標資料,借以解 決現(xiàn)有技術所存在的問題,并可以達成判斷來源資料的文法是否正確的技術功效。


圖IA為本發(fā)明所提的依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng)架構圖。圖IB為本發(fā)明所提的模型建立模塊的組件示意圖。圖IC為本發(fā)明所提的模型解除模塊的組件示意圖。圖2A為本發(fā)明所提的依據(jù)語言單元的詞性建立類別的翻譯方法流程圖。圖2B為本發(fā)明所提的匯編語言單元的方法流程圖。圖2C為本發(fā)明所提的附加翻譯方法流程圖。圖2D為本發(fā)明所提的設定第二類別的屬性的附加方法流程圖。圖3為本發(fā)明實施例所提的描繪圖像的示意圖。主要組件符號說明110輸入模塊120模型建立模塊121語言剖析單元122詞性判斷單元125第一類別建立單元126句型判斷單元129邏輯判斷單元130模型解除模塊132詞性產(chǎn)生單元135第二類別建立單元136語義查找單元137語義組合單元
138語義篩選單元139時態(tài)調(diào)整單元140輸出模塊410第一圖像420第二圖像430第三圖像440第四圖像450第五圖像
具體實施例方式以下將配合圖式及實施例來詳細說明本發(fā)明的特征與實施方式,內(nèi)容足以使任何 本領域技術人員能夠輕易地充分理解本發(fā)明解決技術問題所應用的技術手段并據(jù)以實施, 借此實現(xiàn)本發(fā)明可達成的功效。本發(fā)明所提的第一語言以及第二語言通常屬于不同語種的語言,但本發(fā)明并不以 此為限,例如第一語言為中文,第二語言則為英文,但本發(fā)明所提的第一語言、第二語言并 不分別以中文、英文為限,也可以是日文、德文等。以下先以圖IA本發(fā)明所提的依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng)的系統(tǒng)架 構圖來說明本發(fā)明的系統(tǒng)運作。如圖IA所示,本發(fā)明的系統(tǒng)含有輸入模塊110、模型建立模 塊120、模型解除模塊130、以及輸出模塊140。其中,模型建立模塊120如圖IB所示,更包 含語言剖析單元121、詞性判斷單元122、第一類別建立單元125、以及句型判斷單元126 ;模 型解除模塊130如圖IC所示,更包含詞性產(chǎn)生單元132、第二類別建立單元135、語義查找 單元136、以及語義組合單元137。輸入模塊110負責輸入屬于第一語言的來源資料,被輸入模塊110所輸入的來源 資料通常為一個句子,但本發(fā)明并不以此為限,也可以是一段文章等。一般而言,來源資料 由輸入模塊110提供使用者輸入。語言剖析單元121負責將來源資料剖析為多個語言單元。語言剖析單元121每一 次只會提取(fetch)來源資料中的一個語言元素,語言剖析單元121每次所提取的語言元 素在不同的語言中可能會有不同,例如,中文為一個「字」、英文可能為一個「字母」或是一 個「單字」、日文為一個「音」或一個「單詞」等,但本發(fā)明所提的語言元素并不以此為限。在大部分的情況下,語言剖析單元121會將每次所提取的語言元素定義為一個語 言單元,但若語言剖析單元121在提取語言元素并定義語言單元后,判斷最后定義的語言 元素可以與先前所定義的語言元素組合,則會改變原先的定義,而改以將多個語言元素定 義為一個語言單元。其中,語言剖析單元121判斷是否要將多個語言單元定義為一個語言 單元的條件如下舉例,但本發(fā)明并不以此為限。語言剖析單元121會依據(jù)最后定義的語言單元與先前歷次定義的語言單元組合 后是否成為完整的單字或單詞,判斷是否要將多個語言單元定義為一個語言單元,例如語 言剖析單元121最后定義的語言單元為「b」,的前兩次定義的語言單元分別為「t」、iaj, 則語言剖析單元121可以通過預先建立的字典,判斷出最近三次定義的語言單元的組 合「tab」有意義之后,重新定義最近三次定義的語言單元「t」、「a」、「b」為一個語言單元「tab」。語言剖析單元121也能夠依據(jù)最后定義的語言單元與前次定義的語言單元組合 后的語義是否仍與前次定義的語言單元的語義相同,判斷是否要將多個語言單元定義為一 個語言單元,例如語言剖析單元121最后定義的語言單元為「取」,而前次定義的語言單元 為「讀」,語言剖析單元121可以通過預先建立的語義資料庫,判斷出「讀」以及「讀取」的語 義相同后,重新定義前次與最后定義的語言單元「讀取」為一個語言單元。語言剖析單元121還可以依據(jù)最后定義的語言單元與先前數(shù)次定義的語言單元 是否可以組合為一個具有特定詞性的詞組,判斷是否要將多個語言單元定義為一個語言單 元,例如,將「我提水桶追狗」中的「我提水桶」定義為一個語言單元,其中「我提水桶」的詞 性為名詞。語言剖析單元121也可以依據(jù)第一語言的特性,將多個語言單元定義為一個語言 單元,例如當?shù)谝徽Z言屬于西歐語系時,如「英文」,當語言剖析單元121提取到的語言元素 為空白、「,」或「.」等符號時,語言剖析單元121可以將前次提取到的語言元素間所定義出 的語言單元(如「i」、「S」)重新定義為一個語言單元「is」。詞性判斷單元122負責判斷語言剖析單元121所剖析出的語言單元的第一詞性, 語言單元的第一詞性例如「名詞」、「動詞」、「形容詞」、「副詞」、「介詞」、「數(shù)詞」、「量詞」等, 詞性判斷單元122所判斷出的第一詞性甚至可以更為細分,例如將「名詞」再細分為「動物 名詞」、「植物名詞」等,但本發(fā)明并不以此為限。一般而言,詞性判斷單元122會依據(jù)語言剖析單元121所剖析出的全部或部分的 語言單元或語言單元的語義等條件或來判斷第一詞性,但詞性判斷單元122判斷第一詞性 的方式并不以此為限。例如,當語言剖析單元121所剖析出的語言單元為「一」、「家」以及 「飯店」時,詞性判斷單元122會依據(jù)語言單元「一」的語義判斷出語言單元「一」的第一詞 性為「數(shù)詞」,若詞性判斷單元122由語言單元「家」的語義(數(shù)量單位、親屬生活的地方等) 判斷第一詞性,則詞性判斷單元122可能無法判定語言單元「家」的第一詞性為「量詞」或 是「名詞」等,但若詞性判斷單元122依據(jù)排列于語言單元「家」之前的語言單元「一」的第 一詞性「數(shù)詞」來判斷語言單元「家」的第一詞性,則詞性判斷單元122可以判斷出語言單 元「家」的第一詞性應為「量詞」。第一類別建立單元125負責依據(jù)詞性判斷單元122對各語言單元判斷出的各個第 一詞性分別建立與各語言單元相對應的第一類別,被第一類別建立單元125建立的第一類 別至少包含詞性屬性以及第一語義屬性,其中,詞性屬性預設與第一類別對應的語言單元 的第一詞性相同。第一類別建立單元125在第一類別建立后,還會將語言單元的語義設定 為相對應的第一類別所包含的第一語義屬性的資料。一般而言,第一類別建立單元125中預存有詞性屬性為各種詞性的類別,在需要 建立第一類別時,第一類別建立單元125會以復制詞性屬性與語言單元的第一詞性相同的 類別的方式建立第一類別,但第一類別建立單元125建立第一類別的方式并不以此為限。 其中,預存于第一類別建立單元125中的類別所包含的屬性以及方法會隨著詞性屬性不同 而有不同。例如,詞性屬性為「名詞」的類別包含名稱為「moveable」的屬性,而詞性屬性不 為「名詞」的類別將不會有名稱為「moveable」的屬性。又如,詞性屬性為「動詞」的類別包 含「引入」的方法,以及相對應的參數(shù),而詞性屬性不為「動詞」的類別則沒有方法「引入」。
另外,第一類別建立單元125更可以依據(jù)與被建立的第一類別對應的第一詞性設 定該第一類別中的其它屬性或該第一類別中的方法的參數(shù),例如,當?shù)谝辉~性為「動物名 詞」時,第一類別建立單元125可以設定屬性「moveable」為「true」,而當?shù)谝辉~性為「植物 名詞」時,第一類別建立單元125可以設定屬性「moveable」為「false」,但本發(fā)明并不以此 為限,又如,當?shù)谝辉~性為「動詞」時,第一類別建立單元125可以設定對應方法「引入」的 參數(shù)為「moveable,moveable」。句型判斷單元1 負責依據(jù)語言剖析單元121所剖析出的各語言單元在來源資料 中的排列順序,以及依據(jù)詞性判斷單元122對各個語言單元的第一詞性判斷來源資料的句 型。一般而言,句型判斷單元126在依據(jù)各語言單元的排列順序排列各語言單元的第一詞 性后,會以排列后的第一詞性的組合比對預設的句型對應表中的資料,借以判斷出來源資 料的句型,但句型判斷單元126判斷來源資料的句型的方式并不以此為限。例如,句型判 斷單元1 會依據(jù)來源資料「你打我」中的各個語言單元「你」、「打」、「我」的第一詞性「名 詞」、「動詞」、「名詞」的組合至資料表中查找出來源資料的句型為「什么對什么做什么」。事 實上,由于各第一類別所包含的詞性屬性記錄相對應的語言單元被詞性判斷單元122所判 斷出的第一詞性,故句型判斷單元1 也可以依據(jù)第一類別建立單元125所建立的第一類 別的順序以及各個第一類別所包含的詞性屬性判斷來源資料的句型。句型判斷單元126除了依據(jù)各語言單元的排列順序排列各語言單元的第一詞性 判斷來源資料的句型外,若包含詞性為「副詞」、「介詞」等詞性的語言單元,則句型判斷單元 126可能還需要依據(jù)該語言單元的語義來判斷來源資料的句型。例如,來源資料「我正在工 作」中的各個語言單元「我」、「正在」、「工作」的第一詞性為「名詞」、「副詞」、「動詞」,則句 型判斷單元126需要以「名詞」、「副詞正在」、「動詞」的組合才能夠至資料表中查找出來 源資料的句型為「什么正在做什么」。句型判斷單元126除了依據(jù)各語言單元的排列順序排列各語言單元的第一詞性 判斷來源資料的句型外,若包含詞性為「數(shù)詞」、「量詞」等詞性的語言單元時,由于該些詞性 并不會影響來源資料的句型,因此句型判斷單元1 在判斷來源資料的句型時,會忽略該 些詞性。例如,來源資料「我在一家公司中」中的各個語言單元「我」、「在」、「一」、「家」、「公 司」的第一詞性為「名詞」、「副詞」、「數(shù)詞」、「量詞」、「名詞」時,其句型與「我在公司中」相 同,因此句型判斷單元1 只需要以「名詞」、「副詞」、「名詞」的組合便能夠至資料表中查找 出來源資料的句型為「什么在什么地方」。經(jīng)由語言剖析單元121、詞性判斷單元122、第一類別建立單元125、以及句型判斷 單元126的運作,模型建立模塊120便可以依據(jù)來源資料建立多個第一類別以及取得來源 資料的句型,借以將各個第一類別以及來源資料的句型提供給模型解除模塊130使用。另外,模型建立模塊120更可以額外附加邏輯判斷模塊129,邏輯判斷模塊1 會 依據(jù)第一類別建立單元125所建立的第一類別中的各個屬性以及方法來判斷來源資料的 語法是否正確。例如當來源資料為「狗追樹」,第一類別建立單元125將建立第一語義屬 性為「狗」、詞性屬性為「名詞」、屬性「moveable」為「true」的第一類別、第一語義屬性為 「追」、詞性屬性為「動詞」、對應方法「引入」的參數(shù)為「moveable,moveable」的第一類別、 以及第一語義屬性為「樹」、詞性屬性為「名詞」、屬性「moveable」為「false」的第一類別等 三個第一類別,如此,邏輯判斷模塊1 將可以依據(jù)第一語義屬性為「追」的第一類別的方法「引入」所對應的參數(shù)「moveable,moveable]判斷第一語義屬性為「追」的第一類別的 前后需要是「moveable」屬性「true」的第一類別,由于第一語義屬性為「狗」的第一類別的 Γ moveable]屬性「true」、第一語義屬性為「樹」的第一類別的「moveable」屬性「false」,故 邏輯判斷模塊1 將會判斷出來源資料「狗追樹」的邏輯有誤。詞性產(chǎn)生單元132負責依據(jù)模型建立模塊120所提供的來源資料的句型產(chǎn)生以特 定順序排列的多個第二詞性(以下稱為「第二詞性組」)。詞性產(chǎn)生單元132所產(chǎn)生的各個 第二詞性通常會分別與第一詞性有一對一的關系。一般而言,詞性產(chǎn)生單元132會至與第二語言對應的預設的詞性對應表中查找與 來源資料的句型對應的第二詞性組,但詞性產(chǎn)生單元132產(chǎn)生第二詞性組的方式并不以此 為限。例如,當來源資料的句型為「什么在做什么」時,若第二語言為「英文」,則詞性產(chǎn)生單 元132會以來源資料的句型為「什么正在做什么」至與第二語言「英文」對應的詞性對應表 中查找出相對應的第二詞性組,組成被查找出的第二詞性組的第二詞性依序為「名詞」、「Be 動詞」、「一般動詞」。其中,第二詞性「名詞」、「Be動詞」、「一般動詞」分別與第一詞性的「名 詞」、「副詞」、「動詞」對應。第二類別建立單元135負責依據(jù)詞性產(chǎn)生單元132所產(chǎn)生的各個第二詞性分別建 立包含的詞性屬性與第二詞性相同的第二類別。第二類別建立單元135與第一類別建立單 元125相似,會預存有詞性屬性為各種詞性的類別,在需要建立第二類別時,第二類別建立 單元135會以復制詞性屬性與第二詞性相同的類別的方式建立第二類別,但第二類別建立 單元135建立第二類別的方式并不以此為限。其中,預存于第二類別建立單元135中的類 別所包含的屬性以及方法會隨著詞性屬性不同而有不同。語義查找單元136負責在第二類別建立單元135建立第二類別后,依據(jù)第一類別 包含的第一語義屬性所記錄的語義,至資料庫中查找在使用第二語言所表示的意義相同的 語義,并提供查找出的語義給第二類別建立單元135,使第二類別建立單元135依據(jù)第一詞 性以及第二詞性的對應關系,將被查找出來的語義設定為第二類別中與第二語言對應的第二語義屬性。例如,當?shù)诙~性「名詞」、「Be動詞」、「一般動詞」分別與第一詞性「名詞」、「副 詞」、「動詞」對應時,語義查找單元136會依據(jù)詞性屬性為「名詞」的第一類別包含的第一語 義屬性所記錄的語義「我」,查找出在第二語言中相同的語義「I」,之后,第二類別建立單元 135會依據(jù)第一詞性以及第二詞性間的對應關系,判斷出第一詞性「名詞」與第二詞性「名 詞」對應,所以設定詞性屬性為「名詞」的第二類別所包含的第二語義屬性為「I」。另外,在語義查找單元136查找出詞性屬性為「副詞」的第一類別包含的第一語義 屬性所記錄的語義「正在」在第二語言中的語義為「am」/「are」/「is」后,若本發(fā)明中還 包含語義篩選單元138,則在語義篩選單元138依據(jù)詞性屬性為「名詞」的第二類別所包含 的第二語義屬性為「I」選擇出最適合的語義「am」后,第二類別建立單元135會依據(jù)第一詞 性「副詞」對應第二詞性「Be動詞」,設定詞性屬性為「Be動詞」的第二類別包含的第二語義 屬性為「am」。事實上,語義篩選單元138除了可以選擇最適合主詞的動詞之外,也可以由所 表示的意義相同的多個語義中,選出最適合者,例如由具有相同中文意義的英文單詞中選 擇其中之一。而在語義查找單元136查找出詞性屬性為「動詞」的第一類別包含的第一語義屬性所記錄的語義「工作」在第二語言中的語義為「work」后,若本發(fā)明中還包含時態(tài)調(diào)整單 元139,則在時態(tài)調(diào)整單元139依據(jù)各第二詞性的排列順序判斷排列于「一般動詞」前的第 二詞性為「Be動詞」后,會將語義查找單元136所查找出的語義「work」調(diào)整為時態(tài)最適合 的語義「working」,并提供給第二類別建立單元135,使第二類別建立單元135將詞性屬性 為「一般動詞」的第二類別包含的第二語義屬性設定為「working」。事實上,時態(tài)調(diào)整單元 139除了調(diào)整動詞的時態(tài)之外,若第二語言不為「英文」而為其它語言時,則可能需要調(diào)整 主詞等詞性的時態(tài),如西班牙文或日文等。語義組合單元137負責依據(jù)詞性產(chǎn)生單元132所產(chǎn)生的各個第二詞性的排列順 序,依序讀取詞性屬性為各第二詞性的第二類別所包含的第二語義屬性所記錄的語意后, 組合讀出的語義為目標資料。例如,當?shù)诙~性組依序為「名詞」、「Be動詞」、「一般動詞」 時,語義組合單元137會依序讀取詞性屬性為「名詞」、「Be動詞」、「一般動詞」的第二類別所 包含的第二語義屬性中所記錄的語義「I」、「am」、「working」,之后將讀出的語義「I」、「am」、 「working」組合為目標資料「I am working」,但語義組合單元137讀取各第二類別包含的 第二語義屬性所記錄的資料的方式并不以此為限,語義組合單元137也可以先讀出所有第 二類別包含的第二語義屬性所記錄的語義后,再依據(jù)各第二詞性的排列順序,分別排列詞 性屬性與各第二詞性相同的第二類別,借以將各個第二類別包含的第二語義屬性所記錄的 語義排列為目標資料。通過詞性產(chǎn)生單元132、第二類別建立單元135、語義查找單元136、以及語義組合 單元137,模型解除模塊130便可以依據(jù)模型建立模塊120所提供的各個第一類別以及來源 資料的句型產(chǎn)生屬于第二語言的目標資料。輸出模塊140負責輸出屬于第二語言的目標資料。輸出模塊140可以顯示的方式 輸出目標資料,也可以將目標資料傳遞給本發(fā)明之外的軟件或硬件的方式輸出,但輸出模 塊140輸出目標資料的方式并不以此為限。接著以一個實施例來解說本發(fā)明的運作系統(tǒng)與方法,并請參照圖2A本發(fā)明所提 的依據(jù)語言單元的詞性建立類別的翻譯方法的方法流程圖。本實施例描述中文翻譯為英文 的過程,也就是說,在本實施例中,第一語言為「中文」,第二語言為「英文」,但本發(fā)明所提 的第一語言以及第二語言并不僅限于「中文」以及「英文」。當使用者使用本發(fā)明時,首先會通過輸入模塊110輸入「中文(第一語言)」的來 源資料(步驟301)。假設在本實施例中,使用者所輸入的來源資料為「我在一家公司上班」, 但本發(fā)明所提的來源資料并不以此為限。在輸入模塊110輸入來源資料(步驟301)后,與「中文」對應的模型建立模塊120 會開始運作。模型建立模塊120中的語言剖析單元121會將來源資料剖析為多個語言單元 (步驟311)。由于在本實施例中,來源資料為「我在一家公司上班」,因此語言剖析單元121 首先會提取到一個字(語言元素)「我」,并定義「我」為一個語言單元,而后,語言剖析單 元121會逐次提取出「在」、「一」、「家」、「公」、「司」、「上」、「班」的語言元素,借以定義出各 個語言單元。事實上,語言剖析單元121更可以如圖2B所示,進一步判斷出「公」、「司」以 及「上」、「班」兩組語言元素在合并后將成為完整的單詞(步驟31 ,因此會分別將被定義 為「公」、「司」以及「上」、「班」的語言單元合并后,定義被合并產(chǎn)生的單詞「公司」以及「上 班」為新的語言單元,所以語言剖析單元121會由來源資料「我在一家公司上班」中剖析出「我」、「在」、「一」、「家」、「公司」、「上班」等語言單元。值得一提的是,語言剖析單元121將 兩個以上的語言單元合并并定義為新的語言單元的步驟312并非為本發(fā)明的必要步驟。在模型建立模塊120中的語言剖析單元121將來源資料剖析為多個語言單元(步 驟311)后,模型建立模塊120中的詞性判斷單元122會判斷語言剖析單元121所剖析出的 各個語言單元的第一詞性(步驟320)。在本實施例中,詞性判斷單元122會依據(jù)語言單元 「我」、「在」、「一」、「公司」的語義,直接判斷出語言單元「我」、「在」、「一」、「公司」的第一詞 性分別為「名詞」、「介詞」、「數(shù)詞」、「名詞」,而詞性判斷單元122依據(jù)語言單元「家」語義判 斷出其可能為「量詞」或「名詞」后,會進一步依據(jù)排列于其之前的語言單元「一」的第一詞 性為「數(shù)詞」而判斷出此處的語言單元「家」為「量詞」,另外,雖然詞性判斷單元122由語言 單元「上班」的語義可以判斷出其可能為「名詞」或「動詞」后,因為無法用其它適合的條件 來判斷出語言單元「上班」的詞性,故詞性判斷單元122會先行忽略,而保留語言單元「上 班」的詞性為「名詞」或「動詞」。在模型建立模塊120中的詞性判斷單元122完成各個語言單元的第一詞性的判斷 (步驟320)后,模型建立模塊120中的句型判斷單元1 會依據(jù)各個語言單元在來源資料 中的排列順序,排列各個語言單元的第一詞性,并再依據(jù)排列后的第一詞性判斷來源資料 的句型(步驟340)。在本實施例中,句型判斷單元1 會依據(jù)詞性判斷單元122判斷出的 第一詞性的排列順序「名詞」、「介詞(在)」、「數(shù)詞」、「量詞」、「名詞」、「名詞/動詞」,判斷 出來源資料「我在一家公司上班」的句型為「什么在什么地方做什么」。其中,句形判斷單 元1 更可以將「數(shù)詞」「量詞」「名詞」的排列組合定義為一組名詞后,依據(jù)「名詞」、「介 詞(在)」、「名詞」、「名詞/動詞」的組合,判斷出來源資料「我在一家公司上班」的句型為 「什么在什么地方做什么」。值得一提的是,在來源資料「我在一家公司上班」的句型被判斷出來之后,詞性判 斷單元122更可以依據(jù)句型「什么在什么地方做什么」中的「做什么」判斷出無法確定第一 詞性的語言單元「上班」的第一詞性為「動詞」(請參考圖2C步驟335)。在模型建立模塊120中的詞性判斷單元122判斷出各個語言單元的第一詞性(步 驟320)后,模型建立模塊120中的第一類別建立單元125會依據(jù)各個語言單元的第一詞 性,建立包含的詞性屬性與各第一詞性相同的第一類別(步驟331),并將各語言單元的語 義設定至各第一類別所包含的第一語義屬性中(步驟33幻。在本實施例中,若第一類別建 立單元125所建立的第一類別至少包含「第一語義屬性」、「詞性屬性」、「圖像屬性」等屬性, 則第一類別建立單元125所建立的第一類別分別繼承自名詞類別、介詞類別、數(shù)詞類別、量 詞類別、名詞類別、動詞類別,則第一類別的詞性屬性將分別為「名詞」、「介詞」、「數(shù)詞」、「量 詞」、「名詞」、「動詞」,且第一類別包含的「第一語義屬性」將分別為「我」、「在」、「一」、「家」、 「公司」、「上班」。其中,「詞性屬性」不同的第一類別則可能會有不同的屬性,例如繼承名詞 類別的第一類別可能會包含有「地點」屬性等,如此,當?shù)谝活悇e建立單元125在建立詞性 屬性為「名詞」的第一類別后,更可以依據(jù)來源資料的句型,將第一語義屬性為「公司」的第 一類別的「地點」屬性設定為「true」(圖2C步驟336),借以提供模型解除模塊130使用。另外,由于在本實施例中,第一類別更包含「圖像屬性」,因此當?shù)谝活悇e被建立 時,模型建立模塊120中將會描繪出各個第一類別的圖像屬性中所記錄的對象,也就是說, 在第一語義屬性為「我」的第一類別被建立時,模型建立模塊120將會描繪出第一圖像410,而當?shù)谝徽Z義屬性為「在」、「一」、「公司」、「上班」的第一類別依序被建立后,模型建立模塊 120將會描繪的第二圖像420至第五圖像450將如圖3所示,但本發(fā)明并不以此為限。其 中,由于詞性屬性為「量詞」(第一語義屬性為「家」)的第一類別所包含的圖像屬性不會有 資料,因此模型建立模塊120沒有描繪出任何的圖像。若模型建立模塊120中還包含邏輯判斷單元129,則此時邏輯判斷單元1 會依據(jù) 各個第一類別的各個屬性以及方法來判斷來源資料「我在一家公司上班」的邏輯是否正確 (步驟350)。在模型建立模塊120中的句型判斷單元1 依據(jù)各第一詞性的排列順序判斷來源 資料的句型(步驟340)以及模型建立模塊120中的第一類別建立單元125完成第一類別 的建立以及屬性的設定(步驟331、步驟33 后,與英文(第二語言)對應的模型解除模塊 130會開始運作。模型解除模塊130中的詞性產(chǎn)生單元132會先依據(jù)模型建立模塊120所提供的來 源資料的句型產(chǎn)生以特定順序排列的第二詞性(步驟360)。由于在本實施例中,來源資料 的句型為「什么在什么地方做什么」,因此詞性產(chǎn)生單元132會產(chǎn)生依序為「名詞」、「動詞」、 「介詞」、「名詞」的第二詞性。在詞性產(chǎn)生單元132依據(jù)來源資料的句型產(chǎn)生以特定順序排列的第二詞性(步驟 360)后,第二類別建立模塊135會依據(jù)詞性產(chǎn)生單元132所產(chǎn)生的各第二詞性,分別建立包 含的詞性屬性與各個第二詞性相同的第二類別(步驟371)。在本實施例中,假設第二類別 建立單元135所建立的第二類別至少包含「第二語義屬性」、「詞性屬性」等屬性,且第二類 別建立單元135會依據(jù)各個第二詞性,以繼承名詞類別、數(shù)詞類別、介詞類別、名詞類別的 方式建立詞性屬性分別為「名詞」、「動詞」、「介詞」、「名詞」的第二類別。在第二類別建立模塊135建立包含的詞性屬性與各個第二詞性相同的第二類別 (步驟371)后,語義查找單元136會依據(jù)各第一類別包含的第一語義屬性所記錄的屬于第 一語言的語義,查找出屬于第二語言的相同語義(步驟372)。在本實施例中,語義查找單 元136查找與各個第一類別包含的第一語義屬性所記錄的屬于「中文」的語義「我」、「在」、 「一家公司」、「上班」相同的屬于「英文」的語義「I」、「in」、「a company」、「work」。若模型解除模塊130中還包含語義篩選單元138時,則如圖2D的流程所示,在 語義查找單元136依據(jù)屬于第一語言的語義查找出多個屬于第二語言的相同語義后,語 義篩選單元138會由多個屬于第二語言的語義中篩選出最適合的一個(步驟37 ,例如, 語義查找單元136所查找出的與「中文」語義「公司」相同的「英文」語義為「company」、 Γ corporation],「f irm」,則語義篩選單元138會由其中篩選出最常用的語義「company」來 做為最適合的語義,但語義篩選單元138篩選語義的方式并不以此為限。而若模型解除模塊130中包含時態(tài)調(diào)整單元139,則同樣會如圖2D的流程所示,在 語義查找單元136依據(jù)屬于第一語言的語義查找出屬于第二語言的相同語義后,時態(tài)調(diào)整 單元139會將需要改變時態(tài)的語義進行調(diào)整(步驟376),例如,語義查找單元136所查找出 的與「中文」語義「工作」相同的「英文」語義為「work」,若時態(tài)調(diào)整單元139判斷第二詞性 中包含「Be動詞」、「時間副詞」或是與語義「work」相鄰的語義為第三人稱單數(shù)時,時態(tài)調(diào) 整單元139會將語義「work」修改為最合適的時態(tài),由于時態(tài)調(diào)整單元139判斷出第二詞性 中沒有包含「Be動詞」以及「時間副詞」,且與語義「work」相鄰的第二詞性為「名詞」的語義「I」不為第三人稱,故時態(tài)調(diào)整單元139在本實施例中不會調(diào)整語義「work」的時態(tài),但 時態(tài)調(diào)整單元139調(diào)整時態(tài)的方式并不以此為限。在語義查找單元136依據(jù)各第一類別包含的第一語義屬性所記錄的屬于第一語 言的語義,查找出屬于第二語言的相同語義(步驟37 后,第二類別建立模塊135會將各 個語義設定為各個第二類別的第二語義屬性(步驟378)。在本實施例中,語義查找單元136 查找出的屬于「英文」的語義「I」、「in」、「a company」、「work」會分別被設定為詞性屬性為 「名詞」、「介詞」、「名詞」、「動詞」的第二類別包含只第二語義屬性中。在第二類別建立模塊135將各個語義設定為各個第二類別的第二語義屬性(步 驟378)后,語義組合單元137會依據(jù)詞性產(chǎn)生單元132所產(chǎn)生的第二詞性的排列順序,排 列包含的詞性屬性與第二詞性相同的第二類別(步驟391),并依照排列后的順序,將以排 序的第二類別包含的第二語義屬性所記錄的語義組合為目標資料(步驟39幻。例如,在本 實施例中,語義組合單元137會依照詞性產(chǎn)生單元132所產(chǎn)生的第二詞性的排列順序「名 詞」、「動詞」、「介詞」、「名詞」來排列第二類別。不過因為在本實施例中,包含兩個詞性屬性 為「名詞」的第二類別,故語義組合單元137還需要判斷兩個包含的詞性屬性相同的第二類 別的次序,假設在本實施例中,繼承自名詞類別的第二類別中更包含有「大小」的屬性,則若 第二類別建立單元135在建立第二語義屬性為「1」的第二類別時,還有設定第二類別的「大 小」屬性為「0. 5-1立方米」,而第二類別建立單元135在建立第二語義屬性為「company」 的第二類別時,還有設定第二類別的「大小」屬性為「10 100立方米」,則語義組合單元137 會依據(jù)第二類別包含的「大小」屬性判斷出第二語義屬性「I」的大小小于第二語義屬性 「company」,所以語義組合單元137會將「大小」屬性較低的第二類別排列在詞性屬性為「動 詞」的第二類別之前,并將「大小」屬性較大的第二類別排列在詞性屬性為「介詞」的第二 類別之后,最后再依序讀出各個第二類別包含的第二語義屬性所記錄的語義「I」、「work」、 「in」、「a company」,并組合為目標資料「I work in a company」。其中,值得一提的是,語義 組合單元137需要判斷兩個包含的詞性屬性相同的第二類別的次序的步驟并不是必須的, 在沒有詞性屬性相同的第二類別的情況下,語義組合單元137可以省略此步驟。在語義組合單元137將排序后的第二類別包含的第二語義屬性所記錄的語義組 合為目標資料(步驟39 后,輸出模塊140會輸出目標資料(步驟3%),假設在本實施例 中,輸出模塊140會以顯示的方式輸出目標資料,則使用者便可以觀看到本發(fā)明將來源資 料「我在一家公司工作」翻譯為目標資料「I work in a company]的結果。綜上所述,可知本發(fā)明與現(xiàn)有技術之間的差異在于具有將來源資料剖析為語言單 元后,依據(jù)各個語言單元對應第一語言的第一詞性,判斷出來源資料的句型并建立相對應 的第一類別,之后在依據(jù)來源資料的句型產(chǎn)生對應第二語言的第二詞性后,依據(jù)第二詞性 的排列順序,組合相對應的第二類別中所記錄的語義為目標資料的技術手段,借由此一技 術手段可以解決現(xiàn)有技術所存在法準確進行翻譯的問題,進而達成判斷來源資料的文法是 否正確的技術功效。再者,本發(fā)明的依據(jù)語言單元的詞性建立類別的翻譯方法,可實現(xiàn)于硬件、軟件或 硬件與軟件的組合中,亦可在計算機系統(tǒng)中以集中方式實現(xiàn)或以不同組件散布于若干互連 的計算機系統(tǒng)的分散方式實現(xiàn)。雖然本發(fā)明所提供的實施方式如上,但所述的內(nèi)容并非用以直接限定本發(fā)明的 專利保護范圍。任何本領域技術人員,在不脫離本發(fā)明所公開的精神和范圍的前提下,對本發(fā) 明的實施的形式上及細節(jié)上作些許的更動潤飾,均屬于本發(fā)明的專利保護范圍。本發(fā)明的 專利保護范圍,仍須以所附的權利要求所界定者為準。
權利要求
1.一種依據(jù)語言單元的詞性建立類別的翻譯方法,其特征在于,該翻譯方法至少包含 下列步驟輸入屬于一第一語言的一來源資料; 剖析該來源資料為復數(shù)語言單元; 判斷各該語言單元的第一詞性;分別建立包含一詞性屬性的各第一類別,各該第一類別所包含的該詞性屬性與各該第 一詞性相同;分別設定各該語言單元的語義為各該第一類別所包含的第一語義屬性; 依據(jù)各該第一詞性的排列順序判斷該來源資料的一句型; 依據(jù)該句型產(chǎn)生以特定順序排列的復數(shù)第二詞性;依據(jù)各該第二詞性分別建立包含一詞性屬性的各第二類別,各該第二類別所包含的該 詞性屬性與各該第二詞性相同;依據(jù)各該第一類別包含的第一語義屬性查找一第二語言中的相同的語義; 分別設定各該語義為各該第二類別的第二語義屬性; 依據(jù)各該第二詞性的排列順序排列各該第二類別;組合以排序的各該第二類別包含的第二語義屬性所記錄的各該語義為一目標資料;及 輸出該目標資料。
2.如權利要求1所述的依據(jù)語言單元的詞性建立類別的翻譯方法,其特征在于,該翻 譯方法于該剖析該來源資料為各該語言單元的步驟后,更包含組合合并后的語義不變、合 并后成為完整的單字或單詞、或合并后成為詞組的復數(shù)語言單元為一新語言單元的步驟。
3.如權利要求1所述的依據(jù)語言單元的詞性建立類別的翻譯方法,其特征在于,該依 據(jù)各該第二詞性的排列順序排列各該第二類別的步驟更包含判斷詞性屬性相同的該些第 二類別的排列順序的步驟。
4.如權利要求1所述的依據(jù)語言單元的詞性建立類別的翻譯方法,其特征在于,該翻 譯方法于該依據(jù)各該第一類別包含的第一語義屬性查找該第二語言中的相同的語義的步 驟后,更包含由查找出的復數(shù)語意中選擇最適合者的步驟。
5.如權利要求1所述的依據(jù)語言單元的詞性建立類別的翻譯方法,其特征在于,翻譯 方法于該依據(jù)各該第一類別包含的第一語義屬性查找該第二語言中的相同的語義的步驟 后,更包含調(diào)整各該第二類別包含的第二語義屬性所記錄的語義的時態(tài)的步驟。
6.一種依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng),其特征在于,該翻譯系統(tǒng)至少包含一輸入模塊,用以輸入屬于一第一語言的一來源資料; 一模型建立模塊,包含一語言剖析單元,用以將該來源資料剖析為復數(shù)語言單元; 一詞性判斷單元,用以判斷各該語言單元的第一詞性;一第一類別建立單元,用以分別建立包含一詞性屬性及一第一語義屬性的各第一類 別,及用以將各該語言單元的語義分別設定為各該第一類別所包含的該第一語義屬性,其 中,各該第一類別所包含的該詞性屬性與各該第一詞性相同;及一句型判斷單元,用以依據(jù)各該第一詞性的排列順序判斷該來源資料的一句型;一模型解除模塊,包含一詞性產(chǎn)生單元,用以依據(jù)該句型產(chǎn)生以特定順序排列的復數(shù)第二詞性;一第二類別建立單元,用以依據(jù)各該第二詞性分別建立包含一詞性屬性的各第二類 別,其中,各該第二類別所包含的該詞性屬性與各該第二詞性相同;一語意查找單元,用以依據(jù)各該第一類別包含的第一語義屬性查找一第二語言中的相 同的語義,使該第二類別建立單元將該語意查找單元所查找出的各該語義分別設定為各該 第二類別的第二語義屬性;及一語義組合單元,用以依據(jù)各該第二詞性的排列順序,排列各該第二類別,及用以組合 以排序的各該第二類別包含的第二語義屬性所記錄的各該語義為一目標資料;及一輸出模塊,用以輸出該目標資料。
7.如權利要求6所述的依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng),其特征在于,該語 言剖析單元更用以組合合并后的語義不變、合并后成為完整的單字或單詞、或合并后成為 詞組的復數(shù)語言單元為一新語言單元。
8.如權利要求6所述的依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng),其特征在于,該語 義組合單元更用以判斷詞性屬性相同的該些第二類別的排列順序。
9.如權利要求6所述的依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng),其特征在于,該模 型解除模塊更包含一語義篩選單元,用以由該語意查找單元所查找出的復數(shù)語意中選擇最 適合者。
10.如權利要求6所述的依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng),其特征在于,該模 型解除模塊更包含一時態(tài)調(diào)整單元,用以調(diào)整各該第二類別包含的第二語義屬性所記錄的 語義的時態(tài)。
全文摘要
本發(fā)明提供一種依據(jù)語言單元的詞性建立類別的翻譯系統(tǒng)及其方法,其通過將來源資料剖析為語言單元后,依據(jù)各個語言單元的第一詞性,判斷出來源資料的句型并建立相對應的第一類別,之后在依據(jù)來源資料的句型產(chǎn)生第二詞性后,依據(jù)第二詞性的排列順序,組合相對應的第二類別中所記錄的語義為目標資料的技術手段,可以準確翻譯,并達成判斷來源資料的文法是否正確的技術功效。
文檔編號G06F17/28GK102043770SQ200910178190
公開日2011年5月4日 申請日期2009年10月19日 優(yōu)先權日2009年10月19日
發(fā)明者邱全成, 邱裔俊 申請人:英業(yè)達股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1