亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

采用聲頻數(shù)據(jù)比較的自動翻譯處理方法及自動翻譯器的制作方法

文檔序號:6532830閱讀:147來源:國知局
專利名稱:采用聲頻數(shù)據(jù)比較的自動翻譯處理方法及自動翻譯器的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種自動翻譯方法及裝置,特別涉及一種實用的、采用聲頻數(shù)據(jù)比較的電腦自動翻譯處理方法及翻譯裝置。
背景技術(shù)
目前,使用不同語種的人進行語言交流,完全靠人工翻譯,有二種方式一是交流者中至少有一人能熟練掌握對方的語種(自譯),二是在雙方都不懂對方語種的情況下,請一個能掌握交流雙方語種的人作中間人(他譯),為雙方翻譯交談內(nèi)容。
人工翻譯的好處是,從理論上講,交談雙方交談內(nèi)容可隨機無限制(這當(dāng)然也取決于自譯、他譯者掌握另一語種的水準(zhǔn)),缺點是一、在多數(shù)情況下是交談?wù)叨疾欢畬Ψ秸Z種,也不擁有中間翻譯人員。
二、聘請翻譯人員的費用很高。
三、雙方談話的內(nèi)容對中間翻譯人員無法保密。
四、多數(shù)情況下,某個翻譯人員只懂一門外語,不能針對多語種翻譯。
五、交流的速度很慢。
世界經(jīng)濟的快速發(fā)展,使不同語種的人群交流越來越多,對翻譯的需要越來越大,近年來,隨著電腦技術(shù)的飛速發(fā)展,人們積極探索用電腦來解決翻譯問題,即試圖實現(xiàn)“機器智能”翻譯。在本發(fā)明之前,各國有許多這方面的試驗,但截止目前,仍無法找到可實用的方法。
人類語言是一種社會現(xiàn)象,其歷史幾乎與人類自身的歷史一樣長,在千萬年人類生活中形成的語言是非常復(fù)雜的,各語種的詞、詞素、合成詞、詞組的結(jié)構(gòu)方式及意義,由詞類構(gòu)成的句的構(gòu)成方式及意義,乃至語法結(jié)構(gòu)、修辭方式等等,都是各民族歷史生活中不斷演變的約定俗成,包融并體現(xiàn)著該民族千百年政治、經(jīng)濟、宗教文化、科技、生活方式等等幾乎全部社會范疇的“印記”,再加上各語種內(nèi)部的方言,俚語、各地區(qū)表述習(xí)慣等因素,真是極為個性、極為復(fù)雜,并不象自然科學(xué)的研究對象那樣有嚴(yán)格規(guī)律可循,各語種間沒有統(tǒng)一的法則可依。因此,不能用自然科學(xué)的方法(數(shù)學(xué)的、物理的、化學(xué)的等)來分析、歸納,因此機器智能翻譯(下稱電腦翻譯)的根本困難或根本矛盾,在于企圖用自然科學(xué)的方法(數(shù)學(xué)方法),象人工翻譯那樣實現(xiàn)基本無規(guī)律、無聯(lián)系的各語種語義間的同義互換。至少在目前若干年內(nèi),這應(yīng)被看作是一條難以走通的路。

發(fā)明內(nèi)容
本發(fā)明的目的在于以一種新思路,繞開語義障礙,以處理語音聲頻數(shù)據(jù)的方法,實現(xiàn)電腦翻譯。
本發(fā)明的技術(shù)方案是采用聲頻數(shù)據(jù)比較的自動翻譯處理方法,包括事先將漢語句子、外語句子通過聲頻數(shù)據(jù)輸入到電腦存儲器中,將許多句漢語句子一一編上序號,形成漢語句庫,將許多句外語句子也一一編上序號,形成外語句庫,漢語句庫的漢語句子序號與外語句庫的外語句子序號一對應(yīng),且這種序號的一一對應(yīng)建立在相同語義上,二者構(gòu)成預(yù)譯句庫,麥克風(fēng)拾取的漢語語音聲頻信號經(jīng)音頻放大模/數(shù)轉(zhuǎn)換至微處理器CPU處理識別,微處理器CPU將輸入的漢語聲頻數(shù)據(jù)信號與存儲在預(yù)譯句庫中的漢語句庫的每一句漢語句子的聲頻數(shù)據(jù)信號進行對比,調(diào)取相同或相似聲頻數(shù)據(jù)信號的一句漢語句子,根據(jù)該漢語句子序號,微處理器CPU發(fā)出指令,調(diào)出外語句庫中對應(yīng)的相同序號的外語句子,經(jīng)音頻放大數(shù)/模轉(zhuǎn)換后通過揚聲器播出,反之也如此。
本發(fā)明的又一技術(shù)方案是采用聲頻數(shù)據(jù)比較的自動翻譯器,其特征在于由語音拾取電路、微處理器CPU、句庫存儲器、語音播放電路構(gòu)成,語音拾取電路的麥克風(fēng)接音頻模/數(shù)轉(zhuǎn)換電路,音頻模/數(shù)轉(zhuǎn)換電路接預(yù)譯句庫存儲器,微處理器CPU接預(yù)譯句庫存儲器,預(yù)譯句庫存儲器存儲漢語句庫、外語句庫,漢語句庫、外語句庫輸出接音頻放大數(shù)/模轉(zhuǎn)換電路,音頻放大數(shù)/模轉(zhuǎn)換電路接揚聲器。
本發(fā)明的優(yōu)點本發(fā)明的優(yōu)點確實很多,難以詳盡,現(xiàn)舉其主要者1、回避了無限復(fù)雜,幾乎無法克服的語義障礙,為機器智能翻譯提供了一條可行并具持續(xù)發(fā)展空間的道路。
2、它可以多語種兼容并蓄,一機在手,可與多語種交流者實現(xiàn)交流,只要它預(yù)建了多語種“預(yù)譯句數(shù)據(jù)庫”。它甚至可根據(jù)需要,靈活地從網(wǎng)上下載所需語種的“預(yù)譯句數(shù)據(jù)庫”。
3、所需技術(shù)均為現(xiàn)代成熟技術(shù),如模數(shù)、數(shù)模轉(zhuǎn)換及聲頻數(shù)據(jù)化技術(shù),數(shù)據(jù)處理則是利用了電腦最基本最突出的功能存儲及檢索。在電腦軟硬件技術(shù)日新月異的今天,它能不斷得到新的技術(shù)支持,從而不斷完善及提升其功能。
4、單方配持時,它允許配持一方使用方言,雙方配持時,它允許雙方都使用方言,而不要求一定要會說、聽懂普通話。
5、自動翻譯器體積小巧,成本較低,而且不要求使用者一定要會說聽懂普通話,使它易于為廣大需求者接受,因此極具商業(yè)價值。
本發(fā)明有二個基本特點一、語音聲頻數(shù)據(jù)化本發(fā)明舍棄難以實現(xiàn)的語義電腦翻譯方法,采用語音電腦翻譯方法。
盡管各語種語法、語義上千差萬別,但有一點是共同的,即它們都是有聲語言,都有可以作為電腦處理對象的語音,即聲音或聲頻。利用現(xiàn)有技術(shù)(數(shù)模轉(zhuǎn)換電路)可將任一語句的語音聲波頻率表述為(或記錄為)可被電腦儲存、檢索并識別的數(shù)據(jù)(組、列),即可用電腦數(shù)據(jù)記錄并存儲語句。
二、建立“語音數(shù)據(jù)化預(yù)譯句庫”1、分類別編擬“預(yù)譯句庫”。
現(xiàn)實中,不同語種間的交流大多是有某類主題范圍的,如旅游類、商務(wù)類、一般生活類等等,而某一定類主題的交流所涉及的語句也是有限的。比如《英語900句》,熟練掌握后,在英語國家生活應(yīng)無大問題。
據(jù)此,我們可以根據(jù)不同語種間(為表述方便,以下均以漢語對英語間的旅游類交流為例)交流內(nèi)容的不同主題范圍建立適用的句庫。方法是先請中英旅游類專家根據(jù)一個到英國的中國旅游者與英國人交流可能涉及到的內(nèi)容,擬定中英文旅游句庫,該句庫包容了旅游者與英國人交流必要涉及的和可能涉及到的足夠數(shù)量的語句,假設(shè)為1000句語句,預(yù)先翻譯好,并將中英文句一一對應(yīng)并編號。對應(yīng)的中英文句稱為互譯句。這樣就有了一個實用的旅游類中英文“預(yù)譯句庫”。
2、“預(yù)譯句庫”的語音數(shù)據(jù)化及輸入與存儲首先將“預(yù)譯句庫”中的英文句以標(biāo)準(zhǔn)英語語音讀出,經(jīng)麥克風(fēng)拾音錄音,再經(jīng)模數(shù)轉(zhuǎn)換電路將其錄音的模擬信號轉(zhuǎn)換成數(shù)字信號(數(shù)據(jù)),按序號存入電腦存儲器,構(gòu)成“英文句聲頻數(shù)據(jù)庫”。
而后再將“預(yù)譯句庫”中的中文句由自動翻譯器的漢語使用者用自己慣常的方言語音讀(說)出,經(jīng)上述同樣電路,也將其語音數(shù)據(jù)化并根據(jù)“互譯句”關(guān)系,與已存入存儲器的英文句數(shù)據(jù)同序號一一對應(yīng)并存入電腦存儲器,構(gòu)成“中文句聲頻數(shù)據(jù)庫”。
這樣,就建成了一個擁有1000對中英文互譯句的語音聲頻數(shù)據(jù)庫,這里最關(guān)鍵的是①英文句聲頻數(shù)據(jù)庫與中文句聲頻數(shù)據(jù)庫中的互譯句要同序一一對應(yīng),以便對比、檢索及調(diào)出。
②自動翻譯器的漢語使用者的語音聲頻一定要由其本人用慣常的方言語音讀(說)出,輸入存儲器,這使得眾多不會說本語種“普通話”的人能夠使用自動翻譯器,同時也使自動翻譯器成為純個性化的翻譯工具。
③由于英語語句是以英語標(biāo)準(zhǔn)語音聲頻輸入的,考慮到便捷可行,可以預(yù)先錄音,其聲頻數(shù)據(jù)化后,以多種數(shù)據(jù)載體輸入自動翻譯器的“英文句聲頻數(shù)據(jù)庫”。


圖1——本發(fā)明原理結(jié)構(gòu)及使用流程示意圖。
具體實施例方式
CPU工作程序“中英文語音聲頻數(shù)據(jù)庫”建立后1、漢譯英使用中,漢語使用者說出的語句(該語句必須是預(yù)譯句庫1000句中的一句)的語音經(jīng)微型麥克風(fēng)拾音,并經(jīng)模數(shù)轉(zhuǎn)換電路轉(zhuǎn)換成語音聲頻數(shù)據(jù),輸入電腦,CPU以此數(shù)據(jù)為標(biāo)準(zhǔn)在“中文句語音聲頻數(shù)據(jù)庫”中進行對比、檢索,將與之相同或最相近的一組聲頻數(shù)據(jù)的存儲位置(序號)找到,而后將“英文句語音聲頻數(shù)據(jù)庫”中同位置(序號)的一組聲頻數(shù)據(jù)調(diào)出,經(jīng)數(shù)模轉(zhuǎn)換電路將其錄音通過微型揚聲器播出給英語對話者,同時,還可將其通過自動翻譯器上的液晶顯示屏文字顯示。
在上述過程中,漢語使用者的漢語語音聲頻數(shù)據(jù)是作為CPU在“中文句語音聲頻數(shù)據(jù)庫”中進行對比、檢索的標(biāo)準(zhǔn)的,由于數(shù)據(jù)庫中的語音聲頻的提供者與現(xiàn)在的使用者(語音聲頻輸入者)為同一人,所說的句子又是已存入的1000句中的一句,所以可以準(zhǔn)確判別,即使或有漏字,錯字等現(xiàn)象,CPU也可根據(jù)“最相近(相似)”原則判別出。我們可以把這種“相近似”判斷稱為“CPU”的“模糊識別”,這是衡量自動翻譯器水準(zhǔn)的重要指標(biāo)。
2、英譯漢這是指英語對話者的回答,其語音通過漢語使用者所持的自動翻譯器上的微型指向性麥克風(fēng)拾音,經(jīng)模數(shù)轉(zhuǎn)換電路后,CPU以此數(shù)據(jù)為標(biāo)準(zhǔn)在“英文句語音聲頻數(shù)據(jù)庫”中對比、檢索,將與之相同或最相近似的一組聲頻數(shù)據(jù)的存儲位置(序號)找到,而后將“中文句語音聲頻數(shù)據(jù)庫”中同位置(序號)的一組聲頻數(shù)據(jù)調(diào)出,經(jīng)數(shù)模轉(zhuǎn)換電路,將其錄音通過耳塞式聽筒播出給漢語使用者,這樣漢語使用者聽到的是自己說出的方言譯句。
這里有二種情況①英語對話者沒有配持自動翻譯器,其語句的“翻譯”是通過漢語使用者配持的自動翻譯器來實現(xiàn)的,而該翻譯器中“英文句語音聲頻數(shù)據(jù)庫”內(nèi)的聲頻數(shù)據(jù)提供者與英語對話者不是同一人,二者聲頻數(shù)據(jù)會有程度不同的差異,可能會使CPU對比檢索時增大難度,所以應(yīng)要求英語對話者盡可能說標(biāo)準(zhǔn)語音。
②英語對話者也配持了自動翻譯器,且建有相同類別句庫,則交流將很順暢。
技術(shù)方案采用聲頻數(shù)據(jù)處理的自動翻譯方法包括將預(yù)先擬定并翻譯好的,一定量的中英文互譯句的語音頻率數(shù)據(jù)化,分別存入電腦存儲器中的英文句語音聲頻數(shù)據(jù)庫和漢語句語音聲頻數(shù)據(jù)庫,二庫中的互譯句按相同序號一一對應(yīng),形成中英文“預(yù)譯句數(shù)據(jù)庫”。麥克風(fēng)拾取的漢語語音聲頻信號經(jīng)模數(shù)轉(zhuǎn)換電路轉(zhuǎn)換成數(shù)據(jù)信號后,送至微處理器CPU處理,CPU將其與存儲器中的漢語句聲頻數(shù)據(jù)庫內(nèi)的漢語句聲頻數(shù)據(jù)進行對比、檢索,調(diào)取相同或最相似者,再根據(jù)該句序號,調(diào)出英語句聲頻數(shù)據(jù)庫內(nèi)與其序號對應(yīng)的英語句聲頻數(shù)據(jù),經(jīng)數(shù)模轉(zhuǎn)換后,通過揚聲器播出。反之亦如此。
采用聲頻數(shù)據(jù)處理方法的自動翻譯器,其主要技術(shù)特征在于聲頻處理電路由語音拾取電路、模數(shù)及數(shù)模轉(zhuǎn)換電路、微處理器(CPU)、存儲器(預(yù)譯句數(shù)據(jù)庫)、語音播放電路構(gòu)成語言拾取電路的麥克風(fēng)接音頻模數(shù)轉(zhuǎn)換電路,音頻模數(shù)轉(zhuǎn)換電路接存儲器(預(yù)譯句數(shù)據(jù)庫),微處理器(CPU)接存儲器(預(yù)譯句數(shù)據(jù)庫)、存儲器(預(yù)譯句數(shù)據(jù)庫)接數(shù)模轉(zhuǎn)換電路,數(shù)模轉(zhuǎn)換電路按語音播放電路及液晶顯示電路。
自動翻譯器的配置現(xiàn)代大規(guī)模集成電路及微電腦技術(shù),使得自動翻譯器可以做的很小巧,它基本呈胸卡形,可隨身佩帶。它的配置有1、主機外表面有一塊液晶顯示屏,作譯句文字顯示用,有一微型擴音器,作譯句播音用,一微型指向性話筒,作對未配置翻譯器的對話者拾音用,數(shù)字及模擬信號輸入及輸出接口,電池(內(nèi)置或外置)。
2、耳塞式聽筒。
3、微型領(lǐng)夾式話筒。
本發(fā)明前景在多語種間交流的社會需求如此巨大并還在不斷擴大的時代,作為一項實用的個人化的機器智能翻譯設(shè)備的發(fā)明,必將具有極為廣闊的發(fā)展前景,它必將迅速進入人類多領(lǐng)域生活中。
還從旅游類舉例,它首先可在各國機場、車站、商店、飯店、景點等處設(shè)置(大型臺式),或為服務(wù)人員配置,這將為其他語種旅游者克服幾乎所有有關(guān)旅游方面的語言障礙。
它同樣可在商貿(mào)類甚至軍事類被廣泛采用。
由于它體積小、成本低、易于普及,而普及面越廣,即配持人越多,他們享有的交流自由度就越大。
并且,隨大規(guī)模集成電路及電腦技術(shù)的飛速發(fā)展,主要是存量越大而運算處理速度越快,其翻譯性能----主要指預(yù)譯數(shù)據(jù)庫的類別數(shù)及預(yù)譯句的容量、檢索的速度,特別是檢索的效率(模糊識別能力)----將越優(yōu)異。
此外,預(yù)譯句庫作為人類生活各范疇專家與語言學(xué)家的作品,在市場推動下,必將不斷更新且越來越實用,它將分語種分主題類別以多種數(shù)據(jù)載體方式在專門商店,甚至在網(wǎng)上出售,這甚至可能成為一種產(chǎn)業(yè)。
權(quán)利要求
1.采用聲頻數(shù)據(jù)比較的自動翻譯處理方法,包括事先將漢語句子、外語句子通過聲頻數(shù)據(jù)輸入到電腦存儲器中,將許多句漢語句子一一編上序號,形成漢語句庫,將許多句外語句子也一一編上序號,形成外語句庫,漢語句庫的漢語句子序號與外語句庫的外語句子序號一一對應(yīng),且這種序號的一一對應(yīng)建立在相同語義上,二者構(gòu)成預(yù)譯句庫,麥克風(fēng)拾取的漢語語音聲頻信號經(jīng)音頻放大模/數(shù)轉(zhuǎn)換至微處理器CPU處理識別,微處理器CPU將輸入的漢語聲頻數(shù)據(jù)信號與存儲在預(yù)譯句庫中的漢語句庫的每一句漢語句子的聲頻數(shù)據(jù)信號進行對比,調(diào)取相同或相似聲頻數(shù)據(jù)信號的一句漢語句子,根據(jù)該漢語句子序號,微處理器CPU發(fā)出指令,調(diào)出外語句庫中對應(yīng)的相同序號的外語句子,經(jīng)音頻放大數(shù)/模轉(zhuǎn)換后通過揚聲器播出,反之也如此。
2.采用聲頻數(shù)據(jù)比較的自動翻譯器,其特征在于由語音拾取電路、微處理器CPU、句庫存儲器、語音播放電路構(gòu)成,語音拾取電路的麥克風(fēng)接音頻模/數(shù)轉(zhuǎn)換電路,音頻模/數(shù)轉(zhuǎn)換電路接預(yù)譯句庫存儲器,微處理器CPU接預(yù)譯句庫存儲器,預(yù)譯句庫存儲器存儲漢語句庫、外語句庫,漢語句庫、外語句庫輸出接音頻放大數(shù)/模轉(zhuǎn)換電路,音頻放大數(shù)/模轉(zhuǎn)換電路接揚聲器。
3.根據(jù)權(quán)利要求1所述的采用聲頻數(shù)據(jù)比較的自動翻譯處理方法,其特征在于聲頻數(shù)據(jù)同位存儲電路存儲漢語句子或外語句子的聲頻數(shù)據(jù)信號。
4.根據(jù)權(quán)利要求1所述的采用聲頻數(shù)據(jù)比較的自動翻譯處理方法,其特征在于預(yù)譯句庫中的句子系按語義主題內(nèi)容分類選定。
5.根據(jù)權(quán)利要求1所述的采用聲頻數(shù)據(jù)比較的自動翻譯處理方法,其特征在于存入電腦預(yù)譯句庫存儲器中的漢語句庫的漢語句子由特定人閱讀,經(jīng)麥克風(fēng)拾取該特定聲頻信號并經(jīng)模/數(shù)轉(zhuǎn)換后輸入到微處理器CPU中,微處理器CPU將該特定聲頻數(shù)據(jù)存入預(yù)譯句庫存儲器中。
6.根據(jù)權(quán)利要求1所述的采用聲頻數(shù)據(jù)比較的自動翻譯處理方法,其特征在于預(yù)譯句庫中的句子采用數(shù)據(jù)載體輸入至電腦存儲器。
全文摘要
本發(fā)明涉及一種采用聲頻數(shù)據(jù)比較的自動翻譯處理方法及翻譯器。將漢語、外語句子通過聲頻數(shù)據(jù)輸入電腦,且漢語和外語句子之間一一編上對應(yīng)序號且語義相同,構(gòu)成漢語、外語句庫的預(yù)譯句庫。說漢語時,CPU根據(jù)聲頻數(shù)據(jù)從漢語句庫中找出相同或相似聲頻數(shù)據(jù)的漢語句子,并根據(jù)其序號調(diào)出外語句庫中相同序號的外語句子經(jīng)處理后至揚聲器播出,反之也如此。本發(fā)明利用電腦存儲量大及檢索快的特點,解決了現(xiàn)有翻譯裝置企圖象人工翻譯那樣實現(xiàn)基本無規(guī)律、無聯(lián)系的各語種語義間的同義互換所帶來的不可能實現(xiàn)的難題和缺陷。本發(fā)明使翻譯器能聽懂漢語或外語方言。語言交流內(nèi)容可根據(jù)旅游、經(jīng)濟、法律等進行分類。本翻譯器結(jié)構(gòu)簡單、體積小,可靠性強。
文檔編號G06F3/16GK1716241SQ20051004087
公開日2006年1月4日 申請日期2005年7月4日 優(yōu)先權(quán)日2005年7月4日
發(fā)明者張 杰 申請人:張 杰
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1