專利名稱:一種基于拍照手機(jī)的光學(xué)字符識(shí)別及翻譯方法
技術(shù)領(lǐng)域:
該發(fā)明是一種基于拍照手機(jī)的、可對(duì)字符進(jìn)行識(shí)別并翻譯的方法,是應(yīng)用在手機(jī)領(lǐng)域。
背景技術(shù):
現(xiàn)在手機(jī)已經(jīng)成為人們必不可少一件通訊工具,其功能也越來越強(qiáng)大,價(jià)格也越來越低,有的手機(jī)已經(jīng)可以提供光學(xué)字符識(shí)別功能了,即對(duì)名片上的文字可以進(jìn)行識(shí)別,如LG公司與摩托羅拉公司都有這樣的產(chǎn)品,但是它們僅僅只是識(shí)別文字,即把光學(xué)字符識(shí)別并保存為手機(jī)與電腦可以存儲(chǔ)并處理的文本格式,除此之外沒有太多的其它實(shí)用功能。而現(xiàn)在人們對(duì)文字的翻譯是常用的功能之一,特別是在嵌入式設(shè)備如PDA、學(xué)習(xí)機(jī)上,出現(xiàn)了各種各樣的方案與產(chǎn)品,但這些產(chǎn)品一般都是手工輸入字母機(jī)器翻譯,非常不方便,而光學(xué)字符識(shí)別輸入可以較好地解決這個(gè)問題,中國專利CN200410073266.5就是這樣一個(gè)類似的方案,它的主要步驟為攝取、辨識(shí)、翻譯與顯示,已經(jīng)涉及到了各個(gè)主要的步驟,但是這個(gè)方案也存在不足,就是因?yàn)槭謾C(jī)硬件與識(shí)別軟件的一些局限性,攝取圖像后辨識(shí)后的結(jié)果往往不正確,如果這樣就直接翻譯的話就可能會(huì)導(dǎo)致錯(cuò)誤,因?yàn)榉g是兩語種之間的轉(zhuǎn)換,如果不加驗(yàn)證出現(xiàn)了錯(cuò)誤很不容易發(fā)現(xiàn),所以可靠性會(huì)大大降低。
發(fā)明內(nèi)容
該發(fā)明的目的就是提供一種利用拍照手機(jī)實(shí)現(xiàn)直接可以對(duì)名片、文稿等進(jìn)行拍照,直接得到標(biāo)準(zhǔn)格式的圖像信息,然后進(jìn)行識(shí)別與驗(yàn)證,最后再翻譯以及發(fā)音,以保證識(shí)別結(jié)果的正確性。
該發(fā)明的目的是通過以下的方法和步驟來實(shí)現(xiàn)的(1)獲取目標(biāo)文稿的原始圖像信息;(2)對(duì)具有對(duì)文字、名片、表格等圖像信息,啟動(dòng)光學(xué)字符識(shí)別程序或驅(qū)動(dòng)方法,對(duì)文字及表格進(jìn)行識(shí)別;(3)顯示識(shí)別的結(jié)果;(4)對(duì)識(shí)別結(jié)果進(jìn)行驗(yàn)證,如果識(shí)別結(jié)果正確則進(jìn)行下一步,否則重新進(jìn)行第一步,獲取圖像并重復(fù)上述步驟;(5)對(duì)正確的識(shí)別結(jié)果進(jìn)行翻譯;(6)對(duì)翻譯的結(jié)果進(jìn)行顯示。
為了更加便于使用,可以在對(duì)翻譯的結(jié)果進(jìn)行顯示的同時(shí)或稍候,調(diào)用發(fā)音模塊進(jìn)行發(fā)音。
該發(fā)明的優(yōu)點(diǎn)和效果是充分利用現(xiàn)有拍照手機(jī)的拍照功能,可以對(duì)文稿、表格等進(jìn)行光學(xué)字符識(shí)別與驗(yàn)正,可以保存為標(biāo)準(zhǔn)格式的字符文本信息,并且可以直接翻譯成為另一種文字,并可調(diào)用發(fā)聲模塊發(fā)出聲音。
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說明。
圖1是本發(fā)明提出的一種基于拍照手機(jī)的光學(xué)字符識(shí)別及翻譯方法的流程與步驟示意圖。
圖2是本發(fā)明提出的一種基于拍照手機(jī)的光學(xué)字符識(shí)別及翻譯方法的另一流程與步驟示意圖。
具體實(shí)施例方式
由于現(xiàn)在手機(jī)的普及化,特別是拍照手機(jī)的流行,為圖像處理提供了便利條件,在實(shí)際生活中,光學(xué)字符識(shí)別就是可以通過獲取圖像來實(shí)現(xiàn)的,如在手機(jī)內(nèi)載入光學(xué)字符識(shí)別程序,就可以對(duì)所獲取的圖像進(jìn)行識(shí)別,并且可以進(jìn)行翻譯,甚至發(fā)音。過程為如下所示(1)獲取目標(biāo)文稿的原始圖像信息,這個(gè)獲取圖像可以由拍照手機(jī)直接攝取獲得,也可以直接獲得現(xiàn)有的圖像,如存儲(chǔ)、下載、復(fù)制、傳送到拍照手機(jī)上等,目標(biāo)文稿可以是文稿,也可以是名片,甚至是表格,所獲得的圖像的質(zhì)量與拍照手機(jī)的像素有點(diǎn)直接的聯(lián)系,像素越高識(shí)別的效果越好。
(2)對(duì)具有對(duì)文稿、名片、表格等圖像信息,啟動(dòng)手機(jī)內(nèi)預(yù)先載入的光學(xué)字符識(shí)別程序或驅(qū)動(dòng)方法,對(duì)文稿及表格進(jìn)行識(shí)別。
(3)在手機(jī)的顯示屏幕上顯示識(shí)別后的結(jié)果。
(4)用戶對(duì)識(shí)別后的結(jié)果進(jìn)行驗(yàn)證,看是否與原始圖像所表達(dá)的信息一致,如果識(shí)別結(jié)果正確則進(jìn)行下一步,否則重新進(jìn)行第一步,獲取圖像并重復(fù)上述步驟。這樣做的原因在于由于受到拍照手機(jī)的像素限制、使用條件不理想以及用戶使用不當(dāng)?shù)仍?,都非常容易造成光學(xué)字符識(shí)別結(jié)果的不正確,如果只是直接、簡(jiǎn)單的、同一種文字的識(shí)別,沒有經(jīng)過轉(zhuǎn)換與翻譯,用戶可以容易直接發(fā)現(xiàn),但如果要將原文識(shí)別并翻譯成為另一種文字,用戶就可能會(huì)對(duì)翻譯前的文字不熟悉,那么就無法判斷翻譯的結(jié)果,是否是他自己本來想要的結(jié)果,比如,一個(gè)不懂中文的美國人到中國來旅游,看到中文標(biāo)識(shí)后看不懂,就通過拍照手機(jī)把它拍下來識(shí)別,再翻譯成為英文來理解,如果在翻譯之前,他對(duì)圖像與識(shí)別后的文字時(shí)行比較,經(jīng)過確認(rèn)正確后再進(jìn)行翻譯,這時(shí)的結(jié)果是可以保證正確的,如果不經(jīng)過確認(rèn)直接就進(jìn)行翻譯,就不能夠保證翻譯的正確性,這也是本發(fā)明所要強(qiáng)調(diào)的要點(diǎn)。
(5)對(duì)識(shí)別的結(jié)果進(jìn)行翻譯,在拍照手機(jī)里預(yù)先載入了翻譯模塊,可以直接調(diào)用與識(shí)別結(jié)果相對(duì)應(yīng)的單詞與語句,直接使之對(duì)應(yīng)起來。
(6)對(duì)翻譯的結(jié)果進(jìn)行顯示,將上述對(duì)應(yīng)的結(jié)果在手機(jī)的屏幕上顯示出來,使用者可以直接閱讀。
上述的過程就基本完成了由拍照手機(jī)實(shí)現(xiàn)光學(xué)字符識(shí)別以及翻譯的功能。
在上述的基礎(chǔ)上,為了更加便于使用,可以在對(duì)翻譯的結(jié)果進(jìn)行顯示的同時(shí)或稍候,對(duì)翻譯的結(jié)果進(jìn)行發(fā)音,可以在手機(jī)內(nèi)載入發(fā)音模塊,當(dāng)翻譯的結(jié)果出來以來,通過程序設(shè)定或是按鈕控制,調(diào)用發(fā)音模塊進(jìn)行發(fā)音,完成發(fā)音的功能。
所以,上述的方案適用于拍照手機(jī)對(duì)名片、文稿、文字標(biāo)識(shí)的識(shí)別、翻譯、保存,不但可以應(yīng)用于中文,如果配套的識(shí)別軟件為其它語種,也可以相互識(shí)別以及翻譯,甚至也都可以發(fā)音,為學(xué)習(xí)工作生活提供極大的便利。
雖然這里只說明了本發(fā)明的一個(gè)實(shí)施例,但其意并非限制本發(fā)明的范圍、適用性和配置。相反,對(duì)實(shí)施例的詳細(xì)說明可使本領(lǐng)域技術(shù)人員得以實(shí)施。應(yīng)能理解,在不偏離所附權(quán)利要求書確定的本發(fā)明精神和范圍情況下,可對(duì)一些細(xì)節(jié)做適當(dāng)變更和修改。
權(quán)利要求
1.一種基于拍照手機(jī)并可對(duì)字符進(jìn)行識(shí)別并翻譯的方法,其步驟為(1)獲取目標(biāo)文稿的原始圖像信息;(2)對(duì)具有對(duì)文稿、名片、表格等圖像信息,啟動(dòng)光學(xué)字符識(shí)別程序或驅(qū)動(dòng)方法,對(duì)文字及表格進(jìn)行識(shí)別;(3)顯示識(shí)別的結(jié)果;(4)對(duì)識(shí)別結(jié)果進(jìn)行驗(yàn)證,如果識(shí)別結(jié)果正確則進(jìn)行下一步,否則重新進(jìn)行第一步,獲取圖像并重復(fù)上述步驟;(5)對(duì)識(shí)別的結(jié)果進(jìn)行翻譯;(6)對(duì)翻譯的結(jié)果進(jìn)行顯示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于在對(duì)翻譯的結(jié)果進(jìn)行顯示的同時(shí)或是稍候,調(diào)用發(fā)音模塊進(jìn)行發(fā)音。
3.據(jù)權(quán)利要求1所述的方法,其中所提及的(1)中獲取目標(biāo)文稿的原始圖像信息,是指可以直接對(duì)準(zhǔn)目標(biāo)圖像進(jìn)行拍攝。
4.根據(jù)權(quán)利要求1所述的方法,其中所提及的(1)中獲取目標(biāo)文稿的原始圖像信息,是指可以由其它設(shè)備存儲(chǔ)、下載、復(fù)制、傳送或是輸入到手機(jī)上的圖像信息。
全文摘要
該發(fā)明是一種利用拍照手機(jī)的拍照功能、通過光學(xué)字符識(shí)別達(dá)到翻譯的方法,是主要通過以下步驟來實(shí)現(xiàn)的獲取目標(biāo)文稿的原始圖像信息、光學(xué)字符識(shí)別、顯示識(shí)別的結(jié)果、對(duì)識(shí)別結(jié)果進(jìn)行驗(yàn)證、翻譯、結(jié)果顯示、發(fā)音,其優(yōu)點(diǎn)和效果是可以利用拍照手機(jī)的拍照功能,隨時(shí)隨地對(duì)文字進(jìn)行識(shí)別并翻譯、發(fā)音。
文檔編號(hào)G06K9/72GK101059839SQ20061007226
公開日2007年10月24日 申請(qǐng)日期2006年4月17日 優(yōu)先權(quán)日2006年4月17日
發(fā)明者宋柏君 申請(qǐng)人:宋柏君