圖像文字識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,尤其涉及一種圖像文字識別方法及裝置。
【背景技術(shù)】
[0002]目前,對圖像中的文字一般只是通過簡單的圖像分割處理來進行識別,無法根據(jù)圖像中的文字特征來進行自適應(yīng)調(diào)節(jié),導(dǎo)致現(xiàn)有的圖像文字識別方法精度較低,無法滿足實際應(yīng)用的需求。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的主要目的在于解決現(xiàn)有的圖像文字識別方法對文字的識別精度較低的技術(shù)問題。
[0004]為實現(xiàn)上述目的,本發(fā)明提供的一種圖像文字識別方法,所述方法包括以下步驟:
[0005]將圖像進行二值化處理,獲取圖像對應(yīng)的矩陣;
[0006]分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù);
[0007]基于所述文字矩陣參數(shù)對圖像進行切分,獲取圖像的文字子塊;
[0008]對所述文字子塊進行圖像分割以獲取所述文字子塊中的文字信息,并對所述文字信息進行識別。
[0009]優(yōu)選地,所述分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù)的步驟包括:
[0010]將圖像的矩陣坐標(biāo)中的字體用第一像素值表示,背景用第二像素值表示,統(tǒng)計圖像的矩陣坐標(biāo)中每行第二像素值的個數(shù),獲取一數(shù)組;
[0011]獲取所述數(shù)組中數(shù)值大于預(yù)設(shè)基準值的行的行號,將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準值的行中符合預(yù)設(shè)條件的行組合之間的行號距離作為一個行寬參數(shù),統(tǒng)計所述數(shù)組中的若干行寬參數(shù),對若干行寬參數(shù)取平均值,獲取所述數(shù)組的行寬參數(shù);
[0012]根據(jù)獲取的所述數(shù)組的行寬參數(shù)獲取所述數(shù)組的列寬參數(shù),并根據(jù)所述行寬參數(shù)和列寬參數(shù)獲取所述數(shù)組的字體大小參數(shù)。
[0013]優(yōu)選地,所述將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準值的行中符合預(yù)設(shè)條件的行組合之間的行號距離作為一個行寬參數(shù)的步驟具體為:
[0014]將所述數(shù)組中至少連續(xù)兩次大于預(yù)設(shè)基準值的行組合與下一至少連續(xù)兩次大于預(yù)設(shè)基準值的行組合之間的行號距離作為一個行寬參數(shù)。
[0015]優(yōu)選地,所述對所述文字子塊進行圖像分割以獲取所述文字子塊中的文字信息,并對所述文字信息進行識別的步驟具體為:
[0016]基于預(yù)設(shè)的聚類算法對切分后的文字子塊進行圖像分割處理,獲取所述文字子塊中的文字信息,并根據(jù)所述文字信息在預(yù)置的系統(tǒng)文字庫中進行比對,根據(jù)比對結(jié)果對圖像中的文字進行識別。
[0017]優(yōu)選地,所述分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù)的步驟之前還包括:
[0018]利用矩陣實驗室中的圖像配準函數(shù)在圖像及預(yù)設(shè)的基準圖像中選定若干對匹配點,并根據(jù)所述若干對匹配點對圖像進行配準處理,獲取圖像配準參數(shù);
[0019]基于所述圖像配準參數(shù)對圖像對應(yīng)的矩陣中的任意坐標(biāo)值進行變換處理,獲取變換后的圖像矩陣坐標(biāo)。
[0020]此外,為實現(xiàn)上述目的,本發(fā)明還提供一種圖像文字識別裝置,所述圖像文字識別裝置包括:
[0021]二值化模塊,用于將圖像進行二值化處理,獲取圖像對應(yīng)的矩陣;
[0022]分析模塊,用于分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù);
[0023]切分模塊,用于基于所述文字矩陣參數(shù)對圖像進行切分,獲取圖像的文字子塊;
[0024]識別模塊,用于對所述文字子塊進行圖像分割以獲取所述文字子塊中的文字信息,并對所述文字信息進行識別。
[0025]優(yōu)選地,所述分析模塊包括:
[0026]數(shù)組獲取單元,用于將圖像的矩陣坐標(biāo)中的字體用第一像素值表示,背景用第二像素值表示,統(tǒng)計圖像的矩陣坐標(biāo)中每行第二像素值的個數(shù),獲取一數(shù)組;
[0027]行寬參數(shù)獲取單元,用于獲取所述數(shù)組中數(shù)值大于預(yù)設(shè)基準值的行的行號,將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準值的行中符合預(yù)設(shè)條件的行組合之間的行號距離作為一個行寬參數(shù),統(tǒng)計所述數(shù)組中的若干行寬參數(shù),對若干行寬參數(shù)取平均值,獲取所述數(shù)組的行寬參數(shù);
[0028]字體大小參數(shù)獲取單元,用于根據(jù)獲取的所述數(shù)組的行寬參數(shù)獲取所述數(shù)組的列寬參數(shù),并根據(jù)所述行寬參數(shù)和列寬參數(shù)獲取所述數(shù)組的字體大小參數(shù)。
[0029]優(yōu)選地,所述行寬參數(shù)獲取單元還用于:
[0030]將所述數(shù)組中至少連續(xù)兩次大于預(yù)設(shè)基準值的行組合與下一至少連續(xù)兩次大于預(yù)設(shè)基準值的行組合之間的行號距離作為一個行寬參數(shù)。
[0031]優(yōu)選地,所述識別模塊具體用于:
[0032]基于預(yù)設(shè)的聚類算法對切分后的文字子塊進行圖像分割處理,獲取所述文字子塊中的文字信息,并根據(jù)所述文字信息在預(yù)置的系統(tǒng)文字庫中進行比對,根據(jù)比對結(jié)果對圖像中的文字進行識別。
[0033]優(yōu)選地,所述圖像文字識別裝置還包括:
[0034]配準模塊,用于利用矩陣實驗室中的圖像配準函數(shù)在圖像及預(yù)設(shè)的基準圖像中選定若干對匹配點,并根據(jù)所述若干對匹配點對圖像進行配準處理,獲取圖像配準參數(shù);基于所述圖像配準參數(shù)對圖像對應(yīng)的矩陣中的任意坐標(biāo)值進行變換處理,獲取變換后的圖像矩陣坐標(biāo)。
[0035]本發(fā)明提出的一種圖像文字識別方法及裝置,通過對待識別圖像的矩陣行間紋理特征進行分析,估算出圖像中文字的相關(guān)矩陣參數(shù),再基于文字的相關(guān)矩陣參數(shù)對圖像切分獲取文字子塊,并對文字子塊進行識別,由于是通過估算出的文字的相關(guān)矩陣參數(shù)來進行切分、識別,能根據(jù)圖像中文字的特性進行自適應(yīng)調(diào)節(jié),提高了切分獲取文字子塊的準確性,及對圖像中文字識別的精度。
【附圖說明】
[0036]圖1為本發(fā)明圖像文字識別方法第一實施例的流程示意圖;
[0037]圖2為圖1中步驟S20的細化流程示意圖;
[0038]圖3為本發(fā)明圖像文字識別方法第二實施例的流程示意圖;
[0039]圖4為本發(fā)明圖像文字識別裝置第一實施例的功能模塊示意圖;
[0040]圖5為圖4中分析模塊02的細化功能模塊示意圖;
[0041]圖6為本發(fā)明圖像文字識別裝置第二實施例的功能模塊示意圖。
[0042]本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
【具體實施方式】
[0043]應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0044]本發(fā)明提供一種圖像文字識別方法。
[0045]參照圖1,圖1為本發(fā)明圖像文字識別方法第一實施例的流程示意圖。
[0046]在第一實施例中,該圖像文字識別方法包括:
[0047]步驟S10,將圖像進行二值化處理,獲取圖像對應(yīng)的矩陣;
[0048]將待識別的圖像進行二值化處理,獲取其對應(yīng)的一維的矩陣,以便后續(xù)對圖像進行分析時直接對其矩陣進行分析。
[0049]步驟S20,分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù);
[0050]利用圖像的矩陣行間紋理特征來進行分析,估算出圖像中文字的特征參數(shù),如可體現(xiàn)圖像中文字特性的行寬、列寬、文字大小等文字矩陣參數(shù),這樣,即可根據(jù)不同圖像的矩陣獲取其中相應(yīng)的文字矩陣參數(shù),能根據(jù)不同圖像中文字的不同特性自適應(yīng)的獲取其對應(yīng)的文字矩陣參數(shù)。本實施例中,待識別的圖像可以是jpg、bmp、png等圖像格式,在此不作限定。
[0051]步驟S30,基于所述文字矩陣參數(shù)對圖像進行切分,獲取圖像的文字子塊;
[0052]獲取到圖像的文字矩陣參數(shù)后,根據(jù)該文字矩陣參數(shù)對圖像進行切分,將圖像切分為若干文字子塊,由于是根據(jù)能體現(xiàn)圖像中文字特性的文字矩陣參數(shù)來對圖像進行切分,使得切分后的文字子塊能最大程度的包含文字的有效信息,提高了切分圖像的準確性及合理性,且有利于提升后續(xù)對文字子塊識別的精度。
[0053]步驟S40,對所述文字子塊進行圖像分割以獲取所述文字子塊中的文字信息,并對所述文字信息進行識別。
[0054]由于二值化處理后的圖像中只包括文字與背景這兩種像素,基于預(yù)設(shè)的聚類算法對切分后的文字子塊