專利名稱:一種圖像文字識別系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖象分析處理領(lǐng)域,尤其是相應(yīng)的圖象過濾分析應(yīng)用領(lǐng)域,特別是針 對通信運營商的多媒體信息監(jiān)控過濾系統(tǒng)。
背景技術(shù):
隨著移動通信技術(shù)的發(fā)展,所發(fā)送的數(shù)據(jù)已不僅僅局限于文字信息,也包含了大 量的圖像信息。目前,國家對短信息已經(jīng)有了較好的監(jiān)控,抑制了一部分不良信息的傳播, 但對圖像信息,卻不能監(jiān)控,這就讓很多不法分子有可乘之機(jī),使用這種方式,廣為傳播含 有擾亂社會治安或是居民生活的信息。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一流的、高效穩(wěn)定的圖像文字識別系統(tǒng)解決方案。針對圖像 數(shù)據(jù)進(jìn)行識別處理,直接得到圖像數(shù)據(jù)所包含的字符信息。為此本發(fā)明提出了一種圖像文字識別系統(tǒng),所述圖像文字識別系統(tǒng)包括
數(shù)據(jù)接收模塊,用于從Data krver接收具體的圖象文件數(shù)據(jù)以供后續(xù)的圖象文字識 別工作;背景過濾模塊,用于去除圖像背景,提取字符區(qū)域;字符分割模塊,用于對每個字 符區(qū)域做細(xì)化和大小歸一化處理,分割字符;特征提取模塊,用于提取每個區(qū)域每個字符的 特征值;特征對比模塊,用于查詢數(shù)據(jù)庫,得到字符對比結(jié)果;數(shù)據(jù)庫更新模塊用于將特 征值與對應(yīng)字符寫入特征數(shù)據(jù)庫。根據(jù)本發(fā)明的實施例,所述背景過濾模塊首先進(jìn)行彩色游程編碼;其次得到顏 色聚類;再次進(jìn)行字符層的生成和選擇;最后提取字符區(qū)域。上述彩色游程編碼根據(jù)彩色歐氏距離進(jìn)行編碼從每一行的第一個象素開始,以 該像素為一個新的游程的起始點,計算該起始點和同一行中與它緊鄰的下一個像素在RGB 空間內(nèi)的歐氏距離dii';如果dii'小于閾值Th,將這兩個像素合并為一個游程,游程 長度Ii增1,并計算該游程的平均值RGB值(ri,bi,gi),相反,如果大于等于閾值 Th,則游程序號i增1,并以該像素為新游程的起始點,記錄下該像素坐標(biāo)和顏色值(1) ,新游程長度初始值為1 ;按照這種方法,繼續(xù)計算下一個相鄰像素與該相鄰游程的歐氏 距離,如果距離小于Th,就將該像素并入該游程,并重新計算它的RGB值,反之,生成 新的游程;根據(jù)上述規(guī)則,遍歷圖像中每一行的所有像素可以得到若干個彩色游程;在彩 色游程生成同時,從圖像的第二行開始,計算該行與上一相鄰行在位置上是8鄰域相連的 各彩色游程兩兩之間在RGB空間內(nèi)的歐氏距離,判斷該距離是否小于閾值Tv,若小于Tv 則合并為同一個連通域,即連接這兩個游程;遍歷完全部圖像后,根據(jù)游程之間的連接 指針便可以得到組成圖像的所有連通域的集合{ Ci I 1 = 1,2, ,ρ},ρ為圖像所 包含連通域的總數(shù);其中所述Tv = Th = 13至16。根據(jù)本發(fā)明的實施例,該系統(tǒng)通過如下步驟得到顏色聚類
所含像素數(shù)目最多的連通域的平均顏色作為初始的中心顏色,計算其它連通域與其在RGB彩色空間的歐氏距離;若小于閾值TC,則計算兩個連通域平均RGB值,并作為新 的中心顏色值取代原來的初始中心顏色;若大于TC,則生成第二個新的顏色中心,該連通 域的平均顏色值即為該中心的初始RGB值;按照該方法逐個計算比較,合并中心距離小于 TC的顏色中心;其中所述TC =觀 30。根據(jù)本發(fā)明的實施例,所述圖像文字識別系統(tǒng)按照如下步驟進(jìn)行字符層的生成和 選擇在連通域顏色聚類之后,保留所有面積大于1 Xi的連通域,分別計算這些連通域 與各個顏色中心的歐氏距離;如果某個連通域與其中一個顏色中心的歐氏距離小于TC, 那么該連通域會被分配到該顏色中心決定的層面上。根據(jù)本發(fā)明的實施例,所述圖像文字識別系統(tǒng)通過如下步驟來提取字符區(qū)域
1)依次測試每一圖像層面對于每一個圖像層面,如果大于該層分割閾值的像素個數(shù) 超過100個,就作為文字層面,如果大于該層分割閾值的像素個數(shù)小于100,作為噪聲或背
景層面;
2)依次測試每一連通域如果被測試的連通域的長和寬與測試圖像大小大體相當(dāng), 被測試的連通域的平均顏色作為背景色,它所在層面即為背景層面
3)刪除噪聲層面和背景層面,剩下的層面均為圖像文字層面。根據(jù)本發(fā)明的實施例,所述圖像文字識別系統(tǒng)包括圖像增強(qiáng)模塊,用于對每個字 符區(qū)域做預(yù)處理,增強(qiáng)圖像識別強(qiáng)度;所述圖像文字識別系統(tǒng)通過如下步驟進(jìn)行增強(qiáng)處理 根據(jù)背景過濾模塊處理后的圖像數(shù)據(jù),計算圖像上字符區(qū)域的像素平均值,比較每個像素 與平均像素之間的差異,保留字符區(qū)域中差異不大的像素;然后使用均值濾波去除噪聲; 再根據(jù)灰度直方圖統(tǒng)計閾值,并根據(jù)閾值分割圖像。根據(jù)本發(fā)明的實施例,所述字符分割模塊完成如下步驟
首先要提取字符骨架,文本的骨架,要根據(jù)它的八個相鄰點的情況來判斷1.內(nèi)部點 不能刪除;2.孤立點不能刪除;3.直線端點不能刪除4.如果像素點P是邊界點,去掉P后, 如果連通分量不增加,則刪除P ;
根據(jù)索引表,每次對一行一行的將整個圖象掃描一遍,對于非邊界的每個點,計算它對 應(yīng)在表中的索引,若為0,則保留,否則刪除該點;如果這次掃描沒有一個點被刪除,則循環(huán) 結(jié)束,剩下的點就是骨架點,如果有點被刪除,則進(jìn)行新的一輪掃描,如此反復(fù),直到?jīng)]有點 被刪除為止;
對抽取骨架的圖像數(shù)據(jù),按照從左到右,從上到下的方式進(jìn)行遍歷,根據(jù)字符的八連同 性進(jìn)行字符分割。根據(jù)本發(fā)明的實施例,所述字符特征提取模塊完成如下步驟 首先根據(jù)統(tǒng)一的寬高比,對每個分割的字符進(jìn)行大小歸一處理; 其次,根據(jù)橫向和縱向需要提取特征點的數(shù)量,將字符等量切分;或
1)取得筆畫的起點坐標(biāo)和終點坐標(biāo),分別為(Martx,StartY)和(EndX,EndY);
2)如果EndX=StartX,那么筆畫的矢量編碼code-4,轉(zhuǎn)到5);
3)計算筆畫斜率的絕對值slope
4)根據(jù)slope確定筆畫在第一象限的矢量編碼code。如果 0<~slope<tan( r/16),貝ij code=0 ;如果tan(>/16) S slope<tan(3;r/16),則 code=l ;如果
權(quán)利要求
1.一種圖像文字識別系統(tǒng),其特征在于,所述圖像文字識別系統(tǒng)包括數(shù)據(jù)接收模塊,用于從Data krver接收具體的圖象文件數(shù)據(jù)以供后續(xù)的圖象文字識 別工作;背景過濾模塊,用于去除圖像背景,提取字符區(qū)域;字符分割模塊,用于對每個字符區(qū)域做細(xì)化和大小歸一化處理,分割字符;特征提取模塊,用于提取每個區(qū)域每個字符的特征值;特征對比模塊,用于查詢數(shù)據(jù)庫,得到字符對比結(jié)果;數(shù)據(jù)庫更新模塊用于將特征值與對應(yīng)字符寫入特征數(shù)據(jù)庫。
2.如權(quán)利要求1所述的圖像文字識別系統(tǒng),其特征在于,所述背景過濾模塊 首先進(jìn)行彩色游程編碼;其次得到顏色聚類; 再次進(jìn)行字符層的生成和選擇; 最后提取字符區(qū)域。
3.如權(quán)利要求2所述的圖像文字識別系統(tǒng),其特征在于,所述彩色游程編碼根據(jù)彩色 歐氏距離進(jìn)行編碼從每一行的第一個象素開始,以該像素為一個新的游程的起始點,計算該起始點和同 一行中與它緊鄰的下一個像素在RGB空間內(nèi)的歐氏距離dii';如果dii'小于閾值Th,將這兩個像素合并為一個游程,游程長度Ii增1,并計算 該游程的平均值RGB值(ri,bi,gi),相反,如果大于等于閾值Th,則游程序號i增 1,并以該像素為新游程的起始點,記錄下該像素坐標(biāo)和顏色值(1),新游程長度初始值 為1 ;按照這種方法,繼續(xù)計算下一個相鄰像素與該相鄰游程的歐氏距離,如果距離小于Th ,就將該像素并入該游程,并重新計算它的RGB值,反之,生成新的游程; 根據(jù)上述規(guī)則,遍歷圖像中每一行的所有像素可以得到若干個彩色游程; 在彩色游程生成同時,從圖像的第二行開始,計算該行與上一相鄰行在位置上是8鄰 域相連的各彩色游程兩兩之間在RGB空間內(nèi)的歐氏距離,判斷該距離是否小于閾值Tv,若 小于Tv則合并為同一個連通域,即連接這兩個游程;遍歷完全部圖像后,根據(jù)游程之間的連接指針便可以得到組成圖像的所有連通 域的集合{ Ci I 1 = 1,2, ,ρ},ρ為圖像所包含連通域的總數(shù); 其中所述Tv = Th = 13至16。
4.如權(quán)利要求3所述的圖像文字識別系統(tǒng),其特征在于,該系統(tǒng)通過如下步驟得到顏 色聚類所含像素數(shù)目最多的連通域的平均顏色作為初始的中心顏色,計算其它連通域與其 在RGB彩色空間的歐氏距離;若小于閾值TC,則計算兩個連通域平均RGB值,并作為新 的中心顏色值取代原來的初始中心顏色;若大于TC,則生成第二個新的顏色中心,該連通 域的平均顏色值即為該中心的初始RGB值;按照該方法逐個計算比較,合并中心距離小于 TC的顏色中心;其中所述TC =觀 30。
5.如權(quán)利要求4所述的圖像文字識別系統(tǒng),其特征在于,所述圖像文字識別系統(tǒng)按照 如下步驟進(jìn)行字符層的生成和選擇在連通域顏色聚類之后,保留所有面積大于1 Xi的連通域,分別計算這些連通域與 各個顏色中心的歐氏距離;如果某個連通域與其中一個顏色中心的歐氏距離小于TC,那 么該連通域會被分配到該顏色中心決定的層面上。
6.如權(quán)利要求5所述的圖像文字識別系統(tǒng),其特征在于,所述圖像文字識別系統(tǒng)通過 如下步驟來提取字符區(qū)域1)依次測試每一圖像層面對于每一個圖像層面,如果大于該層分割閾值的像素個數(shù) 超過100個,就作為文字層面,如果大于該層分割閾值的像素個數(shù)小于100,作為噪聲或背 景層面;2)依次測試每一連通域如果被測試的連通域的長和寬與測試圖像大小大體相當(dāng), 被測試的連通域的平均顏色作為背景色,它所在層面即為背景層面;3)刪除噪聲層面和背景層面,剩下的層面均為圖像文字層面。
7.如權(quán)利要求1所述的圖像文字識別系統(tǒng),其特征在于,所述圖像文字識別系統(tǒng)包括 圖像增強(qiáng)模塊,用于對每個字符區(qū)域做預(yù)處理,增強(qiáng)圖像識別強(qiáng)度;所述圖像文字識別系統(tǒng)通過如下步驟進(jìn)行增強(qiáng)處理根據(jù)背景過濾模塊處理后的圖像數(shù)據(jù),計算圖像上字符區(qū)域的像素平均值,比較每個 像素與平均像素之間的差異,保留字符區(qū)域中差異不大的像素;然后使用均值濾波去除噪 聲;再根據(jù)灰度直方圖統(tǒng)計閾值,并根據(jù)閾值分割圖像。
8.如權(quán)利要求1所述的圖像文字識別系統(tǒng),其特征在于,所述字符分割模塊完成如下 步驟首先要提取字符骨架,文本的骨架,要根據(jù)它的八個相鄰點的情況來判斷1.內(nèi)部點 不能刪除;2.孤立點不能刪除;3.直線端點不能刪除4.如果像素點P是邊界點,去掉P后, 如果連通分量不增加,則刪除P ;根據(jù)索引表,每次對一行一行的將整個圖象掃描一遍,對于非邊界的每個點,計算它對 應(yīng)在表中的索引,若為0,則保留,否則刪除該點;如果這次掃描沒有一個點被刪除,則循環(huán) 結(jié)束,剩下的點就是骨架點,如果有點被刪除,則進(jìn)行新的一輪掃描,如此反復(fù),直到?jīng)]有點 被刪除為止;對抽取骨架的圖像數(shù)據(jù),按照從左到右,從上到下的方式進(jìn)行遍歷,根據(jù)字符的八連同 性進(jìn)行字符分割。
9.如權(quán)利要求1所述的圖像文字識別系統(tǒng),其特征在于,所述字符特征提取模塊完成 如下步驟首先根據(jù)統(tǒng)一的寬高比,對每個分割的字符進(jìn)行大小歸一處理;其次,根據(jù)橫向和縱向需要提取特征點的數(shù)量,將字符等量切分;或1)取得筆畫的起點坐標(biāo)和終點坐標(biāo),分別為(StartXdtartY)和(EndX,EndY);2)如果EndX=StartX,那么筆畫的矢量編碼code-4,轉(zhuǎn)到5);3)計算筆畫斜率的絕對值slope4)根據(jù)slope確定筆畫在第一象限的矢量編碼code;如果0<~stof)e<tanOT/16〉,則code=0 ;如果tan( r/16) 5slope<tan(3ir/l6),貝丨J code=l ;如果 tan(3^"/16) Sslope<tan(5; r/16),則 Code=2 ; 如果 tan(5ff/lQSslope<tanC7;T/16),則 code=3 ; 如果 slope >tan(7l/lQ ,貝Ij Code=4 ;5)確定筆畫所在的象限,如果是第二象限,那么COde=S-Code,如果是第三象限,那么 COde=8+COde,如果是第四象限,那么code= (16-code)mod 16 ;算法結(jié)束后,code就是我們 要求的筆畫的矢量編碼;只需要將每一筆的編碼按書寫順序連接起來,就可以得到整個漢 字的編碼。
10.如權(quán)利要求1所述的圖像文字識別系統(tǒng),其特征在于,所述特征對比模塊通過相關(guān) 值進(jìn)行特征對比,其中相關(guān)值按如下方式計算其中字符的特征值數(shù)據(jù)序列為石、/2、 、/ ,標(biāo)準(zhǔn)字符的特征值數(shù)據(jù)序列為Ji、Z
全文摘要
本發(fā)明公開了.一種圖像文字識別系統(tǒng),所述圖像文字識別系統(tǒng)包括數(shù)據(jù)接收模塊,用于從DataServer接收具體的圖象文件數(shù)據(jù)以供后續(xù)的圖象文字識別工作;背景過濾模塊,用于去除圖像背景,提取字符區(qū)域;字符分割模塊,用于對每個字符區(qū)域做細(xì)化和大小歸一化處理,分割字符;特征提取模塊,用于提取每個區(qū)域每個字符的特征值;特征對比模塊,用于查詢數(shù)據(jù)庫,得到字符對比結(jié)果;數(shù)據(jù)庫更新模塊用于將特征值與對應(yīng)字符寫入特征數(shù)據(jù)庫。本發(fā)明的識別系統(tǒng)降低了字符識別的錯誤率,對不能識別的文字,可以進(jìn)行學(xué)習(xí),增強(qiáng)系統(tǒng)的識別能力。
文檔編號G06K9/54GK102136064SQ20111007182
公開日2011年7月27日 申請日期2011年3月24日 優(yōu)先權(quán)日2011年3月24日
發(fā)明者王鑫鑫, 稅彬 申請人:成都四方信息技術(shù)有限公司