圖像識別方法及系統(tǒng)的制作方法

文檔序號：9417874閱讀：731來源：國知局

圖像識別方法及系統(tǒng)的制作方法
【技術領域】
[0001] 本發(fā)明涉及圖像識別領域，尤其涉及一種圖像識別方法及系統(tǒng)。
【背景技術】
[0002] 目前，計算機軟件在進行字符識別時通常是使用標準OCR(光學字符識別）或者模板進行匹配，這些方案都只能處理標準字符，而且需要提供大量的樣本庫文件，無法對具有縮放、旋轉、重疊和扭曲的字符進行識別，這使得現(xiàn)有技術對變形字或手寫體字符等特殊字符的識別存在很大難度，并且缺少準確性。

【發(fā)明內容】

[0003] 本發(fā)明要解決的技術問題是為了克服現(xiàn)有技術中對變形字或手寫體字符等特殊字符的識別不準確的缺陷，提供一種圖像識別方法及系統(tǒng)。
[0004] 本發(fā)明是通過以下技術方案解決上述技術問題的：
[0005] 本發(fā)明提供一種圖像識別方法，其特點是，該圖像識別方法包括：
[0006] S1、從待識別的圖片中獲取該圖片包含的圖像；
[0007] S2、將該圖像切分成若干切片，每個切片包含一個字符；
[0008] S3、根據(jù)每一切片的像素點，分別計算每一切片對應的形狀上下文；
[0009] S4、根據(jù)形狀上下文的特征值進行搜索，找到與切片所包含的字符最接近的樣本作為識別結果。
[0010] 本技術方案基于形狀上下文自動識別圖片中的字符，具有很高的識別準確性，同時，本技術方案還不需要預存大量的樣本文件，能夠減少的樣本文本的存儲量，提高識別效率。
[0011] 較佳地，步驟S1包括：
[0012] Sn、將待識別的圖片進行灰度處理；
[0013] S12、將灰度處理后的圖片進行二值化處理；
[0014] S13、對二值化處理后的圖片包含的圖像進行描邊處理；
[0015] S14、去除該圖像中孤立的像素點；
[0016] S15、補齊該圖像的邊緣。
[0017] 本技術方案對待識別的圖片進行了預處理，預處理主要是為了方便后續(xù)的切分和減少后續(xù)識別中的干擾因素，其中，步驟S 15能夠去除干擾因素，提高識別的準確率。
[0018] 較佳地，S2包括：
[0019] S21、根據(jù)聯(lián)通分量將該圖像切分成X個切片，X為正整數(shù)；
[0020] S22、若X等于該圖像包含的字符數(shù)，則執(zhí)行S3，若X小于該圖像包含的字符數(shù)，則根據(jù)橫向投影將該X個切片切分成若干個切片。
[0021] 本技術方案可以更準確的切分，保證待識別的字符完整性，提高重疊字符識別的準確率。
[0022] 較佳地，S3包括對每一切片分別執(zhí)行以下步驟：
[0023] S31、將切片中每一像素點分別轉換成對數(shù)極坐標；
[0024] S32、將每一對數(shù)極坐標分別轉換為一維矩陣；
[0025] S33、將所有的一維矩陣合并成一 m*n的二維矩陣，m為切片的像素點數(shù)，η為一維矩陣的長度，該m*n的二維矩陣為切片對應的形狀上下文。
[0026] 其中，極坐標的使用可以忽略字符的旋轉對識別字符造成的影響，提高識別的準確性。
[0027] 較佳地，S31包括：
[0028] S311、將待轉換為對數(shù)極坐標的像素點作為極坐標的圓心，半徑為切片中像素點之間的最大距離，并對半徑進行歸一化處理。
[0029] 其中，對極坐標進行歸一化處理可以將轉換成極坐標的集合等比例壓縮在半徑為 1的極坐標集合中，忽略字符的縮放對識別字符造成的影響，提高識別的準確性。
[0030] 較佳地，S32通過以下步驟將對數(shù)極坐標轉換為一維矩陣：
[0031] S321、將極坐標圓的半徑和角度進行等量劃分；
[0032] S322、根據(jù)劃分后每個區(qū)域內的像素點數(shù)得出二維矩陣；
[0033] S323、將S322得到的二維矩陣轉化成一維矩陣；
[0034] S324、將一維矩陣進行一維傅里葉變換。
[0035] 其中，S324可以忽略字符的扭曲變形對識別字符造成的影響，提高識別的準確性。
[0036] 較佳地，S4包括：
[0037] S41、根據(jù)形狀上下文的特征值在樣本庫中進行搜索，利用匈牙利算法進行二分圖匹配，找到距離最近的樣本作為識別結果。
[0038] 傳統(tǒng)的匹配算法是簡單的根據(jù)每個點的比較去進行匹配，存在一對多的匹配，而且無法區(qū)分具有包含關系的字符，如：6和9, 3和8等。而本技術方案使用的匈牙利算法保證只存在一對一匹配，而且通過極坐標的半徑和角度的奇數(shù)劃分可以輕松的區(qū)分具有包含關系的字符，提尚字符識別的準確率。在本技術方案中，匈牙利算法既可以提尚準確率，還可以減少識別的時間（時間復雜度為O(VE))，提高效率。
[0039] 本發(fā)明還提供一種圖像識別系統(tǒng)，其特點是，該圖像識別系統(tǒng)包括：
[0040] -獲取單元，用于從待識別的圖片中獲取該圖片包含的圖像；
[0041] -切分單元，用于將該圖像切分成若干切片，每個切片包含一個字符；
[0042] -計算單元，用于根據(jù)每一切片的像素點，分別計算每一切片對應的形狀上下文；
[0043] -識別單元，用于根據(jù)形狀上下文的特征值進行搜索，找到與切片所包含的字符最接近的樣本作為識別結果。
[0044] 較佳地，該獲取單元包括：
[0045] -灰度處理模塊，用于將待識別的圖片進行灰度處理；
[0046] -二值化處理模塊，用于將灰度處理后的圖片進行二值化處理；
[0047] 一描邊模塊，用于對二值化處理后的圖片包含的圖像進行描邊處理；
[0048] -去除模塊，用于去除該圖像中孤立的像素點；
[0049] -圖像生長模塊，用于補齊該圖像的邊緣。
[0050] 較佳地，該切分單元包括：
[0051] -切片模塊，用于根據(jù)聯(lián)通分量將該圖像切分成X個切片，X為正整數(shù)；
[0052] -比較模塊，用于在X等于該圖像包含的字符數(shù)時調用該計算單元，以及在X小于該圖像包含的字符數(shù)時根據(jù)橫向投影將該X個切片切分成若干個切片。
[0053] 較佳地，該計算單元用于對每一切片分別調用以下模塊：
[0054] 一坐標轉換模塊，用于將切片中每一像素點分別轉換成對數(shù)極坐標；
[0055] -矩陣轉換模塊，用于將每一對數(shù)極坐標分別轉換為一維矩陣；
[0056] -矩陣合并模塊，用于將所有的一維矩陣合并成一 m*n的二維矩陣，m為切片的像素點數(shù)，η為一維矩陣的長度，該m*n的二維矩陣為切片對應的形狀上下文。
[0057] 較佳地，該坐標轉換模塊還用于將待轉換為對數(shù)極坐標的像素點作為極坐標的圓心，半徑為切片中像素點之間的最大距離，并對半徑進行歸一化處理。
[0058] 較佳地，該矩陣轉換模塊包括：
[0059] -劃分模塊，用于將極坐標圓的半徑和角度進行等量劃分；
[0060] -二維矩陣生成模塊，用于根據(jù)劃分后每個區(qū)域內的像素點數(shù)得出二維矩陣；
[0061] --維矩陣生成模塊，用于將該二維矩陣生成模塊得到的二維矩陣轉化成一維矩陣；
[0062] -傅里葉變換模塊，用于將一維矩陣進行一維傅里葉變換。
[0063] 較佳地，該識別單元包括：
[0064] -匹配模塊，用于根據(jù)形狀上下文的特征值在樣本庫中進行搜索，利用匈牙利算法進行二分圖匹配，找到距離最近的樣本作為識別結果。
[0065] 在符合本領域常識的基礎上，上述各優(yōu)選條件，可任意組合，即得本發(fā)明各較佳實例。
[0066] 本發(fā)明的積極進步效果在于：對具有縮放、旋轉、重疊和扭曲的手寫體字符或變形字符等特殊字符進行準確地識別，減少所需的樣本文件，減少識別所需的時間，提高識別效率。
【附圖說明】
[0067] 圖1為本發(fā)明的實施例的圖像識別方法的流程圖。

完整全部詳細技術資料下載

當前第1頁1 2 3

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：何曉力;張勇;李可瑋;
技術所有人：攜程計算機技術（上海）有限公司;
我是此專利的發(fā)明人

上一篇：一種二維碼賦碼打印方法
上一篇：基于圖像的語種識別方法及裝置的制造方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

圖像識別方法及系統(tǒng)的制作方法