亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

醫(yī)學(xué)影像中的文字信息識別方法及裝置的制造方法

文檔序號:9200682閱讀:573來源:國知局
醫(yī)學(xué)影像中的文字信息識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及醫(yī)學(xué)影像處理技術(shù)領(lǐng)域,具體涉及一種醫(yī)學(xué)影像中的文字信息識別方法及裝置。
【背景技術(shù)】
[0002]目前醫(yī)院普遍使用醫(yī)學(xué)影像存檔與通信系統(tǒng)(PACS,Picture Archiving andCommunicat1n System)來存儲和管理醫(yī)護人員對患者進行影像學(xué)檢查后得到的醫(yī)學(xué)影像數(shù)據(jù)。醫(yī)生需要審閱病人的影像,編寫影像檢查報告等。由于影像與報告屬獨立分發(fā),醫(yī)學(xué)影像對應(yīng)的數(shù)字膠片中并沒有以文字格式存儲病人的相關(guān)信息,而是將這些信息以圖像形式嵌入在醫(yī)學(xué)影像對應(yīng)的數(shù)字膠片中。因此,在將膠片和報告交給病人之前,需要將膠片中獲取的病人信息與報告對應(yīng)起來。目前的做法是人工進行膠片及報告的核對與匹配,以將相應(yīng)的影像完全準(zhǔn)確地分配至相應(yīng)的病人,這給醫(yī)護人員增加了非常大的工作量,不僅耽誤了病人取片的時間,而且還有可能出錯。

【發(fā)明內(nèi)容】

[0003]本發(fā)明的主要目的在于,提供一種醫(yī)學(xué)影像中的文字信息識別方法及裝置。
[0004]根據(jù)本發(fā)明的第一方面,本發(fā)明提供一種醫(yī)學(xué)影像中的文字信息識別方法,包括:定位步驟:接收操作者在醫(yī)學(xué)影像上選取文字區(qū)域的輸入,根據(jù)所述輸入確定待進行文字信息識別的文字區(qū)域;預(yù)處理步驟:對所述文字區(qū)域進行圖像預(yù)處理操作以去除非文字信息,得到干凈的文字圖像;識別步驟:對所述文字圖像進行切割以拆分出文字,得到單個的字符圖像,對得到的單個字符圖像進行識別,得到初識別文字;修正步驟:對所述初識別文字進行修正;驗證步驟:將修正后的識別文字根據(jù)預(yù)設(shè)驗證條件進行驗證,以去除不合理和不合法的識別文字,輸出驗證結(jié)果,所述驗證結(jié)果包括通過驗證的識別文字。
[0005]進一步地,所述方法還包括:學(xué)習(xí)步驟:接收操作者對所述通過驗證的識別文字的反饋,所述反饋包括表征識別正確的正反饋和表征識別錯誤的負(fù)反饋,根據(jù)所述正反饋和所述負(fù)反饋對所述通過驗證的識別文字進行訓(xùn)練,得到識別分類器;所述識別步驟還包括根據(jù)所述識別分類器對所述單個字符圖像進行識別;和/或,所述驗證結(jié)果還包括提示操作者識別出錯的提示信息,所述方法還包括:接收步驟:接收操作者對所述提示信息的重新識別的反饋,提示操作者重新執(zhí)行定位步驟。
[0006]進一步地,所述修正包括:去除非文字字符,結(jié)合由預(yù)設(shè)編碼規(guī)則確定的待進行文字信息識別的文字范圍,將所述初識別文字中與所述文字范圍類似的字符修改為所述文字范圍中對應(yīng)的文字,所述預(yù)設(shè)編碼規(guī)則包括所述醫(yī)學(xué)影像對應(yīng)的醫(yī)院提供的包括掛號的編號規(guī)則。
[0007]進一步地,所述預(yù)設(shè)驗證條件包括:所述醫(yī)學(xué)影像對應(yīng)的醫(yī)院提供的包括掛號的業(yè)務(wù)處理情況以及判斷識別內(nèi)容的合法性。
[0008]進一步地,所述方法在所述修正步驟之前還包括:重識別步驟:接收操作者對所述初識別文字的識別情況的反饋,如果所述反饋低于預(yù)設(shè)最低識別閾值條件,則提示所述操作者重新執(zhí)行定位步驟。
[0009]根據(jù)本發(fā)明的第二方面,本發(fā)明提供一種醫(yī)學(xué)影像中的文字信息識別裝置,包括:定位模塊,用于接收操作者在醫(yī)學(xué)影像上選取文字區(qū)域的輸入,根據(jù)所述輸入確定待進行文字信息識別的文字區(qū)域;預(yù)處理模塊,用于對所述文字區(qū)域進行圖像預(yù)處理操作以去除非文字信息,得到干凈的文字圖像;識別模塊,用于對所述文字圖像進行切割以拆分出文字,得到單個的字符圖像,對得到的單個字符圖像進行識別,得到初識別文字;修正模塊,用于對所述初識別文字進行修正;驗證模塊,用于將修正后的識別文字根據(jù)預(yù)設(shè)驗證條件進行驗證,以去除不合理和不合法的識別文字,輸出驗證結(jié)果,所述驗證結(jié)果包括通過驗證的識別文字。
[0010]進一步地,所述裝置還包括:學(xué)習(xí)模塊,用于接收操作者對所述通過驗證的識別文字的反饋,所述反饋包括表征識別正確的正反饋和表征識別錯誤的負(fù)反饋,根據(jù)所述正反饋和所述負(fù)反饋對所述通過驗證的識別文字進行訓(xùn)練,得到識別分類器;所述識別模塊還用于根據(jù)所述識別分類器對所述單個字符圖像進行識別;和/或,所述驗證結(jié)果還包括提示操作者識別出錯的提示信息,所述裝置還包括:接收模塊:接收操作者對所述提示信息的重新識別的反饋,提示操作者重新執(zhí)行定位模塊。
[0011]進一步地,所述修正包括:去除非文字字符,結(jié)合由預(yù)設(shè)編碼規(guī)則確定的待進行文字信息識別的文字范圍,將所述初識別文字中與所述文字范圍類似的字符修改為所述文字范圍中對應(yīng)的文字,所述預(yù)設(shè)編碼規(guī)則包括所述醫(yī)學(xué)影像對應(yīng)的醫(yī)院提供的包括掛號的編號規(guī)則。
[0012]進一步地,所述預(yù)設(shè)驗證條件包括:所述醫(yī)學(xué)影像對應(yīng)的醫(yī)院提供的包括掛號的業(yè)務(wù)處理情況以及判斷識別內(nèi)容的合法性。
[0013]進一步地,所述裝置在所述修正模塊之前還包括:重識別模塊,用于接收操作者對所述初識別文字的識別情況的反饋,如果所述反饋低于預(yù)設(shè)最低識別閾值條件,則提示所述操作者重新執(zhí)行定位模塊。
[0014]本發(fā)明的有益效果是:通過根據(jù)接收到的操作者輸入縮小識別范圍,提高識別效率,還通過對預(yù)處理及識別后的初識別文字進行修正和驗證,進一步提高識別的準(zhǔn)確率。
【附圖說明】
[0015]圖1為本發(fā)明一種實施例的醫(yī)學(xué)影像中的文字信息識別方法的流程示意圖。
[0016]圖2為本發(fā)明另一種實施例的醫(yī)學(xué)影像中的文字信息識別方法的流程示意圖。
[0017]圖3為本發(fā)明又一種實施例的醫(yī)學(xué)影像中的文字信息識別方法的流程示意圖。
【具體實施方式】
[0018]目前對醫(yī)學(xué)影像進行文字識別通常使用OCR (Optical Character Recognit1n,光學(xué)字符辨識)來實現(xiàn)。OCR主要采用了字形識別和模板識別這兩種識別模式。對于字形識別,其基本原理是:由于圖像上文字顏色和背景顏色往往有比較大的色差,通過采集圖像上色差較大的點,即可勾勒出文字的邊框,該邊框上的點的集合即是該文字的特征,而特征點的提取實質(zhì)上是一種矢量分析,所以在采集的特征點不會受字體大小變化的影響。當(dāng)采集到足夠的特征點,可以將其與預(yù)先設(shè)定或者預(yù)先采集的文字特征點進行匹配,并確定最為接近的特征值,從而可以得到圖像對應(yīng)的文字。對于模板識別,其設(shè)計初衷是考慮到在一個圖像上,文字大小固定且文字的形狀也不會變化,則可以進行模板匹配。模板匹配的基本原理是:預(yù)先采集含文字的圖片,將含文字的圖片進行二值化處理,二值化處理后即可得到對應(yīng)的圖像的數(shù)字信息,將這些數(shù)字信息保存為模板,然后在使用時,將采集的含文字的圖片同樣進行二值化處理,由于文字不會變化,所以可以將該采集的圖片的數(shù)值信息與模板庫中的數(shù)值信息進行匹配,得到對應(yīng)的文字。
[0019]但是由于醫(yī)學(xué)影像數(shù)字膠片本身既包括影像區(qū)域又包括文字區(qū)域,且部分影像區(qū)域和文字區(qū)域偶有重疊,因此在使用上述兩種識別方法對醫(yī)學(xué)影像數(shù)字膠片進行識別時,其識別效率和準(zhǔn)確率均不夠理想。
[0020]因此,本發(fā)明提出了一種醫(yī)學(xué)影像中的文字信息識別方法及相應(yīng)的裝置。下面通過【具體實施方式】結(jié)合附圖對本發(fā)明作進一步詳細(xì)說明。
[0021]實施例一
如圖1所示,為本實施例的醫(yī)學(xué)影像中的文字信息識別方法的流程示意圖,方法包括如下步驟110~140。
[0022]定位步驟110:接收操作者在醫(yī)學(xué)影像上選取文字區(qū)域的輸入,根據(jù)該輸入確定待進行文字信息識別的文字區(qū)域。
[0023]在步驟110中,可以通過檢測操作者在醫(yī)學(xué)影像上選擇的區(qū)域,然后將該檢測到的區(qū)域作為待進行文字信息識別的文字區(qū)域,例如,給操作者提供框選工具如鼠標(biāo)或觸摸方式來進行區(qū)域的框選。又或者,通過提供示例輸入文字來供操作者輸入其觀察到的醫(yī)學(xué)影像的信息,結(jié)合該信息來確定待進行文字信息識別的文字區(qū)域,例如CT圖像中右上角區(qū)域?qū)?yīng)的信息是患者信息及操作信息,系統(tǒng)結(jié)合該信息以及操作者輸入的相關(guān)信息自動確定該右上角區(qū)域為待進行文字信息識別的文字區(qū)域。
[0024]預(yù)處理步驟120:對步驟110得到的文字區(qū)域進行圖像預(yù)處理操作以去除非文字信息,得到干凈的文字圖像。這里圖像預(yù)處理操作包括對文字區(qū)域進行過濾、降噪、灰化和去除背景等,其具體算法可參考常用的數(shù)字圖像處理的相關(guān)技術(shù)實現(xiàn),在此不作贅述。從而,對于部分影像區(qū)域和文字區(qū)域偶有重疊的情況,通過這樣的圖像預(yù)處理操作去除該部分影像區(qū)域,得到比較干凈的文字圖像。
[0025]識別步驟130:對步驟120得到的文字圖像進行切割以拆分出文字,得到單個的字符圖像,對得到的單個字符圖像進行識別,得到初識別文字。這里,對文字圖像切割以拆分出文字的相關(guān)算法可以參考目前OCR識別中的相關(guān)技術(shù)實現(xiàn),在此不作贅述。同時,對于拆分得到的單個字符圖像,可以利用前述的OCR識別方法如字形識別和模板識別予以處理,得到初次識別出的文字,即初識別文字。
[0026]修正步驟140:對步驟130得到的初識別文字進行修正。
[0027]在步驟140中,修正包括去除非文字字符,例如如果初識別文字為冒號、空格等非字母或數(shù)字的文字字符,則去除該識別出的字符。修正還可以包括:結(jié)合由預(yù)設(shè)編碼規(guī)則確定的待進行文字信息識別的文字范圍,將初識別文字中與文字范圍類似的字符修改為文字范圍中對應(yīng)的文字,這里預(yù)設(shè)編碼規(guī)則包括醫(yī)學(xué)影像對應(yīng)的醫(yī)院提供的包括掛號的編號規(guī)貝1J。例如醫(yī)院提供的掛號編號規(guī)則為采用純數(shù)字0-9,而如果某一初識別文字為字母I (或i)或L (或1),其與數(shù)字I類似,因此進行修正時將其修改為符合編號規(guī)則的數(shù)字I。當(dāng)然這種修正規(guī)則也可以是預(yù)先設(shè)定在系統(tǒng)中的,一旦出現(xiàn)類似情況則自動從系統(tǒng)調(diào)用來進行修正。
[0028]驗證步驟150:將修正后的識別文字根據(jù)預(yù)設(shè)
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1