專利名稱:含有地址信息的圖象的視頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及郵件的自動分檢,并且尤其涉及其中通過對含有地址信息的郵件進行光學字符識別(OCR)而應(yīng)用地址鑒別自動處理的系統(tǒng),當?shù)刂凡荒芡ㄟ^OCR自動解釋時通過視頻編碼輔助和改進該處理。當結(jié)束視頻編碼時,通常充分完成地址字段以達到期望的分檢水平。
更具體地,本發(fā)明涉及一種利用視頻編碼來處理包含著已被OCR自動鑒別地址拒絕的地址信息的郵件圖象的方法。
背景技術(shù):
在歐洲專利文件97/921794號中,通過視頻編碼對包含著地址信息的圖象的處理在于對地址框中的不同區(qū)域的全部或部分進行系統(tǒng)地編碼,從而明確識別郵件的目的地。采用各種編碼技術(shù),例如輪廓編碼、抽取編碼、互補編碼和選擇編碼。
盡管這些不同的視頻編碼技術(shù)趨于提高視頻編碼操作員的生產(chǎn)率,但是它們完全不利用通過OCR進行自動鑒別地址處理得到的結(jié)果。通常,利用OCR自動鑒別地址處理得到的結(jié)果是按圖象屬性向量的形式給出的,其中包括OCR提取的所有信息,地址信息特征(地址信息的印刷格式手寫/打印),OCR在地址框中檢測到的信息線的數(shù)量和坐標(或者實際上地址框的每個字段的信息),以及和置信等級關(guān)聯(lián)的字段值。該和字段值關(guān)聯(lián)的置信等級表示正確識別OCR所提取的字段值的概率。
圖1示出一幅含有地址信息的圖象IN并且示出帶有含著信息的地址字段V和N的圖象屬性向量AT的結(jié)構(gòu),其中字段V標識地址框中的街道名(V=RUE JEAN PERRIN)而字段N標識地址框中街道上的號碼(N=18)。這些地址字段值關(guān)聯(lián)著置信等級CV和CN,在本情況中這二個等級規(guī)定按等于1的識別概率(最大置信等級)識別出該街道名并以0.38的識別概率識別出該街道號碼。另外,在該圖象屬性向量中,組合置信等級CG對應(yīng)和各地址字段關(guān)聯(lián)的所有置信等級的乘積,其用來指示該地址信息的總識別概率。自動OCR鑒別處理利用該組合置信等級判定是否拒絕圖象,從而該圖象需要進行視頻編碼處理,其中例如通過比較組合置信等級和某預(yù)定閾值做出判定。
例如在一次檢查運動中對通過OCR自動鑒別地址處理提供的因地理內(nèi)向分檢(tri distribution)過程而被拒絕的一組圖象結(jié)果進行詳細分檢表明,可以把拒絕原因分類成幾個主要類別。即,例如在這次檢查運動中發(fā)現(xiàn)·在被拒絕的34%的情況中,通過OCR正確地識別地址字段V和N,但是通過OCR發(fā)出的組合置信等級過低;·在被拒絕的14%的情況中,正確識別地址字段V但地址字段N未正確識別·在被拒絕的25%的情況中,未正確識別地址字段V但正確識別地址字段N;·在被拒絕的26%的情況中,地址字段V和N都未正確識別;以及·只有1%的被拒絕情況和出故障識別情況有關(guān)。
根據(jù)這次觀測,看來根據(jù)對組合置信等級的定閾值過濾被拒絕圖象群中的34%。類似地,可能根據(jù)對置信等級CV的定閾值過濾掉14%的被拒絕圖象,同時可能根據(jù)對置信等級CN的定閾值過濾被拒絕圖象群中的25%。通過根據(jù)這些類別對被拒絕的圖象分類,有可能對每種被拒絕圖象類別施加適應(yīng)該類別的特定視頻編碼處理,從而使操作員花費的時間最小并且由此提高視頻編碼系統(tǒng)的吞吐量。如果某被拒絕圖象不屬于任何預(yù)定拒絕類型,則需要通過視頻編碼掃描所有的地址字段予以處理,這是耗時的。很清楚拒絕類別的數(shù)量是地址結(jié)構(gòu)以及地址字段數(shù)量的函數(shù)。從而應(yīng)理解,以這種方式對被拒絕圖象分類使得能以一種不統(tǒng)一的而且相適應(yīng)的方式處理被拒絕的圖象。
發(fā)明內(nèi)容
為此,本發(fā)明提供一種采用視頻編碼的方法以便處理含有地址信息并且已被OCR自動鑒別地址處理,例如內(nèi)向地理分檢,拒絕的圖象。當然,該方法容易推廣到其它拒絕類型,例如外向分檢(acheminement)、郵政信箱、重新定址、公司分檢。對于每個被拒絕的圖象,OCR自動鑒別地址處理產(chǎn)生一個圖象屬性向量,在該向量中地址框中的各個字段值關(guān)聯(lián)著一個置信等級。依據(jù)本發(fā)明,對每個被拒絕的圖象,該方法在于通過施加作用在和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量中的各置信等級上的級聯(lián)過濾器(過濾器的數(shù)量隨被處理的拒絕類型變化)識別和該被拒絕圖象對應(yīng)的拒絕類別;一旦通過某過濾器識別和該被拒絕圖象對應(yīng)的拒絕類別,操作員首先在該過濾后進行專用于該拒絕類別的編碼以便補充或者修改和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量,然后評估和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量以便能決定何時停止對該被拒絕圖象的視頻編碼??梢苑謩e在不同的視頻編碼單元或控制臺中分別實現(xiàn)不同的操作員編碼操作,從而提供使用專長于特定拒絕類別的不同視頻編碼操作員的優(yōu)點,由此改進它們的工作。過濾的一個例子可以是對單個置信等級、對組合置信等級或者實際上對和地址框的不同字段關(guān)聯(lián)的多個置信等級的組合閾定閾值。還可能在專家規(guī)則下進行細化過濾并且把過濾擴充到屬性向量中地址字段值及關(guān)聯(lián)置信等級之外的部分上,這不超出本發(fā)明的范圍。當通過定閾值過濾時,通過監(jiān)視通過各個過濾器的各圖象部分的監(jiān)控人員能動態(tài)地調(diào)整閾值值是有好處的。調(diào)整閾值值還能改變視頻編碼系統(tǒng)的吞吐量和出錯率。郵政操作員都認為對內(nèi)向分檢所需的所有地址字段進行視頻編碼是無益的,因為它的吞吐率過小。利用本發(fā)明,通過采用級聯(lián)過濾器,有可能除掉不益于通過視頻編碼處理的被拒絕圖象。更具體地,可以調(diào)整各過濾器的閾值,從而只留下視頻編碼處理會比人工會檢快的郵件的圖象。人工分檢的一般吞吐率為每小時1600到1800件,這意味著為了使視頻編碼超過該吞吐率,視頻編碼必須在短于2秒鐘內(nèi)處理每份被拒絕的圖象,這例如意味著作為視頻編碼操作輸入長字符串是沒有問題,例如鍵入街道名字段V(圖1中示出)是沒有問題的。
下面參照附圖更詳細地說明本發(fā)明。
圖1是和地址信息對應(yīng)的圖象以及相應(yīng)的圖象屬性向量。
圖2是說明本發(fā)明方法的框圖。
具體實施例方式
在圖1中,郵件分檢設(shè)備中的OCR自動鑒別地址處理通過產(chǎn)生由地址框中的字段值V和N構(gòu)成的圖象屬性向量AT響應(yīng)含有地址信息的圖象IN,其中這些值關(guān)聯(lián)著置信等級CV和CN并且?guī)в袨橹眯诺燃塁V和CN的乘積的組合置信等級CG。
通常,當組合置信等級CG低于預(yù)定閾值時,OCR自動地址鑒別不能明確地解出地址,從而把圖象IN和對應(yīng)的圖象屬性向量AT發(fā)送到進行視頻編碼處理。
在圖1的例子中,盡管組合置信等級CG代表一條不明確解出的地址,但是地址字段V的值已被明確識別。為了明確解出地址只要求視頻編碼操作員確認N地址字段的值,在操作員不確認該給出的值的情況下只需要操作員對N地址字段輸入新值。通過操作員確認進行編碼是不耗時的,并且要比通過抽取、選擇或互補信息方式輸入信息進行編碼操作員耗時少。依據(jù)本發(fā)明,對圖象屬性向量AT中的各置信等級使用級聯(lián)過濾器以便識別和被拒絕圖象IN對應(yīng)的拒絕類別,從而施加專用于該拒絕類別的處理,例如輸入信息編碼之后的確認編碼。
圖2示出級聯(lián)過濾器F1至F4,每個過濾器之后跟隨著操作員編碼VC1至VC4和對圖象屬性向量AT的評估E。過濾器F1至F4構(gòu)成被拒絕圖象的一種分類器TC并且它們用于確定被拒絕圖象的對應(yīng)類別編號。
在圖2的例子中,每個過濾器F1至F4把置信等級CV、CN、CG和閾值值S1至S4比較。圖2中的過濾器組織成和上面說明的拒絕類型對應(yīng)。在最上游的過濾器F1處,如果置信等級CV(街道名的置信等級)大于閾值S1,則進行鍵盤編碼VC1以輸入街道號碼。
在隨后的過濾器F2處,如果組合置信等級CG大于閾值S2,則通過按鍵或語音合成同時對街道號碼和街道名進行確認編碼VC2。
在過濾器F3處,如果置信等級CV(和街道名相關(guān))大于閾值S3,則先在街道名上進行確認編碼VC3然后通過鍵盤編碼輸入街道號碼。
在過濾器F4處,如果置信等級CN(和街道號碼相關(guān))大于閾值S4,則對街道號碼進行確認編碼VC4并且通過鍵盤編碼輸入街道名。
在這些級聯(lián)過濾器的出口處,進行操作員填寫地址框中的所有字段的鍵盤編碼VC5,因為在這種情況下通過OCR編碼的信息是不可靠的。
過濾器F1至F4排序成使各操作員進行的編碼操作在操作時間上逐漸變成更加耗時。
對于這種類似的拒絕,按如下調(diào)整過濾器F1至F4的閾值值S1的閾值為0.99,S2的閾值為0.93,S3的閾值為0.85,以及S4的閾值為0.83。
根據(jù)這些閾值值,圖1中的圖象IN在過濾器F1的分支上視頻編碼。編碼所需的時間約為1385毫秒(ms),其大大短于編碼地址框中所有的字段估計為4000ms的時間。
另一個被拒絕地址例子V=AVENUE GAMBETTACV=0.98N=?9CN=0.0
CG=0.0由于置信等級CV小于0.990(閾值S1的值),該圖象被過濾器F1拒絕。它被發(fā)送到過濾器F2。置信等級CG小于0.93。該圖象被過濾器F2拒絕并發(fā)送到過濾器F3。由于置信等級CV大于0.85,對街道名施加確認編碼VC3并接著利用鍵盤編碼輸入街道號碼。編碼所需時間約等于1600ms=街道確認(約1385ms)+鍵入街道號碼(約215ms)。
另一個被拒絕圖象的屬性例子V=RUE DE MONTFAAUCONCV=1.0N=6??6CN=0.0CG=0.0其視頻編碼過程和圖1例子相同,從而編碼時間約為1385ms。
另一個被拒絕圖象的屬性例子V=RUE AUGUSTE PERRETCV=0.98N=8CN=0.99CG=0.97由于置信等級CV小于S1,過濾器F1拒絕該圖象。它被發(fā)送到第二過濾器F2。組合置信等級CG大于0.85,從而施加視頻編碼VC 2。本情況下平均編碼時間約為1309ms。
另一個被拒絕圖象的屬性例子V=PLACE FRANCOIS TRUFFAUTCV=0.62N=2CN=0.85CG=0.51
在本情況下過濾器F1、F2、F3和F4拒絕該圖象,從而它受到VC 5處的視頻編碼。編碼時間為4000ms。這是最不順利情況。
如圖2中所示,在操作員編碼VC 1至VC 4后,受到視頻編碼的圖象IN的關(guān)聯(lián)圖象屬性向量AT被補充或被修改,并且在每次視頻編碼操作后在E處評估該圖象屬性向量,以便判定何時停止對該被拒絕圖象的視頻編碼(因為已經(jīng)完全識別地址信息)。當判定不在某個過濾級上停止視頻編碼時,則通過下一級過濾繼續(xù)進行處理,如圖2中的箭頭所示。
圖2清楚地示出過濾器的級聯(lián)結(jié)構(gòu),其中每個過濾級帶有操作員動作例如VC 1、VC 2、VC 3、VC 4以及關(guān)聯(lián)評估E。由于操作員動作VC 1至VC 4分別專用于過濾器F1至F4,在其中各操作員專長于不同拒絕類型的不同視頻編碼單元或控制臺上實現(xiàn)各條處理線F1-VC1-E、F2-VC2-E等等。
圖2還示出監(jiān)控員自動地以動態(tài)方式調(diào)整過濾器F1至F4中的閾值值S1至S4。
為了保證視頻編碼處理是有益的,級聯(lián)過濾器可以僅由當前三個過濾級F1至F3組成,如果某被拒絕圖象未被這三個過濾級中的至少一級識別,則它不由視頻編碼處理而會人工分檢該對應(yīng)的郵件。這能達到每小時約2300份郵件的平均視頻編碼吞吐率。更具體地,在外向內(nèi)向分檢(tri acheminement-distribution)過程中,可以和通過OCR自動鑒別過程相一致地實現(xiàn)依據(jù)本發(fā)明的使用前三個過濾組F1至F3的通過視頻編碼對被拒絕圖象的處理,如果例如把過濾器F1-F3調(diào)整成只對已經(jīng)通過OCR明確識別外向分檢郵政信息的圖象進行分類,因為視頻編碼操作VC 1至VC 3可以按大致和對外向分檢郵件進行視頻編碼所需的處理時間相同的時間予以實現(xiàn)。
權(quán)利要求
1.一種通過視頻編碼用于處理郵件的圖象(IN)的方法,每幅圖象含有地址信息,所述圖象已被通過OCR的自動鑒別地址處理拒絕,該方法特征在于包括對每個被拒絕圖象產(chǎn)生一個圖象屬性向量(AT),該向量由與形成地址信息的地址框中的各字段(V,N)關(guān)聯(lián)的置信等級(CV,CN)構(gòu)成,通過作用在所述圖象的屬性向量的各置信等級的級聯(lián)過濾器(F1-F4)對每個被拒絕的圖象分類,該級聯(lián)過濾器中的各個過濾器級識別不同的拒絕類別并對每種拒絕類別確定特定類型的視頻編碼處理;以及當在某過濾器級上識別和被拒絕圖象對應(yīng)的拒絕類別時,首先在所述過濾后進行專用于該拒絕類別的視頻編碼(VC 1-VC 4)處理以便補充或修改該被拒絕圖象的圖象屬性向量,然后評估(E)該被拒絕圖象的屬性向量以便能判定何時停止對被拒絕圖象的視頻編碼。
2.根據(jù)權(quán)利要求1所述的方法,其中各個過濾級(F1-F4)、各視頻編碼處理(VC 1-VC 4)和對相應(yīng)圖象屬性向量(AT)的評估(E)形成一組分別在不同的視頻編碼單元或控制臺上實現(xiàn)的處理線。
3.根據(jù)權(quán)利要求1或2所述的方法,其中每個過濾級(F1-F4)將被拒絕圖象的屬性向量(AT)的至少一個置信等級(CV,CN,CG)和閾值值(S1-S4)比較。
4.根據(jù)權(quán)利要求3所述的方法,其中由用于監(jiān)視通過各個過濾級的被拒絕圖象的各部分的監(jiān)控員來動態(tài)地調(diào)整閾值值(S1-S4)。
5.根據(jù)權(quán)利要求1至4中任一權(quán)利要求的方法,其中該地址信息是用于郵政分檢的地址信息,其中地址框包括給出街道名的第一字段(V)和給出該街道上的號碼的第二字段(N)構(gòu)成,其中圖象屬性向量(AT)包括和地址框的第一字段(V)關(guān)聯(lián)的第一置信等級(CV)、和地址框的第二字段(N)關(guān)聯(lián)的第二置信等級(CN)、以及等于和地址框的所述第一及第二字段關(guān)聯(lián)的所述置信等級的乘積的組合置信等級(CG),并且通過下述過濾級和處理級組成級聯(lián)的過濾器和專用視頻編碼處理a)如果第一置信等級(CV)大于第一閾值值(S1),則通過視頻編碼(VC 1)輸入街道號碼;b)如果組合置信等級(CG)大于第二閾值值(S2),則通過視頻編碼(VC 2)確認街道號碼以及街道名;以及c)如果第一置信等級(CV)大于第三閾值值(S3),則通過視頻編碼(VC 3)確認街道名,然后輸入街道號碼。
6.根據(jù)權(quán)利要求5所述的方法,其中通過語音合成完成通過視頻編碼的確認。
7.一種外向和內(nèi)向分檢郵政圖象的方法,其特征在于其采用依據(jù)權(quán)利要求1至6中任一權(quán)利要求的對郵件圖象(IN)視頻編碼的處理,其中如果在這些級聯(lián)過濾器后未對某被拒絕的圖象識別出拒絕類別,則把該被拒絕圖象對應(yīng)的郵件發(fā)送到人工分檢處理。
全文摘要
本發(fā)明涉及一種通過視頻編碼處理由地址信息構(gòu)成的圖象的方法。依據(jù)本發(fā)明,對每個被OCR地址識別系統(tǒng)拒絕的圖象,利用對被拒絕圖象關(guān)聯(lián)的圖象屬性向量的各置信值施加的級聯(lián)過濾器(F1-F4)識別和被拒絕圖象對應(yīng)的拒絕類別。隨后,當在某過濾器上識別和該被拒絕圖象對應(yīng)的拒絕類別時,在所述過濾處理后進行下述操作(i)專用于該拒絕類別的操作員編碼(VC1-VC4)從而完成或者修改和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量,以及(ii)評估(E)和被拒絕圖象關(guān)聯(lián)的圖象屬性向量從而可作出對所述被拒絕圖象停止視頻編碼的判定。
文檔編號G06K9/03GK1934577SQ03821899
公開日2007年3月21日 申請日期2003年9月9日 優(yōu)先權(quán)日2002年9月16日
發(fā)明者赫查姆·埃爾-伯恩諾斯, 吉勒斯·莫森, 克里斯托弗·洛霍梅 申請人:索利斯蒂克有限公司