專利名稱:含有地址信息的圖象的視頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及郵件的自動(dòng)分檢,并且尤其涉及其中通過對(duì)含有地址信息的郵件進(jìn)行光學(xué)字符識(shí)別(OCR)而應(yīng)用地址鑒別自動(dòng)處理的系統(tǒng),當(dāng)?shù)刂凡荒芡ㄟ^OCR自動(dòng)解釋時(shí)通過視頻編碼輔助和改進(jìn)該處理。當(dāng)結(jié)束視頻編碼時(shí),通常充分完成地址字段以達(dá)到期望的分檢水平。
更具體地,本發(fā)明涉及一種利用視頻編碼來處理包含著已被OCR自動(dòng)鑒別地址拒絕的地址信息的郵件圖象的方法。
背景技術(shù):
在歐洲專利文件97/921794號(hào)中,通過視頻編碼對(duì)包含著地址信息的圖象的處理在于對(duì)地址框中的不同區(qū)域的全部或部分進(jìn)行系統(tǒng)地編碼,從而明確識(shí)別郵件的目的地。采用各種編碼技術(shù),例如輪廓編碼、抽取編碼、互補(bǔ)編碼和選擇編碼。
盡管這些不同的視頻編碼技術(shù)趨于提高視頻編碼操作員的生產(chǎn)率,但是它們完全不利用通過OCR進(jìn)行自動(dòng)鑒別地址處理得到的結(jié)果。通常,利用OCR自動(dòng)鑒別地址處理得到的結(jié)果是按圖象屬性向量的形式給出的,其中包括OCR提取的所有信息,地址信息特征(地址信息的印刷格式手寫/打印),OCR在地址框中檢測(cè)到的信息線的數(shù)量和坐標(biāo)(或者實(shí)際上地址框的每個(gè)字段的信息),以及和置信等級(jí)關(guān)聯(lián)的字段值。該和字段值關(guān)聯(lián)的置信等級(jí)表示正確識(shí)別OCR所提取的字段值的概率。
圖1示出一幅含有地址信息的圖象IN并且示出帶有含著信息的地址字段V和N的圖象屬性向量AT的結(jié)構(gòu),其中字段V標(biāo)識(shí)地址框中的街道名(V=RUE JEAN PERRIN)而字段N標(biāo)識(shí)地址框中街道上的號(hào)碼(N=18)。這些地址字段值關(guān)聯(lián)著置信等級(jí)CV和CN,在本情況中這二個(gè)等級(jí)規(guī)定按等于1的識(shí)別概率(最大置信等級(jí))識(shí)別出該街道名并以0.38的識(shí)別概率識(shí)別出該街道號(hào)碼。另外,在該圖象屬性向量中,組合置信等級(jí)CG對(duì)應(yīng)和各地址字段關(guān)聯(lián)的所有置信等級(jí)的乘積,其用來指示該地址信息的總識(shí)別概率。自動(dòng)OCR鑒別處理利用該組合置信等級(jí)判定是否拒絕圖象,從而該圖象需要進(jìn)行視頻編碼處理,其中例如通過比較組合置信等級(jí)和某預(yù)定閾值做出判定。
例如在一次檢查運(yùn)動(dòng)中對(duì)通過OCR自動(dòng)鑒別地址處理提供的因地理內(nèi)向分檢(tri distribution)過程而被拒絕的一組圖象結(jié)果進(jìn)行詳細(xì)分檢表明,可以把拒絕原因分類成幾個(gè)主要類別。即,例如在這次檢查運(yùn)動(dòng)中發(fā)現(xiàn)·在被拒絕的34%的情況中,通過OCR正確地識(shí)別地址字段V和N,但是通過OCR發(fā)出的組合置信等級(jí)過低;·在被拒絕的14%的情況中,正確識(shí)別地址字段V但地址字段N未正確識(shí)別·在被拒絕的25%的情況中,未正確識(shí)別地址字段V但正確識(shí)別地址字段N;·在被拒絕的26%的情況中,地址字段V和N都未正確識(shí)別;以及·只有1%的被拒絕情況和出故障識(shí)別情況有關(guān)。
根據(jù)這次觀測(cè),看來根據(jù)對(duì)組合置信等級(jí)的定閾值過濾被拒絕圖象群中的34%。類似地,可能根據(jù)對(duì)置信等級(jí)CV的定閾值過濾掉14%的被拒絕圖象,同時(shí)可能根據(jù)對(duì)置信等級(jí)CN的定閾值過濾被拒絕圖象群中的25%。通過根據(jù)這些類別對(duì)被拒絕的圖象分類,有可能對(duì)每種被拒絕圖象類別施加適應(yīng)該類別的特定視頻編碼處理,從而使操作員花費(fèi)的時(shí)間最小并且由此提高視頻編碼系統(tǒng)的吞吐量。如果某被拒絕圖象不屬于任何預(yù)定拒絕類型,則需要通過視頻編碼掃描所有的地址字段予以處理,這是耗時(shí)的。很清楚拒絕類別的數(shù)量是地址結(jié)構(gòu)以及地址字段數(shù)量的函數(shù)。從而應(yīng)理解,以這種方式對(duì)被拒絕圖象分類使得能以一種不統(tǒng)一的而且相適應(yīng)的方式處理被拒絕的圖象。
發(fā)明內(nèi)容
為此,本發(fā)明提供一種采用視頻編碼的方法以便處理含有地址信息并且已被OCR自動(dòng)鑒別地址處理,例如內(nèi)向地理分檢,拒絕的圖象。當(dāng)然,該方法容易推廣到其它拒絕類型,例如外向分檢(acheminement)、郵政信箱、重新定址、公司分檢。對(duì)于每個(gè)被拒絕的圖象,OCR自動(dòng)鑒別地址處理產(chǎn)生一個(gè)圖象屬性向量,在該向量中地址框中的各個(gè)字段值關(guān)聯(lián)著一個(gè)置信等級(jí)。依據(jù)本發(fā)明,對(duì)每個(gè)被拒絕的圖象,該方法在于通過施加作用在和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量中的各置信等級(jí)上的級(jí)聯(lián)過濾器(過濾器的數(shù)量隨被處理的拒絕類型變化)識(shí)別和該被拒絕圖象對(duì)應(yīng)的拒絕類別;一旦通過某過濾器識(shí)別和該被拒絕圖象對(duì)應(yīng)的拒絕類別,操作員首先在該過濾后進(jìn)行專用于該拒絕類別的編碼以便補(bǔ)充或者修改和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量,然后評(píng)估和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量以便能決定何時(shí)停止對(duì)該被拒絕圖象的視頻編碼。可以分別在不同的視頻編碼單元或控制臺(tái)中分別實(shí)現(xiàn)不同的操作員編碼操作,從而提供使用專長(zhǎng)于特定拒絕類別的不同視頻編碼操作員的優(yōu)點(diǎn),由此改進(jìn)它們的工作。過濾的一個(gè)例子可以是對(duì)單個(gè)置信等級(jí)、對(duì)組合置信等級(jí)或者實(shí)際上對(duì)和地址框的不同字段關(guān)聯(lián)的多個(gè)置信等級(jí)的組合閾定閾值。還可能在專家規(guī)則下進(jìn)行細(xì)化過濾并且把過濾擴(kuò)充到屬性向量中地址字段值及關(guān)聯(lián)置信等級(jí)之外的部分上,這不超出本發(fā)明的范圍。當(dāng)通過定閾值過濾時(shí),通過監(jiān)視通過各個(gè)過濾器的各圖象部分的監(jiān)控人員能動(dòng)態(tài)地調(diào)整閾值值是有好處的。調(diào)整閾值值還能改變視頻編碼系統(tǒng)的吞吐量和出錯(cuò)率。郵政操作員都認(rèn)為對(duì)內(nèi)向分檢所需的所有地址字段進(jìn)行視頻編碼是無益的,因?yàn)樗耐掏侣蔬^小。利用本發(fā)明,通過采用級(jí)聯(lián)過濾器,有可能除掉不益于通過視頻編碼處理的被拒絕圖象。更具體地,可以調(diào)整各過濾器的閾值,從而只留下視頻編碼處理會(huì)比人工會(huì)檢快的郵件的圖象。人工分檢的一般吞吐率為每小時(shí)1600到1800件,這意味著為了使視頻編碼超過該吞吐率,視頻編碼必須在短于2秒鐘內(nèi)處理每份被拒絕的圖象,這例如意味著作為視頻編碼操作輸入長(zhǎng)字符串是沒有問題,例如鍵入街道名字段V(圖1中示出)是沒有問題的。
下面參照附圖更詳細(xì)地說明本發(fā)明。
圖1是和地址信息對(duì)應(yīng)的圖象以及相應(yīng)的圖象屬性向量。
圖2是說明本發(fā)明方法的框圖。
具體實(shí)施例方式
在圖1中,郵件分檢設(shè)備中的OCR自動(dòng)鑒別地址處理通過產(chǎn)生由地址框中的字段值V和N構(gòu)成的圖象屬性向量AT響應(yīng)含有地址信息的圖象IN,其中這些值關(guān)聯(lián)著置信等級(jí)CV和CN并且?guī)в袨橹眯诺燃?jí)CV和CN的乘積的組合置信等級(jí)CG。
通常,當(dāng)組合置信等級(jí)CG低于預(yù)定閾值時(shí),OCR自動(dòng)地址鑒別不能明確地解出地址,從而把圖象IN和對(duì)應(yīng)的圖象屬性向量AT發(fā)送到進(jìn)行視頻編碼處理。
在圖1的例子中,盡管組合置信等級(jí)CG代表一條不明確解出的地址,但是地址字段V的值已被明確識(shí)別。為了明確解出地址只要求視頻編碼操作員確認(rèn)N地址字段的值,在操作員不確認(rèn)該給出的值的情況下只需要操作員對(duì)N地址字段輸入新值。通過操作員確認(rèn)進(jìn)行編碼是不耗時(shí)的,并且要比通過抽取、選擇或互補(bǔ)信息方式輸入信息進(jìn)行編碼操作員耗時(shí)少。依據(jù)本發(fā)明,對(duì)圖象屬性向量AT中的各置信等級(jí)使用級(jí)聯(lián)過濾器以便識(shí)別和被拒絕圖象IN對(duì)應(yīng)的拒絕類別,從而施加專用于該拒絕類別的處理,例如輸入信息編碼之后的確認(rèn)編碼。
圖2示出級(jí)聯(lián)過濾器F1至F4,每個(gè)過濾器之后跟隨著操作員編碼VC1至VC4和對(duì)圖象屬性向量AT的評(píng)估E。過濾器F1至F4構(gòu)成被拒絕圖象的一種分類器TC并且它們用于確定被拒絕圖象的對(duì)應(yīng)類別編號(hào)。
在圖2的例子中,每個(gè)過濾器F1至F4把置信等級(jí)CV、CN、CG和閾值值S1至S4比較。圖2中的過濾器組織成和上面說明的拒絕類型對(duì)應(yīng)。在最上游的過濾器F1處,如果置信等級(jí)CV(街道名的置信等級(jí))大于閾值S1,則進(jìn)行鍵盤編碼VC1以輸入街道號(hào)碼。
在隨后的過濾器F2處,如果組合置信等級(jí)CG大于閾值S2,則通過按鍵或語音合成同時(shí)對(duì)街道號(hào)碼和街道名進(jìn)行確認(rèn)編碼VC2。
在過濾器F3處,如果置信等級(jí)CV(和街道名相關(guān))大于閾值S3,則先在街道名上進(jìn)行確認(rèn)編碼VC3然后通過鍵盤編碼輸入街道號(hào)碼。
在過濾器F4處,如果置信等級(jí)CN(和街道號(hào)碼相關(guān))大于閾值S4,則對(duì)街道號(hào)碼進(jìn)行確認(rèn)編碼VC4并且通過鍵盤編碼輸入街道名。
在這些級(jí)聯(lián)過濾器的出口處,進(jìn)行操作員填寫地址框中的所有字段的鍵盤編碼VC5,因?yàn)樵谶@種情況下通過OCR編碼的信息是不可靠的。
過濾器F1至F4排序成使各操作員進(jìn)行的編碼操作在操作時(shí)間上逐漸變成更加耗時(shí)。
對(duì)于這種類似的拒絕,按如下調(diào)整過濾器F1至F4的閾值值S1的閾值為0.99,S2的閾值為0.93,S3的閾值為0.85,以及S4的閾值為0.83。
根據(jù)這些閾值值,圖1中的圖象IN在過濾器F1的分支上視頻編碼。編碼所需的時(shí)間約為1385毫秒(ms),其大大短于編碼地址框中所有的字段估計(jì)為4000ms的時(shí)間。
另一個(gè)被拒絕地址例子V=AVENUE GAMBETTACV=0.98N=?9CN=0.0
CG=0.0由于置信等級(jí)CV小于0.990(閾值S1的值),該圖象被過濾器F1拒絕。它被發(fā)送到過濾器F2。置信等級(jí)CG小于0.93。該圖象被過濾器F2拒絕并發(fā)送到過濾器F3。由于置信等級(jí)CV大于0.85,對(duì)街道名施加確認(rèn)編碼VC3并接著利用鍵盤編碼輸入街道號(hào)碼。編碼所需時(shí)間約等于1600ms=街道確認(rèn)(約1385ms)+鍵入街道號(hào)碼(約215ms)。
另一個(gè)被拒絕圖象的屬性例子V=RUE DE MONTFAAUCONCV=1.0N=6??6CN=0.0CG=0.0其視頻編碼過程和圖1例子相同,從而編碼時(shí)間約為1385ms。
另一個(gè)被拒絕圖象的屬性例子V=RUE AUGUSTE PERRETCV=0.98N=8CN=0.99CG=0.97由于置信等級(jí)CV小于S1,過濾器F1拒絕該圖象。它被發(fā)送到第二過濾器F2。組合置信等級(jí)CG大于0.85,從而施加視頻編碼VC 2。本情況下平均編碼時(shí)間約為1309ms。
另一個(gè)被拒絕圖象的屬性例子V=PLACE FRANCOIS TRUFFAUTCV=0.62N=2CN=0.85CG=0.51
在本情況下過濾器F1、F2、F3和F4拒絕該圖象,從而它受到VC 5處的視頻編碼。編碼時(shí)間為4000ms。這是最不順利情況。
如圖2中所示,在操作員編碼VC 1至VC 4后,受到視頻編碼的圖象IN的關(guān)聯(lián)圖象屬性向量AT被補(bǔ)充或被修改,并且在每次視頻編碼操作后在E處評(píng)估該圖象屬性向量,以便判定何時(shí)停止對(duì)該被拒絕圖象的視頻編碼(因?yàn)橐呀?jīng)完全識(shí)別地址信息)。當(dāng)判定不在某個(gè)過濾級(jí)上停止視頻編碼時(shí),則通過下一級(jí)過濾繼續(xù)進(jìn)行處理,如圖2中的箭頭所示。
圖2清楚地示出過濾器的級(jí)聯(lián)結(jié)構(gòu),其中每個(gè)過濾級(jí)帶有操作員動(dòng)作例如VC 1、VC 2、VC 3、VC 4以及關(guān)聯(lián)評(píng)估E。由于操作員動(dòng)作VC 1至VC 4分別專用于過濾器F1至F4,在其中各操作員專長(zhǎng)于不同拒絕類型的不同視頻編碼單元或控制臺(tái)上實(shí)現(xiàn)各條處理線F1-VC1-E、F2-VC2-E等等。
圖2還示出監(jiān)控員自動(dòng)地以動(dòng)態(tài)方式調(diào)整過濾器F1至F4中的閾值值S1至S4。
為了保證視頻編碼處理是有益的,級(jí)聯(lián)過濾器可以僅由當(dāng)前三個(gè)過濾級(jí)F1至F3組成,如果某被拒絕圖象未被這三個(gè)過濾級(jí)中的至少一級(jí)識(shí)別,則它不由視頻編碼處理而會(huì)人工分檢該對(duì)應(yīng)的郵件。這能達(dá)到每小時(shí)約2300份郵件的平均視頻編碼吞吐率。更具體地,在外向內(nèi)向分檢(tri acheminement-distribution)過程中,可以和通過OCR自動(dòng)鑒別過程相一致地實(shí)現(xiàn)依據(jù)本發(fā)明的使用前三個(gè)過濾組F1至F3的通過視頻編碼對(duì)被拒絕圖象的處理,如果例如把過濾器F1-F3調(diào)整成只對(duì)已經(jīng)通過OCR明確識(shí)別外向分檢郵政信息的圖象進(jìn)行分類,因?yàn)橐曨l編碼操作VC 1至VC 3可以按大致和對(duì)外向分檢郵件進(jìn)行視頻編碼所需的處理時(shí)間相同的時(shí)間予以實(shí)現(xiàn)。
權(quán)利要求
1.一種通過視頻編碼用于處理郵件的圖象(IN)的方法,每幅圖象含有地址信息,所述圖象已被通過OCR的自動(dòng)鑒別地址處理拒絕,該方法特征在于包括對(duì)每個(gè)被拒絕圖象產(chǎn)生一個(gè)圖象屬性向量(AT),該向量由與形成地址信息的地址框中的各字段(V,N)關(guān)聯(lián)的置信等級(jí)(CV,CN)構(gòu)成,通過作用在所述圖象的屬性向量的各置信等級(jí)的級(jí)聯(lián)過濾器(F1-F4)對(duì)每個(gè)被拒絕的圖象分類,該級(jí)聯(lián)過濾器中的各個(gè)過濾器級(jí)識(shí)別不同的拒絕類別并對(duì)每種拒絕類別確定特定類型的視頻編碼處理;以及當(dāng)在某過濾器級(jí)上識(shí)別和被拒絕圖象對(duì)應(yīng)的拒絕類別時(shí),首先在所述過濾后進(jìn)行專用于該拒絕類別的視頻編碼(VC 1-VC 4)處理以便補(bǔ)充或修改該被拒絕圖象的圖象屬性向量,然后評(píng)估(E)該被拒絕圖象的屬性向量以便能判定何時(shí)停止對(duì)被拒絕圖象的視頻編碼。
2.根據(jù)權(quán)利要求1所述的方法,其中各個(gè)過濾級(jí)(F1-F4)、各視頻編碼處理(VC 1-VC 4)和對(duì)相應(yīng)圖象屬性向量(AT)的評(píng)估(E)形成一組分別在不同的視頻編碼單元或控制臺(tái)上實(shí)現(xiàn)的處理線。
3.根據(jù)權(quán)利要求1或2所述的方法,其中每個(gè)過濾級(jí)(F1-F4)將被拒絕圖象的屬性向量(AT)的至少一個(gè)置信等級(jí)(CV,CN,CG)和閾值值(S1-S4)比較。
4.根據(jù)權(quán)利要求3所述的方法,其中由用于監(jiān)視通過各個(gè)過濾級(jí)的被拒絕圖象的各部分的監(jiān)控員來動(dòng)態(tài)地調(diào)整閾值值(S1-S4)。
5.根據(jù)權(quán)利要求1至4中任一權(quán)利要求的方法,其中該地址信息是用于郵政分檢的地址信息,其中地址框包括給出街道名的第一字段(V)和給出該街道上的號(hào)碼的第二字段(N)構(gòu)成,其中圖象屬性向量(AT)包括和地址框的第一字段(V)關(guān)聯(lián)的第一置信等級(jí)(CV)、和地址框的第二字段(N)關(guān)聯(lián)的第二置信等級(jí)(CN)、以及等于和地址框的所述第一及第二字段關(guān)聯(lián)的所述置信等級(jí)的乘積的組合置信等級(jí)(CG),并且通過下述過濾級(jí)和處理級(jí)組成級(jí)聯(lián)的過濾器和專用視頻編碼處理a)如果第一置信等級(jí)(CV)大于第一閾值值(S1),則通過視頻編碼(VC 1)輸入街道號(hào)碼;b)如果組合置信等級(jí)(CG)大于第二閾值值(S2),則通過視頻編碼(VC 2)確認(rèn)街道號(hào)碼以及街道名;以及c)如果第一置信等級(jí)(CV)大于第三閾值值(S3),則通過視頻編碼(VC 3)確認(rèn)街道名,然后輸入街道號(hào)碼。
6.根據(jù)權(quán)利要求5所述的方法,其中通過語音合成完成通過視頻編碼的確認(rèn)。
7.一種外向和內(nèi)向分檢郵政圖象的方法,其特征在于其采用依據(jù)權(quán)利要求1至6中任一權(quán)利要求的對(duì)郵件圖象(IN)視頻編碼的處理,其中如果在這些級(jí)聯(lián)過濾器后未對(duì)某被拒絕的圖象識(shí)別出拒絕類別,則把該被拒絕圖象對(duì)應(yīng)的郵件發(fā)送到人工分檢處理。
全文摘要
本發(fā)明涉及一種通過視頻編碼處理由地址信息構(gòu)成的圖象的方法。依據(jù)本發(fā)明,對(duì)每個(gè)被OCR地址識(shí)別系統(tǒng)拒絕的圖象,利用對(duì)被拒絕圖象關(guān)聯(lián)的圖象屬性向量的各置信值施加的級(jí)聯(lián)過濾器(F1-F4)識(shí)別和被拒絕圖象對(duì)應(yīng)的拒絕類別。隨后,當(dāng)在某過濾器上識(shí)別和該被拒絕圖象對(duì)應(yīng)的拒絕類別時(shí),在所述過濾處理后進(jìn)行下述操作(i)專用于該拒絕類別的操作員編碼(VC1-VC4)從而完成或者修改和該被拒絕圖象關(guān)聯(lián)的圖象屬性向量,以及(ii)評(píng)估(E)和被拒絕圖象關(guān)聯(lián)的圖象屬性向量從而可作出對(duì)所述被拒絕圖象停止視頻編碼的判定。
文檔編號(hào)G06K9/03GK1934577SQ03821899
公開日2007年3月21日 申請(qǐng)日期2003年9月9日 優(yōu)先權(quán)日2002年9月16日
發(fā)明者赫查姆·埃爾-伯恩諾斯, 吉勒斯·莫森, 克里斯托弗·洛霍梅 申請(qǐng)人:索利斯蒂克有限公司