專利名稱:基于質(zhì)量的指紋匹配的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及自動指紋識別系統(tǒng),并且特別涉及根據(jù)搜索記錄中和數(shù)據(jù)庫中印記的質(zhì)量把所述搜索記錄與所述數(shù)據(jù)庫中歸檔記錄做匹配的系統(tǒng)和方法。
背景技術(shù):
識別模式系統(tǒng),如十指印記或指紋識別系統(tǒng),在當代社會中的刑事和民事案件處理當中發(fā)揮著關(guān)鍵作用。例如,公共安全部門的刑事犯罪識別是當今犯罪調(diào)查中的不可缺少的部分。類似地,在民事糾紛中,諸如信用卡或個人身份欺詐,印記識別已經(jīng)成為安全處理當中的基本部分。
自動指紋識別操作通常由兩個階段組成。第一個階段是注冊或登記階段,以及第二個階段是識別、身份認證或驗證階段。在注冊階段,登記被注冊者的指紋和個人信息并提取所登記指紋的諸如細節(jié)點(minutiae)的匹配特征。個人信息和所提取的匹配特征以及或許還有圖像通常用于形成歸檔記錄,并被保存在歸檔數(shù)據(jù)庫中用于以后對被注冊者的識別。當今的自動指紋識別系統(tǒng)可包含幾十萬至幾百萬這種歸檔記錄。
在識別階段,可從個人獲取一個或多個印記或潛印記(latentprint)。通常從每個印記提取匹配特征,并且連同個人信息形成通常所稱的搜索記錄(search record)。然后把該搜索記錄與指紋匹配系統(tǒng)的數(shù)據(jù)庫中所登記的歸檔記錄做比較。在典型的搜索情況中,搜索記錄可能與存儲在數(shù)據(jù)庫中的數(shù)百萬歸檔記錄做比較,并且通常產(chǎn)生匹配得分的列表作為該匹配處理的結(jié)果。根據(jù)匹配得分來存儲候選的記錄。匹配得分(matched score,這里也稱作相似性得分)是所識別搜索與各歸檔記錄的指紋特征的相似性。通常,得分越高,可判定該歸檔記錄和搜索記錄越相似。因此,最高得分的候選記錄是具有最接近匹配的記錄。
但是,從驗證測試中普遍發(fā)現(xiàn)最高得分的候選記錄可能不總是正確匹配的記錄,因獲取的指紋在質(zhì)量上有很大差異。模糊、獲取指紋的個人在技術(shù)方面?zhèn)€體性差異、設(shè)備質(zhì)量以及環(huán)境因素等都可以影響指紋質(zhì)量。為了保證精確判定正確匹配的候選記錄,通常把搜索記錄和所存儲的列表中得分最高的n個歸檔記錄提供給檢驗者進行人工復(fù)核與檢查。一旦找到真的匹配,把識別信息提供給用戶,并且根據(jù)系統(tǒng)要求,或者從該識別系統(tǒng)丟棄該搜索記錄,或者將其添加到歸檔數(shù)據(jù)庫。如果沒有找到真匹配,通常用該個人信息和該搜索記錄的指紋特征建立新的歸檔記錄,并添加到歸檔數(shù)據(jù)庫中。
已經(jīng)開發(fā)了若干解決方案來改進匹配度的精度并因此降低人工檢查者的工作負擔(dān)。大多數(shù)這類解決方案著重設(shè)計改進的指紋掃描器以獲得更好質(zhì)量的指紋記錄,以及設(shè)計更好的指紋增強處理和特征提取算法來獲得更好的匹配特征。某些解決方案還著重設(shè)計更好的匹配算法來更好區(qū)分匹配指紋和未匹配指紋。還開發(fā)了更好的決策邏輯系統(tǒng)來減少在后面由指紋檢查者復(fù)核的候選記錄的數(shù)量。
最近發(fā)展的一種解決方案中包括過程來建立在識別階段使用的集成與魯棒的數(shù)據(jù)庫。該解決方案在匹配處理期間基于主動搜索記錄和包含在過濾數(shù)據(jù)庫中的主動歸檔記錄的生成和使用。這樣,在為被注冊者登記的所有搜索印記中具有最高質(zhì)量的一組搜索印記形成主動搜索記錄。該主動搜索記錄與主動歸檔數(shù)據(jù)庫匹配,該主動歸檔數(shù)據(jù)庫同樣包括質(zhì)量在給定閾值之上的印記,因此該數(shù)據(jù)庫通常要比傳統(tǒng)自動指紋識別系統(tǒng)(AFIS)的歸檔數(shù)據(jù)庫小。而且,例如歸檔數(shù)據(jù)庫中任何重復(fù)的歸檔記錄被保存在被動數(shù)據(jù)庫中的被動記錄中,被動數(shù)據(jù)庫鏈接到主動歸檔數(shù)據(jù)庫但并不用于實際的指紋匹配處理。
另一種最近的解決方案包括漸進的指紋匹配系統(tǒng)。傳統(tǒng)上,對每個搜索使用預(yù)定數(shù)量的手指,對應(yīng)的搜索記錄中所有手指都已經(jīng)對照整個數(shù)據(jù)庫搜索完畢并且根據(jù)來自所有搜索的手指的組合匹配得分確定平均匹配得分之后才做匹配(即命中)或未匹配(未命中)的決策。使用平均得分通常導(dǎo)致低精度。相對比地,該最近的解決方案包括一種方法,每次用一個手指來搜索過濾的歸檔數(shù)據(jù)庫,其中,在每個搜索的手指一級來做匹配或未匹配的決策,而不是考慮所有手指的匹配報告。
這種方法在兩個方面要快于傳統(tǒng)的固定手指搜索方法。第一,根據(jù)上述解決方案所使用的數(shù)據(jù)庫比傳統(tǒng)的AFIS歸檔數(shù)據(jù)庫要小,其中在匹配過程中只使用主動歸檔數(shù)據(jù)庫。第二,是在手指級而不是實例(case)級做命中或未命中的決策,所以在某些實例中搜索可更早停止。盡管如此,通過在匹配處理中根據(jù)主動搜索記錄中的印記質(zhì)量來平衡從歸檔數(shù)據(jù)庫中的歸檔記錄的檢索,可實現(xiàn)傳統(tǒng)搜索的效率和精度。
這樣,需要有改進的自動指紋識別系統(tǒng)和方法,在不犧牲識別處理精度的前提下可大大提高速度,并且在搜索記錄生成期間和在匹配處理期間使用質(zhì)量,并進而使用質(zhì)量作為從歸檔數(shù)據(jù)庫中檢索歸檔記錄的判據(jù),以實現(xiàn)這種增加的速度和精度。
參照附圖僅以示例的方式來說明本發(fā)明的優(yōu)選實施例,其中圖1示出根據(jù)本發(fā)明實施例的自動指紋識別系統(tǒng)的簡單方框圖;以及圖2示出根據(jù)本發(fā)明實施例的指紋匹配方法的流程圖。
具體實施例方式
盡管本發(fā)明可有許多不同形式的實施例,但附圖示出并在此詳細說明特定的實施例,應(yīng)該理解這里公開的內(nèi)容可被看作是本發(fā)明原理的例子,而不應(yīng)把本發(fā)明限制在所示出和所說明的特定實施例。另外,這里使用的術(shù)語和詞匯不應(yīng)被看作是限制性的,而僅僅是描述性的。還應(yīng)該理解,為了說明的簡明,圖中示出的元素不必是按比例畫出的。例如,某些元素的尺寸相對于其他元素是夸張的。另外,在認為合適的情況下,在各圖中重復(fù)使用參考標號以表示相應(yīng)的元素。
圖1示出了可用于結(jié)合這里所說明的本發(fā)明的系統(tǒng)和方法的自動指紋識別系統(tǒng)(AFIS)10。優(yōu)選地,系統(tǒng)10包括輸入與登記站140、數(shù)據(jù)存儲與檢索設(shè)備100、分布式匹配控制器110、至少一個傳統(tǒng)的自適應(yīng)細節(jié)點匹配器處理器120(在這里也稱作粗細節(jié)點匹配處理器)、至少一個傳統(tǒng)的增強匹配器處理器130和驗證站150。
輸入與登記站140用于獲取印記并可選地提取有關(guān)該印記的匹配特征用于以后的比較。在輸入與登記站140中還可由所獲取的印記和所提取的特征來生成歸檔記錄。在輸入與登記站140,對所登記的印記(這里也稱作印記圖像)做劃分并對每個印記賦予質(zhì)量以保證印記具有足夠的用于匹配的質(zhì)量。還要檢查指紋的完整性以保證每個印記圖像是按照一個或多個獲取準則而獲取的。例如,可通過SLAP至ROLL比較以確定是否每個按下的印記都被正確定位、標記和劃分??稍陬A(yù)定義的質(zhì)量閾值的控制下由具有足夠質(zhì)量的印記生成主動歸檔記錄,例如,可由質(zhì)量不足的指紋或由重復(fù)指紋生成被動歸檔記錄。
輸入與登記站140還可用于獲取指紋并可選地提取該圖像的有關(guān)匹配特征用于同一個或多個歸檔記錄中的匹配特征比較。在輸入與登記站140還可由所獲取的圖像和所提取的特征生成搜索記錄。在輸入和登記站140,對所登記的指紋做劃分并對每個指紋賦予質(zhì)量。還要檢查指紋的完整性。可由具有足夠質(zhì)量的指紋生成主動搜索記錄。另外,可重新登記指紋(即獲取了一個或多個另外的指紋并分析其質(zhì)量),并從所有登記的指紋中提取主動搜索記錄。這樣,輸入與登記站140例如可連接至用于掃描印記或者用于獲取潛印記的平板掃描儀、十指印記現(xiàn)場掃描儀和數(shù)碼照相機,可把所獲取的指紋加載到處理器設(shè)備,如可耦合至登記站140或結(jié)合在登記站140內(nèi)的微處理器,用于執(zhí)行其余的功能。
數(shù)據(jù)存儲與檢索單元100存儲和檢索包含匹配特征的歸檔記錄,并且也可存儲和檢索對執(zhí)行本發(fā)明有用的其他數(shù)據(jù)。自適應(yīng)細節(jié)點匹配器處理器120和增強匹配器處理器130通常使用所提取的印記匹配特征來確定相似性,或配置成在圖像級做比較,驗證站150用于驗證匹配結(jié)果。另外,本領(lǐng)域的普通技術(shù)人員能夠理解,盡管在系統(tǒng)10中所示出的輸入與登記站140和驗證站是分開的框,在替換的實施例中,這兩個站可組合成一個站。
在操作中,分布式匹配器控制器110從輸入登記站140接收主動搜索記錄,并從存儲在數(shù)據(jù)存儲與檢索單元100的主動歸檔數(shù)據(jù)庫中檢索主動歸檔記錄。然后,控制器110把主動搜索和歸檔記錄分布到自適應(yīng)細節(jié)點匹配器處理器,用于每次一個手指地執(zhí)行匹配處理,其中控制器110收集在每個手指匹配完成時收集匹配報告。由決策邏輯評估每個手指匹配的結(jié)果,以確定是否找到命中,并且,例如如果找到強命中(strong hit),則搜索完成。
否則可執(zhí)行控制器110中的淘汰選擇(down-selection)處理,其中,生成匹配印記可能集合的排序或分類列表,用于進一步的詳細評估。根據(jù)這種淘汰選擇處理,對每組印記產(chǎn)生配對細節(jié)點的列表,并且把那些具有超過預(yù)定義水平得分值的印記傳送到輔助匹配器塊130,用于更詳細的匹配處理。在控制器110中由決策邏輯再次評估匹配的結(jié)果,如果發(fā)現(xiàn)命中,則搜索完成。否則,選擇下一個手指作為搜索手指,并重復(fù)在控制器110和匹配器處理器120及130中執(zhí)行的上述匹配處理,直到發(fā)現(xiàn)命中或搜索了期望數(shù)量的手指,如搜索了主動搜索記錄中的所有手指。
可以由未解潛印記、十指印記、指紋組、拍印、掌紋等處理搜索記錄和歸檔記錄。未解潛手紋通常定義成未知其主人的取自犯罪現(xiàn)場或未知源的手指或掌印記。十指印記或指紋組通常是指取自某個人的10個或少于10個的手指紋,通過滾動的或壓平的獲取指紋方法在媒介上獲取。拍印(slap print)是用戶蘸了墨水的手在媒介上的印記或用戶的手在指紋獲取傳感器上的印記。通常,處理這些印記以產(chǎn)生主動搜索記錄,對照主動搜索記錄,比較從歸檔數(shù)據(jù)庫處理的過濾歸檔記錄。應(yīng)該理解,十指印記可包括腳趾紋或掌紋。每個印記提供數(shù)據(jù)記錄,所述數(shù)據(jù)記錄例如可包括每個印記作為四種印記類型(即弓、左萁、右萁和斗)之一的分類,以及具有個X-Y座標位置和方位角的細節(jié)點,如本領(lǐng)域所熟知的。
圖2示出根據(jù)本發(fā)明實施例的指紋匹配方法的流程圖。圖2的方法可作為軟件存儲在合適的存儲區(qū),如內(nèi)存、存儲設(shè)備,并且可在系統(tǒng)10中一個或多個處理器或處理設(shè)備中實現(xiàn)或執(zhí)行??商鎿Q地,根據(jù)本發(fā)明的方法可實現(xiàn)在硬件設(shè)備中,如專用的集成電路。例如在本發(fā)明的一個實施例中,圖2的方法可在分布式匹配器控制器110中執(zhí)行。
根據(jù)圖2的方法,首先從輸入與登記站140把主動搜索記錄接收到分布式匹配器控制器110(步驟202)。為了生成主動搜索記錄,可登記多個印記,如指紋,其中要獲取印記、提取特征以及檢查印記的質(zhì)量和完整性。如果印記質(zhì)量合格,即至少等于預(yù)定義的質(zhì)量閾值,則提取主動搜索記錄。否則,可能發(fā)生重新登記,其中登記附加的印記,并且然后可從所有登記的印記中提取主動搜索記錄。優(yōu)選地,主動搜索記錄包括十指印記,即搜索印記,但可根據(jù)登記環(huán)境而包括較少的印記。
當接收到主動搜索記錄,分布式匹配器控制器110獲取用于搜索結(jié)果的精度要求,并由該主動搜索記錄生成至少一個質(zhì)量簇(206),用于整個N個不同的分層質(zhì)量簇,其中根據(jù)不同的期望質(zhì)量下限來定義每個質(zhì)量簇,并且與該簇相關(guān)聯(lián)的印記具有至少等于該相應(yīng)簇的所述最小質(zhì)量的質(zhì)量。另外,為了獲得例如客戶的精度要求,對每個質(zhì)量簇分配若干手指用于執(zhí)行匹配處理。根據(jù)用于執(zhí)行該匹配處理的AFIS系統(tǒng)的特定精度特性確定手指分配方針,并可將其存儲在例如數(shù)據(jù)存儲與檢索設(shè)備100的精度表中。
落入給定等級的質(zhì)量范圍內(nèi)的圖像包含在該簇中。因此,根據(jù)匹配精度對具有相同質(zhì)量等級的圖像都是類似的這一前提來確定質(zhì)量等級。例如,假定圖像質(zhì)量值在0到100的范圍內(nèi),其中0表示最差的質(zhì)量,100表示最高的質(zhì)量。這個值的范圍可根據(jù)匹配速率進一步量化成N個等級。假定N是4,其中每個質(zhì)量等級分別命名為“A”、“B”、“C”和“D”??蛇x擇每個等級的范圍,使得對該等級的匹配精度是類似的。例如,可分別選擇等級A、B、C和D的范圍是80至100、60至80、40至60以及0至40。因此,其質(zhì)量至少落入分配給A等級的范圍內(nèi)的所有指紋圖像包含在A簇,并且具有A等級或B等級的所有指紋圖像包含在B簇,對C和D也是如此。這些簇是有層次的,簇B包含簇A中的圖像,并且簇C包含簇B中圖像,而簇B已包含簇A中圖像,等等。
當來自搜索記錄的所有印記圖像都分配到質(zhì)量簇,來自A質(zhì)量簇的圖像較之B、C或D質(zhì)量簇應(yīng)該具有更高的精確率。根據(jù)同樣的意思,來自B質(zhì)量簇的的圖像較之C或D質(zhì)量簇應(yīng)該具有更高的精確率,等等。換言之,為了得到相同的精度,A質(zhì)量簇的圖像較之B、C或D將需要較少的手指用于匹配。因此,通過把每個記錄劃分到不同質(zhì)量的圖像簇,可以對每個簇分配不同數(shù)量的手指,以獲得精度和速度之間的期望的平衡。
當把指紋組織成質(zhì)量簇(206),分布式匹配器控制器110在每個質(zhì)量簇內(nèi)生成至少一個搜索包(這里也稱作搜索包裹)(210),每個所述的搜索包具有動態(tài)確定的印記集合。該集合包含分配給相應(yīng)質(zhì)量簇的印記,并且只包含搜索記錄中具有至少所期望最小質(zhì)量的那些手指。在所有N個簇可生成全部M個搜索包,其中,對與每個質(zhì)量簇相關(guān)聯(lián)的給定數(shù)量手指的所有可能不同手指號組合形成搜索包。
相對整個數(shù)據(jù)庫來簡單地匹配搜索包不能獲得所期望的精度要求。為了達到精度要求,必須相對于歸檔記錄來搜索每個搜索包,該歸檔記錄具有印記即歸檔印記,這些印記的質(zhì)量至少等于該搜索包中印記的質(zhì)量(即至少等于相應(yīng)質(zhì)量簇的質(zhì)量下限)并至少包含那些包含在相應(yīng)的搜索記錄中的手指。這樣,分布式匹配器控制器110根據(jù)每個搜索包動態(tài)檢索歸檔記錄。按這種方式,歸檔數(shù)據(jù)庫實際被劃分成對應(yīng)于搜索包數(shù)量的虛擬歸檔箱(file bin),其中每個搜索包中的印記具有類似于其對應(yīng)虛擬歸檔箱中的對應(yīng)指紋的期望質(zhì)量,并且在這二者之間有對應(yīng)的手指。
優(yōu)選地,歸檔數(shù)據(jù)庫是過濾的歸檔數(shù)據(jù)庫,例如,如上述的主動歸檔數(shù)據(jù)庫。另外,每個歸檔記錄優(yōu)選地包括十指印記,盡管給定的歸檔記錄可能包含較少的印記。而且,為了提高匹配處理的速度,優(yōu)選地,每個虛擬歸檔箱包含排除了任何其他虛擬歸檔箱中所包含歸檔記錄的歸檔記錄。換言之,對給定的歸檔記錄,當未發(fā)現(xiàn)命中,該歸檔記錄就不再對照任何其他搜索包做匹配。這是可能的,因如果對給定的歸檔記錄相對于給定質(zhì)量的搜索包未發(fā)現(xiàn)命中,則針對客戶要求的精度等級,可以相應(yīng)地確定與該歸檔記錄相關(guān)聯(lián)的個人同與該搜索記錄相關(guān)聯(lián)的個人不是同一個人。因此,按上述的方式來組織主動搜索記錄,并對照按上述劃分的主動歸檔數(shù)據(jù)庫執(zhí)行搜索記錄的匹配處理,使得本發(fā)明的系統(tǒng)和方法較之現(xiàn)有的技術(shù)可獲得相當高的精度和速度。
下面是根據(jù)本發(fā)明在給定的AFIS系統(tǒng)的范圍內(nèi)如何把主動搜索記錄組織成質(zhì)量簇和搜索包以及如何根據(jù)每個搜索包檢索歸檔記錄以達到期望的精度要求的簡單例子。這里假定主動數(shù)據(jù)庫只有A和B質(zhì)量等級的指紋;主動搜索記錄包含3個A質(zhì)量的印記,并且其余印記是B質(zhì)量的;客戶想要達到99.8%命中率的精度;以及該AFIS系統(tǒng)具有下面的精度表,用于對照A質(zhì)量歸檔記錄匹配的A質(zhì)量搜索記錄和用于對照至少B質(zhì)量歸檔記錄匹配的至少B質(zhì)量搜索記錄。
相對于所有A質(zhì)量搜索記錄匹配的A質(zhì)量數(shù)據(jù)庫
相對于所有A或B質(zhì)量搜索記錄匹配的A或B質(zhì)量數(shù)據(jù)庫
相應(yīng)地,分配給每個不同質(zhì)量簇的手指數(shù)量會產(chǎn)生等于或大于客戶精度要求的預(yù)計精度。根據(jù)上述的精度表,AFIS系統(tǒng)要求對相對于A質(zhì)量歸檔記錄的搜索分配2個A質(zhì)量的指紋以得到所要求的99.8%命中率,對相對于B或更高質(zhì)量歸檔記錄的搜索分配4個B或更高質(zhì)量的指紋以得到所要求的99.8%命中率。從上述的表中可以看出,為了達到期望的精度要求,通常可對與高質(zhì)量指紋相關(guān)聯(lián)的簇分配較少數(shù)量的手指。
如果手指1、5和6是搜索記錄中三個A質(zhì)量的手指印記,則根據(jù)這三個手指確定用于A質(zhì)量簇的相應(yīng)搜索包。特別,在每個搜索包中的印記要基于手指號1、5和6的所有不同的兩手指組合。這樣,可首先生成用于A質(zhì)量簇的三個搜索包,即用于搜索包1的手指號是1和6,用于搜索包2的是1和5,以及用于搜索包3的是5和6。根據(jù)它們所定義的質(zhì)量和手指號分別檢索用于搜索包1、2和3的相應(yīng)歸檔記錄。按這種方式,這樣,A質(zhì)量印記的歸檔數(shù)據(jù)庫實際上被劃分為如下三個相應(yīng)的歸檔箱基于包1的手指號1和6,形成對手指號1和6都具有A質(zhì)量指紋的歸檔記錄,作為歸檔箱1;基于包2的手指號1和5,形成對手指號1和5都具有A質(zhì)量指紋的歸檔記錄(與歸檔箱1中的不同),作為歸檔箱2;以及基于包3的手指號5和6,形成對手指號5和6都具有A質(zhì)量指紋的歸檔記錄(與歸檔箱1和2中的不同),作為歸檔箱3。按相同的方式,可確定另外的質(zhì)量簇、搜索包和相應(yīng)的歸檔記錄,直到實際劃分了所有的歸檔記錄。
一旦確定了質(zhì)量簇、搜索包和相應(yīng)的歸檔記錄,匹配過程就可開始了。通過選擇最高質(zhì)量簇,即具有最高的質(zhì)量下限的簇,來開始匹配過程(218),并且,按照質(zhì)量的降序,在整個剩余的質(zhì)量簇中繼續(xù)處理,直到找到匹配,或直到數(shù)據(jù)庫中沒有剩余的歸檔記錄,或直到搜索記錄中沒有剩余的搜索包。因此,一旦(在未經(jīng)搜索的簇中)選擇了最高質(zhì)量簇(218),則從所選擇的質(zhì)量簇中選擇搜索包并檢索相應(yīng)的歸檔記錄(222)。優(yōu)選地,可根據(jù)某些指標來選擇搜索包,例如根據(jù)手指排列次序,使得搜索效率更高。
然后,把所選擇的搜索包對照其相應(yīng)的歸檔記錄做匹配(226),優(yōu)選地,根據(jù)基于搜索包中指紋質(zhì)量的匹配策略來進行匹配。這可以進一步提供匹配處理的精度。例如,復(fù)雜性低的搜索策略(如基于使用單匹配處理器的單級搜索,如細節(jié)點匹配處理器120)可用于高質(zhì)量搜索包與歸檔記錄之間的搜索。而復(fù)雜性高的搜索策略(如基于使用一個或多個匹配處理器的多級搜索,其中或許至少一個匹配處理器,如增強的匹配處理器,較之至少一個另外的匹配處理器,如粗細節(jié)點匹配處理器,執(zhí)行更詳細的處理)可用于低質(zhì)量搜索包與歸檔記錄之間的搜索。
優(yōu)選地,如上面所述的和本領(lǐng)域所公知的,在手指級執(zhí)行所選擇的搜索包與其對應(yīng)的歸檔記錄之間的搜索,這樣使得當確定在所選擇搜索包中的任何手指與任何歸檔記錄中的相應(yīng)手指之間已找到匹配,則搜索結(jié)束。當該過程以匹配結(jié)束,找到真匹配的可能性在客戶的精度要求的范圍之內(nèi),因此較之現(xiàn)有技術(shù)增加了搜索的精度。如果在所選擇搜索包和任何相應(yīng)歸檔記錄之間沒有找到匹配,則確定是否已經(jīng)搜索了所選擇質(zhì)量簇的所有搜索包(234)。如果否,則選擇下一個搜索包和相應(yīng)的歸檔記錄(222),并重復(fù)匹配過程。如果是,則確定是否已經(jīng)搜索了所有的質(zhì)量簇(238)。如果否,則選擇未經(jīng)搜索的質(zhì)量簇中的具有最高質(zhì)量的質(zhì)量簇(218),并且該過程繼續(xù)。如果是,如果已經(jīng)搜索了所有質(zhì)量簇中的所有搜索包并且沒有找到命中,該過程結(jié)束,其中,與該搜索記錄相關(guān)聯(lián)的個人在該歸檔數(shù)據(jù)庫中沒有相匹配的歸檔記錄的可能性在客戶精度要求的范圍之內(nèi)。
按上述的方式,對任何一個搜索,可在虛擬箱級和手指級確定匹配,而不要求在整個數(shù)據(jù)庫搜索。這較之現(xiàn)有技術(shù)可極大提高搜索速度。
下面是根據(jù)本發(fā)明的實施例并在圖2的流程圖中說明的指紋匹配方法可如何執(zhí)行的例子。該例子基于上述的例子,其中生成3個搜索包1、2和3,分別包括手指號1和5、1和6以及5和6。假定選擇了搜索包1和其對應(yīng)的歸檔記錄來啟動匹配過程。由于這是具有最高質(zhì)量的搜索包,可根據(jù)單級匹配策略,如通過細節(jié)點匹配處理器120,來執(zhí)行匹配過程。每次一個手指地執(zhí)行該搜索,例如以手指號1開始,其中,對照相應(yīng)歸檔記錄的手指號1來搜索包1的手指號1。通過諸如智能決策邏輯(IDL)的決策邏輯,如IDL-1邏輯,來評估所匹配的結(jié)果。
智能決策算法使用上述的特征。首先,IDL可對每個選擇的手指確定可能命中的數(shù)量,然后利用記錄級特征根據(jù)各手指的命中情況進行記錄級決策。記錄級決策提供對該搜索找到的已識別匹配“命中”的數(shù)量以及每個命中的強度。根據(jù)所述的命中的強度,可使用更詳細的匹配來再次搜索這些記錄。如果找到強命中,則該搜索完成。在詳細匹配之后,由IDL重新再評估結(jié)果。按這種方式,減少了可視鑒別的候選數(shù)量,還改進了搜索響應(yīng)時間。由于是在多級的階段進行決策并使用了更正交的特征,也改善了識別精度??膳渲脹Q策系統(tǒng)包括兩個或多個模塊。例如,細節(jié)點匹配器結(jié)果評估邏輯可被標識為IDL-1,并且輔助的或增強的匹配器評估結(jié)果可被標識為IDL-2。本領(lǐng)域的普通技術(shù)人員可理解,對給定質(zhì)量簇的匹配策略還可根據(jù)質(zhì)量具有多于兩個的級。例如,可有IDL-3邏輯等。
返回到匹配過程,如果對手指號1沒有找到匹配,則對照相應(yīng)的歸檔記錄中的相應(yīng)A質(zhì)量指紋來匹配該包中第二手指。由諸如IDL-1的決策邏輯來評估當前的匹配結(jié)果和前一個匹配結(jié)果。如果找到匹配,則指紋搜索完成。如果沒有找到匹配,可選擇下一個搜索包2和其相應(yīng)的歸檔記錄,并重復(fù)匹配過程。繼續(xù)匹配過程,直到搜索了A質(zhì)量簇的所有搜索包1、2和3的所有手指或者歸檔數(shù)據(jù)庫的所有記錄,或者直到找到了無論哪個首先到來的匹配。
如果還有另外的質(zhì)量簇,如簇B、簇C和簇D,各分別具有更低的質(zhì)量,并且在A質(zhì)量簇沒有找到匹配而還有剩余的歸檔記錄未被搜索,可以利用具有次高質(zhì)量下限的簇,即B質(zhì)量簇,來進行搜索。利用多級匹配過程可搜索一個或多個這種更低質(zhì)量的簇,優(yōu)選地,使用兩階段匹配過程。在這種情況下,假定按這種多級方式來搜索C和D質(zhì)量簇。這樣,根據(jù)單級匹配策略,對照相應(yīng)的歸檔記錄逐個手指地搜索B質(zhì)量簇的每個包,直到找到匹配。不然,搜索在整個C和D質(zhì)量簇進行,優(yōu)選地,使用兩階段匹配過程,直到找到匹配。
在兩階段匹配過程中,首先由細節(jié)點匹配器對每個手指執(zhí)行搜索。在對該手指完成搜索之后,由IDL-1邏輯評估結(jié)果。如果沒有找到匹配,不是搜索下一個手指,而是把該手指的前N個候選傳送給增強匹配器處理器130,用于執(zhí)行更詳細的匹配,并且由諸如IDL-2邏輯的決策邏輯來評估結(jié)果。如果沒有直到匹配,該搜索繼續(xù)至下一個手指和相應(yīng)的歸檔記錄,直到找到匹配或直到已經(jīng)匹配了所有的搜索包。
歸結(jié)起來,根據(jù)搜索包來檢索和匹配數(shù)據(jù)庫,并且對不同質(zhì)量的數(shù)據(jù)庫根據(jù)系統(tǒng)的精度來確定搜索包的數(shù)量。由于數(shù)據(jù)庫實際被劃分成較小的箱,并且前面搜索的歸檔記錄不用于相同搜索記錄的任何后續(xù)搜索,因此來劃分和控制數(shù)據(jù)庫。匹配過程從最高質(zhì)量簇到最低質(zhì)量簇、從手指到手指并且包到包地對相對應(yīng)的記錄進行。對不同的質(zhì)量簇可指定不同的匹配策略。而且,對高質(zhì)量的搜索包指定較少的手指數(shù),對低質(zhì)量的搜索包指定較多數(shù)量的手指。另外,對高質(zhì)量搜索包不要求詳細匹配,但詳細匹配可用于低質(zhì)量的搜索包,并且,當在任何級上找到匹配,則搜索完成。根據(jù)本發(fā)明的這些特征,大大改進了匹配過程的響應(yīng)時間和精度。
下面說明如何構(gòu)造搜索包的詳細例子,計算搜索包的數(shù)量并執(zhí)行匹配。假定給定的主動搜索記錄包括10個指紋,并且如上所述,每個指紋被分級到A、B、C和D質(zhì)量簇。這樣,A簇包含A質(zhì)量的印記。B簇包含B或更高質(zhì)量的印記。C簇包含C或更高質(zhì)量的印記,并且D簇包含D或更高質(zhì)量的印記。因此,A質(zhì)量的印記包含在所有4個簇中,而D質(zhì)量的印記只包含在D簇中。
進一步假定客戶指定的精度要求是d%。并且,根據(jù)相應(yīng)設(shè)計的AFIS系統(tǒng)的質(zhì)量表對數(shù)據(jù)庫中所有A質(zhì)量的指紋,所設(shè)計的AFIS系統(tǒng)要求n1個手指來搜索以獲得d%的精度;對數(shù)據(jù)庫中B或更高質(zhì)量的指紋,該AFIS系統(tǒng)要求n2個手指來搜索以獲得d%的精度;對數(shù)據(jù)庫中C或更高質(zhì)量的指紋,該AFIS系統(tǒng)要求n3個手指來搜索以獲得d%的精度;對數(shù)據(jù)庫中D或更高質(zhì)量的指紋,該AFIS系統(tǒng)要求n4個手指來搜索以獲得d%的精度,其中1≤n1<n2<n3<n4≤10。最后假定在搜索記錄之內(nèi)有m個具有A質(zhì)量印記的手指;m1個具有B或更高質(zhì)量印記的手指;m2個具有C或更高質(zhì)量印記的手指;以及m3個具有D或更高質(zhì)量印記的手指。
根據(jù)上述的假設(shè),可按下述來確定搜索包的數(shù)量M。由于來自搜索記錄有m個具有A質(zhì)量印記的手指,并且為了獲得d%精度,要求n1個具有A質(zhì)量指紋的手指,可以在A簇中構(gòu)造的搜索包的數(shù)量是C(m,n1),其中C(a,b)是眾所周知的二項式系數(shù),即C(a,b)=a!/((a-b)!b!)。類似地,可以在B簇中構(gòu)造的搜索包的數(shù)量是C(m1,n2)??梢栽贑簇中構(gòu)造的搜索包的數(shù)量是C(m2,n3)。以及可以在D簇中構(gòu)造的搜索包的數(shù)量是C(10,n4)。因此,可通過把4個簇的所有組合數(shù)加起來而計算出搜索包的總數(shù)M,即M=C(m,n1)+C(m1,n2)+C(m2,n3)+C(10,n4)即M=m!/((m-n1)!n1!)+m1!/((m1-n2)!n2!)+m2!/((m2-n3)!n3!)+10!/((10-n4)!n4!)下面是特定的例子,其中根據(jù)給定的客戶精度要求構(gòu)造了簇和搜索包。在該例子中,搜索記錄包括10個指紋,其質(zhì)量分布如下手指號12345678910ABCDABACBD而且客戶的精度要求是對百萬規(guī)模的數(shù)據(jù)庫有99.8%命中率和0.01%錯誤命中率。所設(shè)計的AFIS系統(tǒng)在所注冊指紋質(zhì)量的條件下在百萬規(guī)模數(shù)據(jù)庫中可得到根據(jù)下面的精度表的精度性能,其中該數(shù)據(jù)庫具有典型的質(zhì)量分布,15%的A質(zhì)量印記,45%的B質(zhì)量印記,30%的C質(zhì)量印記,以及10%的D質(zhì)量印記。
對A質(zhì)量搜索印記和相應(yīng)的A質(zhì)量配對歸檔印記手指數(shù)1 2 34 >=5命中率98.5% 99.9% 99.99% 99.999% 100%誤中率.01% .01% .01%.01% .01%
對B質(zhì)量搜索印記和相應(yīng)的B質(zhì)量配對歸檔印記手指數(shù)1 2 3 45 >=6命中率88.5% 98.9% 99.8% 99.99% 99.999% 100%誤中率.01% .01% .01% .01%.01% .001%對C質(zhì)量搜索印記和相應(yīng)的C質(zhì)量配對歸檔印記手指數(shù)1 2 3 4 5 6 7 89命中率78.5% 89.9% 95.9% 98.9% 99.5% 99.8% 99.9% 99.99% 100%誤中率.01% .01% .01% .01% .01% .01% .01% .01%.001%對D質(zhì)量搜索印記和相應(yīng)的D質(zhì)量配對歸檔印記手指數(shù)1 2 3 4 5 6 7 8 9 10命中率75.5% 85.9% 90.9% 95.9% 97.9% 98.5% 99.5% 99.8% 99.9% 99.99%誤中率01%.01% .01% .01% .01% .01% .01% .01% .01% .001%根據(jù)系統(tǒng)精度規(guī)格,只需要來自搜索記錄的兩個手指來搜索A質(zhì)量數(shù)據(jù)庫以使得所有A質(zhì)量搜索可達到99.8%的命中率和0.01%的誤中率,即所期望的客戶精度性能。需要來自搜索記錄的3個手指來搜索B或更高質(zhì)量數(shù)據(jù)庫以使得所有B或更高質(zhì)量搜索可到達期望的客戶精度性能。需要來自搜索記錄的6個手指來搜索C或更高質(zhì)量數(shù)據(jù)庫以使得所有C或更高質(zhì)量搜索可到達期望的客戶精度性能,以及需要來自搜索記錄的8個手指來搜索D或更高質(zhì)量數(shù)據(jù)庫以使得所有D或更高質(zhì)量搜索可到達期望的客戶精度性能。
現(xiàn)在可使用上述的公式來確定用于每個質(zhì)量簇A、B、C和D的搜索包。為了達到期望的客戶精度性能,必須對簇A分配兩個手指,并且在具有A質(zhì)量的搜索記錄有3個手指,在A簇中手指號組合數(shù)是C(3,2)=3。因此,在該第一簇中有3個手指號搜索包。這些手指號搜索包是手指1和手指5,即搜索包(15);手指1和手指7,即搜索包(17);以及手指5和手指7,即搜索包(57)。為了達到期望的客戶精度性能,必須對簇B分配3個手指,并且在具有B或更高質(zhì)量的搜索記錄有6個手指,在B簇中手指號組合數(shù)是C(6,3)=20。因此,在該第二簇中有20個手指號搜索包。這些手指號搜索包是125,126,127,129,156,157,159,167,169,179,256,257,259,267,269,279,567,569,579和679。為了達到期望的客戶精度性能,必須對簇C分配6個手指,并且在具有C或更高質(zhì)量的搜索記錄有8個手指,在C簇中手指號組合數(shù)是C(8,6)=28。因此,在該第三簇中有28個手指號搜索包。這些手指號搜索包是125679,125673,125678,125639,125689,125379,125879,123679,128679,135679,185679,325679,825679,125638,125389,123879,138679,385679等。最后,為了達到期望的客戶精度性能,必須對簇D分配8個手指,并且所有的手指都在具有D或更高質(zhì)量的搜索記錄中,在D簇中手指號組合數(shù)是C(10,8)=45。因此,在該第四簇中有45個手指號搜索包。
因此,共有M=3+20+28+45=96個搜索包,并且因此根據(jù)每個搜索包中的手指號和手指數(shù)來檢索過濾歸檔數(shù)據(jù)庫中的歸檔記錄。對照相應(yīng)的手指和相應(yīng)的歸檔記錄在第一搜索包的第一手指的A質(zhì)量簇開始搜索,并且,例如根據(jù)圖2的流程圖示出的方法繼續(xù)處理。
本領(lǐng)域的普通技術(shù)人員應(yīng)該理解,根據(jù)圖像質(zhì)量、用于搜索的手指號和手指數(shù)來索引歸檔數(shù)據(jù)庫,由此非常有效地實現(xiàn)上述的對每個例子的基于給定主動搜索記錄的概念模式。這種動態(tài)索引的方法是根據(jù)搜索包的屬性(圖像質(zhì)量、手指號和手指數(shù))推導(dǎo)出的。按這種方式,可避免根據(jù)圖像質(zhì)量、手指號等把歸檔數(shù)據(jù)庫重新組織到實際的歸檔箱中而帶來的昂貴代價,盡管這樣的實施例也可用于本發(fā)明。
根據(jù)本發(fā)明,一種改進的自動指紋識別系統(tǒng)和方法較之現(xiàn)有技術(shù)可大大改進速度而不喪失識別過程的精度。例如,對AFIS系統(tǒng)的匹配百分比節(jié)省的低限和高限是40%和96%,其中該系統(tǒng)可在下述條件下達到99.9%的命中率用兩個手指,如果所有搜索的和匹配的指紋屬于A質(zhì)量;用4個手指,如果所有搜索的和匹配的指紋屬于B或更高質(zhì)量;用6個手指,如果所有搜索的和匹配的指紋屬于C或更高質(zhì)量;以及用10個手指,如果所有搜索的和匹配的指紋屬于D或更高質(zhì)量。
盡管結(jié)合特定實施例說明了本發(fā)明,本領(lǐng)域的技術(shù)人員容易想到另外的有益效果和改型。從更寬的方面來說,本發(fā)明不限于所說明的特定細節(jié)、說明性的裝置和示例性的例子。在上述說明的啟示下,各種替換、改型和變化是顯而易見的。因此,本發(fā)明不是由所述的說明書來限定,而是根據(jù)權(quán)利要求書的精神和范圍包含所有這些替換、改型和變化。
權(quán)利要求
1.對照包含有多個歸檔記錄的歸檔數(shù)據(jù)庫來比較搜索記錄的方法,所述方法包括步驟a)接收包含至少一個搜索印記的搜索記錄;b)生成至少一個分層簇,每個所述簇具有不同的質(zhì)量下限;c)對每個所述簇生成至少一個相應(yīng)的搜索包,所述搜索包包含至少一個從所述搜索記錄中選擇的搜索印記;d)在未被選擇的簇中,選擇具有最高質(zhì)量下限的簇;e)選擇至少一個對應(yīng)于所選擇簇的搜索包,并根據(jù)所述至少一個所選擇的搜索包來檢索至少一個相對應(yīng)的包含至少一個歸檔印記的歸檔記錄,用于把所述至少一個所選擇的搜索包與所述至少一個相對應(yīng)的檢索的歸檔記錄做比較;以及f)判定是否找到匹配,并且如果沒有找到匹配則返回到步驟d),直到比較了所有的所述歸檔記錄。
2.如權(quán)利要求1所述的方法,其中,在所述至少一個選擇的搜索包中的每個所述搜索印記和在所述至少一個相應(yīng)的檢索的歸檔記錄中的每個所述歸檔印記都具有至少等于所選擇簇的所述質(zhì)量下限的印記質(zhì)量。
3.如權(quán)利要求1所述的方法,其中,每次把所述至少一個選擇的搜索包中的搜索印記與所述至少一個相應(yīng)的檢索的歸檔記錄中的歸檔印記做比較時執(zhí)行所述的判定是否找到匹配的步驟。
4.如權(quán)利要求1所述的方法,其中,所述方法繼續(xù),直到找到匹配或者檢索了所述歸檔數(shù)據(jù)庫中的所有歸檔記錄并與相應(yīng)的搜索包做了比較。
5.如權(quán)利要求1所述的方法,其中,每個所述檢索的歸檔記錄只與任何所述生成的搜索包比較一次。
6.如權(quán)利要求1所述的方法,還包括檢索精度要求并根據(jù)所述精度要求向每個所述簇分配若干手指的步驟。
7.如權(quán)利要求1所述的方法,其中在每個所述選擇的搜索包中的所述至少一個搜索印記對應(yīng)于不同手指號的第一集合;在每個對應(yīng)于所述搜索包的所述檢索的歸檔記錄中的所述至少一個歸檔印記對應(yīng)于不同手指號的第二集合;以及所述手指號的第二集合至少包括所述第一集合的所有手指號。
8.如權(quán)利要求1所述的方法,其中,檢索搜索所述歸檔記錄引起所述歸檔數(shù)據(jù)庫實際被劃分成若干不同的歸檔箱,所述歸檔箱的數(shù)量隨所生成的搜索包的數(shù)量變化。
9.如權(quán)利要求1所述的方法,其中,根據(jù)匹配策略把所述至少一個選擇的搜索包與所述至少一個相應(yīng)檢索的歸檔記錄做比較,所述匹配策略基于淘汰選擇處理,并且還隨對應(yīng)于所述至少一個選擇的搜索包的所述簇的質(zhì)量下限變化。
10.一種分布式匹配器控制器,配置成執(zhí)行包括下述步驟的方法a)接收包含至少一個搜索印記的搜索記錄;b)生成至少一個分層簇,每個所述簇具有不同的質(zhì)量下限;c)對每個所述簇生成至少一個相應(yīng)的搜索包,所述搜索包包含至少一個從所述搜索記錄中選擇的搜索印記;d)在未被選擇的簇中,選擇具有最高質(zhì)量下限的簇;e)選擇至少一個對應(yīng)于所選擇簇的搜索包,并根據(jù)所述至少一個所選擇的搜索包來檢索至少一個相對應(yīng)的包含至少一個歸檔印記的歸檔記錄,用于把所述至少一個所選擇的搜索包與所述至少一個相對應(yīng)的檢索的歸檔記錄做比較;以及f)判定是否找到匹配,并且如果沒有找到匹配則返回到步驟d)。
全文摘要
一種方法包括步驟接收(202)搜索記錄;生成(206)至少一個分層簇,每個具有不同的質(zhì)量下限;對每個簇生成(210)至少一個相應(yīng)的搜索包,所述搜索包具有搜索印記的第一集合;選擇最高質(zhì)量的簇(218)、搜索包(222)和相應(yīng)的歸檔記錄以執(zhí)行搜索(226);判定(230)是否找到相應(yīng)的歸檔記錄中任何歸檔印記與所選擇的搜索包中的任何搜索印記之間的命中;并在剩余的質(zhì)量簇中按照質(zhì)量的降序繼續(xù)這種搜索處理,直到找到匹配,或直到?jīng)]有剩余的歸檔記錄可用于對照其來比較搜索包。
文檔編號G06K9/00GK1902638SQ200480039191
公開日2007年1月24日 申請日期2004年12月22日 優(yōu)先權(quán)日2003年12月29日
發(fā)明者彼得·洛 申請人:摩托羅拉公司