特征點(diǎn)集合間的對應(yīng)方法、對應(yīng)裝置以及對應(yīng)程序的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及對作為特征點(diǎn)集合的2個(gè)對象進(jìn)行比較,確定一個(gè)集合內(nèi)的特征點(diǎn)與 另一個(gè)集合內(nèi)的特征點(diǎn)之間的對應(yīng)的對應(yīng)方法、對應(yīng)裝置以及對應(yīng)程序,其中,所述特征點(diǎn) 具有包括N(N為2以上的自然數(shù))維空間中N個(gè)坐標(biāo)值的坐標(biāo)。
【背景技術(shù)】
[0002] 使N維(N為2以上的自然數(shù))空間中的2個(gè)對象內(nèi)的每個(gè)特征點(diǎn)相對應(yīng)的技術(shù)包 括在各領(lǐng)域的應(yīng)用。在此所述的特征點(diǎn)具有包括與N維空間相對應(yīng)的N個(gè)坐標(biāo)值的坐標(biāo), 并成為對象的要素。特征點(diǎn)也可以具有除坐標(biāo)之外的屬性值。
[0003] 例如,將2維平面上通過筆畫來表現(xiàn)的手寫輸入文字以及為了與其進(jìn)行比較而參 照的模板文字作為對象,可以將雙方各筆畫的起點(diǎn)和終點(diǎn)考慮為特征點(diǎn)。如專利文獻(xiàn)1所 示,這種情況的特征點(diǎn)的對應(yīng)被應(yīng)用于聯(lián)機(jī)文字識別的領(lǐng)域。
[0004] 或者,可以將在由頻率與信號強(qiáng)度這兩軸形成的頻譜的2維平面上表現(xiàn)的音聲信 號作為對象,并將其路徑上的點(diǎn)考慮為特征點(diǎn)。如專利文獻(xiàn)2所示,這種情況的2個(gè)音聲信 號的特征點(diǎn)的對應(yīng)被應(yīng)用于音聲識別的領(lǐng)域。
[0005] 上述任一應(yīng)用領(lǐng)域均為教科書(非專利文獻(xiàn)1)記載的一般性技術(shù)領(lǐng)域。
[0006] 在這些應(yīng)用中,2個(gè)特征點(diǎn)對應(yīng)是指,該2個(gè)特征點(diǎn)與各自對象中其他特征點(diǎn)在2 維平面上的相互位置關(guān)系是相同的。即,相對其他特征點(diǎn)也進(jìn)行對應(yīng),因此,在各自對象中 的相互位置關(guān)系相同,作為整體才會對應(yīng)。
[0007] 此外,對于這些應(yīng)用中的對象,每個(gè)個(gè)體中存在被稱為"失真"或"偏差"的變動, 而使對應(yīng)變難。作為吸收被稱為失真或偏差的變動而進(jìn)行對應(yīng)的方法,已知有被稱作彈性 對應(yīng)的手法之一的DP (動態(tài)規(guī)劃)匹配(專利文獻(xiàn)1、非專利文獻(xiàn)2)。
[0008] DP匹配為最優(yōu)化問題的解決方法,即,對被對應(yīng)的2個(gè)對象中一個(gè)對象內(nèi)的特征 點(diǎn)與另一個(gè)對象內(nèi)的特征點(diǎn)的所有組合確定成本,使1對1的對應(yīng)所形成的組的成本總計(jì) 最小化。如非專利文獻(xiàn)2(2. 1項(xiàng))還記述有"局部距離",該成本還經(jīng)常被稱為距離。實(shí)際 上,成本值中,2個(gè)特征點(diǎn)間的歐幾里德距離也合計(jì)包括在內(nèi)的情形較多。但是,如非專利文 獻(xiàn)4或如專利文獻(xiàn)1中作為以往技術(shù)而記述的,還存在將形狀的差異表現(xiàn)為距離的情形,距 離這一用語并非一定符合幾何學(xué)距離的定義。例如,非專利文獻(xiàn)3(5. 1項(xiàng))的"筆點(diǎn)移動方 向"的值便包括在距離中。
[0009] 如非專利文獻(xiàn)4考慮在DP匹配中,將通過2個(gè)特征點(diǎn)的N維空間的坐標(biāo)而得的歐 幾里德距離包括在成本內(nèi)的情況。如果歐幾里德距離大則成本會變大,2個(gè)特征點(diǎn)相對應(yīng)便 為否定的。即意味著,與各自對象中其他特征點(diǎn)的相互位置關(guān)系上,2個(gè)特征點(diǎn)差異大。反 之,如果該歐幾里德距離小,則意味著2個(gè)特征點(diǎn)在上述相互位置關(guān)系中差異較少。如此, 在DP匹配這樣的對應(yīng)中可以解釋為:由N維空間上的坐標(biāo)而得的特征點(diǎn)間的距離被用作為 在對象內(nèi)特征點(diǎn)的相互位置關(guān)系的差異大小的尺度。以下僅將如該歐幾里德距離這樣被用 作為在對象內(nèi)特征點(diǎn)于N維空間上的相互位置關(guān)系的差異大小的尺度者稱為距離。當(dāng)然不 僅歐幾里德距離,還將曼哈頓距離或不滿足幾何學(xué)距離定義者也稱為距離。而非專利文獻(xiàn) 3中記述的將形狀差異作為距離來進(jìn)行評價(jià)的情形則不稱為距離。
[0010] 上述"失真"或"偏差"從對應(yīng)的觀點(diǎn)來看,可以被理解為以下現(xiàn)象,即,雖然特征 點(diǎn)在對象內(nèi)的相互位置關(guān)系沒有變化,但是N維空間的坐標(biāo)卻產(chǎn)生變動,作為結(jié)果距離也 會產(chǎn)生變動。
[0011] 另一方面,無論應(yīng)用哪種對應(yīng)方法,一般在對應(yīng)之前要對對象客體進(jìn)行某些預(yù)處 理。例如,非專利文獻(xiàn)3 (5. 1項(xiàng))記述了對文字?jǐn)?shù)據(jù)進(jìn)行了"規(guī)范化"。非專利文獻(xiàn)1 (2. 4. 2 項(xiàng))還記述有:作為用于調(diào)整的處理,采用平行移動或放大縮小處理。例如,如果是手寫輸 入的文字,所描繪的文字的位置或大小當(dāng)然不是一律的,因此需要對大小或位置等進(jìn)行修 正。即,在作為對應(yīng)對象的對象中包括變動,該變動作為一般被稱作規(guī)范化的處理的對象。 如非專利文獻(xiàn)3所述,上述特征點(diǎn)間的歐幾里德距離通常也在規(guī)范化后進(jìn)行計(jì)算。
[0012] 現(xiàn)有技術(shù)文獻(xiàn)
[0013] 專利文獻(xiàn)
[0014] 專利文獻(xiàn)1:日本特開平9-179940號公報(bào)
[0015] 專利文獻(xiàn)2:日本特開平6-51793號公報(bào)
[0016] 非專利文獻(xiàn)1:半谷精一郎《生物識別技術(shù)教科書-從原理到編制程序_》日本 CORONA 出版社 2012 年 7 月 ISBN-978-4-339-00835-7
[0017] 非專利文獻(xiàn)2:內(nèi)田誠一《DP匹配概論~基礎(chǔ)與各種擴(kuò)充》日本電子情報(bào)通信學(xué)會 技術(shù)報(bào)告PRM2006-1662006年12月
[0018] 非專利文獻(xiàn)3:稹重弼、迫江博昭《用于筆順·筆畫數(shù)自由聯(lián)機(jī)文字識別的 筆畫對應(yīng)確定法-多層次Cube檢索》日本電子情報(bào)通信學(xué)會論文期刊(D-2)vol. J82-D-2no. 2ρρ· 230-2391999 年 2 月
[0019] 非專利文獻(xiàn)4:小高和己、若原徹、增田功《不依賴于筆順的聯(lián)機(jī)手寫文字識別運(yùn) 算法則》日本電子情報(bào)通信學(xué)會論文期刊(D)vol.J65-D ηο·6ρρ·679-6861982年6月
【發(fā)明內(nèi)容】
[0020] 發(fā)明要解決的問題
[0021] 在包括非專利文獻(xiàn)3所述彈性對應(yīng)的以往對應(yīng)中,在取包含有上述由失真產(chǎn)生的 變動的坐標(biāo)值的坐標(biāo)系中、于N維空間上計(jì)算出的距離被用作為上述成本。因此,對于對應(yīng) 則需要DP匹配等非單純手法。
[0022] 在計(jì)算特征點(diǎn)間的距離時(shí),如果不使用取包含有由失真產(chǎn)生的變動的坐標(biāo)值的坐 標(biāo)系,而是使用取表示上述相互位置關(guān)系本質(zhì)的坐標(biāo)值的坐標(biāo)系,則會產(chǎn)生以下效果,即, 能夠通過更簡單的手法來進(jìn)行對應(yīng),或者即使采用相同的手法,也會為更準(zhǔn)確高速的處理。 并且,如果使用取表示相互位置關(guān)系本質(zhì)的坐標(biāo)值的坐標(biāo)系的話,還會對作為規(guī)范化對象 的變動進(jìn)行吸收。
[0023] 本發(fā)明的目的在于提供特征點(diǎn)的對應(yīng)方法、裝置以及程序,即為,從取包含由失真 產(chǎn)生的變動、或包含作為規(guī)范化對象的變動的坐標(biāo)值的坐標(biāo)系,轉(zhuǎn)換到表示相互位置關(guān)系 本質(zhì)的新坐標(biāo)系,使用該新坐標(biāo)系上的距離的、特征點(diǎn)的對應(yīng)方法、裝置以及程序。
[0024] 解決尚題的摶術(shù)方案
[0025] 本發(fā)明的特征點(diǎn)的對應(yīng)方法的第1構(gòu)成為:一種特征點(diǎn)的對應(yīng)方法,構(gòu)成為,將2 個(gè)以上的特征點(diǎn)作為要素的對象,其中所述2個(gè)以上的特征點(diǎn)均具有包括N(N為2以上的 自然數(shù))維空間中N個(gè)坐標(biāo)值的坐標(biāo),當(dāng)對2個(gè)所述對象進(jìn)行比較、使第1所述對象的所述 特征點(diǎn)與第2所述對象的所述特征點(diǎn)進(jìn)行對應(yīng)時(shí),確定作為對應(yīng)對象的所述特征點(diǎn)之間的 成本,使對應(yīng)的所述特征點(diǎn)之間的所述成本的合計(jì)值變小,以確定對應(yīng),所述特征點(diǎn)的對應(yīng) 方法的特征在于,包括:第1順序坐標(biāo)計(jì)算步驟,確定所述N維空間上彼此不平行的2個(gè)以 上的多個(gè)坐標(biāo)軸,對所述多個(gè)坐標(biāo)軸的每個(gè)坐標(biāo)軸,求算作為所述第1對象要素的所述特 征點(diǎn)在該坐標(biāo)軸上的坐標(biāo)值,求取根據(jù)求算出的該坐標(biāo)值將所述特征點(diǎn)按升序或降序排序 羅列的特征點(diǎn)序列,計(jì)算表示所述特征點(diǎn)在所述序列中的出現(xiàn)順序的整數(shù)值,來作為所述 特征點(diǎn)在該坐標(biāo)軸的順序坐標(biāo)值;第2順序坐標(biāo)計(jì)算步驟,對所述第2對象,也對作為其要 素的所述特征點(diǎn)的所述順序坐標(biāo)值進(jìn)行計(jì)算;成本計(jì)算步驟,將所述第1對象的所述特征 點(diǎn)與所述第2對象的所述特征點(diǎn)這2個(gè)特征點(diǎn)之間的所述成本確定為,包括對所述2個(gè)特 征點(diǎn)在所述多個(gè)坐標(biāo)軸的每個(gè)坐標(biāo)軸上的所述順序坐標(biāo)值的差分進(jìn)行單調(diào)增加而得的計(jì) 算值;以及利用通過所述成本計(jì)算步驟確定的所述成本來確定對應(yīng)的步驟。
[0026] 根據(jù)該構(gòu)成,通過以下2個(gè)效果來吸收由失真產(chǎn)生的變動。第1個(gè)效果為,即使坐 標(biāo)值由于由失真產(chǎn)生的變動而稍微產(chǎn)生變化,順序坐標(biāo)值也會保持為相同的值。
[0027] 第2個(gè)效果為,在所述多個(gè)坐標(biāo)軸中的一部分坐標(biāo)軸上即使有時(shí)順序坐標(biāo)值產(chǎn)生 變動,通過保持其余坐標(biāo)軸上的順序坐標(biāo)值,從而使整體上計(jì)算出的成本的變動被抑制得 較小。
[0028] 并且,在對應(yīng)之前不需要進(jìn)行大小或位置的規(guī)范化。吸收由失真產(chǎn)生的變動,并且 可以解釋為,"利用順序坐標(biāo)值則具有相當(dāng)于DP匹配這樣的彈性對應(yīng)的效果",或"順序坐標(biāo) 值體現(xiàn)了將如彈性對應(yīng)所要處理的失真去除后的本質(zhì)性相互位置關(guān)系"。
[0029] 本發(fā)明的特征點(diǎn)的對應(yīng)方法的第2構(gòu)成的特征在于:對于所述第1構(gòu)成,在所述第 1順序坐標(biāo)計(jì)算步驟和所述第2順序坐標(biāo)計(jì)算步驟中,取代表示所述特征點(diǎn)在所述序列中 的出現(xiàn)順序的整數(shù)值,而是使用將該整數(shù)值通過單調(diào)函數(shù)進(jìn)行轉(zhuǎn)換而得的值來作為所述順 序坐標(biāo)值。
[0030] 根據(jù)該構(gòu)成,即使在作為所述第1對象要素的特