專利名稱:顯示或檢索圖像中的目標的方法及其裝置、計算機程序、計算機系統(tǒng)和計算機可讀存儲媒體的制作方法
技術領域:
本發(fā)明涉及以檢索為目的的在多媒體數(shù)據(jù)庫中保存的圖像那樣的靜止圖像或視頻圖像中出現(xiàn)的目標的顯示,特別是使用這樣的顯示檢索目標的方法和裝置。
背景技術:
在圖像程序庫的圖像的應用程序中,進行視頻圖像或靜止圖像中出現(xiàn)的目標的輪廓及形狀或目標的一部分的有效的顯示和保存。在用于進行附加形狀庫的索引和檢索的眾所周知的方法中,可以使用曲率標度空間(CSS)顯示。關于CSS的詳細情況,可以在論文「利用曲率標度空間的堅固性附加有效的形狀索引」(英國機器影像會報pp.53~62、愛丁堡、英國、1996年)和「利用使用誚標度空間的形狀內(nèi)容附加圖像數(shù)據(jù)庫的索引」(關于智能數(shù)據(jù)庫的IEE專家會議報、倫敦、1996年)中找到。兩篇論文都是Mokhtarian、S.Abbasi和J.Kittler撰寫的,其內(nèi)容在本說明書中是作為參考文獻而引用的。
在CSS顯示中,為了得到目標的輪廓,使用曲率函數(shù),從輪廓上的任意的點開始進行顯示。通過進行使形狀平滑化的一連串的變形,將輪廓的形狀展開,研究曲率函數(shù)。此外,具體而言,就是計算與高斯濾波器的族一起卷積的曲率函數(shù)的導函數(shù)的零交叉。作為曲率標度空間,如所周知,零交叉繪制在曲線圖上。但是,x軸是曲線的正規(guī)化的弧長,y軸是展開參量,特別是應用濾波器的參量。曲線圖上的點形成表示輪廓的特征的環(huán)。構成目標的輪廓的各凸狀或凹狀的部分,與CSS圖像的環(huán)對應。在CSS圖像中,最突起的環(huán)的尖峰的縱坐標用于進行輪廓的顯示。
為了檢索與輸入目標的形狀一致的數(shù)據(jù)庫中的保存圖像的目標,計算輸入形狀的CSS顯示。通過使用匹配算法語言比較各CSS圖像的尖峰的位置和高度,判斷輸入形狀與保存形狀間的類似度。
作為關于眾所周知的CSS顯示的問題,有指定的輪廓的尖峰基于從輪廓上的任意的點開始進行計算的曲率函數(shù)的問題。改變該開始點時,發(fā)生CSS圖像的尖峰沿x軸周期地移位。因此,在計算類似度測定值時,必須考慮所有的可能的移位或至少必須考慮最容易發(fā)生的移位。結果,將增加檢索手續(xù)和匹配手續(xù)的復雜性。
因此,本發(fā)明的目的旨在提供通過處理與圖像對應的信號來表示出現(xiàn)在靜止圖像或視頻圖像中的目標的方法,該方法包括從輪廓上的任意的點開始導出與在目標的輪廓上顯現(xiàn)的特征相關的多個數(shù)值的步驟和對上述值應用指定的分類而得到輪廓的顯示的步驟。最好根據(jù)上述輪廓的CSS顯示導出上述值,另外,上述值最好與CSS峰值對應。
作為本發(fā)明的結果,可以不顯著地降低檢索精度而大幅度地降低關于匹配程序的計算。
發(fā)明的內(nèi)容本發(fā)明的第1方面所述的顯示圖像中的目標的方法是通過處理與靜止圖像或視頻圖像對應的信號來表示在圖像中出現(xiàn)的目標的方法,其特征在于包括從目標的輪廓上的任意的點開始導出與在輪廓上顯現(xiàn)的特征相關的多個數(shù)值的步驟和對該值應用指定的分類而得到輪廓的顯示的步驟。
本發(fā)明的第2方面所述的顯示圖像中的目標的方法,其特征在于作為結果而得到的顯示與輪廓上的開始點無關地進行指定的分類。
本發(fā)明的第3方面所述的顯示圖像中的目標的方法,其特征在于數(shù)值反映曲線上的彎曲點。
本發(fā)明的第4方面所述的顯示圖像中的目標的方法,其特征在于通過使用平滑化參量σ按多個階段將輪廓平滑而生成多個輪廓曲線和通過使用表示各輪廓曲線的曲率的最大值和最小值的值導出表示原來的輪廓的特征的曲線以及通過選擇作為數(shù)值表示特征的曲線的尖峰的縱坐標,來得到輪廓的曲率標度空間的顯示。
本發(fā)明的第5方面所述的顯示圖像中的目標的方法,其特征在于表示特征的曲線的縱坐標與輪廓的弧長參量和平滑化參量對應。
本發(fā)明的第6方面所述的顯示圖像中的目標的方法,其特征在于根據(jù)與平滑化參量對應的尖峰的高度的值將尖峰的縱坐標值進行分類。
本發(fā)明的第7方面所述的顯示圖像中的目標的方法,其特征在于將數(shù)值從最大值開始進行分類。
本發(fā)明的第8方面所述的顯示圖像中的目標的方法,其特征在于將數(shù)值按大小降低的順序進行分類。
本發(fā)明的第9方面所述的顯示圖像中的目標的方法,其特征在于將數(shù)值從最小值開始進行分類。
本發(fā)明的第10方面所述的顯示圖像中的目標的方法是通過處理與靜止圖像或視頻圖像對應的信號來表示在圖像中出現(xiàn)的目標的方法,其特征在于包括為了表示目標的輪廓而導出與在輪廓上顯現(xiàn)的特征相關的多個數(shù)值的步驟和導出使用數(shù)值中的至少2個值間的關系表示顯示的可靠性的系數(shù)的步驟。
本發(fā)明的第11方面所述的顯示圖像中的目標的方法,其特征在于系數(shù)基于數(shù)值中的2個值間的比。
本發(fā)明的第12方面所述的顯示圖像中的目標的方法,其特征在于上述比是2個最大值之比。
本發(fā)明的第13方面所述的顯示圖像中的目標的方法,其特征在于通過使用平滑化參量σ按多個階段將輪廓平滑而生成多個輪廓曲線和通過使用表示用于導出表示原來的輪廓的特征的曲線的各輪廓曲線的曲率的最大值和最小值的值以及通過選擇作為數(shù)值表示特征的曲線的尖峰的縱坐標,來得到輪廓的曲率標度空間的顯示。
本發(fā)明的第14方面所述的顯示圖像中的目標的方法,其特征在于使用第1~9方面的任一方面所述的方法導出上述數(shù)值。
本發(fā)明第15方面所述的檢索圖像中的目標的方法是通過處理與靜止圖像或視頻圖像對應的信號來檢索圖像中的目標的方法,其特征在于包括用2維的輪廓的形式輸入查詢的步驟、使用第1~9方面的任一方面所述的方法導出輪廓的描述符的步驟、取得使用第1~9方面的任一方面所述的方法導出的所保存的圖像中的目標的描述符并將所保存的目標的各描述符與查詢描述符進行比較的步驟和根據(jù)比較而選擇顯示與包含表示查詢與目標間的類似度的程度的對象目標的圖像對應的至少1個結果的步驟。
本發(fā)明第16方面所述的檢索圖像中的目標的方法,其特征在于使用第10~12方面的任一方面所述的方法對于查詢的輪廓和各保存的輪廓導出系數(shù),僅使用指定的分類或使用指定的分類和與系數(shù)有關的某個其他分類進行比較。
本發(fā)明的第17方面所述的顯示圖像中的目標的方法,是通過處理與靜止圖像或視頻圖像對應的信號來表示在圖像中出現(xiàn)的多個目標的方法,其特征在于包括導出與在各目標的輪廓上顯現(xiàn)的特征關聯(lián)的多個數(shù)值的步驟和應用與表示各輪廓的值相同的指定的分類得到各輪廓的顯示的步驟。
本發(fā)明的第18方面所述的顯示或檢索圖像中的目標的裝置,其特征在于適合于執(zhí)行第1~17方面的任一方面所述的方法。
本發(fā)明的第19方面所述的顯示或檢索圖像中的目標的計算機程序,其特征在于適合于執(zhí)行第1~17方面的任一方面所述的方法。
本發(fā)明的第20方面所述的顯示或檢索圖像中的目標的計算機系統(tǒng),其特征在于編程為按照第1~17方面的任一方面所述的方法而動作。
本發(fā)明的第21方面所述的計算機可讀存儲媒體,其特征在于保存用于實現(xiàn)第1~17方面的任一方面所述的方法的計算機可以執(zhí)行的處理。
本發(fā)明的第22方面所述的顯示圖像中的目標的方法,其特征在于和參照附圖在本說明書中說明的實際上相同,顯示靜止圖像或視頻圖像中的目標。
本發(fā)明的第23方面所述的檢索圖像中的目標的方法,其特征在于和參照附圖在本說明書中說明的實際上相同,檢索靜止圖像或視頻圖像中的目標。
本發(fā)明的第24方面所述的顯示或檢索圖像中的目標的計算機系統(tǒng),其特征在于和參照附圖在本說明書中說明的實際上相同。
附圖的簡單說明圖1是視頻數(shù)據(jù)庫系統(tǒng)的框圖。
圖2是目標的輪廓的圖。
圖3是表示圖2的輪廓的CSS顯示的圖。
圖4是表示檢索方法的框圖。
具體實施例方式
下面,參照
本發(fā)明的實施例。
實施例1.
圖1表示本發(fā)明的實施例進行計算機處理的視頻數(shù)據(jù)庫系統(tǒng)。在該系統(tǒng)中,包括計算機形式的控制裝置2、監(jiān)視器形式的顯示裝置4、鼠標形式的指示裝置6、包含保存的靜止圖像和視頻圖像的圖像數(shù)據(jù)庫8和保存在圖像數(shù)據(jù)庫8保存的圖像中出現(xiàn)的目標或目標的幾個部分的描述符的描述符數(shù)據(jù)庫10。
表示在圖像數(shù)據(jù)庫的圖像中出現(xiàn)的有興趣的各目標的形狀的描述符由控制裝置2導出,保存導描述符數(shù)據(jù)庫10中??刂蒲b置2根據(jù)執(zhí)行以下說明的方法的適當?shù)某绦虻目刂贫鴦幼鳎瑢С雒枋龇?br>
第1,對于指定的目標的輪廓,導出該輪廓的CSS顯示。
使用上述論文之一所描述的眾所周知的方法進行該CSS顯示。
此外,具體而言,就是利用映射表現(xiàn)Ψ={(x(u),y(u),u∈
)}表示該輪廓(其中,u是正規(guī)化的弧長參量)。
該輪廓通過使用ID高斯核g(u,ρ)進行卷積(convolve)而平滑,對于ρ的變化,檢查展開(evolving)曲線的曲率零交叉。零交叉使用表示曲率的下述公式進行特定。即k(u,σ)=Xu(u,σ)Yuu(u,σ)-Xuu(u,σ)Yu(u,σ)(Xu(u,σ)2+Yu(u,σ)2)3/2]]>其中,X(u,σ)=x(u)*g(u,σ) Y(u,σ)=y(tǒng)(u)*g(u,σ)并且,Xu(u,σ)=x(u)*gu(u,σ) Xuu(u,σ)=x(u)*guu(u,σ)在上述公式中,*表示卷積,腳標表示導函數(shù)。
曲率零交叉的數(shù)隨ρ的變化而變化,ρ非常高時,Ψ成為零交叉的凸狀的曲線。
零交叉點(u,ρ)描繪在作為CSS圖像空間的曲線圖上。結果,就形成表示原來的輪廓的特征的曲線。于是,特定表示該特征的曲線的尖峰,并抽出對應的縱坐標進行保存。通常,上述結果給出n個坐標對((x1,y1)、(x2,y2)、...(xn,yn))的組(其中,n是尖峰的數(shù)、xi是第i個尖峰的弧長的位置、yi是尖峰的高度)。
表示該特征的曲線的分類和位置以及對應的尖峰在CSS圖像空間中出現(xiàn)時,與上述曲率函數(shù)的開始點有關。在本發(fā)明中,尖峰的縱坐標使用專用的分類函數(shù)進行再分類。
利用尖峰索引{1...n}與新的集合的索引{1...n}的1對1映射T進行分類。
在本實施例中,縱坐標的對通過考慮y縱坐標的尺寸進行分類。第1,選擇最大尖峰。假定第k個尖峰最突起。這時,在數(shù)值進行了分類的集合中,(xk,yk)成為第1個坐標。換言之,就是T(k)=1。同樣,其他的尖峰的縱坐標按尖峰的高度的降低順序進行再分類。在2個尖峰具有相同的高度時,具有與上述縱坐標對的x坐標最接近的x坐標的尖峰配置為第1。換言之,具有原來的索引i的各縱坐標對被分配給新的索引。但是,T(i)=j,并且yj>=y(tǒng)(j+1)。另外,各值xi符合-xk的周期的移位。
作為特定的例子,從圖2所示的輪廓可以得到圖3所示的CSS圖像的結果。CSS圖像的曲線的尖峰的縱坐標的詳細情況示于以下的表1。
表1
這些尖峰使用上述分類方法進行分類。即,縱坐標按尖峰的高度降低的順序進行分類。另外,x縱坐標都向零的方向咬與最大尖峰的原來的x縱坐標相等的量。結果,便形成示于以下表2中的進行了再分類的尖峰坐標。
表2
利用這些進行了再分類的尖峰的縱坐標,對保存在數(shù)據(jù)10中的目標的輪廓形成描述符的數(shù)據(jù)庫。在本實施例中,按表2所示的分類順序保存尖峰的縱坐標?;蛘撸部梢耘c表示新的分類順序的關聯(lián)的索引一起保存縱坐標。
實施例2.
下面,說明實施例2的表示目標的輪廓的代替方法。
表示輪廓的CSS顯示按上述方式導出。但是,尖峰的縱坐標的分類與上述實施例1的分類不同。此外,具體而言,第1,選擇最大尖峰。假定尖峰k是最突起的尖峰。這時,(xk,yk)在尖峰的分類集合中成為第1個尖峰。其后的尖峰對于原來的索引i的尖峰的縱坐標,成為T(i)=J并且xj<=x(j+1)。另外,所有的值xi都向下方咬與原來的尖峰k的原來的x縱坐標相等的量xk。
換言之,在實施例2的方法中,選擇最大尖峰,配置到第1位,然后,其余的尖峰按照從最大尖峰開始的原來的順序進行配置。
以下的表3表示按照實施例2進行分類的表1的峰值的表。
表3
在上述實施例1和2的展開中,可靠性系數(shù)(CF)與形狀的各顯示相關聯(lián)。CF根據(jù)指定形狀的第2最大峰值與最大峰值之比來計算。
對于圖2所示的輪廓,CF值為CF=1001/2120。在本例中,通過使CF最接近于0.1而進行量化處理,減少存儲要件。因此,在本例中,CF=0.5。
本例的CF值是顯示的痂度即唯一性的反映。在本例中,接近于1的CF值意味著可靠性低,接近于零的CF值表示可靠性高。換言之,如果2個最大峰值越接近,顯示正確的可能性就越小。
進行以下說明的匹配順序時,CF值可以成為有益的數(shù)值。
實施例3.
下面,參照作為表示檢索方法的框圖的圖4說明根據(jù)本發(fā)明的實施例檢索圖像中的目標的方法。
在本例中,在圖1的系統(tǒng)的描述符數(shù)據(jù)庫10中,與關聯(lián)的CF值一起保存著按照上述第1分類方法導出的描述符。
用戶使用指示裝置通過在顯示器上描繪目標的輪廓,開始進行檢索(步驟410)。其次,控制裝置2導出輸入輪廓的CSS顯示,按照與對數(shù)據(jù)庫中的圖像所使用的函數(shù)相同的分類函數(shù)進行尖峰的縱坐標的分類,得到表示輸入輪廓的描述符(步驟420)。然后,控制裝置2通過計算第2最大峰值與最大峰值的比率,來計算輸入輪廓的CF值,并進行該結果的量化處理(步驟430)。
然后,控制裝置2將輸入輪廓的CF值與指定的閾值進行比較(步驟440)。在本例中,該閾值是0.75。表示對輸入描述符的精度的相對的高的可靠性,在CF值比該閾值低時,下一個步驟就是考慮現(xiàn)在考慮中的模型(即保存在數(shù)據(jù)庫中的圖像)的CF值的步驟。在模型的CF仍然比閾值低時(步驟450),僅使用指定的分類順序的各描述符進行輸入描述符與模型的比較(步驟460)。在輸入描述符或模型的CF大于閾值時,通過將輸入描述符中的縱坐標值的所有的可能的不同的分類順序與數(shù)據(jù)庫中的模型描述符進行比較,來進行匹配(步驟470)。
在數(shù)據(jù)庫中,各描述符的類似度測定值使用作為結果而得到的適當?shù)乃惴ㄕZ言進行匹配比較。也可以使用在上述論文中說明的眾所周知的匹配算法語言。下面,簡單地說明該匹配順序。
給定2個閉合的輪廓的形狀、圖像曲線Ψi和模型曲線Ψm和這些曲線的尖峰的設定值{(xi1,yi1),(xi2,yi2),..,(xin,yin)}和{(xm1,ym1),(xm2,ym2),..,(xmn,ymn)},可以計算類似度測定值。類似度測定值定義為圖像中的尖峰與模型中的尖峰的匹配的總代價。使總成本最小化的匹配使用動態(tài)程序設計進行計算。利用算法語言,從模型得到的尖峰反饋給從圖像得到的尖峰進行匹配,進行這種匹配的各種代價的計算。可以使各模型的尖峰與唯一的圖像尖峰進行匹配,也可以使各圖像的尖峰與唯一的模型尖峰進行匹配。在模型和/或圖像尖峰中有時也有仍然不匹配的尖峰,對于未匹配的尖峰,存在追加的損失代價。在2個尖峰的水平距離小于0.2時,可以使2個尖峰匹配。匹配的代價就是2個匹配的尖峰件的直線長度。未匹配的尖峰的代價是其高度。
更詳細而言,就是算法語言通過作成并擴張與節(jié)點匹配的尖峰對應的樹狀的結構而前作用。
1.作成由圖像(xik,yik)的最大值與模型(xir,yir)的最大值構成的開始節(jié)點。
2.對圖像尖峰的最大值的80%以內(nèi)的各其余的模型尖峰作成追加的開始節(jié)點。
3.將上述1和2作成的各開始節(jié)點的代價初始化為該開始節(jié)點與鏈接的圖像尖峰和模型尖峰的y坐標之差的絕對值。
4.對上述3的各開始節(jié)點計算作為在該開始節(jié)點匹配的模型尖峰與圖像尖峰的x(水平)坐標之差而定義的CSS移位參量α。移位參量對各節(jié)點是不同的。
5.對各開始節(jié)點作成模型尖峰的列表和圖像尖峰的列表。在該列表中包含關于哪個尖峰還未匹配的信息。對于各開始節(jié)點,對于“已匹配的”,就給在該節(jié)點已匹配的尖峰加上標志,而對其他所有的尖峰則作為“未匹配的”也給加上標志。
6.反饋擴大最低代價的節(jié)點,直至滿足下述8的條件(從在步驟1~6作成的各節(jié)點開始,各節(jié)點的子節(jié)點位于其后)。為了擴大節(jié)點,使用以下的步驟。
7.節(jié)點的擴大在存在仍然未匹配的至少1個圖像還1個模型尖峰時,選擇未匹配的最大的標度圖像曲線CSS的最大值(xip,yip)。將應用(在步驟4計算的)開始節(jié)點移位參量所選擇的最大值映射導模型CSS圖像上,選擇的尖峰具有坐標(xip-alpha,yip)。決定未匹配的最近的模型曲線尖峰(xms,yms)。在2個尖峰間的水平距離小于0.2(即|xip-alpha-xms|<0.2)時,就使2個尖峰匹配,作為2個尖峰間的直線的長度,定義匹配的代價。將匹配的代價加到該節(jié)點的總代價上。對于匹配的尖峰,通過作為“已匹配的”加上標志,從各列表中除去已匹配的尖峰。在2個尖峰間的水平距離大于0.2時,圖像尖峰(xip,yip)就不能進行匹配。這時,就將圖像尖峰的高度yip加到總代價上,通過給“已匹配的”尖峰加上標志,將尖峰(xip,yip)從圖像尖峰表中除去。
在不滿足上述條件(只存在未匹配的圖像尖峰或只存在未匹配的模型尖峰)時,就置于仍然未匹配的狀態(tài)。
作為未匹配的圖像尖峰或模型尖峰的增高的高度,定義匹配的代價,并將尖峰從列表中除去。
8.在上述7擴大節(jié)點之后,在圖像列表和模型列表中都不存在未匹配的尖峰時,就結束匹配處理。該節(jié)點的代價就是圖像與模型曲線間的類似度測定值。在存在尖峰時,就返回到上述7,擴大最低代價的節(jié)點。
將圖像曲線峰值與模型曲線峰值進行交換,反復進行上述步驟。最終匹配值是這2個峰值中的低的一方的值。
作為另一個例子,對于分類的順序的各位置,計算輸入的x值與和其對應的模型的x值間的距離和輸入的y值與和其對應的模型的y值間的距離。計算所有位置的合距離,合距離越小,匹配的程度越接近。在輸入輪廓與模型的尖峰的樹不同時,在合距離中就包含其余的未匹配的峰值的高度。
對數(shù)據(jù)庫的各模型反復進行上述步驟(步驟480)。
將匹配比較的結果而產(chǎn)生的類似度值進行分類(步驟490),然后,在顯示裝置4上向用戶顯示與具有表示最近的匹配值(即,在本例中最低的類似度值)的類似度值的媒質(zhì)符對應的目標(步驟500)。顯示對象的目標樹用戶可以預先設定或選擇。
在上述實施例中,在CF值大于閾值時,就考慮匹配時輸入描述符值的所有的可能的順序。但是,也可以不必考慮所有的可能的順序,而代之以僅考慮原來的CSS顯示的幾個猴所有的周期的移位的幾個可能的順序。此外,在上述實施例中,閾值設定為0.75,但是,該閾值也可以設定為不同的電平。例如,在閾值設定為零時,就通過幾個或所有的可能的順序的分析進行所有的匹配。因此,與閾值大于零的情況相比,將增加必要的計算量,但是,尖峰已進行了分類,峰值的x坐標已對特定的開始點或目標旋轉進行了調(diào)整,所以,與未進行這樣的調(diào)整的原來的系統(tǒng)相比,所需要的計算量還是降低了。因此,通過將閾值設定為零,可以減少若干計算,檢索性能和原來的系統(tǒng)完全相同。
或者,將閾值設定為1時,使用僅保存的順序進行匹配。這時,檢索精度只降低一點點,卻可以顯著地減少所需要的計算量。
對于上述實施例,可以進行各種各樣的變更。例如,也可以利用其他的分類方法,取代實施例1和實施例2說明的CSS尖峰的總坐標值的分類。也可以按例如尖峰的高度升高的順序配置總坐標值,取代按尖峰的高度降低的順序進行配置。也可以在匹配步驟中進行分類,而取代將分類的值保存在數(shù)據(jù)庫中。
產(chǎn)業(yè)上利用的可能性本發(fā)明的系統(tǒng),可以設置在例如圖像程序庫中。或者,數(shù)據(jù)庫可以通過因特網(wǎng)那樣的網(wǎng)絡利用電話線的暫時的鏈接與控制裝置連接,配置在距離系統(tǒng)的控制裝置遠的地方。例如,圖像數(shù)據(jù)庫和描述符數(shù)據(jù)庫可以設置在永久存儲裝置或ROM及DVD那樣的便攜式的存儲媒體中。
以上說明的系統(tǒng)的結構要素,可以用軟件或硬件的形式進行設置。以上用計算機系統(tǒng)的形式說明了本發(fā)明,但是,本發(fā)明也可以使用專用芯片等用其他形式來實現(xiàn)。
以上給出了表示目標的2D形狀的方法和計算表示2個形狀間的類似度的值的方法的特定的例子,但是,同樣也可以使用任意的適當?shù)姆椒ā?br>
例如,為了確認的目的,進行目標圖像的匹配或進行環(huán)形濾波也可以使用本發(fā)明。
權利要求
1.一種通過處理與靜止圖像或視頻圖像對應的信號來表示在圖像中出現(xiàn)的目標的方法,其特征在于包括從目標的輪廓上的任意的點開始導出與在輪廓上顯現(xiàn)的特征相關的多個數(shù)值的步驟和對該值應用指定的分類而得到輪廓的顯示的步驟。
2.按權利要求1所述的顯示圖像中的目標的方法,其特征在于作為結果而得到的顯示與輪廓上的開始點無關地進行指定的分類。
3.按權利要求1所述的顯示圖像中的目標的方法,其特征在于上述數(shù)值反映上述曲線上的彎曲點。
4.按權利要求1所述的顯示圖像中的目標的方法,其特征在于通過使用平滑化參量σ按多個階段將輪廓平滑而生成多個輪廓曲線和通過使用表示各輪廓曲線的曲率的最大值和最小值的值導出表示原來的輪廓的特征的曲線以及通過選擇作為上述數(shù)值表示特征的曲線的尖峰的縱坐標,來得到上述輪廓的曲率標度空間的顯示。
5.按權利要求4所述的顯示圖像中的目標的方法,其特征在于表示上述特征的曲線的縱坐標與上述輪廓的弧長參量和上述平滑化參量對應。
6.按權利要求5所述的顯示圖像中的目標的方法,其特征在于根據(jù)與上述平滑化參量對應的尖峰的高度的值將上述尖峰的縱坐標值進行分類。
7.按權利要求1~6的任一權項所述的顯示圖像中的目標的方法,其特征在于上述值從最大值開始進行分類。
8.按權利要求7所述的顯示圖像中的目標的方法,其特征在于上述值按大小降低的順序進行分類。
9.按權利要求1~6的任一權項所述的顯示圖像中的目標的方法,其特征在于上述值從最小值開始進行分類。
10.一種通過處理與靜止圖像或視頻圖像對應的信號來表示在圖像中出現(xiàn)的目標的方法,其特征在于包括為了表示目標的輪廓而導出與在上述輪廓上顯現(xiàn)的特征相關的多個數(shù)值的步驟和導出使用上述數(shù)值中的至少2個值間的關系表示上述顯示的可靠性的系數(shù)的步驟。
11.按權利要求10所述的顯示圖像中的目標的方法,其特征在于上述系數(shù)基于上述值中的2個值間的比值。
12.按權利要求11所述的顯示圖像中的目標的方法,其特征在于上述比是2個最大值之比。
13.按權利要求10~12的任一權項所述的顯示圖像中的目標的方法,其特征在于通過使用平滑化參量σ按多個階段將輪廓平滑而生成多個輪廓曲線和通過使用表示用于導出表示原來的輪廓的特征的曲線的各輪廓曲線的曲率的最大值和最小值的值以及通過選擇作為上述數(shù)值表示上述特征的曲線的尖峰的縱坐標,來得到上述輪廓的曲率標度空間的顯示。
14.按權利要求10所述的顯示圖像中的目標的方法,其特征在于使用權利要求1~9的任一權項所述的方法導出上述值。
15.一種通過處理與靜止圖像或視頻圖像對應的信號來檢索上述圖像中的目標的方法,其特征在于包括用2維的輪廓的形式輸入查詢的步驟、使用權利要求1~9的任一權項所述的方法導出輪廓的描述符的步驟、取得使用權利要求1~9的任一權項所述的方法導出的所保存的圖像中的目標的描述符并將所保存的目標的各描述符與上述查詢描述符進行比較的步驟和根據(jù)該比較而選擇顯示與包含表示上述查詢與上述目標間的類似度的程度的對象目標的圖像對應的至少1個結果的步驟。
16.按權利要求15所述的檢索圖像中的目標的方法,其特征在于使用權利要求10~12的任一權項所述的方法對于上述查詢的輪廓和各保存的輪廓導出系數(shù),僅使用指定的分類或使用上述指定的分類和與上述系數(shù)有關的某個其他分類進行比較。
17.一種通過處理與靜止圖像或視頻圖像對應的信號來表示在上述圖像中出現(xiàn)的多個目標的方法,其特征在于包括導出與在各目標的輪廓上顯現(xiàn)的特征關聯(lián)的多個數(shù)值的步驟和應用與表示各輪廓的上述值相同的指定的分類得到各輪廓的顯示的步驟。
18.一種顯示或檢索圖像中的目標的裝置,其特征在于適合于執(zhí)行權利要求1~17的任一權項所述的方法。
19.一種顯示或檢索圖像中的目標的計算機程序,其特征在于適合于執(zhí)行權利要求1~17的任一權項所述的方法。
20.一種顯示或檢索已編程的圖像中的目標的計算機系統(tǒng),其特征在于按照權利要求1~17的任一權項所述的方法而動作。
21.一種計算機可讀存儲媒體,其特征在于保存可以由用于實現(xiàn)權利要求1~17的任一權項所述的方法的計算機執(zhí)行的處理。
22.一種和參照附圖在本說明書中說明的實際上相同的顯示靜止圖像或視頻圖像中的目標的方法。
23.一種和參照附圖在本說明書中說明的實際上相同的檢索靜止圖像或視頻圖像中的目標的方法。
24.一種和參照附圖在本說明書中說明的實際上相同的顯示或檢索圖像中的目標的計算機系統(tǒng)。
全文摘要
一種通過處理與圖像對應的信號來表示在靜止圖像或視頻圖像中出現(xiàn)的目標的方法,通過處理與圖像對應的信號來表示在靜止圖像或視頻圖像中出現(xiàn)的目標的方法包括從目標的輪廓上的任意的點開始導出與在輪廓上顯現(xiàn)的特征相關的多個數(shù)值的步驟和對該值應用指定的分類而得到輪廓的顯示的步驟。
文檔編號G06K9/48GK1967543SQ200610149588
公開日2007年5月23日 申請日期2000年7月3日 優(yōu)先權日1999年7月5日
發(fā)明者M·Z·波伯 申請人:三菱電機株式會社