專利名稱:一種基于視覺特征的圖片搜索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖片的識別與搜索技術(shù),特別是涉;sut"圖片特征變量的選擇與對圖片 特征譜線的分析與提取方法及其在圖片的識別與搜索中的應用。
背景技術(shù):
基于視覺特征或基于內(nèi)容的圖片搜索技^f究從第 一個商業(yè)化的基于內(nèi)容的圖像 和動態(tài)景M索系統(tǒng)一-IBM公司的QBIC到現(xiàn)在已經(jīng)有十幾年的歷i了。
現(xiàn)將當前世界上主要的類似技術(shù)做一介紹
1. QBIC(Query By I咖ge Content)圖<綠索系統(tǒng)是IBM公司90年代開發(fā)制作 的圖像和動態(tài)景^r索系統(tǒng),是第一個基于內(nèi)容的商業(yè)化的圖#^索系統(tǒng).QBIC系統(tǒng)提供了 多種的查詢方式,包括利用標準范圖(系統(tǒng)自身提供)檢索,用戶繪制簡圖或掃描輸入圖 像進行檢索,選擇色彩或結(jié)構(gòu)查詢方式,用戶輸入動態(tài)影象片段和前景中運動的對勤全索。 在用戶輸入圖像、簡圖或影象片段時,QBIC對輸入的查詢圖像進行顏色、紋理、形狀等特征 進行分析和抽取,然后根據(jù)用戶選擇的查詢方式分別進行不同的處理。QBIC中使用的顏色特 征有色彩百分比、色彩位置分布等;使用的玟理特征是根據(jù)Tamura提出的故理表示的一種 改進,即結(jié)合了M度、對比度和方向性的特性;使用的形狀特征有面積、圓形度、偏心度、 主軸偏向和一組代數(shù)矩不變量。QBIC還是少數(shù)幾個考慮了高維特征索引的系統(tǒng)之一。
QBIC除了上面的基于內(nèi)容特性的檢索,還輔以文本查詢手段。
2. Virage是由Virage公司開發(fā)的基于內(nèi)容的圖^b^索引擎.同QBIC系統(tǒng)一樣, 它也支持基于色彩、顏色布局、紋理和結(jié)構(gòu)等視覺特征的圖傳輪索。
VIRAGE公司的VIR (Visual Information Retrieval)圖像引擎提供了四種可視 屬性檢索(顏色、成分、紋理和形狀)。每種屬性^J昧予0到10的權(quán)值。通過顏色特性檢索 是最簡單明了的,該軟件對選出的基礎(chǔ)圖像的色調(diào)、色彩以及飽合度進行分析,然后在圖像 庫中查找與這些顏色屬性最接近的圖像。成分(composition)特性指相關(guān)顏色區(qū)域的近似程 度。用戶可以設(shè)定一個或多個屬性權(quán)值來優(yōu)化檢索。要達到最佳平衡度需要反復試驗,但 檢索過程是相當快的。在結(jié)果顯示矩陣中可以選擇查看3、 6、 9、 12、 15或18個簡圖。通過 對四個屬性權(quán)值的調(diào)整,顯示出不同的檢索結(jié)果。簡閨是根據(jù)相似度降序排列。點擊簡圖標 題將得到該圖像的一些詳細說明,包括Virage計算出的相似比。
3. RetrievalWare是由Excalibur科技有限公司開發(fā)的一種基于內(nèi)容的圖像檢 索工具。早期版本中,可以看到該系統(tǒng)的重點在于運用神經(jīng)網(wǎng)絡(luò)算法實現(xiàn)閨像檢索。在比較 新的版本中r提供基于6種圖像屬性的檢索,分別是顏色、形狀、紋理、顏色結(jié)構(gòu)、亮度結(jié) 構(gòu)和縱橫比。顏色屬性是對圖像的顏色及其所占的比率進行測定,但并不包括對顏色的結(jié)構(gòu) 或位置的測定,這一項是由顏色結(jié)構(gòu)屬性控制的;形狀屬性指圖像中物體的輪廓或線條的相 對方位、彎曲度及對比度;紋理屬性是指圖像的平滑度或粗糙度, 一幅圖的表面特性;亮度 屬性是指構(gòu)成圖像的象素組合的亮度。
4. Photobook是美國麻省理工學院的多媒體實驗室所開發(fā)的用于圖像查詢和瀏覽 的交互工具。它由三個子系統(tǒng)組成,分別負責提取形狀、紋理、面部特征。因此,用戶可以 在這三個子系統(tǒng)中分別進行基于形狀、基于玟理和基于面部特征的圖像檢索。
5. VisualSEEK是基于視覺特征的檢索工具,WebSEEK是一種面向兩的文本或 圖4綠索引擎。這兩個檢索系統(tǒng)都是由哥倫比亞大學開發(fā)的。它們的主要特點是采用了圖像 區(qū)域之間空間關(guān)系和M縮域中提取的視覺特征。系統(tǒng)所采用的視覺特征是利用顏色集和基 于小波變換的紋理特征。Visual SEEK同時支持基于視覺特征的查詢和基于空間關(guān)系的查詢。 WebSEEK包括三個主要模塊圖像/視頻釆集模塊,主題分類和索引模塊,查找、瀏覽和檢索模塊'
毫無例外的,在這些基于視覺特征或基于內(nèi)容的圖片搜索技術(shù)中,紋理和形狀是 不同的兩種屬性。復雜的算法與結(jié)構(gòu)使得對使用這些技術(shù)的用戶的知識結(jié)構(gòu)要求是比較高的, 算法復雜,數(shù)據(jù)處理量偏大,人工干預多的特點對大規(guī)模商業(yè)運營的成本壓力也是顯而易見 的。
(三)
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問 _:在圖片的識別與搜索中,選擇合適的圖片特征變 量并對圖片特征變量特征譜線進行分析,采用減少處理數(shù)據(jù)量的特征值提取方法,降低大眾 普及使用的難度。
由于客戶端處理數(shù)據(jù)量小,易于搮作,可以廣泛適用于互聯(lián)網(wǎng)困片搜索引擎、移 動終端圖片搜索等領(lǐng)域。
又由于可以根據(jù)用戶意愿隨意確定搜索的有效區(qū)域與內(nèi)容,還可以用于用戶^AL 計算機的圖片搜索領(lǐng)域。
為解決以上技術(shù)問題,本發(fā)明在公開了以下技術(shù)方案。
(四)
具體實施例方式
一種基于視覺特征的圖片搜索方法的實現(xiàn),包括
將圖片的色相、飽和度、亮度、^JL和平面位置等特征變量數(shù)量化并賦值。 將圖庫中的圖片文件按照設(shè)定幾何尺寸轉(zhuǎn)為標準縮略圖。
獲取標準縮略圖每個像素點的色相、飽和度、亮度、灰度和平面位置數(shù)值,形成 標準縮略圖單一特征變量的一次特征數(shù)據(jù)庫.
對標準縮略圖按照設(shè)定的不同識別精度分析,形成單一特征變量的躍變邊界線。 并由全部的躍變邊界線形成每個圖片文件標準縮略圖的單一特征變量的特征鐠線.全部圖片 文件標準縮略圖的單一特征變量特征譜線形成該特征變量的二次特征數(shù)據(jù)庫。
單一特征變量躍變邊界線上每個像素點位置的切線方向形成該特征變量的三次特
征數(shù)據(jù)庫。
一次特征數(shù)據(jù)庫、二次特征數(shù)據(jù)庫與三次特征數(shù)據(jù)庫形成圖庫圖片標準縮略圖的 全特征數(shù)據(jù)庫。全特征數(shù)據(jù)庫與圖庫中圖片文件的URL (Uniform Resoure Locator)關(guān)聯(lián)。
搜索時,在作為樣本文件的圖片上,以計算M入設(shè)備取得的通過"搜索目標" 的一條或多條連續(xù)或不連續(xù)曲線作為"搜索條件"。對"搜索條件"與躍變邊界線的交集,按 照其色相、飽和度、亮度、灰度、平面位置和躍變邊界線在該像素點(點蔟)上的切線方向 等數(shù)值與全特征數(shù)據(jù)庫進行比對,完成單一特征變量或多特征變量組合搜索。
搜索的結(jié)果返回為與"搜索條件"吻合程度符合預先設(shè)定的圖片以及其URL。 本技術(shù)方案中涉及的下列詞匯是指 "圖庫"本地計算機的圖片存^i殳備或搜索引擎在網(wǎng)絡(luò)中能4^到的圖片。 "標準縮略圖"按照搜索準度與文件大小平衡而確定地固定尺寸縮略圖。
"躍變邊界線"按照單一特征變量的識別精度,發(fā)生數(shù)值變化像素點連線的中點 順序連接而成的圓滑曲線。由于在當前的顯示技術(shù)中的像素表達導致躍變邊界線不落在任何 像素點上,實際處理時,以躍變邊界線兩側(cè)的像素點形成的兩條曲線分別計算。
權(quán)利要求
1、一種基于視覺特征的圖片搜索方法,其特征在于,包括將圖庫中的圖片按照設(shè)定幾何尺寸轉(zhuǎn)為標準縮略圖,再以標準縮略圖上每個像素點色相、飽和度、亮度、灰度、平面位置、單一特征變量的躍變邊界線和躍變邊界線在其上每像素點處的切線方向為特征變量形成全特征數(shù)據(jù)庫并與該圖片的URL(Uniform ResoureLocator)關(guān)聯(lián)。標準縮略圖按照設(shè)定的識別精度,形成單一特征變量的躍變邊界線。并由全部的躍變邊界線形成該圖片的單一特征變量譜線。搜索時,在作為樣本文件的圖片上,以計算機輸入設(shè)備取得的任意的點、連續(xù)或不連續(xù)曲線作為“搜索條件”。對“搜索條件”與躍變邊界線的交集,按照其色相、飽和度、亮度、灰度、平面位置和躍變邊界線在該像素點(點簇)上的切線方向進行單一特征變量或多特征變量組合搜索。搜索的結(jié)果返回為與“搜索條件”吻合程度符合預先設(shè)定的圖片以及其URL。
2、 根據(jù)權(quán)利要求l所述的方法,其中標準縮略圖是指按照搜索準度與文件大小平衡而 確定的固定尺寸縮略圖。
3、 根據(jù)權(quán)利要求1所述的方法,其中全特征數(shù)據(jù)庫是指對圖片的標準縮略圖按照色相、 飽和度、亮度、灰度和平面位置等特征變量的數(shù)值做出的描述。全特征數(shù)據(jù)庫包括一次特 征數(shù)據(jù)庫、二次特征數(shù)據(jù)庫與三次特征數(shù)據(jù)庫。其中,標準縮略圖每個像素點的色相、飽和度、亮度、灰度和平面位置數(shù)值, 形成標準縮略圖一次特征數(shù)據(jù)庫;標準縮略圖的單一特征變量躍變邊界線譜線形成該特征 變量的二次特征數(shù)據(jù)庫;標準縮略圖單一特征變量躍變邊界線在躍變邊界線上每個像素點 位置的切線方向形成三次特征數(shù)據(jù)庫。
4、 根據(jù)權(quán)利要求1所述的方法,其中躍變邊界線是指按照單一特征變量的識別精度, 發(fā)生數(shù)值變化像素點連線的中點順序連接而成的圓滑曲線。由于在當前的顯示技術(shù)中的像 素表達導致躍變邊界線不落在任何像素點上,實際處理時,以躍變邊界線兩側(cè)的像素點形 成的兩條曲線分別計算。
全文摘要
本發(fā)明涉及圖片的識別與搜索技術(shù)。以圖片的標準縮略圖為對象,將色相、飽和度、亮度、灰度和平面位置等特征變量數(shù)量化并賦值。并在此基礎(chǔ)上,形成單一特征變量的躍變邊界線的集合--單一特征變量的特征譜線。對單一特征變量的躍變邊界線逐像素點作切線,以切線的方向為該像素點的單一特征變量的特征值。操作簡單,無需用戶擁有專業(yè)知識背景。以用戶輸入的曲線與單一特征變量的特征譜線的交點特征值為識別圖片的基礎(chǔ)數(shù)據(jù)。搜索時,客戶端與服務器端處理數(shù)據(jù)量都比較小。本發(fā)明可以廣泛適用于圖片識別、互聯(lián)網(wǎng)圖片搜索引擎、移動終端圖片搜索等領(lǐng)域。也可以與“關(guān)鍵字”搜索結(jié)合,對現(xiàn)有圖片搜索方式進行優(yōu)化。
文檔編號G06F17/30GK101556611SQ200910107050
公開日2009年10月14日 申請日期2009年5月8日 優(yōu)先權(quán)日2009年5月8日
發(fā)明者白青山 申請人:白青山