專利名稱:一種視頻或圖像視點(diǎn)類型的識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻處理與識別研究領(lǐng)域,特別涉及一種視頻或圖像視點(diǎn)類型的識別方法。
背景技術(shù):
隨著顯示技術(shù)和數(shù)字多媒體技術(shù)的發(fā)展,人們越來越傾向于真實(shí)的視覺體驗(yàn),立體顯示技術(shù)被看作是下一代顯示技術(shù),立體顯示是利用人的左右眼觀看到的場景具有一定的視差而形成3D模型,進(jìn)而感受到物體具有遠(yuǎn)近之分,像是真實(shí)的立體場景。目前3D顯示器可以顯示2個、8個、9個等各種視點(diǎn)視頻的視頻源,有些3D顯示器甚至可以對2D/3D進(jìn)行切換。視頻種類多樣,極大的豐富了 3D世界,快速的推動3D顯示技術(shù)的應(yīng)用。2D平面顯示是現(xiàn)在視頻的主流,對于3D顯示器而言,兼容2D無疑是明智的選擇,兩視點(diǎn)即左右圖格式視頻源,包括各種偏振光形式,紅藍(lán)形式是目前各種3D顯示器的主流視頻格式,能較輕易的實(shí)現(xiàn),用戶只需要帶著紅藍(lán)眼鏡就能看到3D效果,但此類視頻需要戴著眼鏡,體驗(yàn)效果相對較差,也只能是從單一的角度看到立體效果,相對而言,8視點(diǎn)、9視點(diǎn)等格式的多視點(diǎn)技術(shù)是未來發(fā)展的主要方向,能在裸眼3D上展示出較好的效果,對于未來的立體顯示設(shè)備,如果能夠全部兼容2D、兩視點(diǎn)、多視點(diǎn)則其應(yīng)用范圍將大大擴(kuò)大。對此,如何能快速智能地識別各種視頻源,從而做出相應(yīng)的排圖顯示,無疑是非常重要的。對此,目前的視頻格式還沒有形成統(tǒng)一的標(biāo)準(zhǔn),因此視頻格式的自動識別成了一個難題,已有的方法有通過加入額外的識別碼進(jìn)行識別等,但是由于不同視點(diǎn)的視頻排圖格式不同,同時不同公司的內(nèi)部規(guī)則也不盡相同,因此效率較低,操作復(fù)雜,不能形成一個統(tǒng)一的標(biāo)準(zhǔn)。因此,能夠針對各視點(diǎn)不同的視頻進(jìn)行自動識別成為一個極具實(shí)際研究意義的課題。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提供一種視頻或圖像視點(diǎn)類型的識別方法,該識別方法能夠根據(jù)圖像相似度和排圖規(guī)則的不同對所有類型的2D/3D視頻源的類型進(jìn)行識別,識別效率高,準(zhǔn)確性高。本發(fā)明的目的通過以下的技術(shù)方案實(shí)現(xiàn):一種視頻或圖像視點(diǎn)類型的識別方法,包括以下步驟:(I)預(yù)先通過訓(xùn)練獲得直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值;(2)對于輸入的視頻或圖像,根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域;(3)對這兩個區(qū)域先進(jìn)行直方圖相似性特征值提取,如果該特征值大于直方圖相關(guān)性閾值,則說明兩個區(qū)域相似,然后進(jìn)入步驟(5);如果否,進(jìn)入步驟(4);(4)將這兩個區(qū)域均對應(yīng)分為若干塊,兩個區(qū)域?qū)?yīng)的每一塊之間進(jìn)行宏塊似然率提取,將兩個區(qū)域中所有對應(yīng)塊的宏塊似然率求平均作為區(qū)域相似性特征值,與區(qū)域相似性特征值閥值比較,如果小于閥值則判定此兩個區(qū)域相似,否則判定是不相似,然后進(jìn)入步驟(5);(5)判斷結(jié)束,重回步驟(2),繼續(xù)根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域,直到判斷出視頻或圖像的視點(diǎn)類型。具體的,所述步驟(I)中,直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值均可以通過大量的實(shí)驗(yàn)或根據(jù)實(shí)際操作經(jīng)驗(yàn)進(jìn)行設(shè)定,但是為了盡量避免人為的參與,減少對操作人員的依賴性,可以采用如下的獲取過程得到。所述步驟(I)中,直方圖相關(guān)性閾值的獲取過程如下:(1-1-1)建立訓(xùn)練數(shù)據(jù)庫,訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組,相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組,非相似圖像組為不是同一場景的兩個圖像序列;初始化閾值Kp K2,K1Mi2 ;( 1-1-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行直方圖相似性特征值提取,記為r2 ;如果訓(xùn)練用兩幅圖像為相似圖像,且ΛΚρ則將r2賦值給閾值K1,如果訓(xùn)練用兩幅圖像為非相似圖像,且r2>K2,則將r2賦值給閾值K2 ;(1-1-3)重復(fù)步驟(1-1-2),直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束,得到最終的K/和K2,;(1-1-4)對最后得到的閾值K/和K2’之間的值進(jìn)行訓(xùn)練,采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷,判斷準(zhǔn)確率最高的值K即為單個訓(xùn)練最優(yōu)閥值。所述步驟(I)中,區(qū)域相似性特征值閾值的獲取過程如下:(1-2-1)建立訓(xùn)練數(shù)據(jù)庫,訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組,相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組,非相似圖像組為不是同一場景的兩個圖像序列;初始化閾值V τ2,T1XT2 ;(1-2-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行區(qū)域相似性特征值提取,記為λ ;如果訓(xùn)練用兩幅圖像為相似圖像,且λ CT1,則將λ賦值給閾值T1,如果訓(xùn)練用兩幅圖像為非相似圖像,且λ >τ2,則將λ賦值給閾值T2;(1-2-3)重復(fù)步驟(1-2-2),直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束,得到最終的T/和
V;(1-2-4)對最后得到的閾值IV和Τ2’之間的值進(jìn)行訓(xùn)練,采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷,判斷準(zhǔn)確率最高的值T即為單個訓(xùn)練最優(yōu)區(qū)域相似性特征
值閥值。更進(jìn)一步的,對所述步驟(1-1-4)和步驟(1-2-4)得到的直方圖相關(guān)性閾值K和區(qū)域相似性特征值閥值T進(jìn)一步采用如下方法優(yōu)化:(1-3-1)固定閾值 T ;(1-3-2)在閾值K周圍限定區(qū)間[K_al,K+bl]內(nèi)進(jìn)行取值,設(shè)取值為Ki,針對訓(xùn)練數(shù)據(jù)庫中已知相似性的各組圖像,采用當(dāng)前直方圖相關(guān)性閾值Ki和區(qū)域相似性特征值閥值T對其相似性進(jìn)行判斷,如果判斷準(zhǔn)確率為100%,則最優(yōu)的直方圖相關(guān)性閾值即為當(dāng)前所取的Ki,最優(yōu)的區(qū)域相似性特征值閥值即為當(dāng)前的T,然后退出;若否,進(jìn)入步驟(1-3-3);(1-3-3)在閾值T周圍限定區(qū)間[T_a2,T+b2]內(nèi)進(jìn)行取值,代替原來的閾值T,然后重復(fù)步驟(1-3-1)、(1-3-2),直到出現(xiàn)一個直方圖相關(guān)性閾值和區(qū)域相似度特征值閾值能夠達(dá)到判斷準(zhǔn)確率為100%,然后退出。具體的,所述步驟(3)中,設(shè)直方圖相似性特征值為r2,r的求取方法如下:
權(quán)利要求
1.一種視頻或圖像視點(diǎn)類型的識別方法,其特征在于,包括以下步驟: (1)預(yù)先通過訓(xùn)練獲得直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值; (2)對于輸入的視頻或圖像,根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域; (3)對這兩個區(qū)域先進(jìn)行直方圖相似性特征值提取,如果該特征值大于直方圖相關(guān)性閾值,則說明兩個區(qū)域相似,然后進(jìn)入步驟(5);如果否,進(jìn)入步驟(4); (4)將這兩個區(qū)域均對應(yīng)分為若干塊,兩個區(qū)域?qū)?yīng)的每一塊之間進(jìn)行宏塊似然率提取,將兩個區(qū)域中所有對應(yīng)塊的宏塊似然率求平均作為區(qū)域相似性特征值,與區(qū)域相似性特征值閥值比較,如果小于閥值則判定此兩個區(qū)域相似,否則判定是不相似,然后進(jìn)入步驟(5); (5)判斷結(jié)束,重回步驟(2),繼續(xù)根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域,直到判斷出視點(diǎn)類型。
2.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法,其特征在于,所述步驟(I)中,直方圖相關(guān)性閾值的獲取過程如下: (1-1-1)建立訓(xùn)練數(shù)據(jù)庫,訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組,相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組,非相似圖像組為不是同一場景的兩個圖像序列;初始化閾值1、KyipK2 ; (1-1-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行直方圖相似性特征值提取,記為r2 ;如果訓(xùn)練用兩幅圖像為相似圖像,且I^K1,則將r2賦值給閾值K1,如果訓(xùn)練用兩幅圖像為非相似圖像,且r2>K2,則將r2賦值給閾值K2 ; (1-1-3)重復(fù)步驟(1- 1-2),直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束,得到最終的K1'和K2’ ; (1-1-4)對最后得到的閾值K/和Κ2’之間的值進(jìn)行訓(xùn)練,采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷,判斷準(zhǔn)確率最高的值K即為單個訓(xùn)練最優(yōu)閥值。
3.根據(jù)權(quán)利要求2所述的視頻或圖像視點(diǎn)類型的識別方法,其特征在于,所述步驟(I)中,區(qū)域相似性特征值閾值的獲取過程如下: (1-2-1)建立訓(xùn)練數(shù)據(jù)庫,訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組,相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組,非相似圖像組為不是同一場景的兩個圖像序列;初始化閾值!\、T2,T1XT2 ; (1-2-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行區(qū)域相似性特征值提取,記為λ ;如果訓(xùn)練用兩幅圖像為相似圖像,且λ CT1,則將λ賦值給閾值T1,如果訓(xùn)練用兩幅圖像為非相似圖像,且λ >Τ2,則將λ賦值給閾值T2; (1-2-3)重復(fù)步驟(1-2-2),直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束,得到最終的T1'和Τ2’ ; (1-2-4)對最后得到的閾值IV和Τ2’之間的值進(jìn)行訓(xùn)練,采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷,判斷準(zhǔn)確率最高的值T即為單個訓(xùn)練最優(yōu)區(qū)域相似性特征值閥值。
4.根據(jù)權(quán)利要求3所述的視頻或圖像視點(diǎn)類型的識別方法,其特征在于,對所述步驟(1-1-4)和步驟(1-2-4)得到的直方圖相關(guān)性閾值K和區(qū)域相似性特征值閥值T進(jìn)一步采用如下方法優(yōu)化: (1-3-1)固定閾值T ; (1-3-2)在閾值K周圍限定區(qū)間[K-al,K+bl]內(nèi)進(jìn)行取值,設(shè)取值為Ki,針對訓(xùn)練數(shù)據(jù)庫中已知相似性的各組圖像,采用當(dāng)前直方圖相關(guān)性閾值Ki和區(qū)域相似性特征值閥值T對其相似性進(jìn)行判斷,如果判斷準(zhǔn)確率為100%,則最優(yōu)的直方圖相關(guān)性閾值即為當(dāng)前所取的Ki,最優(yōu)的區(qū)域相似性特征值閥值即為當(dāng)前的T,然后退出;若否,進(jìn)入步驟(1-3-3); (1-3-3)在閾值T周圍限定區(qū)間[T-a2,T+b2]內(nèi)進(jìn)行取值,代替原來的閾值T,然后重復(fù)步驟(1-3-1)、(1-3-2),直到出現(xiàn)一個直方圖相關(guān)性閾值和區(qū)域相似度特征值閾值能夠達(dá)到判斷準(zhǔn)確率為100%,然后退出。
5.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法,其特征在于,所述步驟(3)中,設(shè)直方圖相似性特征值為r2,r的求取方法如下:
6.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法,其特征在于,所述步驟(4)中,設(shè)需要檢測相似性的兩個區(qū)域Φ” Φ2均對應(yīng)分為M塊,對應(yīng)的每一塊之間進(jìn)行宏塊似然率計算,宏塊似然率λ k的計算方法如下:
7.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法,其特征在于,所述步驟(2)輸入視頻的排圖規(guī)則是以視點(diǎn)圖像為單位,即把每個視點(diǎn)作為檢測區(qū)域,提取需要檢測相似性的兩個區(qū)域時,根據(jù)各視點(diǎn)分布不同,依次選擇如下區(qū)域進(jìn)行判斷: (2-1)選擇視點(diǎn)圖像的左半部分和右半部分判斷二者相似性,同時選擇視點(diǎn)圖像的上半部分和下半部分判斷二者相似性,只要其中之一具有相似性,則認(rèn)為是兩視點(diǎn)視頻,結(jié)束識別;否則,進(jìn)入步驟(2-2); (2-2)將視點(diǎn)圖像分為橫向、縱向各3份,提取出位于圖像最上面一層的3份,兩兩之間進(jìn)行相似性判斷,如果至少兩份相似,則進(jìn)入步驟(2-3);否則,認(rèn)為是單視點(diǎn)圖像,結(jié)束識別; (2-3)將視點(diǎn)圖像分為橫向3份、縱向4份,提取出位于圖像最下面一層的3份,兩兩之間進(jìn)行相似性判斷,如果至少兩份相似,則認(rèn)為是9視點(diǎn)圖像;否則,認(rèn)為是8視點(diǎn)圖像,結(jié)束識別。
全文摘要
本發(fā)明公開了一種視頻或圖像視點(diǎn)類型的識別方法,預(yù)先通過訓(xùn)練得到設(shè)定的直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值;對于輸入的視頻或圖像,根據(jù)排圖規(guī)則提取出需要檢測相似性的區(qū)域;對檢測相似性的區(qū)域先進(jìn)行直方圖相似性特征值提取,然后與其閾值做比對判斷是否相似,如果不相似,則將這兩個區(qū)域?qū)?yīng)分為若干塊,每一塊之間進(jìn)行宏塊似然率提取,將兩個區(qū)域中所有對應(yīng)塊的宏塊似然率求平均作為區(qū)域相似性特征值,與區(qū)域相似性特征值閾值做比對,判斷是否相似。根據(jù)排圖規(guī)則采用這種方法提取出若干對需要檢測相似性的兩個區(qū)域后即可判斷出視頻片源類型。本發(fā)明基于整體性相關(guān)性檢測為主、局部相關(guān)性檢測為輔的思想,識別快速、準(zhǔn)確。
文檔編號G06K9/62GK103198294SQ20131005765
公開日2013年7月10日 申請日期2013年2月22日 優(yōu)先權(quán)日2013年2月22日
發(fā)明者桂海田, 劉禮豐 申請人:廣州市朗辰電子科技有限公司