一種視頻或圖像視點(diǎn)類型的識別方法

文檔序號：6587179閱讀：147來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種視頻或圖像視點(diǎn)類型的識別方法
技術(shù)領(lǐng)域：
本發(fā)明涉及視頻處理與識別研究領(lǐng)域，特別涉及一種視頻或圖像視點(diǎn)類型的識別方法。
背景技術(shù)：
隨著顯示技術(shù)和數(shù)字多媒體技術(shù)的發(fā)展，人們越來越傾向于真實(shí)的視覺體驗(yàn)，立體顯示技術(shù)被看作是下一代顯示技術(shù)，立體顯示是利用人的左右眼觀看到的場景具有一定的視差而形成3D模型，進(jìn)而感受到物體具有遠(yuǎn)近之分，像是真實(shí)的立體場景。目前3D顯示器可以顯示2個、8個、9個等各種視點(diǎn)視頻的視頻源，有些3D顯示器甚至可以對2D/3D進(jìn)行切換。視頻種類多樣，極大的豐富了 3D世界，快速的推動3D顯示技術(shù)的應(yīng)用。2D平面顯示是現(xiàn)在視頻的主流，對于3D顯示器而言，兼容2D無疑是明智的選擇，兩視點(diǎn)即左右圖格式視頻源，包括各種偏振光形式，紅藍(lán)形式是目前各種3D顯示器的主流視頻格式，能較輕易的實(shí)現(xiàn)，用戶只需要帶著紅藍(lán)眼鏡就能看到3D效果，但此類視頻需要戴著眼鏡，體驗(yàn)效果相對較差，也只能是從單一的角度看到立體效果，相對而言，8視點(diǎn)、9視點(diǎn)等格式的多視點(diǎn)技術(shù)是未來發(fā)展的主要方向，能在裸眼3D上展示出較好的效果，對于未來的立體顯示設(shè)備，如果能夠全部兼容2D、兩視點(diǎn)、多視點(diǎn)則其應(yīng)用范圍將大大擴(kuò)大。對此，如何能快速智能地識別各種視頻源，從而做出相應(yīng)的排圖顯示，無疑是非常重要的。對此，目前的視頻格式還沒有形成統(tǒng)一的標(biāo)準(zhǔn)，因此視頻格式的自動識別成了一個難題，已有的方法有通過加入額外的識別碼進(jìn)行識別等，但是由于不同視點(diǎn)的視頻排圖格式不同，同時不同公司的內(nèi)部規(guī)則也不盡相同，因此效率較低，操作復(fù)雜，不能形成一個統(tǒng)一的標(biāo)準(zhǔn)。因此，能夠針對各視點(diǎn)不同的視頻進(jìn)行自動識別成為一個極具實(shí)際研究意義的課題。

發(fā)明內(nèi)容
本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足，提供一種視頻或圖像視點(diǎn)類型的識別方法，該識別方法能夠根據(jù)圖像相似度和排圖規(guī)則的不同對所有類型的2D/3D視頻源的類型進(jìn)行識別，識別效率高，準(zhǔn)確性高。本發(fā)明的目的通過以下的技術(shù)方案實(shí)現(xiàn):一種視頻或圖像視點(diǎn)類型的識別方法，包括以下步驟:(I)預(yù)先通過訓(xùn)練獲得直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值；(2)對于輸入的視頻或圖像，根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域；(3)對這兩個區(qū)域先進(jìn)行直方圖相似性特征值提取，如果該特征值大于直方圖相關(guān)性閾值，則說明兩個區(qū)域相似，然后進(jìn)入步驟(5);如果否，進(jìn)入步驟(4)；(4)將這兩個區(qū)域均對應(yīng)分為若干塊，兩個區(qū)域?qū)?yīng)的每一塊之間進(jìn)行宏塊似然率提取，將兩個區(qū)域中所有對應(yīng)塊的宏塊似然率求平均作為區(qū)域相似性特征值，與區(qū)域相似性特征值閥值比較，如果小于閥值則判定此兩個區(qū)域相似，否則判定是不相似，然后進(jìn)入步驟(5)；(5)判斷結(jié)束，重回步驟(2)，繼續(xù)根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域，直到判斷出視頻或圖像的視點(diǎn)類型。具體的，所述步驟(I)中，直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值均可以通過大量的實(shí)驗(yàn)或根據(jù)實(shí)際操作經(jīng)驗(yàn)進(jìn)行設(shè)定，但是為了盡量避免人為的參與，減少對操作人員的依賴性，可以采用如下的獲取過程得到。所述步驟(I)中，直方圖相關(guān)性閾值的獲取過程如下:(1-1-1)建立訓(xùn)練數(shù)據(jù)庫，訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組，相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組，非相似圖像組為不是同一場景的兩個圖像序列；初始化閾值Kp K2，K1Mi2 ；( 1-1-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行直方圖相似性特征值提取，記為r2 ;如果訓(xùn)練用兩幅圖像為相似圖像，且ΛΚρ則將r2賦值給閾值K1,如果訓(xùn)練用兩幅圖像為非相似圖像，且r2>K2，則將r2賦值給閾值K2 ；(1-1-3)重復(fù)步驟(1-1-2)，直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束，得到最終的K/和K2,；(1-1-4)對最后得到的閾值K/和K2’之間的值進(jìn)行訓(xùn)練，采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷，判斷準(zhǔn)確率最高的值K即為單個訓(xùn)練最優(yōu)閥值。所述步驟(I)中，區(qū)域相似性特征值閾值的獲取過程如下:(1-2-1)建立訓(xùn)練數(shù)據(jù)庫，訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組，相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組，非相似圖像組為不是同一場景的兩個圖像序列；初始化閾值V τ2，T1XT2 ；(1-2-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行區(qū)域相似性特征值提取，記為λ ;如果訓(xùn)練用兩幅圖像為相似圖像，且λ CT1，則將λ賦值給閾值T1，如果訓(xùn)練用兩幅圖像為非相似圖像，且λ >τ2，則將λ賦值給閾值T2;(1-2-3)重復(fù)步驟(1-2-2)，直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束，得到最終的T/和
V；(1-2-4)對最后得到的閾值IV和Τ2’之間的值進(jìn)行訓(xùn)練，采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷，判斷準(zhǔn)確率最高的值T即為單個訓(xùn)練最優(yōu)區(qū)域相似性特征
值閥值。更進(jìn)一步的，對所述步驟(1-1-4)和步驟(1-2-4)得到的直方圖相關(guān)性閾值K和區(qū)域相似性特征值閥值T進(jìn)一步采用如下方法優(yōu)化:(1-3-1)固定閾值 T ;(1-3-2)在閾值K周圍限定區(qū)間[K_al，K+bl]內(nèi)進(jìn)行取值，設(shè)取值為Ki,針對訓(xùn)練數(shù)據(jù)庫中已知相似性的各組圖像，采用當(dāng)前直方圖相關(guān)性閾值Ki和區(qū)域相似性特征值閥值T對其相似性進(jìn)行判斷，如果判斷準(zhǔn)確率為100%，則最優(yōu)的直方圖相關(guān)性閾值即為當(dāng)前所取的Ki,最優(yōu)的區(qū)域相似性特征值閥值即為當(dāng)前的T，然后退出；若否，進(jìn)入步驟(1-3-3)；(1-3-3)在閾值T周圍限定區(qū)間[T_a2，T+b2]內(nèi)進(jìn)行取值，代替原來的閾值T，然后重復(fù)步驟(1-3-1)、(1-3-2)，直到出現(xiàn)一個直方圖相關(guān)性閾值和區(qū)域相似度特征值閾值能夠達(dá)到判斷準(zhǔn)確率為100%，然后退出。具體的，所述步驟(3)中，設(shè)直方圖相似性特征值為r2，r的求取方法如下:
權(quán)利要求
1.一種視頻或圖像視點(diǎn)類型的識別方法，其特征在于，包括以下步驟: (1)預(yù)先通過訓(xùn)練獲得直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值； (2)對于輸入的視頻或圖像，根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域； (3)對這兩個區(qū)域先進(jìn)行直方圖相似性特征值提取，如果該特征值大于直方圖相關(guān)性閾值，則說明兩個區(qū)域相似，然后進(jìn)入步驟(5);如果否，進(jìn)入步驟(4)； (4)將這兩個區(qū)域均對應(yīng)分為若干塊，兩個區(qū)域?qū)?yīng)的每一塊之間進(jìn)行宏塊似然率提取，將兩個區(qū)域中所有對應(yīng)塊的宏塊似然率求平均作為區(qū)域相似性特征值，與區(qū)域相似性特征值閥值比較，如果小于閥值則判定此兩個區(qū)域相似，否則判定是不相似，然后進(jìn)入步驟(5)； (5)判斷結(jié)束，重回步驟(2)，繼續(xù)根據(jù)排圖規(guī)則提取出需要檢測相似性的兩個區(qū)域，直到判斷出視點(diǎn)類型。
2.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法，其特征在于，所述步驟(I)中，直方圖相關(guān)性閾值的獲取過程如下: (1-1-1)建立訓(xùn)練數(shù)據(jù)庫，訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組，相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組，非相似圖像組為不是同一場景的兩個圖像序列；初始化閾值1、KyipK2 ； (1-1-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行直方圖相似性特征值提取，記為r2 ；如果訓(xùn)練用兩幅圖像為相似圖像，且I^K1，則將r2賦值給閾值K1，如果訓(xùn)練用兩幅圖像為非相似圖像，且r2>K2，則將r2賦值給閾值K2 ； (1-1-3)重復(fù)步驟(1- 1-2)，直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束，得到最終的K1'和K2’ ； (1-1-4)對最后得到的閾值K/和Κ2’之間的值進(jìn)行訓(xùn)練，采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷，判斷準(zhǔn)確率最高的值K即為單個訓(xùn)練最優(yōu)閥值。
3.根據(jù)權(quán)利要求2所述的視頻或圖像視點(diǎn)類型的識別方法，其特征在于，所述步驟(I)中，區(qū)域相似性特征值閾值的獲取過程如下: (1-2-1)建立訓(xùn)練數(shù)據(jù)庫，訓(xùn)練數(shù)據(jù)庫中包括相似圖像組和非相似圖像組，相似圖像組為屬于同一場景的不同視點(diǎn)的圖像組，非相似圖像組為不是同一場景的兩個圖像序列；初始化閾值!\、T2，T1XT2 ； (1-2-2)對數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行區(qū)域相似性特征值提取，記為λ ;如果訓(xùn)練用兩幅圖像為相似圖像，且λ CT1，則將λ賦值給閾值T1，如果訓(xùn)練用兩幅圖像為非相似圖像，且λ >Τ2，則將λ賦值給閾值T2; (1-2-3)重復(fù)步驟(1-2-2)，直到數(shù)據(jù)庫中樣本數(shù)據(jù)訓(xùn)練結(jié)束，得到最終的T1'和Τ2’ ； (1-2-4)對最后得到的閾值IV和Τ2’之間的值進(jìn)行訓(xùn)練，采用訓(xùn)練數(shù)據(jù)庫中已知是否相似的兩幅圖像進(jìn)行判斷，判斷準(zhǔn)確率最高的值T即為單個訓(xùn)練最優(yōu)區(qū)域相似性特征值閥值。
4.根據(jù)權(quán)利要求3所述的視頻或圖像視點(diǎn)類型的識別方法，其特征在于，對所述步驟(1-1-4)和步驟(1-2-4)得到的直方圖相關(guān)性閾值K和區(qū)域相似性特征值閥值T進(jìn)一步采用如下方法優(yōu)化: (1-3-1)固定閾值T ; (1-3-2)在閾值K周圍限定區(qū)間[K-al，K+bl]內(nèi)進(jìn)行取值，設(shè)取值為Ki,針對訓(xùn)練數(shù)據(jù)庫中已知相似性的各組圖像，采用當(dāng)前直方圖相關(guān)性閾值Ki和區(qū)域相似性特征值閥值T對其相似性進(jìn)行判斷，如果判斷準(zhǔn)確率為100%，則最優(yōu)的直方圖相關(guān)性閾值即為當(dāng)前所取的Ki,最優(yōu)的區(qū)域相似性特征值閥值即為當(dāng)前的T，然后退出；若否，進(jìn)入步驟(1-3-3)； (1-3-3)在閾值T周圍限定區(qū)間[T-a2，T+b2]內(nèi)進(jìn)行取值，代替原來的閾值T，然后重復(fù)步驟(1-3-1)、(1-3-2)，直到出現(xiàn)一個直方圖相關(guān)性閾值和區(qū)域相似度特征值閾值能夠達(dá)到判斷準(zhǔn)確率為100%，然后退出。
5.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法，其特征在于，所述步驟(3)中，設(shè)直方圖相似性特征值為r2，r的求取方法如下:
6.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法，其特征在于，所述步驟(4)中，設(shè)需要檢測相似性的兩個區(qū)域Φ” Φ2均對應(yīng)分為M塊，對應(yīng)的每一塊之間進(jìn)行宏塊似然率計算，宏塊似然率λ k的計算方法如下:
7.根據(jù)權(quán)利要求1所述的視頻或圖像視點(diǎn)類型的識別方法，其特征在于，所述步驟(2)輸入視頻的排圖規(guī)則是以視點(diǎn)圖像為單位，即把每個視點(diǎn)作為檢測區(qū)域，提取需要檢測相似性的兩個區(qū)域時，根據(jù)各視點(diǎn)分布不同，依次選擇如下區(qū)域進(jìn)行判斷: (2-1)選擇視點(diǎn)圖像的左半部分和右半部分判斷二者相似性，同時選擇視點(diǎn)圖像的上半部分和下半部分判斷二者相似性，只要其中之一具有相似性，則認(rèn)為是兩視點(diǎn)視頻，結(jié)束識別；否則，進(jìn)入步驟(2-2)； (2-2)將視點(diǎn)圖像分為橫向、縱向各3份，提取出位于圖像最上面一層的3份，兩兩之間進(jìn)行相似性判斷，如果至少兩份相似，則進(jìn)入步驟(2-3);否則，認(rèn)為是單視點(diǎn)圖像，結(jié)束識別； (2-3)將視點(diǎn)圖像分為橫向3份、縱向4份，提取出位于圖像最下面一層的3份，兩兩之間進(jìn)行相似性判斷，如果至少兩份相似，則認(rèn)為是9視點(diǎn)圖像；否則，認(rèn)為是8視點(diǎn)圖像，結(jié)束識別。
全文摘要
本發(fā)明公開了一種視頻或圖像視點(diǎn)類型的識別方法，預(yù)先通過訓(xùn)練得到設(shè)定的直方圖相關(guān)性閾值、區(qū)域相似性特征值閾值；對于輸入的視頻或圖像，根據(jù)排圖規(guī)則提取出需要檢測相似性的區(qū)域；對檢測相似性的區(qū)域先進(jìn)行直方圖相似性特征值提取，然后與其閾值做比對判斷是否相似，如果不相似，則將這兩個區(qū)域?qū)?yīng)分為若干塊，每一塊之間進(jìn)行宏塊似然率提取，將兩個區(qū)域中所有對應(yīng)塊的宏塊似然率求平均作為區(qū)域相似性特征值，與區(qū)域相似性特征值閾值做比對，判斷是否相似。根據(jù)排圖規(guī)則采用這種方法提取出若干對需要檢測相似性的兩個區(qū)域后即可判斷出視頻片源類型。本發(fā)明基于整體性相關(guān)性檢測為主、局部相關(guān)性檢測為輔的思想，識別快速、準(zhǔn)確。
文檔編號G06K9/62GK103198294SQ20131005765
公開日2013年7月10日申請日期2013年2月22日優(yōu)先權(quán)日2013年2月22日
發(fā)明者桂海田, 劉禮豐申請人:廣州市朗辰電子科技有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：桂海田;劉禮豐
技術(shù)所有人：廣州市朗辰電子科技有限公司
我是此專利的發(fā)明人

上一篇：一種動脈粥樣硬化斑塊醫(yī)學(xué)圖像的處理方法
上一篇：基于氣動非線性與耦合的高速飛行器隨控優(yōu)化方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

圖像識別方法相關(guān)技術(shù)

圖像識別的方法相關(guān)技術(shù)

安檢圖像識別方法相關(guān)技術(shù)

圖像識別常用的方法相關(guān)技術(shù)

箭頭圖像識別方法相關(guān)技術(shù)

安檢機(jī)圖像識別方法相關(guān)技術(shù)

車牌識別圖像分割方法相關(guān)技術(shù)

圖像識別相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種視頻或圖像視點(diǎn)類型的識別方法