用于檢測運動對象的設(shè)備和方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及用于檢測運動對象的設(shè)備。此外,本發(fā)明設(shè)及用于檢測運動對象的相 應(yīng)方法。
[0002] 本發(fā)明設(shè)及用于在視頻序列中檢測運動對象的設(shè)備和方法。
【背景技術(shù)】
[0003] 諸如視覺監(jiān)視系統(tǒng)、交通控制系統(tǒng)或訪問控制系統(tǒng)的許多應(yīng)用需要有效的解決方 案W便在由多個視頻帖組成的視頻流中檢測運動對象。由于此原因過去開發(fā)了不同的檢測 算法。用于在視頻帖中檢測對象的常用技術(shù)被稱為前景/背景分割。在此運動對象(前景) 通過應(yīng)用復(fù)雜的模型與場景(即每視頻帖)的背景分離,所述模型能夠在前景和背景之間進 行區(qū)分。運通常導(dǎo)致二進制圖像,所述二進制圖像說明:確定的像素是屬于前景對象還是屬 于背景。
[0004] 運既可W在像素域中又可W在壓縮域中發(fā)生。像素域中的對象探測可W被視為在 視頻流中檢測對象的傳統(tǒng)的方案。對象根據(jù)描述運些對象的專口的特征來檢測、識別W及 追蹤。運種特征例如是顏色直方圖、形狀、輪廓或其組合。但是用于特征產(chǎn)生W及提取的前 提是能夠直接訪問相應(yīng)的圖像數(shù)據(jù)、即每帖的像素。運要求在可W進行關(guān)于運動對象的分 析之前,解碼所接收或所存儲的數(shù)據(jù)流、即視頻流。在解析所壓縮的語法元素之后重建當(dāng)前 像素數(shù)據(jù)是具有最高計算復(fù)雜度的解碼步驟。此外,像素域中的分析算法在計算上是復(fù)雜 的,因為必須處理每個單個像素。因此在像素域中的解碼和分析在實時應(yīng)用中或在應(yīng)該應(yīng) 用多個視頻流的并行處理時可能是有問題的。
【發(fā)明內(nèi)容】
[0005] 在此背景下,本發(fā)明的任務(wù)在于提供視頻序列中的運動對象的有效識別。
[0006] 據(jù)此提出用于在視頻序列中檢測運動對象的設(shè)備,其中視頻序列作為壓縮的比特 流存在,該比特流具有多個帖,其中多個帖中的每個被劃分成多個塊。所述設(shè)備具有:加權(quán) 單元,所述加權(quán)單元被設(shè)置用于給相應(yīng)帖的多個塊中的至少一個塊在考慮該塊在帖之內(nèi)的 水平空間分量、該塊在帖之內(nèi)的垂直空間分量和該塊在多個帖之內(nèi)的時間分量的情況下分 配加權(quán)值,W及確定單元,所述確定單元被用于針對多個塊中的至少一個炔基于所分配的 加權(quán)值和闊值來確定:所述塊是否具有運動對象。
[0007] 在識別運動對象時可W直接在所謂的壓縮域中分割視頻帖,而不是首先解碼所接 收的壓縮數(shù)據(jù)流、即視頻序列的所接收的壓縮表示W(wǎng)便獲得像素數(shù)據(jù)。W運種方式,算法可 W具有更低的復(fù)雜度并且更快地被執(zhí)行,因為消除解碼的計算密集的步驟。分割在此上下 文中被理解為將帖分成前景或背景。視頻序列在此由多個連續(xù)的圖像、即所謂的帖組成。
[0008] 所述設(shè)備基于W下構(gòu)思:直接從壓縮的比特流中針對各個帖或各個帖之內(nèi)的各個 塊判定:運動對象是否位于該帖中。帖在此可W被劃分成塊,其中每個塊包括確定數(shù)目的像 素。
[0009] 視頻序列例如可W在使用所謂的基于塊的混合視頻編碼技術(shù)的情況下被壓縮。在 此視頻流或視頻序列的每一視頻帖被劃分成可變大小的塊并且運些塊中的每一個被單獨 處理。運些塊之內(nèi)的像素在使用要么當(dāng)前帖的已經(jīng)被處理的像素要么相鄰帖的像素的情況 下來預(yù)測。然后進一步編碼并且傳輸對應(yīng)的預(yù)測誤差。
[0010] 運種基于塊的混合視頻編碼技術(shù)的示例是H. 264/AVC視頻編碼標準。下面根據(jù)該 標準描述所述設(shè)備的示例,但是其它的標準或技術(shù)也是可能的。
[0011] H. 264/AVC視頻編碼標準定義用于將帖劃分成更小的像素塊的分級結(jié)構(gòu)。帖或編 碼圖像被劃分成所謂的子圖像或切片,其中一個切片由多個連續(xù)的所謂的宏塊組成,所述 宏塊具有16x16像素的大小。每個宏塊在帖間預(yù)測時可W被進一步劃分成16x8、8xl6和 8x8像素的塊。在一個宏塊被劃分成具有8x8像素的大小的所謂的亞宏塊或子宏塊的情況 下支持附加地將塊分區(qū)成8x4、4x8和4x4塊。
[0012] 宏塊和子宏塊通過使用帖內(nèi)或帖間預(yù)測來預(yù)測。帖內(nèi)預(yù)測(I )僅使用在使用當(dāng) 前帖的鄰居塊的情況下的預(yù)測。帖間預(yù)測(P或B)使用運動估計技術(shù),W便補償連續(xù)的帖 之間的運動。因此,P塊在使用設(shè)及參考帖的第一列表之內(nèi)的參考帖的預(yù)測器的情況下來 預(yù)測W及B塊通過附加地使用設(shè)及參考帖的第二列表之內(nèi)的參考帖的第二預(yù)測器的情況 下來預(yù)測。連續(xù)的帖(P和B)之間的運動通過所謂的運動向量來表示。每個P或B宏塊或 子宏塊具有相應(yīng)的運動向量。附加地針對每個塊用信號通知所屬的索引,該索引說明哪個 參考帖被用于運動補償。作為減少不相關(guān)數(shù)據(jù)的步驟,所變換的圖像數(shù)據(jù)被量化。H. 264/ AVC為此針對帖或針對帖序列定義量化參數(shù)并且提供針對切片和甚至宏塊來適配該參數(shù)的 可能性。
[0013] 根據(jù)所提出的設(shè)備,在針對塊識別運動對象的情況下考慮=個不同的維度、即水 平空間維度、垂直空間維度和時間維度。因此,針對塊不僅考慮在帖之內(nèi)的位置、即位置的 空間垂直和水平分量而且針對塊考慮關(guān)于多個帖的位置、即關(guān)于時間的位置的時間分量。 在此給每個塊分配加權(quán)。根據(jù)預(yù)先確定的闊值,確定單元可W判定運動對象是否位于確定 的塊中。在分配加權(quán)值時考慮所述=個維度。
[0014] 在一種實施方式中,加權(quán)單元被設(shè)置用于針對所述塊中的多個塊或每個塊執(zhí)行加 權(quán)值的分配。確定單元于是也可W相應(yīng)地針對多個塊或針對每個塊確定運些塊是否包含運 動對象。
[0015] 如果確定單元確定一個塊具有運動對象,則該塊被定義為前景。與此相反,W下塊 被定義為背景,在該塊的情況下確定單元確定沒有運動對象位于該塊中。
[0016] 例如加權(quán)單元或確定單元的相應(yīng)單元可W用硬件技術(shù)和/或用軟件技術(shù)來實現(xiàn)。 在用硬件技術(shù)實現(xiàn)的情況下相應(yīng)單元可W被構(gòu)造為設(shè)備或者被構(gòu)造為設(shè)備的一部分,例如 被構(gòu)造為計算機或微處理器。在用軟件技術(shù)實現(xiàn)的情況下相應(yīng)單元可W被構(gòu)造為計算機程 序產(chǎn)品、函數(shù)、例程、程序代碼的一部分或能夠?qū)嵤┑膶ο蟆?br>[0017] 根據(jù)一種實施方式,確定單元被設(shè)置用于在加權(quán)值大于闊值或等于闊值時確定相 應(yīng)塊具有運動對象,W及在加權(quán)值小于闊值時確定相應(yīng)塊不具有運動對象。
[0018] 運意味著,如果加權(quán)值大于闊值,則相應(yīng)塊被定義為前景。如果加權(quán)值小于闊值, 則相應(yīng)塊被定義為背景。更高的加權(quán)值因此與相應(yīng)的塊具有運動對象的更高的概率對應(yīng)。 更小的闊值與相應(yīng)的塊具有運動對象的更低的概率對應(yīng)。
[0019] 根據(jù)另一種實施方式,給相應(yīng)帖的多個塊中的每個塊分配相同類型的語法元素的 組中的語法元素。
[0020] 在壓縮原始視頻內(nèi)容期間編碼器已經(jīng)分析原始視頻內(nèi)容的內(nèi)容,W便獲得用于有 效壓縮的盡可能好的設(shè)置。已經(jīng)在編碼過程中獲得的該認識又可W被使用。通過編碼器的 分析通常在率失真優(yōu)化(Rate Distortion化timization,畑0)過程中進行。該分析的輸 出是??诘恼Z法元素,所述語法元素直接被嵌入到壓縮的比特流中。作為結(jié)果可W直接使 用語法元素,W便得出關(guān)于當(dāng)前視頻內(nèi)容的結(jié)論。
[0021] 語法元素在此上下文中被理解為不同圖像、即視頻帖的特性或元素,所述特性或 元素在產(chǎn)生壓縮的比特流時、即在編碼視頻序列時被產(chǎn)生并且可W從壓縮的比特流中提 取。不同的語法元素可W被用于分割、即劃分成塊。
[0022] 根據(jù)另一種實施方式,加權(quán)單元被設(shè)置用于給多個塊中的每個炔基于所分配的語 法元素分配初始加權(quán)值。