基于split-merge策略的人群分組檢測方法
【技術領域】
[OOOU 本發(fā)明屬于圖像處理技術及模式識別領域,特別設及一種基于split-merge策略 的人群分組檢測方法。
【背景技術】
[0002] 單人行為識別是計算機視覺領域備受關注的前沿方向,已有多年的研究歷史,而 近年來,由于視頻監(jiān)督、人機交互、基于視頻的內(nèi)容檢索的需求越來越大,群體行為識別漸 漸成為了計算視覺和模式識別的研究熱點之一。作為群體行為識別的基礎,人群分組檢測 該一研究方面也受到了研究學者們越來越多的關注。但是由于一般場景的復雜性、人數(shù)的 不固定型、人之間交互關系的多變性,檢測人群分組該一研究領域具有極大的挑戰(zhàn)。
[0003] 在目前現(xiàn)存的人群分組檢測算法中,有一系列算法是基于F-化rmation, F-化rmation是Kendon在1990年提出的一個概念;當兩個甚至更多的人維持一定的空間 和方向關系,他們之間圍成的區(qū)域就是所謂的F-化rmation, F-formation由S個空間區(qū)域 構成,也就是o-space, p-space and r-space。其中最重要的部分是o-space,例如幾個人 進行交談時,他們的目光方向大概會匯集到一點,而他們中間圍成的凸形區(qū)域既o-space。 檢測不同的群體是靠尋找o-space實現(xiàn)的,一旦找到一個o-space,也就意味著檢測出一個 群組。但是該種方法只限于檢測幾個人"談話"該種情況,局限性比較大。另外有些方法雖 然不再局限于某種特定類型的群組,但是對于包含人數(shù)較多的群組,效果并不是很理想。還 有一些方法是利用人的軌跡特征,根據(jù)人的運動方向和速度來進行分群檢測,但該種方法 主要適用于人物是運動的狀態(tài)。
【發(fā)明內(nèi)容】
[0004] 對于一般的場景而言,由于存在各種不同的人群,比如較為普遍的"排隊"、"談 話"、"走路"等,傳統(tǒng)的方法大多是針對某一種特定形式的人群進行檢測,尚且存在很大的 局限。本發(fā)明的目的在于提出一種基于split-merge策略的人群分組檢測方法。其特征是, 該方法包括如下步驟:
[0005] 步驟1將視頻監(jiān)控場景中的個體分為靜態(tài)和動態(tài)兩種,分別W社會距離模型和社 會力量模型為基礎,模擬量化場景中個體之間的交互關系。對于動態(tài)、靜態(tài)該兩種狀態(tài)的 人,最后分別用一個權值矩陣把表示個體之間交互程度的權值聚集起來;
[0006] 步驟2將場景中兩種狀態(tài)的人分別用無向權值圖表示,圖的頂點表示人,頂點之 間的權值,也就是上一步計算出來的權值,表示個體之間的交互程度,檢測人群分組的問題 就轉化為對無向權值圖的聚類問題,本文采用基于split-merge策略的方法對無向權值圖 進行聚類。
[0007] 作為本發(fā)明的進一步改進,所述步驟1具體包括:
[000引步驟11根據(jù)場景中人物的軌跡特征,W及人物的軌跡變化情況,將人分成動態(tài)、 靜態(tài)兩種狀態(tài);
[0009] 步驟12對于狀態(tài)為靜態(tài)的目標人物,基于社會距離模型(Social Distance Model),根據(jù)每個人的人臉方向W及位置,定義其社交區(qū)域,根據(jù)任意兩人的社交區(qū)域相交 情況,量化其之間的交互關系。對場景中的目標人物兩兩計算,最后用一個權值矩陣來表示 所有的權值;
[0010] 步驟13對于狀態(tài)為動態(tài)的目標人物,我們基于社會力量模型(Social Force Model)來模擬量化人之間的交互關系。社會力量模型解決的問題是;已知人群分組情況來 推測每個人的軌跡。而本文把人群分組檢測看成該個問題的逆向問題;已知每個人的運動 軌跡,推測場景中的人群分組情況。
[0011] 作為本發(fā)明的進一步改進,所述步驟2具體包括:
[0012] 步驟21split階段;根據(jù)量化后的每兩個人之間的交互關系,也就是權值矩陣 中相應的權值,設定一個闊值,只要兩個人之間的權值大于闊值,就把該兩個目標人物分 到一個小的子組里面。若場景中一共有n個靜態(tài)個體,該樣場景中的靜態(tài)個體就被分為 個子組;
[0013] 步驟22merge階段;對上一步產(chǎn)生的所有子組進行合并,只要兩個子組有交集,就 把該兩個子組合并成一個較大的子組;
[0014] 步驟23不停的迭代上一步驟,直到最后形成的子組之間交集為空,那么最后的每 個子組就表示檢測出了一個人群分組,對于最后無向權值圖中不屬于任何子組的孤立的頂 點,表示場景中不屬于任何人群進行單獨活動的個體。
[00巧]有益效果;
[0016] 由于一般場景中不止存在一種人群,而存在人數(shù)差異較大形式各不相同進行不 同交互活動的人群,現(xiàn)存的一些人群分組檢測算法大多只局限于檢測某種特定形式的 人群,或者是人物數(shù)量和組成都比較簡單的人群。本發(fā)明基于運用在圖像分割領域的 split-merge算法:先確定一個分裂合并的準則,即區(qū)域特征一致性的測度,當圖像中某 個區(qū)域的特征不一致時就將該區(qū)域分裂成若干個相等的子區(qū)域,當相鄰的子區(qū)域滿足一 致性特征時則將它們合成一個大區(qū)域,直至所有區(qū)域不再滿足分裂合并的條件為止?;?此,本發(fā)明提出了一種基于split-merge策略的人群分組檢測方法,能夠?qū)崿F(xiàn)對更為一般 的場景中的人群分組檢測。在對場景中的人物模擬量化之后,用無向權值圖表示,檢測人群 分組就轉化為基于圖的聚類算法。傳統(tǒng)的基于圖的聚類算法一般對局部結構的相似性有很 好的表達。難W獲取數(shù)據(jù)真實的全局相似性。而本文提出的基于split-merge策略的聚類 方法能把握全局,忽視局部差異。該方法適用于更為普遍的監(jiān)控場景,而不再局限與某種特 定的人群,同樣適用于包含人數(shù)比較多的人群。
【附圖說明】
[0017] 圖1發(fā)明的主流程圖。
[0018] 圖2基于社會距離模型定義人的社交區(qū)域。
[0019] 圖3無向權值圖表示場景中所有個體,然后基于split-merge策略進行無向權值 圖聚。
[0020] 圖4本文方法在Collectivity Activity dataset數(shù)據(jù)庫上的檢測實例。
【具體實施方式】
[0021] 下面結合附圖和實例對本發(fā)明作進一步說明,應指出的是,所描述的實例僅旨在 便于對本發(fā)明的理解,而對其不起任何限定作用。
[002引基于split-merge策略的人群分組檢測方法,包括如下步驟;
[0023] 步驟1將視頻監(jiān)控場景中的個體分為靜態(tài)和動態(tài)兩種,分別W社會距離模型和社 會力量模型為基礎,模擬量化場景中個體之間的交互關系。對于動態(tài)、靜態(tài)該兩種狀態(tài)的 人,最后分別用一個權值矩陣把表示個體之間交互程度的權值聚集起來;
[0024] 步驟2將場景中兩種狀態(tài)的人分別用無向權值圖表示,圖的頂點表示人,頂點之 間的權值,也就是上一步計算出來的權值,表示個體之間的交互程度,檢測人群分組的問題 就轉化為對無向權值圖的聚類問題,采用基于split-merge策略的方法對無向權值圖進行 聚類。如圖1,是雙語詞典的構建過程圖所示:
[0025] 權值矩陣的構建過程包括:
[0026] 步驟11根據(jù)場景中人物的軌跡特征,通過計算一定時間內(nèi)人物的軌跡變化情況, 將人分成動態(tài)、靜態(tài)兩種狀態(tài);
[0027] 步驟12對于狀態(tài)為靜態(tài)的目標人物,基于社會距離模型(Social Distance Model),根據(jù)每個人的人臉方向W及位置,定義其社交區(qū)域,根據(jù)任意兩人的社交區(qū)域相交 情況,量化其之間的交互關系。對場景中的目標人物兩兩計算,最后用一個權值矩陣來表示 所有的權值;
[002引步驟13對于狀態(tài)為動態(tài)的目標人物,我們基于社會力量模型(Social Force Model)來模擬量化人之間的交互關系。社會力量模型解決的問題是;已知人群分組情況來 推測每個人的軌跡。而本文把人群分組檢測看成該個問題的逆向問題;已知每個人的運動 軌跡,推測場景中的人群分組情況。
[0029] 步驟12基于社會距離模型量化靜態(tài)人之間社會交互程度。具體的操作過程有:
[0030] (1)用集合N = (1,...,n}表示場景中所有靜態(tài)的人。假設已知其中個體i的人 臉方向和位置信息,定義一個楠圓區(qū)域E (。,a, b),該個楠圓模擬了 i該個人的社交區(qū)域范 圍。。是楠圓的中屯、,(a, b)分別是楠圓的長軸短軸。因為通常情況下人的注意力主要集 中在他的前面,所W楠圓中屯、應當沿著人的面部朝向移動一定距離C。圖2表示了兩個人的 社交區(qū)域。
[0031] (2)對任意的兩個人i和j,引入距離馬,其中ij表示i和j該兩個人的距 y 離,j'表示射線。與楠圓E(Ci,a,b)的交點,如果Ru的大小在區(qū)間[(U]內(nèi),就說明i和 j存在交互。兩個人離得越近,存在交互的可能性越大。我們用權值量化兩個人的交互程