基于啟發(fā)信息的行人流量統(tǒng)計方法

文檔序號：6682407閱讀：529來源：國知局

專利名稱：基于啟發(fā)信息的行人流量統(tǒng)計方法
技術領域：
本發(fā)明屬于智能視頻監(jiān)控領域，具體涉及一種基于啟發(fā)信息的行人流量統(tǒng)計方法。
背景技術：
行人流量統(tǒng)計就是統(tǒng)計某個時間段內(nèi)進出某一通道的人數(shù)。從不同的角度分類，行人流量統(tǒng)計系統(tǒng)有多種類型。按照所選硬件平臺的不同，可分為接觸式(如旋轉門)，傳感器式(如激光束)，和基于視覺式(如攝像機)系統(tǒng)。按照攝像機安放位置的不同，可分為基于垂直攝像和基于傾斜攝像的系統(tǒng)。按照攝像機是否被標定，可分為相機標定式和相機未標定式系統(tǒng)。接觸式和傳感器式系統(tǒng)容易造成出入口的擁堵，且計數(shù)精度較差；基于垂直攝像的系統(tǒng)雖然計數(shù)精度高，算法簡單，但它只能從頂之下獲取行人的部分信息，出于安全監(jiān)控考慮，我們需要保留行人的其它信息(如面部特征，衣著特征等)，而且當今監(jiān)控攝像頭以傾斜攝像為主；相機標定式系統(tǒng)需要尋求相機本身的標定系數(shù)，不具有普適性。因此，綜合考慮各方面因素，當今多數(shù)行人流量統(tǒng)計系統(tǒng)是相機未標定、基于傾斜攝像的。近年來，已有一些研究工作在這方面開展，可參考Chan等人的文獻(A. B. Chan, Ζ. S. J. Liang, and N. Vasconcelos, “Privacy Preserving Crowd Monitoring: Counting People without People Models or Tracking, ，， In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Anchorage, June 2008)?？偟膩碚f，可將所采用的算法大體分為三類?；谛腥藱z測跟蹤的方法。首先分割前景，然后采用匹配搜索的方法檢測行人或行人的一部分(人臉，人頭，頭肩，上身等)，最后對檢測的結果進行跟蹤，一條有效的跟蹤軌跡代表一個行人。此類方法中的兩個核心技術——行人檢測和運動目標跟蹤，在視頻監(jiān)控領域本身就是兩類技術難題，算法的復雜度較高，這為計數(shù)系統(tǒng)的實時性能帶來了考驗?；谔卣鼽c軌跡聚類的方法。首先提取某些利于跟蹤的特征點，例如角點，然后對這些特征點逐幀跟蹤，形成特征軌跡，最后將具有相似性特征的軌跡聚類，一個類代表一個行人。此類方法要求統(tǒng)計的運動目標需具同一性，且需要尋求一種較好的聚類方法。基于低層特征回歸的方法。首先分割前景，然后提取前景區(qū)域中的低層特征(面積，周長，邊緣，邊緣方向，紋理等)，形成一個若干維的特征向量，最后通過某種回歸函數(shù)來確定特征向量與人數(shù)之間的對應關系。此類方法無需進行行人檢測和跟蹤，但是對前景分割結果的依賴性較大，且一般情況下需要對大量特定場景的樣本進行標注訓練，缺乏通用性。

發(fā)明內(nèi)容
本發(fā)明的目的主要是針對現(xiàn)有的行人流量統(tǒng)計系統(tǒng)很難在滿足計數(shù)精度的前提下，達到較好的實時性，而提供一種算法復雜度低、有較好精度的方法，實現(xiàn)對一般場景中的行人流量統(tǒng)計。
本發(fā)明方法步驟如下
步驟(1)獲取輸入視頻的第一幀圖像，在該圖像任意位置設定一個虛擬門。步驟( 采用混合高斯背景建模方法，將前景區(qū)域從背景中分割出來，并對得到的前景區(qū)域進行后處理，后處理主要包括以下步驟
1)采用形態(tài)學腐蝕和膨脹方法去除噪聲；
2)分析前景點的連通性，去除小于某個閾值的連通區(qū)域。步驟(3)將原圖轉換到HSV空間后，去除前景區(qū)域的陰影部分。步驟學習階段。包括以下步驟
1)采用基于梯度方向直方圖的方法進行行人檢測；
2)利用檢測出的行人的外接矩形中心的縱坐標和矩形框內(nèi)的前景點象素總數(shù)來構成行人模型，并將若干個行人模型通過最小二乘法擬合成直線，形成啟發(fā)信息；
3)通過啟發(fā)信息，確定虛擬門上各點與其所在位置行人模型中的前景點象素總數(shù)的比值，來為每個點賦予權重。步驟(5)計數(shù)階段。包括以下步驟
1)采用稀疏光流LK算法對門上的點進行運動補償。包括如下步驟 a由稀疏光流LK算法確定的相角與虛擬門方向之間的夾角確定運動矢量方向； b由稀疏光流LK算法確定的幅值與運動矢量方向的正弦值確定運動矢量大小。2)統(tǒng)計門上各個前景點的個數(shù)并獲得其信息，包括權重、運動矢量的大小和方向。通過補償后的前景點的加權和來統(tǒng)計行人流量。本發(fā)明是基于低層特征回歸方法的一個變種，不同于傳統(tǒng)依賴檢測、跟蹤或是特征點聚類方法具有較高的算法復雜度，本發(fā)明主要復雜度集中在行人檢測，學習階段完成后，在計數(shù)階段即可達到實時計數(shù)的效果。對來自CAVIAR Test Case kenarios公開數(shù)據(jù)庫中的幾個視頻進行測試，能夠達到85%以上的計數(shù)精度。

圖1是一幅流程框圖，表示了本發(fā)明的整個過程。圖2是虛擬門設置的一幅示例圖。圖3 (a)是一幀原始圖像。圖3(b)是利用混合高斯背景建模方法，并進行后處理的前景分割示例圖。圖3(c)是在圖3(b)的基礎上去除陰影后的效果圖。圖4是利用梯度方向直方圖方法檢測出的行人。圖5是通過最小二乘法將6個行人模型擬合后得到的直線。
具體實施例方式以下將參考附圖詳細介紹本發(fā)明的實施例。圖1是一個流程框圖，表示了本發(fā)明基于啟發(fā)信息的行人流量統(tǒng)計系統(tǒng)方法的流程圖。本方法處理的視頻可以針對多種視頻編碼格式，例如MPG、FLV等，只要能將該格式的視頻轉換為XviD編碼的AVI格式視頻即可。在此實施例中假定輸入的視頻已經(jīng)是XviD編碼后的AVI格式了。虛擬門設置是計數(shù)系統(tǒng)運行前必不可少的一步。首先獲取輸入視頻的第一幀圖像，在該圖像任意位置設定一個虛擬門。這里所謂的虛擬門實際上是人為確定的、處于圖像任意位置的一條直線。在畫虛擬門時，用戶只需要確定其兩個端點，系統(tǒng)將會自動采用 Bresenham算法繪制直線。虛擬門可以認為是手工設置的一個感興趣區(qū)域，后續(xù)步驟都將圍繞它展開。虛擬門的長短和方向設定是任意的，但是在一般情況下，為了計數(shù)的準確性，在設置虛擬門時，應使其落在視覺的地平面上并且與行人大體運動方向垂直。虛擬門示例圖如圖2。兩個端點坐標值分別為(70，178)和(四0，178)。前景分割(即運動區(qū)域檢測)結果的好壞直接影響到最終的統(tǒng)計結果，因為人流的數(shù)量是通過累加虛擬門上的前景點而獲得的。本實施例采用Gauffer等人設計的混合高斯背景模型(C. Stauffer, W. E. L. Grimson. "Adaptive background mixture models for real-time tracking, 〃 Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, Vol. 2 (06 August 1999)，pp. 246-252)來獲取前景。此方法用N個高斯分布模型來一同描述背景像素的分布規(guī)律。實施例中幾個關鍵變量設置為高斯分布個數(shù) N=4，背景比例 T=O. 7，學習速率 Alpha=max (0. 001, l/framelndex) (framelndex 為幀的索引值)，學習速率Beta=max (Alpha, l/framelndex)，匹配閾值Lambda=2. 5，初始權重^iitWfeight=O. 05，初始方差^ιΗ θ1 ει=320。為了使結果更精確，需要進行后處理。首先利用形態(tài)學方法，先腐蝕后膨脹，去除前景及背景中的噪聲點，然后分析連通性(這里的連通性指的是某個象素點的8連通域)，去除面積小于某個閾值的噪聲塊。這個閾值初始化時被賦予較小值(實施例中取經(jīng)驗值200)，在計數(shù)階段，可以根據(jù)學習階段獲取的行人模型的大小，將該閾值自適應調(diào)整到一個合適的值。附圖3(b)是圖3(a)利用上述背景建模以及后處理方法后提取運動區(qū)域的一幅示例圖。陰影去除部分是在運動目標檢測之后，對一些與運動目標有著相同運動特征的陰影進行消除的過程。在獲取前景時，由于光照的影響，行人運動時產(chǎn)生的陰影也被當成了運動像素，這無疑會使最終的統(tǒng)計結果偏大。為此，去除陰影也是必不可少的一個步驟。本實施例米用文獻(R. Cucchiara, C. Grana, M. Piccardi, and A. Prati. "Detecting moving objects, ghosts, and shadows in video streams, 〃 IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003，Vol. 25(10) : 1337—1342.)的方法，將原圖轉換到HSV空間，檢測并去除陰影。可以根據(jù)式⑴的方法判斷HSV空間中的某個前景點是否為陰影。
權利要求
1.基于啟發(fā)信息的行人流量統(tǒng)計方法，其特征在于該方法包括以下步驟(1)獲取輸入視頻的第一幀圖像，在該圖像任意位置設定一個虛擬門；(2)采用混合高斯背景建模方法，將前景區(qū)域從背景中分割出來，并對前景進行后處理；(3)將原圖轉換到HSV空間后，去除前景區(qū)域的陰影部分；(4)學習階段，包括以下步驟4-1采用基于梯度方向直方圖的方法進行行人檢測； 4-2通過檢測結果形成啟發(fā)信息；4-3為虛擬門上的每個點賦予權重；(5)計數(shù)階段，包括以下步驟5-1采用稀疏光流LK算法對門上的點進行運動補償； 5-2通過補償后的前景點的加權和來統(tǒng)計行人流量。
2.如權利要求1所述的方法，其特征在于步驟4-2中所述的通過檢測結果形成啟發(fā)信息是采用最小二乘法將若干個行人模型擬合后形成一條直線。
3.如權利要求2所述的方法，其特征在于所述的行人模型是由檢測出的行人的外接矩形中心的縱坐標和矩形框內(nèi)的前景點象素總數(shù)構成。
4.如權利要求1所述的方法，其特征在于步驟4-3中所述的為虛擬門上的每個點賦予權重是由各點與其所在位置行人模型中的前景點象素總數(shù)的比值來確定。
5.如權利要求1所述的方法，其特征在于步驟O)中所述的前景后處理步驟包括A.采用形態(tài)學腐蝕和膨脹方法去除噪聲；B.分析前景點的連通性，去除小于某個閾值的連通區(qū)域。
6.如權利要求1所述的方法，其特征在于步驟5-1中所述的采用稀疏光流LK算法對門上的點進行運動補償步驟包括C.由稀疏光流LK算法確定的相角與虛擬門方向之間的夾角確定運動矢量方向；D.由稀疏光流LK算法確定的幅值與運動矢量方向的正弦值確定運動矢量大小。
全文摘要
本發(fā)明涉及一種基于啟發(fā)信息的行人流量統(tǒng)計方法。本發(fā)明首先在輸入視頻的第一幀圖像中的任意位置設定一個虛擬門；然后采用混合高斯背景建模方法分割前景，并對結果后處理，去除噪聲；接著，將原圖轉換到HSV空間，去除前景中的陰影部分；在學習階段，采用基于梯度方向直方圖的方法進行行人檢測，并將若干檢測結果通過最小二乘法擬合成直線后，作為啟發(fā)信息確定虛擬門上各點與其所在位置行人模型的前景點象素總數(shù)的比值，來為每個點賦予權重；在計數(shù)階段，采用稀疏光流LK算法對門上的點進行運動補償，確定運動矢量的大小和方向，并通過累加這些具有權重的、經(jīng)過運動補償了的前景點以達到行人流量統(tǒng)計的目的。本發(fā)明復雜度低、計數(shù)精度高。
文檔編號G07C9/00GK102194270SQ201110147358
公開日2011年9月21日申請日期2011年6月2日優(yōu)先權日2011年6月2日
發(fā)明者吳海虹, 姚金良, 汪澄, 王大全, 王小華, 王榮波, 諶志群, 陸蓓申請人:杭州電子科技大學

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：陸蓓;姚金良;汪澄;王小華;諶志群;王榮波;吳海虹;王大全
技術所有人：杭州電子科技大學
我是此專利的發(fā)明人

上一篇：紙幣處理裝置的制作方法
上一篇：一種金融業(yè)務憑證影像數(shù)據(jù)生成裝置及系統(tǒng)的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
4、張老師：1.機械設計的應力分析、強度校核的計算機仿真 2.生物反應器研制 3.生物力學
5、孫老師：1.機機器人技術 2.機器視覺 3.網(wǎng)絡控制系統(tǒng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于啟發(fā)信息的行人流量統(tǒng)計方法