專利名稱:一種運動捕捉數(shù)據(jù)的關(guān)鍵幀提取方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種運動捕捉數(shù)據(jù)的關(guān)鍵幀提取方法,屬于圖像處理技術(shù)領(lǐng)域。
背景技術(shù):
由于運動捕捉技術(shù)獲得的動畫具有高度的逼真性,20世紀70年代末,運動捕捉技術(shù)已經(jīng)應(yīng)用于人體動畫的制作,而在過去 的十年里,隨著計算機技術(shù)的迅猛發(fā)展,使得基于運動捕獲技術(shù)的角色動畫制作已經(jīng)逐漸代替?zhèn)鹘y(tǒng)的關(guān)鍵幀、過程模擬、動力學(xué)等計算機動畫制作方法,成為制作三維計算機動畫的主流方法,同時也成為計算機圖形學(xué)領(lǐng)域的一大熱點,該技術(shù)被廣泛應(yīng)用于電影廣告、數(shù)字娛樂、體育仿真等領(lǐng)域。在具體動畫制作過程中,動畫師將運動捕獲設(shè)備捕獲得到的真實感的角色運動數(shù)據(jù)應(yīng)用在動畫角色身上,以此制作完成具有很強真實感的計算機動畫。值得一提的是,虛擬角色運動的逼真性往往能掩蓋其角色模型本身的粗糙感和不真實性,這大大改善了最后制作完成的計算機動畫的視覺效果O運動捕捉的分類方法有很多種。從應(yīng)用角度來看,可以分為表情捕捉和身體運動捕捉兩類;從實時性來看,可以分為實時捕捉系統(tǒng)和非實時捕捉系統(tǒng)兩類;而從工作原理角度來看,則可分為機械式、聲學(xué)式、電磁式和光學(xué)式。不同原理的設(shè)備各有其優(yōu)缺點,主要體現(xiàn)在定位精度、實時性、使用方便程度、可捕捉運動范圍大小、成本、干擾性、多目標捕捉能力等方面。常用的光學(xué)式運動捕捉的優(yōu)點是表演者活動范圍大,無電纜、機械裝置的限制,表演者可以自由地表演,使用很方便。其采樣速率較高,可以滿足多數(shù)高速運動測量的需要。而這種方法的缺點是,在使用這種技術(shù)的過程中,由于標記點經(jīng)常會被遮擋或者混淆,運動信息往往會缺失或者計算產(chǎn)生錯誤,發(fā)生這種情況后,需要后期進行人工干預(yù),對標記點空間坐標的計算,需要對標一記點進行識別和跟蹤,這就使后期的工作量變得非常大。一般來說,目前的光學(xué)式運動捕捉系統(tǒng)價格比較貴,對一使用場地的燈光及反射情況有一定的要求,安裝和定位都比較繁瑣。再者,運動捕獲技術(shù)仍存在以下缺點①價格昂貴;
②大量冗余數(shù)據(jù)的存在,不便于運動數(shù)據(jù)的壓縮存儲及瀏覽;③運動數(shù)據(jù)重用性差,表示形象特征的高維信號難以進行編輯等。鑒于運動捕獲技術(shù)存在上述不足之處,近年來對運動捕獲數(shù)據(jù)進行后期處理成為國內(nèi)外眾多研究學(xué)者竟相研究的熱點問題。如果一個動畫師只想修改運動中的一部分動作,那么他需要修改每一幀的關(guān)節(jié)信息,這將耗費大量的時間。而關(guān)鍵幀技術(shù)恰好能解決這個問題。這個過程需要從大量的運動數(shù)據(jù)中選取一些具有代表性的幀,動畫師只需修改關(guān)鍵幀的信息,再通過插值還原等方法重建運動序列來達到想要的結(jié)果。關(guān)鍵幀提取是一種被廣泛應(yīng)用于視頻分析與檢索領(lǐng)域的技術(shù),與二維時序視頻數(shù)據(jù)中的關(guān)鍵幀不同,在運動捕獲數(shù)據(jù)中,關(guān)鍵幀指能夠代表運動序列的三維骨架數(shù)據(jù)?,F(xiàn)有的運動捕獲數(shù)據(jù)關(guān)鍵幀提取技術(shù)主要分為三大類基于曲線簡化、聚類和基于矩陣分解的技術(shù)。基于曲線簡化就是將運動捕獲數(shù)據(jù)中每一幀看成高維空間中的一點,通過按序連接整段數(shù)據(jù)中的數(shù)據(jù)點,將原始運動視為高維空間中的一段曲線,然后采用曲線簡化算法提取關(guān)鍵幀;聚類是將N幀運動數(shù)據(jù)聚類到K個群集合中,取各集合中的某一幀作為關(guān)鍵幀;基于矩陣分解就是將每一幀的所有關(guān)節(jié)點放在一個矩陣的同一行上,然后這個矩陣被近似的因式分解成一個權(quán)重矩陣和一個關(guān)鍵幀矩陣。上述方法,均需預(yù)先指定一些經(jīng)驗閾值,這些閾值對某些實驗數(shù)據(jù)有效,而對有些是無效的。尤其是在對運動內(nèi)容一無所知的情況下,要求預(yù)先指定決定其中需要的各個經(jīng)驗閾值是一個非常困難的問題。而眾所周知,基于差異的關(guān)鍵幀提取技術(shù)對于相關(guān)參數(shù)的設(shè)定非常敏感,初值設(shè)置不當(dāng)對實驗結(jié)果影響很大。而運功序列中運動類型速率的不同,運動內(nèi)容千差萬別,不可能用統(tǒng)一的閾值對所有的實驗數(shù)據(jù)均取得較好的效果。從而設(shè)計一種能夠自適應(yīng)地根據(jù)當(dāng)前運動序列,獲得動態(tài)數(shù)據(jù)來進行動態(tài)設(shè)定所需參數(shù),進而提高效率,減少誤差的關(guān)鍵幀提取方法仍然是 一個具有挑戰(zhàn)性的任務(wù)。
發(fā)明內(nèi)容
為了實現(xiàn)上述的目標,本發(fā)明的目的在于提出了一種運動捕捉數(shù)據(jù)的關(guān)鍵幀提取方法,該方法通過分層使用聚類的方法提取關(guān)鍵幀,著重解決在運動內(nèi)容未知的情況下需要多次人工設(shè)定閾值的問題,從而提高了數(shù)據(jù)的處理效率,使得在處理過程中無需人工干預(yù),并且在原始數(shù)據(jù)上進行操作的短耗時也滿足運動捕捉的實時性要求。本發(fā)明的技術(shù)方案如下第一步初始聚類的劃分和所需閾值計算,其由以下4步驟構(gòu)成步驟I.有N幀的運動序列連續(xù)讀入,這里利用歐拉公式得到的相鄰幀之間的相似度存放在數(shù)組中,數(shù)組中共有N-I個元素;所述利用歐氏距離來表示相鄰運動幀之間的相似度,采用的計算公式是
權(quán)利要求
1.一種運動捕捉數(shù)據(jù)的關(guān)鍵幀提取方法,其特征在于 第一 步初始聚類的劃分和所需閾值計算,其由以下4步驟構(gòu)成 步驟I.有N幀的運動序列連續(xù)讀入,這里利用歐拉公式得到的相鄰幀之間的相似度存放在數(shù)組中,數(shù)組中共有N-I個元素; 所述利用歐氏距離來表示相鄰運動幀之間的相似度,采用的計算公式是 所述F是運動幀,Co是各個關(guān)節(jié)點的權(quán)值,t指的是各個關(guān)節(jié)點; 步驟2.數(shù)組中存放的相似度的元素作為參數(shù)分別依次進行聚類,分為兩類, 而且通過比較得到的兩類的離散度最小時候的相似度值,此時的相似度作為所求的閾值之一; 所有基于幀間差異來判斷兩幀是否相似的方法都要指定閾值,采用以下步驟來計算出第二次聚類所需的各種閾值參數(shù) (1)設(shè)一個運動序列中共有N幀仍,F(xiàn)2,F3,, FJ,連續(xù)讀入這些運動,并利用上述公式⑴來計算相鄰幀之間的相似度,得到數(shù)組Dif= (D1, D2,, DN_J,所述N是運動序列中總的運動幀數(shù)目; (2)依次以Dif中的相似度為參數(shù)分別依次進行聚類,分為兩類,而且通過比較得到的兩類的離散度最小時候的相似度值。此時的相似度作為所求的閾值之一;離散度的計算公式如下 sI2 = T-Jz (:::::(云 S2 = 1............iD::醫(yī)紗 I—/):)).Tj I — If w I,JL w A Jl I ^ II* / jIS2=Hiin (S12+S22); 所述I < T < N-2,N是運動序列中總的幀數(shù)目;是兩個聚類離散度的和;當(dāng)最小的時候,此時分得兩個聚類的相似度Dt就是我們在下一步聚類過程中需要的參數(shù)之一; 步驟3.利用得到離散度最小的聚類時候的相似度開始對運動序列進行分類,如果相鄰的幀的相似度大于或等于Dt,則開始新的類;否則如果當(dāng)前幀與當(dāng)前聚類中心的距離大于等于Dt時,開始新的類; 步驟4.當(dāng)此算法停止的時候,得到劃分的初始類的數(shù)目和初始類的劃分,以及第二次聚類所需的其他閾值; 第二步利用ISODATA進行動態(tài)聚類,步驟如下; 步驟I.利用ISODATA進行動態(tài)聚類并提取關(guān)鍵幀,過程如下 動態(tài)聚類的分裂如果某類的類內(nèi)離散度大于各個分類離散度的均值,且該類的最大標準偏差大于各個相鄰聚類間的最大標準偏差時,將此類分裂成新的兩類;并且如果此時的聚類數(shù)目小于K/2或是當(dāng)?shù)螖?shù)是奇數(shù)且此時的聚類數(shù)目在K/2和2K之間的時候分裂成兩類;所述K是期望的最大聚類數(shù)目; 動態(tài)聚類的合并如果某相鄰聚類的類中心的相似度小于在初始分類得到兩類離散度最小時候的相似度值時,合并這兩個聚類;或者聚類內(nèi)部的幀數(shù)目小于一個聚類可容納的最少幀數(shù)目時將其與相鄰的聚類合并;再者如果聚類的數(shù)目大于2K或者當(dāng)前迭代次數(shù)是偶數(shù)且此時聚類數(shù)目在K/2和2K之間的時候合并兩類; 步驟2.確定閾值;所述確定閾值的方法如下 K :期望得到的最大聚類數(shù)目,無需從太短的序列里提取關(guān)鍵幀,我們使用的運動捕捉數(shù)據(jù)庫的采樣頻率是每秒120幀,每秒最多提取四個關(guān)鍵幀即可,
全文摘要
本發(fā)明公開了一種用于被動式光學(xué)人體運動捕捉數(shù)據(jù)中關(guān)鍵幀提取方法。通過分層使用聚類方法,初次聚類得到初始分類數(shù)目和初始類劃分等第二次聚類所需的閾值,然后采用動態(tài)的無監(jiān)督聚類算法ISODATA再次自動提取聚類,而無需人工預(yù)定義閾值。最后得到比較合理的聚類,并提取出離聚類中心最近的運動幀作為關(guān)鍵幀。本發(fā)明在得到較理想的關(guān)鍵幀的同時,能夠滿足運動捕捉的實時性要求。
文檔編號G06T7/20GK102855639SQ20121029873
公開日2013年1月2日 申請日期2012年8月16日 優(yōu)先權(quán)日2012年8月16日
發(fā)明者張強, 于少沛, 周東生 申請人:大連大學(xué)