專利名稱:自動(dòng)確定對(duì)應(yīng)于電視會(huì)議參加者的預(yù)置位置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電視會(huì)議技術(shù)的領(lǐng)域,尤其是涉及一種用于自動(dòng)確定攝象機(jī)的適當(dāng)?shù)娜啊A斜和變焦參數(shù)的方法,這些參數(shù)相應(yīng)于在電視會(huì)議設(shè)置中所希望的參加者的視域。
在電視會(huì)議期間,必須知道對(duì)每個(gè)參加者合適的攝象機(jī)參數(shù),以便攝象機(jī)的視域可迅速地從一個(gè)參加者改變?yōu)榱硪粋€(gè)參加者。這些參數(shù)包括攝象機(jī)的適當(dāng)?shù)淖兘?、全景和傾斜-將被合起來(lái)稱為攝象機(jī)“參數(shù)”,這些與每個(gè)參加者有關(guān)的參數(shù)值是“預(yù)置”的。當(dāng)會(huì)議進(jìn)行時(shí),用戶需要有能力可快速地觀看不同的參加者;在短時(shí)間內(nèi)頻繁地從一個(gè)參加者改變?yōu)榱硪粋€(gè)。
現(xiàn)有技術(shù)設(shè)備需要用戶人工地為每個(gè)電視會(huì)議的參加者設(shè)置攝象機(jī)參數(shù)。每個(gè)所用的攝象機(jī)被聚焦在一個(gè)參加者并啟動(dòng)一個(gè)初置開(kāi)關(guān)。例如,如果在會(huì)議中有三個(gè)人,開(kāi)關(guān)1被用于代表對(duì)參加者1合適的攝象機(jī)參數(shù);開(kāi)關(guān)2用于參加者2;且開(kāi)關(guān)3用于參加者3。當(dāng)使用者希望在參加者1和2之間切換視域時(shí),他只需要啟動(dòng)開(kāi)關(guān)2,攝象機(jī)被相應(yīng)地移動(dòng)和聚焦。然而,為每個(gè)參加者設(shè)置攝象機(jī)常常是一種冗長(zhǎng)而乏味的過(guò)程,需要攝象機(jī)操作員或使用者付出時(shí)間。另外,每次一個(gè)參加者離開(kāi)或進(jìn)入房間,預(yù)置必須被相應(yīng)地重新調(diào)節(jié)。如果一個(gè)參加者只是從他的原先位置移動(dòng),原先的攝象機(jī)預(yù)置將不再采用。很清楚,如果一個(gè)參加者在房間內(nèi)從一個(gè)位置移到另一位置,這就是一個(gè)問(wèn)題。然而,即使參數(shù)加在他自己的椅子內(nèi)移動(dòng)(即,向前,向后,靠向一邊,等),參數(shù)可改變,參加者可能不再處于焦點(diǎn)位置,不再處于攝象機(jī)視域的中心,或不再處于對(duì)于攝象機(jī)視域所希望的尺寸。
在美國(guó)專利5,598,209中,使用者可指出它希望觀看的目標(biāo)或人,系統(tǒng)自動(dòng)地存儲(chǔ)相對(duì)于目標(biāo)中心的攝象機(jī)全景和傾斜參數(shù)。然而,所有在房間中的目標(biāo)或人必須在使用者的控制下被確定地選取和存儲(chǔ),這還是費(fèi)時(shí)間。當(dāng)一個(gè)參加者離開(kāi)或進(jìn)入房間時(shí),也不提供對(duì)參數(shù)的更新。
自動(dòng)確定預(yù)置位置的能力在會(huì)議布局中同樣是有用的。一般,在這些類型的房間中,攝象機(jī)預(yù)置是根據(jù)為每個(gè)個(gè)人使用的話筒。當(dāng)一個(gè)參加者接通他的話筒時(shí),使用涉及到話筒位置的攝象機(jī)預(yù)置。這是有問(wèn)題的,因?yàn)槿绻捦膊还ぷ?,或者如果一個(gè)參加者的話筒被另一個(gè)談話者使用,在談話者和攝象機(jī)視域之間的適當(dāng)相關(guān)將不發(fā)生。
因此,需要一種電視會(huì)談系統(tǒng),它自動(dòng)地為所有參加者確定適當(dāng)?shù)臄z象機(jī)參數(shù),當(dāng)參加者進(jìn)入和離開(kāi)房間時(shí),也可自我調(diào)節(jié)。電視會(huì)議的目的是有效通信和交談,如果一個(gè)使用者必須重新調(diào)節(jié)系統(tǒng)來(lái)使預(yù)置參數(shù)初始化或更新,那末這個(gè)目的被落空。在末端用戶之間的交談動(dòng)態(tài)過(guò)程與一種產(chǎn)品(如在電視中)的動(dòng)態(tài)過(guò)程不同。為了有利于這種動(dòng)態(tài)過(guò)程,希望使盡可能多的系統(tǒng)自動(dòng)化,不求助于靜態(tài)的取遠(yuǎn)景(zoomed out)得到意義不大的通信視域。
本發(fā)明的一個(gè)方面是一種在電視會(huì)議系統(tǒng)中計(jì)算對(duì)應(yīng)于參加者的攝象機(jī)參數(shù)預(yù)置值的方法。本方法包括提供一種具有傾斜、全景和變焦參數(shù)的攝象機(jī),并規(guī)定一個(gè)基于電視會(huì)議系統(tǒng)布局的空間。本方法進(jìn)一步包括通過(guò)所有適當(dāng)?shù)臄z全景值移動(dòng)攝象機(jī),適當(dāng)?shù)臄z全景值是由電視會(huì)議系統(tǒng)所在的空間規(guī)定的,攝取遠(yuǎn)景象機(jī),使所有可能的參加者可被攝象機(jī)觀察到,并使每個(gè)參加者在空間的位置可被確定。本方法進(jìn)一步提供檢測(cè)在空間內(nèi)的參加者,并計(jì)算對(duì)應(yīng)于參加者的預(yù)置值,預(yù)置值規(guī)定攝象機(jī)的視域,預(yù)置值是基于在攝象機(jī)視域中參加者至少一個(gè)可選位置,將參加者頭部的中心與攝象機(jī)視域的中心對(duì)齊,將參加者的中心位置與攝象機(jī)視域的中心對(duì)齊。
這一方面像以下的方面一樣,允許自動(dòng)檢測(cè)和更新與電視會(huì)議中參加者對(duì)應(yīng)的攝象機(jī)參加。
依據(jù)本發(fā)明的另一方面,一種電視會(huì)議系統(tǒng)包括至少一個(gè)具有全景、傾斜,和變焦參數(shù)的攝象機(jī)。這些參數(shù)具有預(yù)置值,分配給電視會(huì)議系統(tǒng)的相應(yīng)的參加者。每個(gè)預(yù)置值規(guī)定一種攝象機(jī)的視域,并確定于,在由電視會(huì)議系統(tǒng)所規(guī)定的空間中將攝象機(jī)攝全景和變焦操作中的一種,檢測(cè)參加者,并根據(jù)攝象機(jī)位置規(guī)定預(yù)置值,將參加者放在最佳位置之一中,參加者的頭部與攝象機(jī)視域的中心對(duì)齊的位置,和參加者的中心位置與攝象機(jī)視域的中心對(duì)齊的位置。
依據(jù)本發(fā)明的另一方面,一種電視會(huì)議系統(tǒng)包括至少一個(gè)具有全景、傾斜和變焦參數(shù)的攝象機(jī)。這些參數(shù)具有預(yù)置值,分配給電視會(huì)議系統(tǒng)的相應(yīng)的參加者;預(yù)置值規(guī)定攝象機(jī)的視域。系統(tǒng)進(jìn)一步包括至少一個(gè)攝全景裝置,用于在由電視會(huì)議系統(tǒng)規(guī)定的空間中搖動(dòng)攝象機(jī)攝全景,和變焦裝置,用于使攝象機(jī)取遠(yuǎn)景,由此允許攝象機(jī)觀看由電視會(huì)議系統(tǒng)限定的空間。一種檢測(cè)裝置被用于檢測(cè)在此空間中的參加者。一種確定裝置被用于根據(jù)攝象機(jī)的位置確定攝象機(jī)的預(yù)置值,將參加者之一放在最佳位置之一中,參加者的頭部與所述的攝象機(jī)的視域中心對(duì)齊的位置,和參加者的中心部分與攝象機(jī)的視域中心對(duì)齊的位置。
本發(fā)明的一個(gè)目的是提供一種電視會(huì)議系統(tǒng)和方法,可自動(dòng)地確定有關(guān)參加者適當(dāng)?shù)囊曈虻臄z象機(jī)參數(shù)預(yù)置值。
本發(fā)明的另一個(gè)目的是提供一種電視會(huì)議系統(tǒng)和方法,可以依據(jù)參加者數(shù)量和位置的變化連續(xù)地更新攝象機(jī)預(yù)置值。通過(guò)閱讀以下的描述連同附圖這些目的以及其他的目的將變得更清楚,其中同樣的標(biāo)號(hào)代表相同的部件。
圖1A,1B和1C分別是依據(jù)本發(fā)明的一個(gè)電視會(huì)議系統(tǒng)的房間、會(huì)議和桌子的布局圖;圖2A,2B和2C是示出在依據(jù)本發(fā)明的一個(gè)電視會(huì)議系統(tǒng)中當(dāng)攝象機(jī)對(duì)一個(gè)房間攝全景時(shí),一個(gè)參加者進(jìn)入攝象機(jī)視域的圖;圖3是在本發(fā)明中所用的一個(gè)攝象機(jī)的透視模型;圖4是示出帶有各自指明的臨時(shí)預(yù)置值的電視會(huì)議參加者的示意圖;圖5示出一個(gè)參加者的中心部分偏離此參加者的攝象機(jī)視域中心的示意圖;圖6示出電視會(huì)議的參加者帶的各自被指明的已更新預(yù)置值的示意圖;圖7是示出利用兩臺(tái)攝象機(jī)的本發(fā)明一種替代的實(shí)施方案的示意圖;圖8是一種用于圖象中象素的圖形顏色的圓柱座標(biāo)系的示意圖;圖9是三張表示YUV顏色域投影的圖,指明皮膚的彩色象素所在的區(qū)域;圖10A-10F是原先的圖象和各自的二進(jìn)制圖象,二進(jìn)制圖象是通過(guò)將基于彩色的象素分離形成的;
圖11是用作說(shuō)明一個(gè)3×3的掩膜是如何用作依據(jù)本發(fā)明的亮度變化檢測(cè)的部件的示意圖;圖12A和12B分別用作說(shuō)明4和8類型的連通性的示意圖;圖13A和13B示出在依據(jù)本發(fā)明的邊緣被移動(dòng)去后,圖3C和3E的圖象看上去將像什么樣的圖象;圖14是示出施加到圖象圖3F上的邊界框的例子的圖象;圖15是示出依據(jù)本發(fā)明,一個(gè)圖象的組分是如何用各頂點(diǎn)來(lái)表示并被連接形成圖形的一個(gè)系列圖;圖16A-16D是用作說(shuō)明依據(jù)本發(fā)明的一種啟發(fā)式方法的應(yīng)用的一系列圖象;和圖17是一種詳細(xì)說(shuō)明包含在臉部檢測(cè)中的一般步驟的流程圖。
在圖1A中,示出一個(gè)電視會(huì)議系統(tǒng),其中參加者是圍繞一張桌子就座的。圖1B示出在大會(huì)型式安排中的參加者。一臺(tái)攝象機(jī)50由控制器52控制,從房間的一側(cè)搖全景到另一側(cè),很清楚,搖全景的移動(dòng)可在相同的地點(diǎn)開(kāi)始和結(jié)束。例如,如圖1c中所示,攝象機(jī)50可被安放在房間的中間,參加者全都圍著它就座。在這種類型的情況下,攝象機(jī)50可完全按圓形旋轉(zhuǎn)以便完全對(duì)整個(gè)房間攝全景,在圖1B中所示的大會(huì)方式安排中,攝象機(jī)50可以采取多種攝全景的路徑以覆蓋不同的排。這些路徑中每一條將具有不同的傾斜和可能還有不同的變焦(如果參加者在離攝象機(jī)基本相同的半徑距離上互相直接向上就座,變焦可以是相同的)。又,在大會(huì)方式安排中,攝象機(jī)50可被放置在房間的中間,然后攝全景的移動(dòng)可能如圖1C中所示的那樣需要完全的旋轉(zhuǎn)。
為簡(jiǎn)單起見(jiàn),圖1A中所示的安排現(xiàn)在將作進(jìn)一步的描述,然而應(yīng)該明白,相同的思路將適用于所有提到的安排并且其他的安排對(duì)于本領(lǐng)域的普通技術(shù)人員也是明白的。本發(fā)明將為由電視會(huì)議系統(tǒng)的可調(diào)節(jié)性所規(guī)定的任何空間服務(wù)。三位參加者(PartA,PartB和PartC)被示出,但,更多的參加者也可被包括在內(nèi)。
當(dāng)攝象機(jī)50從房間的一側(cè)攝全景搖到另一側(cè)時(shí),參加者將看上去是移動(dòng)著通過(guò)攝象機(jī)的視域。正如在圖2A-2C中所示的那樣,一個(gè)參加者出現(xiàn)在攝象機(jī)視域的不同部分,取決于攝象機(jī)攝全景的位置。也可從圖中看出,對(duì)于三個(gè)不同的攝全景的位置(P1,P2,P3),傾斜(T)和變焦(Z)仍然是相同的。在初始攝象機(jī)瀏覽期間,其他參數(shù)(也就是傾斜或變焦)之一可在適當(dāng)?shù)姆秶鷥?nèi)移動(dòng),同時(shí)其余的兩個(gè)參數(shù)保持不變。另一種可能性是,如果攝象機(jī)50已設(shè)置其變焦參數(shù),以致整個(gè)房間可馬上看見(jiàn)(假定足夠的信息可被搜集以確定不動(dòng)的參加者的位置,以下將更清楚地討論)。再次,為了簡(jiǎn)單,攝象機(jī)攝全景的思路將被描述,但應(yīng)該明白,帶有適當(dāng)變化的其他建議可被實(shí)現(xiàn),這對(duì)于本領(lǐng)域的技術(shù)人員是清楚的。
在初始攝全景期間,攝象機(jī)處理的每個(gè)幀被分析以確定是否一個(gè)參加者是在幀內(nèi)。作這種確定的一種方法在以下的參加者檢測(cè)節(jié)中詳細(xì)說(shuō)明。很清楚,其他的方法可實(shí)施。對(duì)于每個(gè)被檢測(cè)的參加者,攝全景的攝象機(jī)將檢測(cè)包括參加者的多個(gè)幀。例如,如果一臺(tái)攝象機(jī)對(duì)一個(gè)房間處理一千個(gè)幀,如果一個(gè)參加者在每幀中都出現(xiàn),這可能被解釋為一個(gè)個(gè)參加者。
為了避免參加者實(shí)際數(shù)目增多的這個(gè)問(wèn)題,每個(gè)被檢測(cè)的參加者被打上標(biāo)記。對(duì)于每個(gè)被處理的幀計(jì)算每個(gè)被檢測(cè)的參加者的質(zhì)量中心。然后,第二個(gè),包含潛在參加者的相繼的幀與以前的第一幀作比較,看看是否攝象機(jī)正在觀看一個(gè)新的參加者或者只是包括相同參加者的另一幀。實(shí)現(xiàn)這種比較的一個(gè)方法是執(zhí)行一種基于第一中心和攝象機(jī)已從第一位置移動(dòng)的量的幾何外推。如果第二幀包括與第一幀相同的參加者,這將得到該中心應(yīng)該所在的近似位置。同樣,可以計(jì)算第二幀的質(zhì)量中心,然后隨同在第一幀被觀看的位置和第二幀被觀看的位置之間攝象機(jī)已知的移動(dòng)與第一中心作比較。另外,可為每個(gè)被檢測(cè)的參加者建立署名,然后在相繼幀中參加者的署名可與起始的署名作比較。署名方法在技術(shù)上是已知的。某些署名技術(shù)的例子在以下的參加者識(shí)別和位置刷新章節(jié)中討論。一旦確定一個(gè)參加者的圖象被放置在一個(gè)幀內(nèi),可計(jì)算臨時(shí)預(yù)置值。
參考圖3,示出一臺(tái)攝象機(jī)的透視模型。攝象機(jī)的傳感器56有一個(gè)主要點(diǎn)PP,其x,y座標(biāo)分別為PPx和PPy。透鏡58的中心位于離主要點(diǎn)PP的焦點(diǎn)長(zhǎng)度f(wàn)上。攝象機(jī)變焦的改變是通過(guò)改變焦點(diǎn)長(zhǎng)度實(shí)現(xiàn)的。較短的f意味著寬的視域(“取遠(yuǎn)景”)。在攝全景參數(shù)方面的變化是使傳感器圍繞全景軸有效地旋轉(zhuǎn)。在傾斜參數(shù)方面的變化是使傳感器圍繞傾斜軸旋轉(zhuǎn)。
當(dāng)一個(gè)目標(biāo)或參加者62進(jìn)入攝象機(jī)的視域時(shí),如果包含參加者的兩個(gè)幀可得到的話,參加者在空間的位置可利用常規(guī)方法確定。這是因?yàn)橹饕c(diǎn)PP(現(xiàn)示為60)和焦點(diǎn)f的位置是已知的。當(dāng)攝象機(jī)50對(duì)一個(gè)房間攝全景時(shí),獲得包含參加者的多個(gè)幀,所以每個(gè)參加者在空間的位置可被確定。如果攝象機(jī)正在變焦移出而不是攝全景,可能需要兩種性質(zhì)不同的測(cè)量以確定位置。一旦一個(gè)參加者的位置已知,可由處理器54(圖1A-1C)計(jì)算臨時(shí)預(yù)置值。
為了計(jì)算臨時(shí)預(yù)置值,如以上對(duì)參加者打標(biāo)記那樣,利用已知技術(shù)確定參加者的中心。例如,可以計(jì)算參加者的輪廓平均和其質(zhì)量中心。然后將中心點(diǎn)放在攝象機(jī)視域的中心以產(chǎn)生,例如,圖1中PartA的預(yù)置值Psa,Tsa,和Zsa。對(duì)于房間中的所有參加者重復(fù)這些攝全景和預(yù)置值計(jì)算過(guò)程,從而,也確定一開(kāi)始在房間中有多少參加者。在會(huì)議的開(kāi)始期間全部被實(shí)施,往后在更新的程序期間可被重復(fù),以下要更充分地進(jìn)行描述。
一旦如圖4所示,在房間中的所有參加者被打上標(biāo)記,所有的臨時(shí)參數(shù)被計(jì)算出,攝象機(jī)50對(duì)房間實(shí)施第二次攝全景(取遠(yuǎn)景)。每個(gè)預(yù)置視域被進(jìn)一步細(xì)調(diào),因?yàn)樵诔跏紨z全景階段中實(shí)施的標(biāo)定一般來(lái)說(shuō)將是不夠精確的。
如圖5中所示,攝象機(jī)視域的中心與每個(gè)參加者的頭部的中心作比較。參數(shù)被調(diào)節(jié),使得在攝象機(jī)視域中這些中心調(diào)成一致。一旦預(yù)置值被精調(diào),計(jì)算與每個(gè)參加者的“最佳”視域?qū)?yīng)的預(yù)置值。這可能是不同的,與社會(huì)文化有關(guān)。例如,一個(gè)參加者的頭部和軀體可以取整個(gè)幀的30-60%-如在美國(guó)新聞節(jié)目中那樣。最佳視域產(chǎn)生刷新的預(yù)置值Psn',Tsn'和Zsn',如圖6中所示,這些值被連續(xù)地刷新,取決于系統(tǒng)是如何構(gòu)成的和刷新是如何實(shí)施的,以下要解釋。如果攝象機(jī)對(duì)著一個(gè)參加者,參加者移動(dòng)時(shí),將計(jì)算新的最佳位置,因此攝象機(jī)的預(yù)置值將被連續(xù)地調(diào)節(jié)。
攝象機(jī)可根據(jù)聲頻跟蹤,視頻跟蹤,由使用者作選擇,或由技術(shù)上已知的任何其他技術(shù)作選擇,對(duì)參加者聚焦。單獨(dú)的聲頻跟蹤是有限度的,因?yàn)楫?dāng)人進(jìn)一步離開(kāi)時(shí)在精度上被降低,并且不可能由本身使用,因?yàn)樗话阌?-5度的誤差,當(dāng)參加者停止談話時(shí)不可能進(jìn)行跟蹤。
一旦參加者被檢測(cè)到,每個(gè)參加者聯(lián)系著一個(gè)名字,例如,圖1的三個(gè)參加者可被識(shí)別為A,B和C,以致使用者可僅指出他希望觀看參加者A,攝象機(jī)將移到對(duì)A最佳的最佳值。另外,系統(tǒng)可被編程監(jiān)聽(tīng)關(guān)于每個(gè)參加者的某些特征,因而對(duì)參加者打上標(biāo)記。例如,為每個(gè)參加者建立署名,個(gè)人的襯衫顏色,可取得的話音型式,或者臉部和話音的組合可被用于構(gòu)成與參加者有關(guān)的標(biāo)記。利用這種附加的信息,如果參加者A繞著房間移動(dòng),系統(tǒng)將知道哪個(gè)參加者正在移動(dòng),將不會(huì)被參加者A通過(guò)對(duì)應(yīng)于參加者B的參數(shù)的視域走動(dòng)弄混淆。而且,如果兩個(gè)參加者的位置互相靠得足夠近,以致他們共享一個(gè)攝象機(jī)的視域,那末兩個(gè)參加者可被認(rèn)為是一個(gè)參加者,攝象機(jī)聚焦在他們的圖象組合的中心。
如上所述,本發(fā)明的一個(gè)好處是當(dāng)房間的參加者的動(dòng)態(tài)狀況改變時(shí),允許預(yù)置值能被自動(dòng)地調(diào)節(jié)。很清楚,如果選取一個(gè)預(yù)置值,相應(yīng)的參加者離開(kāi)房間,系統(tǒng)將感知這點(diǎn)并刷新預(yù)置值。另一種刷新的方法是每次一個(gè)新的預(yù)置值被選取時(shí),在攝象機(jī)50移到所選的預(yù)置值以前,攝象機(jī)50將變焦移出(或攝房間全景)看看,是否任何人已經(jīng)進(jìn)入或離開(kāi)房間。攝象機(jī)50可被周期性地控制,即使在被命令觀看一個(gè)所選的參加者時(shí),臨時(shí)停止觀看參加者,對(duì)房間攝全景或取遠(yuǎn)景,看看是否參加者的數(shù)目已經(jīng)改變。另一種技術(shù)是認(rèn)出一個(gè)參加者并不在他應(yīng)該呆的地方,例如,如攝象機(jī)50被告知從參加者C的預(yù)置值移到例如(圖1)參加者A,如果參加者B已經(jīng)離開(kāi)房間,系統(tǒng)可認(rèn)識(shí)到這點(diǎn)并作出適當(dāng)?shù)恼{(diào)節(jié)。還有另一種刷新技術(shù)包括攝象機(jī)50對(duì)整個(gè)房間攝全景(或者取遠(yuǎn)景),或者是周期性地或者是每次一個(gè)新的預(yù)置值被選取時(shí)進(jìn)行。
參考圖7,示出第二實(shí)施方案。除了增加第二攝象機(jī)64以外,該實(shí)施方案示出與圖1A中相同的特性。實(shí)施初始標(biāo)定與上述的相同。然而,在會(huì)議期間,一臺(tái)攝象機(jī)被用于對(duì)適當(dāng)?shù)膮⒓诱呔劢梗硪慌_(tái)被用于連續(xù)地刷新預(yù)置值,正在刷新的攝象機(jī)可被連續(xù)地取遠(yuǎn)景,使得它可確定何時(shí)一個(gè)參加者離開(kāi)或進(jìn)入房間。另一種方案是,正在刷新的攝象機(jī)可連續(xù)地對(duì)房間攝全景,對(duì)預(yù)置值作適當(dāng)?shù)乃⑿?。兩臺(tái)攝象機(jī)通過(guò),例如,處理器54共享預(yù)置信息。很清楚,可使用多臺(tái)攝象機(jī)。例如,一臺(tái)攝象機(jī)可分配給計(jì)劃出席會(huì)議的每個(gè)個(gè)人,然后一臺(tái)附加的攝象機(jī)可被用作刷新該攝象機(jī)。
確定是否一個(gè)參加者位于攝象機(jī)視域內(nèi)的一種方法是確定是否有一張臉位于攝象機(jī)觀看到的圖象內(nèi)。在圖象中的每個(gè)象素通常在HSV(色調(diào),飽和,值)顏色域中表示。這些值被映射到園柱座標(biāo)系上,如圖8所示,其中P是值(或亮度),θ是色調(diào),r是飽和。由于圓柱座標(biāo)系的非線性,其他的顏色空間被用于近似HSV空間。在本應(yīng)用中,采用YUV顏色空間,因?yàn)榇蠖鄶?shù)存儲(chǔ)在磁介質(zhì)上的視頻材料和MPEG2標(biāo)準(zhǔn)都使用這種顏色空間。
將RGB圖象變換到Y(jié)UV域,并進(jìn)一步投影到VU,VY和VU平面,產(chǎn)生如圖9所示的圖形。圓形段代表HSV域的近似值。當(dāng)對(duì)應(yīng)于皮膚顏色的象素畫(huà)在YUV空間中時(shí),通常落在所示的這些圓形段內(nèi)。例如,當(dāng)一個(gè)象素的亮度具有值在0和200之間,色度U通常對(duì)于一個(gè)膚色的象素具有在-100和0之間的值。這些是基于實(shí)驗(yàn)的一般值。很清楚,可為每個(gè)所用的攝象機(jī)實(shí)施一種顏色訓(xùn)練操作。然后訓(xùn)練的結(jié)果將被用于產(chǎn)生更精確的膚色段。
為了檢測(cè)一張臉,在圖象中的每一象素被查看以便辨別是否是皮膚顏色。那些是皮膚顏色的象素被從圖象的其余部分編組,并因而被留作潛在的臉的候選者。如果一個(gè)象素的至少一個(gè)投影并未落在皮膚組段的邊界內(nèi),則該象素被認(rèn)為不是皮膚顏色,從作為潛在臉的候選者的考慮內(nèi)除去。
由皮膚顏色檢測(cè)構(gòu)成的合成圖象是二進(jìn)制的,因?yàn)樗境龌蛘呤菆D象的皮膚顏色部分,或者不是皮膚顏色的部分,如圖10B,10D和10F中所示,對(duì)應(yīng)于圖10A,10C,和10E中原先的圖象。在圖中,白色表示皮膚顏色,黑色表示非皮膚顏色。如圖10A和10B中所示,單單這個(gè)檢測(cè)步驟當(dāng)其中有臉部時(shí),可刪除大部分的圖象。利用顏色和形狀的現(xiàn)有技術(shù)可為簡(jiǎn)單的背景工作,如圖10A所示。可是,看在圖10C和10D,圖10E和圖10F上,很清楚僅用顏色和形狀來(lái)檢測(cè)對(duì)于檢測(cè)臉部不可能是足夠的。在圖10C-10F中,在背景中的物體如皮革,木頭,衣服,和頭發(fā),具有與皮膚類似的顏色。正如從圖10D和10F中所見(jiàn),這些皮膚顏色的物體與臉部皮膚緊鄰地放置,所以臉部本身難以檢測(cè)。
在象素用顏色分離后,位于邊緣上的象素從考慮中排除。一個(gè)邊緣在亮度等級(jí)方面從一個(gè)象素到下一個(gè)象素是變化的。通過(guò)取每個(gè)皮膚顏色象素并計(jì)算在亮度組分中圍繞它的象素中的方差實(shí)現(xiàn)這種排除;高方差指明是一個(gè)邊緣,如圖11中所示,一個(gè)或者是3×3或者是5×5象素尺寸的框(“窗”)被放在膚色象素的頂上。很清楚,可以采用方框以外的其他障板。
方差被定義為1nΣi=1n(xi-μx)2]]>其中μx是被查看的窗中所有象素的平均值?!案摺狈讲畹乃綄⑹遣煌?,取決于臉部和所用的攝象機(jī)。因此,采用一種迭代程序從非常高的方差水平開(kāi)始往下工作到低的方差水平。
在方差迭代的每一步,如果在膚色象素周圍的一個(gè)窗中的方差大于對(duì)該迭代測(cè)試到的方差閾值,這些象素從面部的考慮中排除。所有的象素在一次迭代中被查看以后,為面部的特征查看合成的已連接的組分,以下將更充分地描述。已連接的組分是具有相同的二進(jìn)制值(對(duì)于面部顏色是白色)并被連接的象素。連通性可以是4或8類型的連通性。正如圖12A中所示,對(duì)于4類型的連通性,中心象素被考慮“連接”僅直接鄰近它的象素,在鄰近框中用“1”表示。在8類型的連通性中,如圖12B所示,對(duì)角線接觸中心象素的象素也被考慮為“連接”此象素。
如上所述,在每次迭代以后,已連接的組分被在組分分類步驟中查看,看看是否它們可能是一張臉。這種查看包含看五個(gè)性質(zhì)不同的準(zhǔn)則,是根據(jù)圍繞每個(gè)合成的已連接的組分所畫(huà)的邊界框進(jìn)行的;它們的例子示于圖14中,是以圖10E的圖象為基礎(chǔ)的,這些準(zhǔn)則是1.邊界框的面積與一個(gè)閾值相比較。這種方法辯認(rèn)面孔,一個(gè)面孔通常將不是非常大或非常小。
2.邊界框的縱橫比(高與寬比較)與一個(gè)閾值相比較。這種方法辨認(rèn)人的面孔通常落在縱橫比的一個(gè)范圍內(nèi)。
3.檢測(cè)到的膚色象素的面積與邊界框面積之比與一個(gè)閾值相比較。此準(zhǔn)則辯認(rèn)面孔,由人的面孔覆蓋的面積將落入邊界框面積的百分?jǐn)?shù)的范圍內(nèi)。
4.邊界框內(nèi)被伸長(zhǎng)物體的方向。有許多已知的方法確定一系列象素的方向。例如,可以確定醫(yī)學(xué)軸,從此軸可找出方向。通常,面孔并不圍繞此軸(“Z-軸”)較大地旋轉(zhuǎn),該軸與具有圖象的平面垂直,所以帶有相對(duì)于Z軸旋轉(zhuǎn)的被伸長(zhǎng)物體的組分被從考慮中排除。
5.邊界框的中心和被查看的組分的質(zhì)量中心之間的距離。通常,面孔位于邊界框的中心內(nèi),并例如,將不全部位于一側(cè)。
對(duì)于方差的迭代由此繼續(xù)分析圖象進(jìn)入較小組分,直到組分的大小低于一個(gè)閾值為止。圖10C和10E的圖象在方差迭代過(guò)程以后分別被示出轉(zhuǎn)變?yōu)閳D13A和13B。正如可被辯別的那樣,作為方差迭代的結(jié)果,在圖象中的面孔與背景中非面部膚色區(qū)分離。經(jīng)常,這引起被檢測(cè)到的膚色區(qū)被分裂,如圖13B中舉例的那樣。這種情況的發(fā)生是因?yàn)榇嬖谧枞糠置婵椎奈矬w(如眼鏡或面部的頭發(fā))或者由于高的方差除去若干部分。因此利用合成的組分通過(guò)他們自己來(lái)尋找一個(gè)面孔將是困難的。在方差迭代和組分分類步驟以后仍然可能是臉的部分的組分被連接形成如圖15中所示的圖形。用這種方法,具有類似特性和空間上靠近的膚色組分被一起編組并接著進(jìn)一步查看。
參考圖15,每個(gè)合成的組分(顏色檢測(cè),邊緣排除,和組分分類步驟的幸存者)用圖形的頂點(diǎn)表示。如果這些頂點(diǎn)在原先圖象中在空間上是靠近的,和在原先的圖象中具有類似的顏色,在把這些頂點(diǎn)連接。如果|Yi-Yj|<ty∧|Ui-Uj|<tuANDLINEVi-Vj|<tv兩個(gè)組分i和j具有類似的顏色。
其中Yn,Un和Vn是第n個(gè)組分的亮度和色度的平均值,tn是閾值值。閾值是基于面孔中Y,U,和V中的方差并保持足夠高,以致相同面孔的組分將被認(rèn)為是類似的。如果組分之間的距離小于閾值,就認(rèn)為這些組分在空間上是靠近的??臻g上的要求保證空間上遠(yuǎn)離的組分不在一起編組,因?yàn)橐粋€(gè)面孔的部分通常并不位于圖象中空間上遠(yuǎn)離的部分。
在頂點(diǎn)之間的連接被稱為邊線。每個(gè)邊線給出與兩個(gè)頂點(diǎn)之間的歐幾里德距離成比例的權(quán)重。將頂點(diǎn)連在一起將得到一張圖或一組拆散的圖。對(duì)于每一張得到的圖形,推斷出最小跨距樹(shù)。最小跨距樹(shù)通常被定義為一張圖的子集,其中所有的頂點(diǎn)仍然是被連接的,該圖的邊線長(zhǎng)度之和為盡可能的小(最小權(quán)重)。然后利用在上面提到的組分分類步驟中規(guī)定的外形參數(shù),將對(duì)應(yīng)于每張所得的圖形的組分分類為臉部或非臉部,然后通過(guò)將最弱的邊線(具有最大權(quán)重的邊線)除去將每張圖分成兩張圖,再次查看所得的圖形對(duì)應(yīng)的組分,繼續(xù)劃分,直到圍繞合成的圖形構(gòu)成的邊界框的面積小于閾值為止。
通過(guò)分析和查看對(duì)于一張臉的每張圖,在一個(gè)圖象中一組所有可能的臉部的位置和其尺寸被確定。該組可包含大量的虛假正片,所以一種啟發(fā)式方法被用于除去某些虛假的正片。尋找所有的臉部特征(也就是鼻,嘴,等)將需要一種樣板,這將得到太大的搜索空間。然而,實(shí)驗(yàn)已經(jīng)表明,那些臉部特征具有帶高方差的邊線。通過(guò)查看一張潛在的面孔內(nèi)的高方差象素與此潛在面孔中象素總數(shù)的比例,可以排除許多虛假的正片。
以上提到的啟動(dòng)式方法是首先通過(guò)對(duì)圖象內(nèi)的臉部候選者應(yīng)用一種形態(tài)接近操作來(lái)實(shí)現(xiàn)的。正如在技術(shù)上已知的那樣,選取一種障板并應(yīng)用到一個(gè)潛在的臉部區(qū)域內(nèi)的每個(gè)象素。例如,可采用一個(gè)3×3障板。一種膨脹算法被用于擴(kuò)展臉部候選者組分的邊界。然后,一種腐蝕算法被用于消除來(lái)自邊界的象素。本領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到,按這種次序執(zhí)行的這兩種算法將充滿組分之間的縫隙,并也將按基本相同的比例保持這些組分。很清楚,我們可以執(zhí)行多次膨脹,然后是多次腐蝕步驟,只要兩者被應(yīng)用相等數(shù)量的次數(shù)。
現(xiàn)在,在臉部候選者區(qū)域內(nèi)帶有高方差鄰居的象素與臉部候選者區(qū)域中的象素總數(shù)作比較。參考圖16A到16D,利用以上描述的方法,為潛在的臉部候選者查看圖16A中一個(gè)原先的圖象,以實(shí)現(xiàn)圖16B中所示的二進(jìn)制圖象。對(duì)二進(jìn)制圖象執(zhí)行形態(tài)接近操作,得到圖16C中所示的圖象。最后,位于圖16C的圖象中的帶有高方差的象素被檢測(cè),如圖16D中所示。然后可以確定高方差象素與象素總數(shù)之比。通過(guò)圖17中所示的步驟S2-S16概要說(shuō)明整個(gè)參加者檢測(cè)方法。
可以看出,通過(guò)控制攝象機(jī)觀看由電視會(huì)議系統(tǒng)規(guī)定的空間,對(duì)應(yīng)于參加者的攝象機(jī)參數(shù)預(yù)置值可被自動(dòng)地計(jì)算和連續(xù)地刷新。
通過(guò)描述優(yōu)選實(shí)施方案,應(yīng)該明了,可以作各種改變而不偏離在所附的權(quán)利要求中被更清楚地規(guī)定的本發(fā)明的范圍和精神。
權(quán)利要求
1.一種在電視會(huì)議系統(tǒng)中用于計(jì)算對(duì)應(yīng)于參加者(PartA,PartB,PartC)的攝象機(jī)參數(shù)預(yù)置值的方法,所述的方法包括-提供一種具有傾斜、全景和變焦參數(shù)(50)的攝象機(jī);-根據(jù)所述的電視會(huì)議系統(tǒng)的布局規(guī)定一個(gè)空間;執(zhí)行以下操作之一通過(guò)所有合適的攝全景值移動(dòng)所述的攝象機(jī),所述的合適的攝全景值是由所述的電視會(huì)議系統(tǒng)所在的空間規(guī)定的,和使所述的攝象機(jī)取遠(yuǎn)景,使得所有可能的參加者可被所述的攝象機(jī)觀看到,并使得在所述的空間中每個(gè)參加者的位置可被確定;-檢測(cè)在所述空間內(nèi)所述的參加者;和-計(jì)算對(duì)應(yīng)于所述的參加者的所述的預(yù)置值,所述的預(yù)置值規(guī)定攝象機(jī)的視域,所述的預(yù)置值是基于在所述的攝象機(jī)視域中所述的參加者的至少一個(gè)最佳位置,將所述的參加者的頭部中心與所述的攝象機(jī)視域的中心對(duì)準(zhǔn),和將一個(gè)參加者的中心與所述的攝象機(jī)視域所述的中心對(duì)準(zhǔn)。
2.如權(quán)利要求1的方法,進(jìn)一步包括通過(guò)將標(biāo)記與每個(gè)所述的參加者相關(guān)聯(lián)來(lái)跟蹤所述的參加者。
3.如權(quán)利要求1的方法,進(jìn)一步包括刷新所述的預(yù)置值,當(dāng)預(yù)置值由使用者選取時(shí),所述的電視會(huì)議系統(tǒng)執(zhí)行至少一項(xiàng)對(duì)預(yù)置值的調(diào)節(jié),當(dāng)對(duì)應(yīng)于預(yù)置值的參加者離開(kāi)所述的空間時(shí)刪除預(yù)置值,并重復(fù)所述的實(shí)施步驟。
4.如權(quán)利要求1的方法,其中在所述的計(jì)算步驟中,當(dāng)多于一個(gè)參加者在所述的攝象機(jī)視域內(nèi)時(shí),參加者被組合成為一個(gè)組合圖象,組合圖象的中心被用于確定所述的預(yù)置值。
5.如權(quán)利要求1的方法,其中所述的檢測(cè)步驟包括-提供由多個(gè)象素組成的數(shù)字圖象(52);-通過(guò)檢測(cè)膚色象素從數(shù)字圖象產(chǎn)生二進(jìn)制圖象(54);-在所述的二進(jìn)制圖象的亮度組分中排除對(duì)應(yīng)于邊線的象素,從而產(chǎn)生二進(jìn)制圖象組分(56);-將所述的二進(jìn)制圖象組分映射到至少一張圖形中(512);和-將所述的被映射的二進(jìn)制圖象組分分類為臉部和非臉部類型,其中臉部類型用作臉部的候選者(514)。
6.如權(quán)利要求5的方法,進(jìn)一步包括應(yīng)用一種啟發(fā)式方法的步驟,所述的啟發(fā)式方法包括以下步驟-對(duì)每個(gè)所述的臉部候選者施加一種形態(tài)接近操作以產(chǎn)生至少一個(gè)接近的臉部候選者;-在所述的接近的臉部候選者中確定高方差象素;-在所述的接近的臉部候選者中確定所述的高方差象素和象素總數(shù)之間的比;和-將所述的比與一個(gè)閾值作比較。
7.如權(quán)利要求5的方法,其中所述的排除步驟包括-將一個(gè)障板加到包括一個(gè)被查看的象素的多個(gè)象素上;-確定在所述的被查看的象素和在所述的障板內(nèi)放置的象素之間的方差;和-將所述的方差與方差閾值作比較。
8.如權(quán)利要求7的方法,其中-為了降低方差閾值,所述的排除步驟被重復(fù),直到所述的二進(jìn)制圖象組分的大小低于組分大小的閾值為止;和-在每次排除步驟以后實(shí)施對(duì)所述的組分的分類步驟。
9.如權(quán)利要求5的方法,其中所述的二進(jìn)制圖象組分被連接。
10.如權(quán)利要求5的方法,其中所述的分類步驟包括形成圍繞所述的組分中一個(gè)被分類的組分的邊界框并執(zhí)行至少一項(xiàng)以下的操作-圍繞所述的組分中一個(gè)被分類的組分形成一個(gè)邊界框;-將邊界框的面積與邊界框閾值作比較;-將邊界框的縱橫比與縱橫比閾值作比較;-確定面積比,所述的面積比是在所述的被分類組分的面積和所述的邊界框面積之間的比較,和所述的面積比與面積比閾值的比較;-確定在所述的邊界框內(nèi)被延長(zhǎng)物體的方向;和-確定所述的邊界框的中心和所述的被分類組分的中心之間的距離。
11.如權(quán)利要求5的方法,其中所述的映射步驟包括以下步驟-將每個(gè)組分表示為一個(gè)頂點(diǎn);-當(dāng)在空間上接近和顏色上類似時(shí),將這些頂點(diǎn)用邊線連接,從而構(gòu)成所述的至少一個(gè)圖形。
12.如權(quán)利要求11的方法,其中每條邊線具有有關(guān)的權(quán)重,并進(jìn)一步包括以下步驟-推斷出每張圖的最小跨度樹(shù);-將每張圖相應(yīng)的二進(jìn)制圖象組分分類為臉部或非臉部;-在每張具有最大權(quán)重的圖形中除去邊線從而形成兩張較小的圖形;和-對(duì)每張所述的較小的圖形重復(fù)所述的將相應(yīng)的二進(jìn)制圖象組分分類的步驟,直到圍繞所述的較小圖形的邊界框小于圖形閾值為止。
13.如權(quán)利要求1的方法,進(jìn)一步包括提供至少一個(gè)第二攝象機(jī),用于通過(guò)執(zhí)行所述的實(shí)施步驟刷新所述的預(yù)置值。
14.一種電視會(huì)議系統(tǒng),包括-至少一臺(tái)具有全景、傾斜和變焦參數(shù)的攝象機(jī)(50);-所述的參數(shù)具有分配給所述的電視會(huì)議系統(tǒng)的相應(yīng)參加者(PartA,PartB,PartC)的預(yù)置值,-每個(gè)所述的預(yù)置值規(guī)定一種攝象機(jī)的視域,并被確定于在由所述的電視會(huì)議系統(tǒng)規(guī)定的整個(gè)空間內(nèi)進(jìn)行將所述的攝象機(jī)攝全景和變焦操作中的一種,檢測(cè)一個(gè)參加者,和根據(jù)攝象機(jī)的位置規(guī)定預(yù)置值,將所述的參加者放在最佳位置之一中,所述的參加者的頭部與所述的攝象機(jī)視域的中心對(duì)準(zhǔn)的位置,和所述的參加者的中心與所述的攝象機(jī)視域的中心對(duì)準(zhǔn)的位置。
15.如權(quán)利要求14的電視會(huì)議系統(tǒng),進(jìn)一步包括通過(guò)將一個(gè)標(biāo)記與每個(gè)所述的參加者相關(guān)聯(lián)來(lái)跟蹤所述的參加者的裝置。
16.如權(quán)利要求14的電視會(huì)議系統(tǒng),進(jìn)一步包括用于刷新所述的預(yù)置值的裝置,通過(guò)當(dāng)預(yù)置值由用戶選取時(shí),所述的電視會(huì)議系統(tǒng)執(zhí)行至少一項(xiàng)調(diào)節(jié)預(yù)置值的操作,當(dāng)對(duì)應(yīng)于預(yù)置值的參加者離開(kāi)所述的空間時(shí),刪除預(yù)置值,在整個(gè)所述的空間使所述的攝象機(jī)攝全景,并在整個(gè)所述的空間使所述的攝象機(jī)變焦來(lái)實(shí)現(xiàn)。
17.如權(quán)利要求14的電視會(huì)議系統(tǒng),其中當(dāng)多于一個(gè)參加者在所述的攝象機(jī)視域內(nèi)時(shí),參加者被組合成一個(gè)組合圖象且組合圖象的中心被用于確定所述的預(yù)置值。
18.如權(quán)利要求14的電視會(huì)議系統(tǒng),其中所述的檢測(cè)包括-提供由多個(gè)象素組成的數(shù)字圖象(52);-通過(guò)檢測(cè)膚色象素從數(shù)字圖象產(chǎn)生二進(jìn)制圖象(54);-在所述的二進(jìn)制圖象的亮度組分中刪去對(duì)應(yīng)于邊線的象素,從而產(chǎn)生二進(jìn)制圖象組分(56);-將所述的二進(jìn)制圖象組分映射到至少一張圖形中(512);和-將所述的被映射的二進(jìn)制圖象組分分類為臉部和非臉部類型,其中臉部類型用作臉部的候選者(514)。
19.如權(quán)利要14的電視會(huì)議系統(tǒng),進(jìn)一步包括至少一個(gè)第二攝象機(jī)用于刷新所述的預(yù)置值,通過(guò)執(zhí)行至少一項(xiàng)以下的操作來(lái)實(shí)現(xiàn),使所述的攝象機(jī)在整個(gè)所述的空間內(nèi)攝全景,并使所述的攝象機(jī)在整個(gè)所述的空間內(nèi)變焦。
20.一種電視會(huì)議系統(tǒng),包括-至少一臺(tái)具有全景、傾斜和變焦參數(shù)的攝象機(jī)(50);-所述的參數(shù)具有分配給所述的電視會(huì)議系統(tǒng)的相應(yīng)參加者的預(yù)置值,所述的預(yù)置值規(guī)定攝象機(jī)的視域;-至少一臺(tái)攝全景裝置,用于使所述的攝象機(jī)在由所述的電視會(huì)議系統(tǒng)規(guī)定的空間中攝全景,和變焦裝置,用于使所述的攝象機(jī)取遠(yuǎn)景,從而使所述的攝象機(jī)能觀看由所述的電視會(huì)議系統(tǒng)規(guī)定的空間;-檢測(cè)裝置,用于檢測(cè)在所述空間中的參加者;和-確定裝置,用于根據(jù)攝象機(jī)的位置確定所述的攝象機(jī)的預(yù)置值,將所述的參加者之一放在最佳位置之一中,所述的參加者的頭部與所述的攝象機(jī)的視域中心對(duì)準(zhǔn)的位置,和所述的參加者的中心與所述的攝象機(jī)的視域中心對(duì)準(zhǔn)的位置。
21.如權(quán)利要求20的電視會(huì)議系統(tǒng),進(jìn)一步包括用于跟蹤所述的參加者的裝置,通過(guò)將一個(gè)標(biāo)記與每個(gè)所述的參加者相關(guān)聯(lián)來(lái)實(shí)現(xiàn)。
22.如權(quán)利要求20的電視會(huì)議系統(tǒng),進(jìn)一步包括用于刷新所述的預(yù)置值的裝置,通過(guò)當(dāng)預(yù)置值由使用者選取時(shí),所述的電視會(huì)議系統(tǒng)執(zhí)行至少一項(xiàng)調(diào)節(jié)預(yù)置值的操作,當(dāng)對(duì)應(yīng)于預(yù)置值的參加者離開(kāi)所述的空間時(shí),刪除預(yù)置值,使所述的攝象機(jī)在整個(gè)所述的空間攝全景,和使所述的攝象機(jī)在整個(gè)所述的空間變焦來(lái)實(shí)現(xiàn)。
23.如權(quán)利要求20的電視會(huì)議系統(tǒng),其中當(dāng)多于一個(gè)參加者在所述的攝象機(jī)視域內(nèi)時(shí),參加者被組合成一個(gè)組合圖象,組合圖象的中心被用于確定所述的預(yù)置值。
24.如權(quán)利要求20的電視會(huì)議系統(tǒng),其中所述的檢測(cè)包括-提供由多個(gè)象素組成的數(shù)字圖象(52);-通過(guò)檢測(cè)膚色象素從數(shù)字圖象產(chǎn)生二進(jìn)制圖象(54);-在所述的二進(jìn)制圖象的亮度組分中除去對(duì)應(yīng)于邊線的象素,從而產(chǎn)生二進(jìn)制圖象組分(56);-將所述的二進(jìn)制圖象組分映射到至少一張圖形中(512);和-將所述的被映射的二進(jìn)制圖象組分分類為臉部和非臉部類型,其中臉部類型用作臉部候選者(514)。
25.如權(quán)利要求20的電視會(huì)議系統(tǒng),進(jìn)一步包括至少一臺(tái)第二攝象機(jī),用于刷新所述的預(yù)置值,通過(guò)執(zhí)行至少一項(xiàng)以下操作來(lái)實(shí)現(xiàn),使所述的攝象機(jī)在整個(gè)所述的空間攝全景,和使所述的攝象機(jī)在整個(gè)所述的空間變焦。
全文摘要
一種電視會(huì)議系統(tǒng)和方法,自動(dòng)地確定對(duì)應(yīng)于參加電視會(huì)議的參加者的適當(dāng)?shù)念A(yù)置攝象機(jī)參數(shù)。攝象機(jī)對(duì)電視會(huì)議空間取遠(yuǎn)景或攝全景并根據(jù)參加者的臉部尋找參加者。當(dāng)一個(gè)參加者被檢測(cè)到時(shí),在參加者的中心位于攝象機(jī)視域中心期間,對(duì)于該參加者的預(yù)置攝象機(jī)參數(shù)被計(jì)算。這個(gè)過(guò)程對(duì)于房間中的所有參加者繼續(xù)進(jìn)行。根據(jù)文化背景確定對(duì)每個(gè)參加者的最佳位置和相應(yīng)的攝象機(jī)參數(shù)。通過(guò)使攝象機(jī)變焦移出或?qū)Ψ块g攝全景可以周期性地進(jìn)行預(yù)置值刷新。多臺(tái)攝象機(jī)可用于連續(xù)地刷新預(yù)置值。
文檔編號(hào)H04N5/232GK1298601SQ99805338
公開(kāi)日2001年6月6日 申請(qǐng)日期1999年12月14日 優(yōu)先權(quán)日1998年12月22日
發(fā)明者E·科亨-索拉爾, A·P·馬特爾, S·森古普塔, H·斯特魯貝, J·卡維德斯, M·阿布德?tīng)枺詹? A·埃爾加馬爾 申請(qǐng)人:皇家菲利浦電子有限公司