亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種視頻會議智能前端系統(tǒng)的制作方法

文檔序號:7995516閱讀:556來源:國知局
專利名稱:一種視頻會議智能前端系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及視頻會議系統(tǒng)領(lǐng)域,尤其涉及一種視頻會議智能前端系統(tǒng)。
背景技術(shù)
隨著視頻攝像技術(shù)、網(wǎng)絡(luò)寬帶技術(shù)、視頻壓縮技術(shù)以及存儲技術(shù)的飛速發(fā)展,視頻會議被廣泛地使用于多種場合下的本地或遠(yuǎn)程的會議中。如圖1所示,視頻會議系統(tǒng)的基本工作原理是通過麥克風(fēng)和攝像頭前端采集設(shè)備10采集音頻信號和視頻信號,利用視頻會議主機20對采集到的音頻和視頻信號壓縮后存儲于本地或利用網(wǎng)絡(luò)設(shè)備30傳送到遠(yuǎn)端,根據(jù)主控系統(tǒng)40的控制信號選擇本地的或遠(yuǎn)端的經(jīng)壓縮音視頻信號,經(jīng)視頻會議主機20解碼,并送往相應(yīng)的顯示設(shè)備50顯示?,F(xiàn)有的視頻會議系統(tǒng)大致分為傳統(tǒng)型和智能型兩類,傳統(tǒng)型系統(tǒng)中音視頻信號是分離的獨立采集的;智能型系統(tǒng)中音視頻信號的采集是相互關(guān)聯(lián)的,通常利用音頻信號控制攝像頭的相關(guān)參數(shù)以便采集到的視頻圖像中能看清發(fā)言者的臉部?,F(xiàn)有的智能型視頻會議系統(tǒng)的攝像頭控制系統(tǒng)一般采用麥克風(fēng)陣列進(jìn)行聲音信號的采集,通過分析聲音信號確定聲音的來源位置,控制攝像頭進(jìn)行轉(zhuǎn)動,以期拍攝到會議發(fā)言人的面部。但該方案一方面,容易受到噪聲或非發(fā)言人的聲音影響導(dǎo)致聲音的來源判斷不準(zhǔn)確,從而導(dǎo)致控制攝像頭轉(zhuǎn)動不到位,不能拍攝到發(fā)言者的臉部;另一方面,攝像頭的放置位置或轉(zhuǎn)動控制比較復(fù)雜,而且更大的不足在于即使攝像頭能調(diào)整到位,也只能看清發(fā)言者,而會場全貌無法看到,這樣跟我們的真實的會議現(xiàn)場有很大的差別。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述缺陷,提出了一種改進(jìn)型的智能前端系統(tǒng),一方面,能準(zhǔn)確地捕捉到發(fā)言者的視頻圖像;另一方面,視頻會議畫面不僅能看清發(fā)言者的臉部,同時也能看到會場的全貌。為實現(xiàn)上述目的,本發(fā)明通過以下技術(shù)手段實現(xiàn)
一種視頻會議智能前端系統(tǒng),包括一組語音視頻攝入設(shè)備、一個視頻會議攝像機、一個會議系統(tǒng)控制單元、一個視音頻矩陣切換器和一個視頻處理器,其中
所述語音視頻攝入設(shè)備,對會議現(xiàn)場的發(fā)言者聲音和視頻圖像的采集后,發(fā)送給視音頻矩陣切換器;
所述視頻會議攝像機,對會議現(xiàn)場的全景視頻圖像的采集后,發(fā)送給視頻處理器; 所述會議系統(tǒng)控制單元,對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制; 所述視音頻矩陣切換器,根據(jù)會議系統(tǒng)控制單元發(fā)送的控制信號,實現(xiàn)會議系統(tǒng)中多路音視頻信號的同步切換;
所述視頻處理器,接收來自視音頻矩陣切換器輸出的視頻信號,完成發(fā)言者視頻圖像的恢復(fù)、發(fā)言者人臉的檢測與裁剪、會議現(xiàn)場的全景視頻圖像的恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加、編碼生成混合視頻信號輸出。
所述語音視頻攝入設(shè)備,由多組麥克風(fēng)和微型攝像機構(gòu)成,每組麥克風(fēng)和微型攝像機采集同一個發(fā)言者的聲音和視頻圖像,即麥克風(fēng)和微型攝像機分成若干組且每組內(nèi)部一一對應(yīng)采集同一個發(fā)言者的聲音和視頻圖像。所述視頻會議攝像機,是一個廣角的長焦的視頻攝像機,以便于能清晰地攝取會議現(xiàn)場的全景。所述會議系統(tǒng)控制單元,其控制過程為每位發(fā)言者的面前都有一個設(shè)備,通過操作設(shè)備面板上的按鍵來控制自己的話筒開關(guān)狀態(tài),如需要發(fā)言,先按設(shè)備上的請求發(fā)言鍵, 如此時無其它人發(fā)言,控制面板的指示燈變?yōu)榧t色,話筒上的光管也變?yōu)榧t色;如此時有其它人發(fā)言,控制面板上的指示燈變?yōu)殚W動的綠色,會議系統(tǒng)控制單元的中央控制器會根據(jù)現(xiàn)有請求進(jìn)行排隊,在其余人先發(fā)言完畢后,申請發(fā)言人即可發(fā)言,此時控制面盤上的指示燈及話筒上的指示光管均為紅色;最后,會議系統(tǒng)控制單元將控制結(jié)果送給視音頻矩陣切換器。所述視音頻矩陣切換器,通常的視音頻矩陣切換器是專門用于對視頻信號和音頻信號進(jìn)行切換和分配,可將多路信號從輸入通道切換輸送到輸出通道中的任一通道上,并且輸出通道間彼此獨立;本系統(tǒng)中的視音頻矩陣切換器,是其中的一種特殊形式,即根據(jù)會議系統(tǒng)控制單元的控制信號,從多路音視頻信號中將發(fā)言者的那路信號從輸入通道切換輸送到一個輸出通道上。所述視頻處理器,由微型攝像機視頻圖像恢復(fù)單元、微型攝像機視頻圖像預(yù)處理單元、人臉檢測單元、會議全景攝像機視頻圖像恢復(fù)單元、會議全景攝像機視頻圖像預(yù)處理單元、人臉疊加混合單元、復(fù)合視頻信號編碼生成單元組成;視音頻矩陣切換器輸出的發(fā)言者模擬復(fù)合視頻信號先傳輸給微型攝像機視頻圖像恢復(fù)單元,再依次經(jīng)過微型攝像機視頻圖像預(yù)處理單元、人臉檢測單元,傳輸給人臉疊加混合單元;視頻會議攝像機輸出的會議全景模擬復(fù)合視頻信號先傳輸給會議全景攝像機視頻圖像恢復(fù)單元,再經(jīng)過會議全景攝像機視頻圖像預(yù)處理單元傳輸給人臉疊加混合單元;兩路信號在人臉疊加混合單元疊加后經(jīng)復(fù)合視頻信號編碼生成單元傳輸給視頻會議主機。總體上,視音頻矩陣切換器輸出的發(fā)言者的音頻信號、視頻處理器輸出的含有發(fā)言者人臉的混合視頻信號,一起發(fā)送到視頻會議主機處理。以下具體分析視頻處理器的工作的實現(xiàn)原理 一、微型攝像機視頻圖像恢復(fù)單元
視音頻矩陣切換器輸出為微型攝像機采集的發(fā)言者的模擬復(fù)合視頻信號(CVBS),首先進(jìn)行模數(shù)轉(zhuǎn)換,接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量,V為紅差分量), 這樣可以恢復(fù)出微型攝像機所攝入的圖像,發(fā)送給微型攝像機視頻圖像預(yù)處理單元。二、微型攝像機視頻圖像預(yù)處理單元
對微型攝像機視頻圖像恢復(fù)單元恢復(fù)出的圖像解交錯,并對解交錯后的圖像進(jìn)行降噪濾波,然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉檢測單元。三、人臉檢測單元
微型攝像機視頻圖像預(yù)處理單元處理后的圖像,是包含了發(fā)言者臉部完整信息的圖像。由于發(fā)言者離微型攝像機的遠(yuǎn)近不一,導(dǎo)致發(fā)言者臉部圖像像素大小差別很大,這樣視覺效果很差。為了使得發(fā)言者臉部圖像像素大小基本統(tǒng)一,人臉檢測單元,其檢測步驟為第一步,接收來自微型攝像機視頻圖像預(yù)處理單元處理后的圖像信號,利用人臉檢測技術(shù)對整個圖像進(jìn)行人臉檢測,確定發(fā)言者人臉的位置; 第二步,截取發(fā)言者人臉畫面; 第三步,縮放成指定的大小,發(fā)送給人臉疊加混合單元。四、會議全景攝像機視頻圖像恢復(fù)單元
視頻會議攝像機輸出為會議全景的模擬復(fù)合視頻信號(CVBS),首先進(jìn)行模數(shù)轉(zhuǎn)換,接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量,V為紅差分量),這樣可以恢復(fù)出會議全景攝像機所攝入的圖像,發(fā)送給會議全景攝像機視頻圖像預(yù)處理單元。五、會議全景攝像機視頻圖像預(yù)處理單元
對會議全景攝像機視頻圖像恢復(fù)單元恢復(fù)出的圖像解交錯,并對解交錯后的圖像進(jìn)行降噪濾波,然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉疊加混合單元。六、人臉疊加混合單元
為了使得在一個視頻畫面既能看清發(fā)言者的臉部又能看到會場的全貌,我們將人臉檢測單元送來的發(fā)言者人臉圖像通過圖像疊加的方式,疊加到會議全景攝像機視頻圖像預(yù)處理單元送來的會場全景圖像的指定位置,并將疊加后的混合視頻數(shù)據(jù)發(fā)送給復(fù)合視頻信號編碼生成單元。七、復(fù)合視頻信號(CVBS)編碼生成單元
復(fù)合視頻信號(CVBS)編碼生成單元,對來自人臉疊加混合單元的圖像數(shù)據(jù)加上行場同步信號以及色同步信號,并對色度信號進(jìn)行平衡調(diào)幅調(diào)制,一起疊加生成復(fù)合視頻信號 (CVBS),通過同軸線傳輸給視頻會議系統(tǒng)主機的視頻輸入端。采用本發(fā)明的有益效果在于與現(xiàn)有的前端系統(tǒng)相比,一方面,本發(fā)明克服了原系統(tǒng)完全依賴語音識別判斷發(fā)言者,容易受到噪聲或非發(fā)言人的聲音影響導(dǎo)致聲音的來源判斷不準(zhǔn)確,導(dǎo)致攝像頭不能準(zhǔn)確拍攝到發(fā)言者臉部;另一方面,本發(fā)明使得在一個視頻畫面中既能準(zhǔn)確看清發(fā)言者的臉部,又能看到會場的全景;另外,利用本發(fā)明,可以在基本不改變原有視頻會議系統(tǒng)的情況下,實現(xiàn)視頻會議系統(tǒng)的智能化升級。


圖1 現(xiàn)有視頻會議系統(tǒng)基本組成的結(jié)構(gòu)示意圖。圖2 本發(fā)明視頻會議智能前端系統(tǒng)的結(jié)構(gòu)示意圖。圖3 本發(fā)明視頻處理器的結(jié)構(gòu)示意圖。其中圖1、圖2和圖3的符號說明如下
10、前端采集設(shè)備,20、視頻會議主機,30、網(wǎng)絡(luò)設(shè)備,40、主控系統(tǒng),50、顯示設(shè)備,101、 一組語音視頻攝入設(shè)備,102、視頻會議攝像機,103、會議系統(tǒng)控制單元,104、視音頻矩陣切換器,105、視頻處理器,VI、第1路微型攝像機,Al、第1路麥克風(fēng),V2、第2路微型攝像機, A2、第2路麥克風(fēng),Vn-I、第n-1路微型攝像機,An-I、第n_l路麥克風(fēng)n_l,Vn、第η路微型攝像機,An、第η路麥克風(fēng),Vx、第χ路視頻信號,Αχ、第χ路聲音信號,V、視頻信號,Α、聲音信號,201、微型攝像機視頻圖像恢復(fù)單元,202、微型攝像機視頻圖像預(yù)處理單元,203、人臉檢測單元,204、會議全景攝像機視頻圖像恢復(fù)單元,205、會議全景攝像機視頻圖像預(yù)處理單元,206、人臉疊加混合單元,207、復(fù)合視頻信號編碼生成單元。
具體實施例方式如圖2、圖3所示,分別是本發(fā)明視頻會議智能前端系統(tǒng)和視頻處理器的結(jié)構(gòu)示意圖。一種視頻會議智能前端系統(tǒng),包括一組語音視頻攝入設(shè)備101、一個視頻會議攝像機102、一個會議系統(tǒng)控制單元103、一個視音頻矩陣切換器104和一個視頻處理器105,其中
所述語音視頻攝入設(shè)備101,對會議現(xiàn)場的發(fā)言者聲音和視頻圖像的采集后,發(fā)送給視音頻矩陣切換器104 ;
所述視頻會議攝像機102,對會議現(xiàn)場的全景視頻圖像的采集后,發(fā)送給視頻處理器
105 ;
所述會議系統(tǒng)控制單元103,對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制; 所述視音頻矩陣切換器104,根據(jù)會議系統(tǒng)控制單元103發(fā)送的控制信號,實現(xiàn)會議系統(tǒng)中多路音視頻信號的同步切換;
所述視頻處理器105,接收來自視音頻矩陣104切換器輸出的視頻信號,完成發(fā)言者視頻圖像的恢復(fù)、發(fā)言者人臉的檢測與裁剪、會議現(xiàn)場的全景視頻圖像的恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加、編碼生成混合視頻信號輸出。所述語音視頻攝入設(shè)備101,由η組麥克風(fēng)和微型攝像機構(gòu)成,η為正整數(shù),具體可以根據(jù)會場發(fā)言者人數(shù)的多少進(jìn)行增減。比如第1路微型攝像機Vl和第1路麥克風(fēng)Al采集第一位發(fā)言者的聲音和視頻圖像,第2路微型攝像機V2和第2路麥克風(fēng)Α2采集第二位發(fā)言者的聲音和視頻圖像,依次類推,直到第η路微型攝像機Vn和第η路麥克風(fēng)An采集第 η位發(fā)言者的聲音和視頻圖像。所述視頻會議攝像機102,是一個廣角的長焦的視頻攝像機,以便于能清晰地攝取會議現(xiàn)場的全景。所述會議系統(tǒng)控制單元103,其控制過程為每位發(fā)言者的面前都有一個設(shè)備,通過操作設(shè)備面板上的按鍵來控制自己的話筒開關(guān)狀態(tài),如需要發(fā)言,先按設(shè)備上的請求發(fā)言鍵,如此時無其它人發(fā)言,控制面板的指示燈變?yōu)榧t色,話筒上的光管也變?yōu)榧t色;如此時有其它人發(fā)言,控制面板上的指示燈變?yōu)殚W動的綠色,會議系統(tǒng)控制單元103的中央控制器會根據(jù)現(xiàn)有請求進(jìn)行排隊,在其余人先發(fā)言完畢后,申請發(fā)言人即可發(fā)言,此時控制面盤上的指示燈及話筒上的指示光管均為紅色;最后,會議系統(tǒng)控制單元103將控制結(jié)果送給視音頻矩陣切換器104。所述視音頻矩陣切換器104,本系統(tǒng)中的視音頻矩陣切換器104,根據(jù)會議系統(tǒng)控制單元103的控制信號,從多路音視頻信號中將發(fā)言者的那路信號從輸入通道切換輸送到一個輸出通道上,即從η路視音頻信號中選取發(fā)言者(標(biāo)記為χ,χ為小于等于η的正整數(shù)) 的那路第χ路視頻信號Vx切換輸送到視頻處理器105,第χ路聲音信號Ax切換輸送到視頻會議主機20。所述視頻處理器105,由微型攝像機視頻圖像恢復(fù)單元201、微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元203、會議全景攝像機視頻圖像恢復(fù)單元204、會議全景攝像機視頻圖像預(yù)處理單元205、人臉疊加混合單元206、復(fù)合視頻信號編碼生成單元207組成;視音頻矩陣切換器104輸出的發(fā)言者模擬復(fù)合視頻信號先傳輸給微型攝像機視頻圖像恢復(fù)單元201,再依次經(jīng)過微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元203,傳輸給人臉疊加混合單元206 ;視頻會議攝像機102輸出的會議全景模擬復(fù)合視頻信號先傳輸給會議全景攝像機視頻圖像恢復(fù)單元204,再經(jīng)過會議全景攝像機視頻圖像預(yù)處理單元205傳輸給人臉疊加混合單元206 ;兩路信號在人臉疊加混合單元206疊加后經(jīng)復(fù)合視頻信號編碼生成單元207傳輸給視頻會議主機20??傮w上,視音頻矩陣切換器104輸出的發(fā)言者的音頻信號A、視頻處理器105輸出的含有發(fā)言者人臉的混合視頻信號V,一起發(fā)送到視頻會議主機20處理。以下具體分析視頻處理器105的工作的實現(xiàn)原理 一、微型攝像機視頻圖像恢復(fù)單元201
視音頻矩陣切換器104輸出為微型攝像機采集的發(fā)言者的模擬復(fù)合視頻信號(CVBS), 首先進(jìn)行模數(shù)轉(zhuǎn)換,接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量,V為紅差分量),這樣可以恢復(fù)出微型攝像機所攝入的圖像,發(fā)送給微型攝像機視頻圖像預(yù)處理單元 202。二、微型攝像機視頻圖像預(yù)處理單元202
對微型攝像機視頻圖像恢復(fù)單元201恢復(fù)出的圖像解交錯,并對解交錯后的圖像進(jìn)行降噪濾波,然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉檢測單元203。三、人臉檢測單元203
微型攝像機視頻圖像預(yù)處理單元202處理后的圖像,是包含了發(fā)言者臉部完整信息的圖像。由于發(fā)言者離微型攝像機的遠(yuǎn)近不一,導(dǎo)致發(fā)言者臉部圖像像素大小差別很大,這樣視覺效果很差。為了使得發(fā)言者臉部圖像像素大小基本統(tǒng)一,人臉檢測單元203,其檢測步驟為
第一步,接收來自微型攝像機視頻圖像預(yù)處理單元202處理后的圖像信號,利用人臉檢測技術(shù)對整個圖像進(jìn)行人臉檢測,確定發(fā)言者人臉的位置; 第二步,截取發(fā)言者人臉畫面;
第三步,縮放成指定的大小,發(fā)送給人臉疊加混合單元206。四、會議全景攝像機視頻圖像恢復(fù)單元204
視頻會議攝像機102輸出為會議全景的模擬復(fù)合視頻信號(CVBS),首先進(jìn)行模數(shù)轉(zhuǎn)換,接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量,V為紅差分量),這樣可以恢復(fù)出會議全景攝像機所攝入的圖像,發(fā)送給會議全景攝像機視頻圖像預(yù)處理單元205。五、會議全景攝像機視頻圖像預(yù)處理單元205
對會議全景攝像機視頻圖像恢復(fù)單元204恢復(fù)出的圖像解交錯,并對解交錯后的圖像進(jìn)行降噪濾波,然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉疊加混合單元206。六、人臉疊加混合單元206
為了使得在一個視頻畫面既能看清發(fā)言者的臉部又能看到會場的全貌,我們將人臉檢測單元203送來的發(fā)言者人臉圖像通過圖像疊加的方式,疊加到會議全景攝像機視頻圖像預(yù)處理單元205送來的會場全景圖像的指定位置,并將疊加后的混合視頻數(shù)據(jù)發(fā)送給復(fù)合視頻信號編碼生成單元207。七、復(fù)合視頻信號(CVBS)編碼生成單元207復(fù)合視頻信號(CVBS)編碼生成單元207,對來自人臉疊加混合單元206的圖像數(shù)據(jù)加上行場同步信號以及色同步信號,并對色度信號進(jìn)行平衡調(diào)幅調(diào)制,一起疊加生成復(fù)合視頻信號(CVBS),通過同軸線傳輸給視頻會議系統(tǒng)主機的視頻輸入端。
權(quán)利要求
1.一種視頻會議智能前端系統(tǒng),其特征在于包括一組語音視頻攝入設(shè)備101、一個視頻會議攝像機102、一個會議系統(tǒng)控制單元103、一個視音頻矩陣切換器104和一個視頻處理器105,其中所述語音視頻攝入設(shè)備101,對會議現(xiàn)場的發(fā)言者聲音和視頻圖像的采集后,發(fā)送給視音頻矩陣切換器104 ;所述視頻會議攝像機102,對會議現(xiàn)場的全景視頻圖像的采集后,發(fā)送給視頻處理器105 ;所述會議系統(tǒng)控制單元103,對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制;所述視音頻矩陣切換器104,根據(jù)會議系統(tǒng)控制單元103發(fā)送的控制信號,實現(xiàn)會議系統(tǒng)中多路音視頻信號的同步切換;所述視頻處理器105,接收來自視音頻矩陣104切換器輸出的視頻信號,完成發(fā)言者視頻圖像的恢復(fù)、發(fā)言者人臉的檢測與裁剪、會議現(xiàn)場的全景視頻圖像的恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加、編碼生成混合視頻信號輸出。
2.如權(quán)利要求1所述的視頻會議智能前端系統(tǒng),其特征在于所述語音視頻攝入設(shè)備 101,由多組麥克風(fēng)和微型攝像機構(gòu)成,每組麥克風(fēng)和微型攝像機采集同一個發(fā)言者的聲音和視頻圖像。
3.如權(quán)利要求1所述的視頻會議智能前端系統(tǒng),其特征在于所述會議系統(tǒng)控制單元 103,其控制過程為每位發(fā)言者的面前都有一個設(shè)備,通過操作設(shè)備面板上的按鍵來控制自己的話筒開關(guān)狀態(tài),如需要發(fā)言,先按設(shè)備上的請求發(fā)言鍵,如此時無其它人發(fā)言,控制面板的指示燈變?yōu)榧t色,話筒上的光管也變?yōu)榧t色;如此時有其它人發(fā)言,控制面板上的指示燈變?yōu)殚W動的綠色,會議系統(tǒng)控制單元103的中央控制器會根據(jù)現(xiàn)有請求進(jìn)行排隊,在其余人先發(fā)言完畢后,申請發(fā)言人即可發(fā)言,此時控制面盤上的指示燈及話筒上的指示光管均為紅色;最后,會議系統(tǒng)控制單元103將控制結(jié)果送給視音頻矩陣切換器104。
4.如權(quán)利要求1所述的視頻會議智能前端系統(tǒng),其特征在于所述視頻處理器105, 由微型攝像機視頻圖像恢復(fù)單元201、微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元 203、會議全景攝像機視頻圖像恢復(fù)單元204、會議全景攝像機視頻圖像預(yù)處理單元205、人臉疊加混合單元206、復(fù)合視頻信號編碼生成單元207組成;視音頻矩陣切換器104輸出的發(fā)言者模擬復(fù)合視頻信號先傳輸給微型攝像機視頻圖像恢復(fù)單元201,再依次經(jīng)過微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元203,傳輸給人臉疊加混合單元206 ;視頻會議攝像機102輸出的會議全景模擬復(fù)合視頻信號先傳輸給會議全景攝像機視頻圖像恢復(fù)單元204,再經(jīng)過會議全景攝像機視頻圖像預(yù)處理單元205傳輸給人臉疊加混合單元206 ;兩路信號在人臉疊加混合單元206疊加后經(jīng)復(fù)合視頻信號編碼生成單元207傳輸給視頻會議主機20。
5.如權(quán)利要求4所述的視頻會議智能前端系統(tǒng),其特征在于所述人臉檢測單元203, 其檢測步驟為第一步,接收來自微型攝像機視頻圖像預(yù)處理單元202處理后的圖像信號,利用人臉檢測技術(shù)對整個圖像進(jìn)行人臉檢測,確定發(fā)言者人臉的位置;第二步,截取發(fā)言者人臉畫面;第三步,縮放成指定的大小,發(fā)送給人臉疊加混合單元206。
6.如權(quán)利要求4所述的視頻會議智能前端系統(tǒng),其特征在于所述人臉疊加混合單元 206,將人臉檢測單元203送來的發(fā)言者人臉圖像通過圖像疊加的方式,疊加到會議全景攝像機視頻圖像預(yù)處理單元205送來的會場全景圖像的指定位置,并將疊加后的混合視頻數(shù)據(jù)發(fā)送給復(fù)合視頻信號編碼生成單元207。
全文摘要
本發(fā)明公開了一種視頻會議智能前端系統(tǒng),包括一組語音視頻攝入設(shè)備、一個視頻會議攝像機、一個會議系統(tǒng)控制單元、一個視音頻矩陣切換器和一個視頻處理器,通過對會議現(xiàn)場的發(fā)言者聲音和視頻圖像、會議現(xiàn)場的全景視頻圖像的采集,對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制,對會議系統(tǒng)中多路音視頻信號的同步切換,對發(fā)言者人臉進(jìn)行檢測與裁剪、會議現(xiàn)場的全景視頻圖像進(jìn)行恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加。其有益效果在于在一個視頻畫面中既能準(zhǔn)確看清發(fā)言者的臉部,又能看到會場的全景;在基本不改變原有視頻會議系統(tǒng)的情況下,實現(xiàn)視頻會議系統(tǒng)的智能化升級。
文檔編號H04N7/15GK102368816SQ201110391129
公開日2012年3月7日 申請日期2011年12月1日 優(yōu)先權(quán)日2011年12月1日
發(fā)明者崔鐳, 曹水婧, 李軍, 薛亮, 謝正茂, 趙敏, 邵春偉 申請人:中科芯集成電路股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1