一種視頻會議智能前端系統(tǒng)的制作方法

文檔序號：7995516閱讀：556來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種視頻會議智能前端系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及視頻會議系統(tǒng)領(lǐng)域，尤其涉及一種視頻會議智能前端系統(tǒng)。
背景技術(shù)：
隨著視頻攝像技術(shù)、網(wǎng)絡(luò)寬帶技術(shù)、視頻壓縮技術(shù)以及存儲技術(shù)的飛速發(fā)展，視頻會議被廣泛地使用于多種場合下的本地或遠(yuǎn)程的會議中。如圖1所示，視頻會議系統(tǒng)的基本工作原理是通過麥克風(fēng)和攝像頭前端采集設(shè)備10采集音頻信號和視頻信號，利用視頻會議主機20對采集到的音頻和視頻信號壓縮后存儲于本地或利用網(wǎng)絡(luò)設(shè)備30傳送到遠(yuǎn)端，根據(jù)主控系統(tǒng)40的控制信號選擇本地的或遠(yuǎn)端的經(jīng)壓縮音視頻信號，經(jīng)視頻會議主機20解碼，并送往相應(yīng)的顯示設(shè)備50顯示?，F(xiàn)有的視頻會議系統(tǒng)大致分為傳統(tǒng)型和智能型兩類，傳統(tǒng)型系統(tǒng)中音視頻信號是分離的獨立采集的；智能型系統(tǒng)中音視頻信號的采集是相互關(guān)聯(lián)的，通常利用音頻信號控制攝像頭的相關(guān)參數(shù)以便采集到的視頻圖像中能看清發(fā)言者的臉部?，F(xiàn)有的智能型視頻會議系統(tǒng)的攝像頭控制系統(tǒng)一般采用麥克風(fēng)陣列進(jìn)行聲音信號的采集，通過分析聲音信號確定聲音的來源位置，控制攝像頭進(jìn)行轉(zhuǎn)動，以期拍攝到會議發(fā)言人的面部。但該方案一方面，容易受到噪聲或非發(fā)言人的聲音影響導(dǎo)致聲音的來源判斷不準(zhǔn)確，從而導(dǎo)致控制攝像頭轉(zhuǎn)動不到位，不能拍攝到發(fā)言者的臉部；另一方面，攝像頭的放置位置或轉(zhuǎn)動控制比較復(fù)雜，而且更大的不足在于即使攝像頭能調(diào)整到位，也只能看清發(fā)言者，而會場全貌無法看到，這樣跟我們的真實的會議現(xiàn)場有很大的差別。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于，針對現(xiàn)有技術(shù)的上述缺陷，提出了一種改進(jìn)型的智能前端系統(tǒng)，一方面，能準(zhǔn)確地捕捉到發(fā)言者的視頻圖像；另一方面，視頻會議畫面不僅能看清發(fā)言者的臉部，同時也能看到會場的全貌。為實現(xiàn)上述目的，本發(fā)明通過以下技術(shù)手段實現(xiàn)
一種視頻會議智能前端系統(tǒng)，包括一組語音視頻攝入設(shè)備、一個視頻會議攝像機、一個會議系統(tǒng)控制單元、一個視音頻矩陣切換器和一個視頻處理器，其中
所述語音視頻攝入設(shè)備，對會議現(xiàn)場的發(fā)言者聲音和視頻圖像的采集后，發(fā)送給視音頻矩陣切換器；
所述視頻會議攝像機，對會議現(xiàn)場的全景視頻圖像的采集后，發(fā)送給視頻處理器；所述會議系統(tǒng)控制單元，對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制；所述視音頻矩陣切換器，根據(jù)會議系統(tǒng)控制單元發(fā)送的控制信號，實現(xiàn)會議系統(tǒng)中多路音視頻信號的同步切換；
所述視頻處理器，接收來自視音頻矩陣切換器輸出的視頻信號，完成發(fā)言者視頻圖像的恢復(fù)、發(fā)言者人臉的檢測與裁剪、會議現(xiàn)場的全景視頻圖像的恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加、編碼生成混合視頻信號輸出。
所述語音視頻攝入設(shè)備，由多組麥克風(fēng)和微型攝像機構(gòu)成，每組麥克風(fēng)和微型攝像機采集同一個發(fā)言者的聲音和視頻圖像，即麥克風(fēng)和微型攝像機分成若干組且每組內(nèi)部一一對應(yīng)采集同一個發(fā)言者的聲音和視頻圖像。所述視頻會議攝像機，是一個廣角的長焦的視頻攝像機，以便于能清晰地攝取會議現(xiàn)場的全景。所述會議系統(tǒng)控制單元，其控制過程為每位發(fā)言者的面前都有一個設(shè)備，通過操作設(shè)備面板上的按鍵來控制自己的話筒開關(guān)狀態(tài)，如需要發(fā)言，先按設(shè)備上的請求發(fā)言鍵，如此時無其它人發(fā)言，控制面板的指示燈變?yōu)榧t色，話筒上的光管也變?yōu)榧t色；如此時有其它人發(fā)言，控制面板上的指示燈變?yōu)殚W動的綠色，會議系統(tǒng)控制單元的中央控制器會根據(jù)現(xiàn)有請求進(jìn)行排隊，在其余人先發(fā)言完畢后，申請發(fā)言人即可發(fā)言，此時控制面盤上的指示燈及話筒上的指示光管均為紅色；最后，會議系統(tǒng)控制單元將控制結(jié)果送給視音頻矩陣切換器。所述視音頻矩陣切換器，通常的視音頻矩陣切換器是專門用于對視頻信號和音頻信號進(jìn)行切換和分配，可將多路信號從輸入通道切換輸送到輸出通道中的任一通道上，并且輸出通道間彼此獨立；本系統(tǒng)中的視音頻矩陣切換器，是其中的一種特殊形式，即根據(jù)會議系統(tǒng)控制單元的控制信號，從多路音視頻信號中將發(fā)言者的那路信號從輸入通道切換輸送到一個輸出通道上。所述視頻處理器，由微型攝像機視頻圖像恢復(fù)單元、微型攝像機視頻圖像預(yù)處理單元、人臉檢測單元、會議全景攝像機視頻圖像恢復(fù)單元、會議全景攝像機視頻圖像預(yù)處理單元、人臉疊加混合單元、復(fù)合視頻信號編碼生成單元組成；視音頻矩陣切換器輸出的發(fā)言者模擬復(fù)合視頻信號先傳輸給微型攝像機視頻圖像恢復(fù)單元，再依次經(jīng)過微型攝像機視頻圖像預(yù)處理單元、人臉檢測單元，傳輸給人臉疊加混合單元；視頻會議攝像機輸出的會議全景模擬復(fù)合視頻信號先傳輸給會議全景攝像機視頻圖像恢復(fù)單元，再經(jīng)過會議全景攝像機視頻圖像預(yù)處理單元傳輸給人臉疊加混合單元；兩路信號在人臉疊加混合單元疊加后經(jīng)復(fù)合視頻信號編碼生成單元傳輸給視頻會議主機。總體上，視音頻矩陣切換器輸出的發(fā)言者的音頻信號、視頻處理器輸出的含有發(fā)言者人臉的混合視頻信號，一起發(fā)送到視頻會議主機處理。以下具體分析視頻處理器的工作的實現(xiàn)原理一、微型攝像機視頻圖像恢復(fù)單元
視音頻矩陣切換器輸出為微型攝像機采集的發(fā)言者的模擬復(fù)合視頻信號(CVBS)，首先進(jìn)行模數(shù)轉(zhuǎn)換，接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量，V為紅差分量)，這樣可以恢復(fù)出微型攝像機所攝入的圖像，發(fā)送給微型攝像機視頻圖像預(yù)處理單元。二、微型攝像機視頻圖像預(yù)處理單元
對微型攝像機視頻圖像恢復(fù)單元恢復(fù)出的圖像解交錯，并對解交錯后的圖像進(jìn)行降噪濾波，然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉檢測單元。三、人臉檢測單元
微型攝像機視頻圖像預(yù)處理單元處理后的圖像，是包含了發(fā)言者臉部完整信息的圖像。由于發(fā)言者離微型攝像機的遠(yuǎn)近不一，導(dǎo)致發(fā)言者臉部圖像像素大小差別很大，這樣視覺效果很差。為了使得發(fā)言者臉部圖像像素大小基本統(tǒng)一，人臉檢測單元，其檢測步驟為第一步，接收來自微型攝像機視頻圖像預(yù)處理單元處理后的圖像信號，利用人臉檢測技術(shù)對整個圖像進(jìn)行人臉檢測，確定發(fā)言者人臉的位置；第二步，截取發(fā)言者人臉畫面；第三步，縮放成指定的大小，發(fā)送給人臉疊加混合單元。四、會議全景攝像機視頻圖像恢復(fù)單元
視頻會議攝像機輸出為會議全景的模擬復(fù)合視頻信號(CVBS)，首先進(jìn)行模數(shù)轉(zhuǎn)換，接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量，V為紅差分量)，這樣可以恢復(fù)出會議全景攝像機所攝入的圖像，發(fā)送給會議全景攝像機視頻圖像預(yù)處理單元。五、會議全景攝像機視頻圖像預(yù)處理單元
對會議全景攝像機視頻圖像恢復(fù)單元恢復(fù)出的圖像解交錯，并對解交錯后的圖像進(jìn)行降噪濾波，然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉疊加混合單元。六、人臉疊加混合單元
為了使得在一個視頻畫面既能看清發(fā)言者的臉部又能看到會場的全貌，我們將人臉檢測單元送來的發(fā)言者人臉圖像通過圖像疊加的方式，疊加到會議全景攝像機視頻圖像預(yù)處理單元送來的會場全景圖像的指定位置，并將疊加后的混合視頻數(shù)據(jù)發(fā)送給復(fù)合視頻信號編碼生成單元。七、復(fù)合視頻信號(CVBS)編碼生成單元
復(fù)合視頻信號(CVBS)編碼生成單元，對來自人臉疊加混合單元的圖像數(shù)據(jù)加上行場同步信號以及色同步信號，并對色度信號進(jìn)行平衡調(diào)幅調(diào)制，一起疊加生成復(fù)合視頻信號 (CVBS)，通過同軸線傳輸給視頻會議系統(tǒng)主機的視頻輸入端。采用本發(fā)明的有益效果在于與現(xiàn)有的前端系統(tǒng)相比，一方面，本發(fā)明克服了原系統(tǒng)完全依賴語音識別判斷發(fā)言者，容易受到噪聲或非發(fā)言人的聲音影響導(dǎo)致聲音的來源判斷不準(zhǔn)確，導(dǎo)致攝像頭不能準(zhǔn)確拍攝到發(fā)言者臉部；另一方面，本發(fā)明使得在一個視頻畫面中既能準(zhǔn)確看清發(fā)言者的臉部，又能看到會場的全景；另外，利用本發(fā)明，可以在基本不改變原有視頻會議系統(tǒng)的情況下，實現(xiàn)視頻會議系統(tǒng)的智能化升級。

圖1 現(xiàn)有視頻會議系統(tǒng)基本組成的結(jié)構(gòu)示意圖。圖2 本發(fā)明視頻會議智能前端系統(tǒng)的結(jié)構(gòu)示意圖。圖3 本發(fā)明視頻處理器的結(jié)構(gòu)示意圖。其中圖1、圖2和圖3的符號說明如下
10、前端采集設(shè)備，20、視頻會議主機，30、網(wǎng)絡(luò)設(shè)備，40、主控系統(tǒng)，50、顯示設(shè)備，101、一組語音視頻攝入設(shè)備，102、視頻會議攝像機，103、會議系統(tǒng)控制單元，104、視音頻矩陣切換器，105、視頻處理器，VI、第1路微型攝像機，Al、第1路麥克風(fēng)，V2、第2路微型攝像機， A2、第2路麥克風(fēng)，Vn-I、第n-1路微型攝像機，An-I、第n_l路麥克風(fēng)n_l，Vn、第η路微型攝像機，An、第η路麥克風(fēng)，Vx、第χ路視頻信號，Αχ、第χ路聲音信號，V、視頻信號，Α、聲音信號，201、微型攝像機視頻圖像恢復(fù)單元，202、微型攝像機視頻圖像預(yù)處理單元，203、人臉檢測單元，204、會議全景攝像機視頻圖像恢復(fù)單元，205、會議全景攝像機視頻圖像預(yù)處理單元，206、人臉疊加混合單元，207、復(fù)合視頻信號編碼生成單元。
具體實施例方式如圖2、圖3所示，分別是本發(fā)明視頻會議智能前端系統(tǒng)和視頻處理器的結(jié)構(gòu)示意圖。一種視頻會議智能前端系統(tǒng)，包括一組語音視頻攝入設(shè)備101、一個視頻會議攝像機102、一個會議系統(tǒng)控制單元103、一個視音頻矩陣切換器104和一個視頻處理器105，其中
所述語音視頻攝入設(shè)備101，對會議現(xiàn)場的發(fā)言者聲音和視頻圖像的采集后，發(fā)送給視音頻矩陣切換器104 ；
所述視頻會議攝像機102，對會議現(xiàn)場的全景視頻圖像的采集后，發(fā)送給視頻處理器
105 ；
所述會議系統(tǒng)控制單元103，對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制；所述視音頻矩陣切換器104，根據(jù)會議系統(tǒng)控制單元103發(fā)送的控制信號，實現(xiàn)會議系統(tǒng)中多路音視頻信號的同步切換；
所述視頻處理器105，接收來自視音頻矩陣104切換器輸出的視頻信號，完成發(fā)言者視頻圖像的恢復(fù)、發(fā)言者人臉的檢測與裁剪、會議現(xiàn)場的全景視頻圖像的恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加、編碼生成混合視頻信號輸出。所述語音視頻攝入設(shè)備101，由η組麥克風(fēng)和微型攝像機構(gòu)成，η為正整數(shù)，具體可以根據(jù)會場發(fā)言者人數(shù)的多少進(jìn)行增減。比如第1路微型攝像機Vl和第1路麥克風(fēng)Al采集第一位發(fā)言者的聲音和視頻圖像，第2路微型攝像機V2和第2路麥克風(fēng)Α2采集第二位發(fā)言者的聲音和視頻圖像，依次類推，直到第η路微型攝像機Vn和第η路麥克風(fēng)An采集第 η位發(fā)言者的聲音和視頻圖像。所述視頻會議攝像機102，是一個廣角的長焦的視頻攝像機，以便于能清晰地攝取會議現(xiàn)場的全景。所述會議系統(tǒng)控制單元103，其控制過程為每位發(fā)言者的面前都有一個設(shè)備，通過操作設(shè)備面板上的按鍵來控制自己的話筒開關(guān)狀態(tài)，如需要發(fā)言，先按設(shè)備上的請求發(fā)言鍵，如此時無其它人發(fā)言，控制面板的指示燈變?yōu)榧t色，話筒上的光管也變?yōu)榧t色；如此時有其它人發(fā)言，控制面板上的指示燈變?yōu)殚W動的綠色，會議系統(tǒng)控制單元103的中央控制器會根據(jù)現(xiàn)有請求進(jìn)行排隊，在其余人先發(fā)言完畢后，申請發(fā)言人即可發(fā)言，此時控制面盤上的指示燈及話筒上的指示光管均為紅色；最后，會議系統(tǒng)控制單元103將控制結(jié)果送給視音頻矩陣切換器104。所述視音頻矩陣切換器104，本系統(tǒng)中的視音頻矩陣切換器104，根據(jù)會議系統(tǒng)控制單元103的控制信號，從多路音視頻信號中將發(fā)言者的那路信號從輸入通道切換輸送到一個輸出通道上，即從η路視音頻信號中選取發(fā)言者(標(biāo)記為χ，χ為小于等于η的正整數(shù)) 的那路第χ路視頻信號Vx切換輸送到視頻處理器105，第χ路聲音信號Ax切換輸送到視頻會議主機20。所述視頻處理器105，由微型攝像機視頻圖像恢復(fù)單元201、微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元203、會議全景攝像機視頻圖像恢復(fù)單元204、會議全景攝像機視頻圖像預(yù)處理單元205、人臉疊加混合單元206、復(fù)合視頻信號編碼生成單元207組成；視音頻矩陣切換器104輸出的發(fā)言者模擬復(fù)合視頻信號先傳輸給微型攝像機視頻圖像恢復(fù)單元201，再依次經(jīng)過微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元203，傳輸給人臉疊加混合單元206 ；視頻會議攝像機102輸出的會議全景模擬復(fù)合視頻信號先傳輸給會議全景攝像機視頻圖像恢復(fù)單元204，再經(jīng)過會議全景攝像機視頻圖像預(yù)處理單元205傳輸給人臉疊加混合單元206 ；兩路信號在人臉疊加混合單元206疊加后經(jīng)復(fù)合視頻信號編碼生成單元207傳輸給視頻會議主機20?？傮w上，視音頻矩陣切換器104輸出的發(fā)言者的音頻信號A、視頻處理器105輸出的含有發(fā)言者人臉的混合視頻信號V，一起發(fā)送到視頻會議主機20處理。以下具體分析視頻處理器105的工作的實現(xiàn)原理一、微型攝像機視頻圖像恢復(fù)單元201
視音頻矩陣切換器104輸出為微型攝像機采集的發(fā)言者的模擬復(fù)合視頻信號(CVBS)，首先進(jìn)行模數(shù)轉(zhuǎn)換，接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量，V為紅差分量)，這樣可以恢復(fù)出微型攝像機所攝入的圖像，發(fā)送給微型攝像機視頻圖像預(yù)處理單元 202。二、微型攝像機視頻圖像預(yù)處理單元202
對微型攝像機視頻圖像恢復(fù)單元201恢復(fù)出的圖像解交錯，并對解交錯后的圖像進(jìn)行降噪濾波，然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉檢測單元203。三、人臉檢測單元203
微型攝像機視頻圖像預(yù)處理單元202處理后的圖像，是包含了發(fā)言者臉部完整信息的圖像。由于發(fā)言者離微型攝像機的遠(yuǎn)近不一，導(dǎo)致發(fā)言者臉部圖像像素大小差別很大，這樣視覺效果很差。為了使得發(fā)言者臉部圖像像素大小基本統(tǒng)一，人臉檢測單元203，其檢測步驟為
第一步，接收來自微型攝像機視頻圖像預(yù)處理單元202處理后的圖像信號，利用人臉檢測技術(shù)對整個圖像進(jìn)行人臉檢測，確定發(fā)言者人臉的位置；第二步，截取發(fā)言者人臉畫面；
第三步，縮放成指定的大小，發(fā)送給人臉疊加混合單元206。四、會議全景攝像機視頻圖像恢復(fù)單元204
視頻會議攝像機102輸出為會議全景的模擬復(fù)合視頻信號(CVBS)，首先進(jìn)行模數(shù)轉(zhuǎn)換，接著對CVBS信號亮色分離與U/V分離(其中U為藍(lán)差分量，V為紅差分量)，這樣可以恢復(fù)出會議全景攝像機所攝入的圖像，發(fā)送給會議全景攝像機視頻圖像預(yù)處理單元205。五、會議全景攝像機視頻圖像預(yù)處理單元205
對會議全景攝像機視頻圖像恢復(fù)單元204恢復(fù)出的圖像解交錯，并對解交錯后的圖像進(jìn)行降噪濾波，然后將經(jīng)過處理的圖像數(shù)據(jù)發(fā)送給人臉疊加混合單元206。六、人臉疊加混合單元206
為了使得在一個視頻畫面既能看清發(fā)言者的臉部又能看到會場的全貌，我們將人臉檢測單元203送來的發(fā)言者人臉圖像通過圖像疊加的方式，疊加到會議全景攝像機視頻圖像預(yù)處理單元205送來的會場全景圖像的指定位置，并將疊加后的混合視頻數(shù)據(jù)發(fā)送給復(fù)合視頻信號編碼生成單元207。七、復(fù)合視頻信號(CVBS)編碼生成單元207復(fù)合視頻信號(CVBS)編碼生成單元207，對來自人臉疊加混合單元206的圖像數(shù)據(jù)加上行場同步信號以及色同步信號，并對色度信號進(jìn)行平衡調(diào)幅調(diào)制，一起疊加生成復(fù)合視頻信號(CVBS)，通過同軸線傳輸給視頻會議系統(tǒng)主機的視頻輸入端。
權(quán)利要求
1.一種視頻會議智能前端系統(tǒng)，其特征在于包括一組語音視頻攝入設(shè)備101、一個視頻會議攝像機102、一個會議系統(tǒng)控制單元103、一個視音頻矩陣切換器104和一個視頻處理器105，其中所述語音視頻攝入設(shè)備101，對會議現(xiàn)場的發(fā)言者聲音和視頻圖像的采集后，發(fā)送給視音頻矩陣切換器104 ；所述視頻會議攝像機102，對會議現(xiàn)場的全景視頻圖像的采集后，發(fā)送給視頻處理器105 ；所述會議系統(tǒng)控制單元103，對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制；所述視音頻矩陣切換器104，根據(jù)會議系統(tǒng)控制單元103發(fā)送的控制信號，實現(xiàn)會議系統(tǒng)中多路音視頻信號的同步切換；所述視頻處理器105，接收來自視音頻矩陣104切換器輸出的視頻信號，完成發(fā)言者視頻圖像的恢復(fù)、發(fā)言者人臉的檢測與裁剪、會議現(xiàn)場的全景視頻圖像的恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加、編碼生成混合視頻信號輸出。
2.如權(quán)利要求1所述的視頻會議智能前端系統(tǒng)，其特征在于所述語音視頻攝入設(shè)備 101，由多組麥克風(fēng)和微型攝像機構(gòu)成，每組麥克風(fēng)和微型攝像機采集同一個發(fā)言者的聲音和視頻圖像。
3.如權(quán)利要求1所述的視頻會議智能前端系統(tǒng)，其特征在于所述會議系統(tǒng)控制單元 103，其控制過程為每位發(fā)言者的面前都有一個設(shè)備，通過操作設(shè)備面板上的按鍵來控制自己的話筒開關(guān)狀態(tài)，如需要發(fā)言，先按設(shè)備上的請求發(fā)言鍵，如此時無其它人發(fā)言，控制面板的指示燈變?yōu)榧t色，話筒上的光管也變?yōu)榧t色；如此時有其它人發(fā)言，控制面板上的指示燈變?yōu)殚W動的綠色，會議系統(tǒng)控制單元103的中央控制器會根據(jù)現(xiàn)有請求進(jìn)行排隊，在其余人先發(fā)言完畢后，申請發(fā)言人即可發(fā)言，此時控制面盤上的指示燈及話筒上的指示光管均為紅色；最后，會議系統(tǒng)控制單元103將控制結(jié)果送給視音頻矩陣切換器104。
4.如權(quán)利要求1所述的視頻會議智能前端系統(tǒng)，其特征在于所述視頻處理器105，由微型攝像機視頻圖像恢復(fù)單元201、微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元 203、會議全景攝像機視頻圖像恢復(fù)單元204、會議全景攝像機視頻圖像預(yù)處理單元205、人臉疊加混合單元206、復(fù)合視頻信號編碼生成單元207組成；視音頻矩陣切換器104輸出的發(fā)言者模擬復(fù)合視頻信號先傳輸給微型攝像機視頻圖像恢復(fù)單元201，再依次經(jīng)過微型攝像機視頻圖像預(yù)處理單元202、人臉檢測單元203，傳輸給人臉疊加混合單元206 ；視頻會議攝像機102輸出的會議全景模擬復(fù)合視頻信號先傳輸給會議全景攝像機視頻圖像恢復(fù)單元204，再經(jīng)過會議全景攝像機視頻圖像預(yù)處理單元205傳輸給人臉疊加混合單元206 ；兩路信號在人臉疊加混合單元206疊加后經(jīng)復(fù)合視頻信號編碼生成單元207傳輸給視頻會議主機20。
5.如權(quán)利要求4所述的視頻會議智能前端系統(tǒng)，其特征在于所述人臉檢測單元203，其檢測步驟為第一步，接收來自微型攝像機視頻圖像預(yù)處理單元202處理后的圖像信號，利用人臉檢測技術(shù)對整個圖像進(jìn)行人臉檢測，確定發(fā)言者人臉的位置；第二步，截取發(fā)言者人臉畫面；第三步，縮放成指定的大小，發(fā)送給人臉疊加混合單元206。
6.如權(quán)利要求4所述的視頻會議智能前端系統(tǒng)，其特征在于所述人臉疊加混合單元 206，將人臉檢測單元203送來的發(fā)言者人臉圖像通過圖像疊加的方式，疊加到會議全景攝像機視頻圖像預(yù)處理單元205送來的會場全景圖像的指定位置，并將疊加后的混合視頻數(shù)據(jù)發(fā)送給復(fù)合視頻信號編碼生成單元207。
全文摘要
本發(fā)明公開了一種視頻會議智能前端系統(tǒng)，包括一組語音視頻攝入設(shè)備、一個視頻會議攝像機、一個會議系統(tǒng)控制單元、一個視音頻矩陣切換器和一個視頻處理器，通過對會議現(xiàn)場的發(fā)言者聲音和視頻圖像、會議現(xiàn)場的全景視頻圖像的采集，對整個會議系統(tǒng)的聲音和視頻信號的優(yōu)先級管理控制，對會議系統(tǒng)中多路音視頻信號的同步切換，對發(fā)言者人臉進(jìn)行檢測與裁剪、會議現(xiàn)場的全景視頻圖像進(jìn)行恢復(fù)、發(fā)言者人臉圖像同會議現(xiàn)場的全景視頻圖像的疊加。其有益效果在于在一個視頻畫面中既能準(zhǔn)確看清發(fā)言者的臉部，又能看到會場的全景；在基本不改變原有視頻會議系統(tǒng)的情況下，實現(xiàn)視頻會議系統(tǒng)的智能化升級。
文檔編號H04N7/15GK102368816SQ201110391129
公開日2012年3月7日申請日期2011年12月1日優(yōu)先權(quán)日2011年12月1日
發(fā)明者崔鐳, 曹水婧, 李軍, 薛亮, 謝正茂, 趙敏, 邵春偉申請人:中科芯集成電路股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：薛亮
技術(shù)所有人：中科芯集成電路股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

智能視頻會議系統(tǒng)相關(guān)技術(shù)

視頻會議系統(tǒng)分幾種相關(guān)技術(shù)

視頻會議系統(tǒng)相關(guān)技術(shù)

視頻會議系統(tǒng)方案相關(guān)技術(shù)

高清視頻會議系統(tǒng)相關(guān)技術(shù)

億聯(lián)視頻會議系統(tǒng)1688相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種視頻會議智能前端系統(tǒng)的制作方法