基于流媒體技術(shù)的協(xié)作平臺系統(tǒng)架構(gòu)下的視頻綜合系統(tǒng)的制作方法
【專利摘要】本系統(tǒng)是一種基于流媒體技術(shù)的視頻綜合性平臺,采用瀏覽器/服務(wù)器模式,方便實用的實時感知交流、隱私保護、文件傳輸、文檔共享、白板等多功能的整合實現(xiàn)。語音處理中采用高效的回音消除、自動增益、背景降噪、靜音檢測技術(shù);視頻處理中采用先進的視頻優(yōu)化技術(shù)、帶寬自適應機制、視頻多碼率支持、誤碼掩蓋技術(shù)、前向糾錯編碼技術(shù),使視頻更流暢,更清晰。支持超大規(guī)模用戶并發(fā),多服務(wù)器交叉級聯(lián)、動態(tài)網(wǎng)絡(luò)帶寬均衡等技術(shù)。
【專利說明】基于流媒體技術(shù)的協(xié)作平臺系統(tǒng)架構(gòu)下的視頻綜合系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本系統(tǒng)是一種基于流媒體技術(shù)的視頻綜合性平臺,主要用于視頻會議、遠程協(xié)助、遠程心理輔導等功能。并基于流媒體協(xié)作平臺的靈活、方便的工作空間感知處理方法和保護協(xié)作者人物特征的方法,及實現(xiàn)具有隱私保護的遠程音視頻綜合協(xié)作平臺,具有重大的理論意義和實際應用價值。
【背景技術(shù)】
[0002]現(xiàn)有的視頻會議系統(tǒng)大致可以分為教學型的雙向視頻會議系統(tǒng)、會議型雙向視頻會議系統(tǒng)、商務(wù)型視頻會議系統(tǒng)(即桌面型視頻會議系統(tǒng))、軟件視頻會議系統(tǒng)、軟件專業(yè)版高清視頻會議多種類型。但其會議系統(tǒng)在通用技術(shù)上差別不大,效果主要受網(wǎng)絡(luò)帶寬限制和電腦配置制約。由于其技術(shù)方案原因,對于用戶的軟硬件要求較高,通常需配置相應的視頻卡;加上未考慮到用戶隱私保護,給用戶帶來了心理負擔,不利于參與者的大膽工作。
[0003]本系統(tǒng)將采用基于膚色和臉部特征的視頻序列中實時人臉檢測與跟蹤方法;采用基于PLAR (PseudoLogAreaRatiO)系數(shù)曲線變換方法和基于線性預測的基音同步疊加(LP-PSOLA)算法分別對語音信號的譜參數(shù)和韻律參數(shù)進行修改。
[0004]基于以上技術(shù)方案,本系統(tǒng)開發(fā)的基于流媒體的視頻綜合平臺將具有特有的技術(shù)競爭優(yōu)勢?;诖似脚_,還可以方便的構(gòu)建諸如遠程心理診療系統(tǒng)、咨詢系統(tǒng)、企業(yè)商務(wù)管理系統(tǒng)、教學系統(tǒng)等應用。
【發(fā)明內(nèi)容】
[0005]本系統(tǒng)基于瀏覽器/服務(wù)器模式架構(gòu),用戶通過訪問網(wǎng)頁的形式進行視頻協(xié)作,在語音處理技術(shù)中采用高效的回音消除、自動增益、背景降噪、靜音檢測,帶來比電話還清晰、接近CD播放音質(zhì)的語音通話效果;并采用先進的視頻編碼技術(shù),以及視頻優(yōu)化技術(shù)、先進的帶寬自適應機制、視頻多碼率支持、誤碼掩蓋技術(shù)、前向糾錯編碼技術(shù),使視頻更流暢,更清晰?;谑噶砍上窦夹g(shù)的文檔共享使得文檔大小縮放不失真;其結(jié)構(gòu)組成:
[0006](I)基于Web的流媒體協(xié)作管理子系統(tǒng)
[0007]包括基于Web的協(xié)作會議的組織、協(xié)作會議的控制、會議安全管理、訪問權(quán)限管理等關(guān)鍵技術(shù),同時開發(fā)相關(guān)模塊,從而構(gòu)成基于Web的流媒體協(xié)作管理子系統(tǒng)。
[0008](2)高效的流媒體與共享文檔的傳輸方式
[0009]實時協(xié)作系統(tǒng)中必須保證音視頻信息的高效、實時采集、處理和傳輸,研究開發(fā)包括多路視頻、多人混音、屏幕廣播、實時錄制、點播等技術(shù)和功能的實現(xiàn)方法。
[0010](3)研究靈活的多模式交互方式
[0011]集音頻、視頻、文檔、文字、郵件、短信等多種模式的協(xié)作交互方式,以保證在音視頻會議的同時能方便地實現(xiàn)電子白板、資料共享、協(xié)同瀏覽、遠程輔導、網(wǎng)頁同步、文字討論、系統(tǒng)消息、程序共享等功能。
[0012](4)視頻信息隱私保護處理方法[0013]視頻信息隱私保護處理方法,該方法可根據(jù)協(xié)作用戶的不同要求,在視頻圖像序列中始終檢測跟蹤待保護的隱私區(qū)域,并對此區(qū)域進行模糊化處理以隱藏用戶個人生物特征。
[0014](5)音頻信息隱私保護處理方法
[0015]音頻信息隱私保護處理方法,該方法在進行語音交流時,可根據(jù)協(xié)作用戶的要求,實時改變說話人語音、語調(diào),從而能隱藏說話人身份。
[0016](6)基于流媒體的協(xié)作綜合平臺的集成開發(fā)
[0017]在各個子功能模塊設(shè)計實現(xiàn)的基礎(chǔ)上,利用基于瀏覽器/服務(wù)器模式的方法架構(gòu)實現(xiàn)整個系統(tǒng),從而構(gòu)建基于流媒體的協(xié)作綜合平臺。系統(tǒng)技術(shù)路線描述:
[0018](I)語音處理中采用高效的回音消除、自動增益、背景降噪、靜音檢測技術(shù),提高語音通話質(zhì)量;視頻圖像處理中采用視頻優(yōu)化技術(shù)、先進的帶寬自適應機制、誤碼掩蓋技術(shù)、前向糾錯編碼技術(shù),使視頻更流暢,更清晰。
[0019](2)以先進且流行的硬件環(huán)境作為基礎(chǔ)支撐,集.net環(huán)境和.net公共模塊、基礎(chǔ)信息模塊、FMS公共模塊、音頻視頻處理和傳輸模塊、PPT轉(zhuǎn)換SWF模塊、白板功能、系統(tǒng)通知模塊、短信通知模塊和ActiveX開發(fā)接口為一體的軟件集成開發(fā)思路,設(shè)計實現(xiàn)整個平臺軟件。
[0020](3)各子系統(tǒng)及模塊采用面向?qū)ο蟮姆绞皆O(shè)計開發(fā)可重用和易繼承的構(gòu)件,系統(tǒng)采用先進的軟件構(gòu)架支撐技術(shù)進行集成開發(fā)實現(xiàn)。
[0021 ] (4)自主研究開發(fā)視頻信息隱私保護處理方法
[0022]采用模糊化和初略化對保護視頻信息進行過濾處理,模糊化算法可采用周邊象素灰度插值法,而初略化則是在一定密度的網(wǎng)格中,用其內(nèi)象素灰度的均值代替該網(wǎng)格內(nèi)的灰度值,從而實現(xiàn)具有馬賽克狀的圖像效果。
[0023]提供用戶選擇隱私保護區(qū)域,可綜合采用基于神經(jīng)網(wǎng)絡(luò)的學習法和基于區(qū)域特征(如:顏色、形狀、漸變等特征),自動跟蹤該區(qū)域,進行隱私保護。
[0024](5)自主研究開發(fā)音頻信息隱私保護處理方法
[0025]研制音頻信息過濾器,通過對特征信號進行分析,結(jié)合聲學原理,加入白噪聲,再與原聲在能量上相當?shù)那闆r下,生成新的音頻信息,使原音頻信息失真,實現(xiàn)音頻信息隱私保護,同時也針對用戶對音頻感知的需求情形,進行柔和化處理。
【權(quán)利要求】
1.基于流媒體技術(shù)的協(xié)作平臺系統(tǒng)架構(gòu)下的視頻綜合系統(tǒng),其權(quán)利要求的內(nèi)容包括:多路海量數(shù)據(jù)的實時同步傳輸:實時協(xié)作系統(tǒng)中必須保證音視頻信息的高效、實時采集、處理和傳輸,研究開發(fā)包括多路視頻、多人混音、屏幕廣播、實時錄制、點播等技術(shù)和功能的實現(xiàn)方法。
2.基于視頻空間的隱私保護區(qū)域的識別和跟蹤算法:該方法可根據(jù)協(xié)作用戶的不同要求,在視頻圖像序列中始終檢測跟蹤待保護的隱私區(qū)域,并對此區(qū)域進行模糊化處理以隱藏用戶個人生物特征。
3.音頻信息隱私保護處理方法:該方法在進行語音交流時,可根據(jù)協(xié)作用戶的要求,實時改變說話人語音、語調(diào),從而能隱藏說話人身份。
【文檔編號】G10L21/02GK103796034SQ201210424924
【公開日】2014年5月14日 申請日期:2012年10月26日 優(yōu)先權(quán)日:2012年10月26日
【發(fā)明者】吳冠玉 申請人:鎮(zhèn)江鼎拓科技信息有限公司