視頻通信方法和設(shè)備的制作方法
【專利摘要】本發(fā)明公開(kāi)了一種視頻通信方法和設(shè)備。所述方法包括:從圖像中提取特征區(qū)域;使用第一編碼方法來(lái)對(duì)所述特征區(qū)域進(jìn)行編碼;以及向接收端發(fā)送編碼后的所述特征區(qū)域。因此,在本發(fā)明中,可以大大提高特征區(qū)域的清晰度,即使在攝像頭晃動(dòng)較大的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,由于只傳輸特征區(qū)域,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會(huì)大大的減少,這樣可以大大提高視頻通信中用戶更加關(guān)心的特征區(qū)域的清晰度,從而提高了用戶體驗(yàn)。
【專利說(shuō)明】視頻通信方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,更具體地,本發(fā)明涉及一種視頻通信方法和設(shè)備。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)技術(shù)及網(wǎng)絡(luò)技術(shù)的發(fā)展,近年來(lái),諸如筆記本計(jì)算機(jī)、平板電腦(PAD)、移動(dòng)電話、個(gè)人數(shù)字助理(PDA)之類的電子設(shè)備越發(fā)普及,并且越來(lái)越多的用戶開(kāi)始使用在這些電子設(shè)備上裝備的諸如攝像頭之類的圖像捕捉裝置以及相關(guān)應(yīng)用程序來(lái)進(jìn)行視頻聊天、視頻會(huì)議等視頻通信應(yīng)用。
[0003]目前,視頻通信應(yīng)用為用戶帶來(lái)的直觀體驗(yàn)是可以讓對(duì)方用戶在對(duì)端電子設(shè)備上看到本方用戶的視頻并且聽(tīng)到本方用戶的聲音,其中本方用戶視頻是從本端電子設(shè)備上的攝像頭直接捕捉的視頻數(shù)據(jù)經(jīng)過(guò)編碼后、經(jīng)過(guò)網(wǎng)絡(luò)而傳輸?shù)綄?duì)端電子設(shè)備上的。
[0004]由于在傳統(tǒng)的視頻通信應(yīng)用中、通常是直接通過(guò)攝像頭捕捉某個(gè)固定分辨率大小(例如,176X144)的視頻數(shù)據(jù)、然后經(jīng)過(guò)視頻編碼來(lái)實(shí)現(xiàn)對(duì)整幅圖像的編碼并將編碼后的整幅圖像直接發(fā)送到對(duì)端電子設(shè)備的,所以在一幀圖像中往往包含了很多復(fù)雜的背景圖像。
[0005]這樣,在攝像頭由于各種原因而產(chǎn)生晃動(dòng)的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,編碼之后所產(chǎn)生的視頻數(shù)據(jù)往往具有很大的碼率。而這種具有很大碼率的視頻數(shù)據(jù)在帶寬受限的通信信道中(諸如,在使用電路交換(CS)的通信模式的情況下)傳送時(shí)將產(chǎn)
生誤差。
[0006]這時(shí),為了滿足網(wǎng)絡(luò)傳輸對(duì)碼率的限制,就不得不在編碼時(shí)采用丟幀處理和減少幀率的處理。然而,這樣會(huì)導(dǎo)致視頻圖像在對(duì)端電子設(shè)備上顯示時(shí)產(chǎn)生不連續(xù)性及馬賽克,從而大大降低了視頻通信中的圖像清晰度,最終無(wú)法有效地突出在整幅圖像中對(duì)方用戶往往更為關(guān)心的某一特征區(qū)域(諸如,本方用戶的臉部)。
[0007]因而,需要一種新型的視頻通信方法和設(shè)備來(lái)解決上述問(wèn)題。
【發(fā)明內(nèi)容】
[0008]為了解決上述技術(shù)問(wèn)題,根據(jù)本發(fā)明的一個(gè)方面,提供了一種視頻通信方法,其特征在于,所述方法包括:從圖像中提取特征區(qū)域;使用第一編碼方法來(lái)對(duì)所述特征區(qū)域進(jìn)行編碼;以及向接收端發(fā)送編碼后的所述特征區(qū)域。
[0009]此外,根據(jù)本發(fā)明的另一方面,提供了一種視頻通信設(shè)備,其特征在于,所述設(shè)備包括:提取裝置,用于從圖像中提取特征區(qū)域;第一編碼裝置,用于使用第一編碼方法來(lái)對(duì)所述特征區(qū)域進(jìn)行編碼;以及發(fā)送裝置,用于向接收端發(fā)送編碼后的所述特征區(qū)域。
[0010]與現(xiàn)有技術(shù)相比,采用根據(jù)本發(fā)明的視頻通信方法和設(shè)備,在視頻通信過(guò)程中,可以在本端電子設(shè)備中,利用特征區(qū)域檢測(cè)技術(shù)在每一幀的視頻圖像中提取特征區(qū)域,利用與特征區(qū)域?qū)?yīng)的編碼方法對(duì)該特征區(qū)域進(jìn)行編碼,并且向?qū)Χ穗娮釉O(shè)備傳送僅僅包括特征區(qū)域的編碼后的視頻數(shù)據(jù),使得在解碼操作之后,對(duì)方用戶能夠在對(duì)端電子設(shè)備中觀看到僅僅關(guān)心的特征區(qū)域。因此,在本發(fā)明中,可以大大提高特征區(qū)域的清晰度,即使在攝像頭晃動(dòng)較大的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,由于只傳輸特征區(qū)域,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會(huì)大大的減少,這樣可以大大提高視頻通信中用戶更加關(guān)心的特征區(qū)域的清晰度,從而提高了用戶體驗(yàn)。
[0011]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書中闡述,并且,部分地從說(shuō)明書中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在說(shuō)明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
【專利附圖】
【附圖說(shuō)明】
[0012]附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
[0013]圖1圖示了根據(jù)本發(fā)明的視頻通信方法。
[0014]圖2圖示了根據(jù)本發(fā)明的視頻通信設(shè)備。
[0015]圖3圖示了根據(jù)本發(fā)明第一實(shí)施例的視頻通信方法。
[0016]圖4圖示了根據(jù)本發(fā)明第一實(shí)施例的視頻通信系統(tǒng)。
[0017]圖5圖示了根據(jù)本發(fā)明第二實(shí)施例的視頻通信方法。
[0018]圖6圖示了根據(jù)本發(fā)明第二實(shí)施例的視頻通信系統(tǒng)。
【具體實(shí)施方式】
[0019]將參照附圖詳細(xì)描述根據(jù)本發(fā)明的各個(gè)實(shí)施例。這里,需要注意的是,在附圖中,將相同的附圖標(biāo)記賦予基本上具有相同或類似結(jié)構(gòu)和功能的組成部分,并且將省略關(guān)于它們的重復(fù)描述。
[0020]在下文中,將參考圖1和圖2來(lái)描述根據(jù)本發(fā)明的視頻通信方法和設(shè)備。
[0021]圖1圖示了根據(jù)本發(fā)明的視頻通信方法,而圖2圖示了根據(jù)本發(fā)明的視頻通信設(shè)備。
[0022]圖1所圖示的視頻通信方法通過(guò)圖2所圖示的視頻通信設(shè)備來(lái)實(shí)現(xiàn)。具體地,所述視頻通信設(shè)備100包括:提取裝置110、第一編碼裝置120和發(fā)送裝置130。
[0023]如圖1所圖示的,所述電子設(shè)備定制方法包括:
[0024]在步驟SllO中,提取裝置110從圖像中提取特征區(qū)域;
[0025]在步驟S120中,第一編碼裝置120使用第一編碼方法來(lái)對(duì)所述特征區(qū)域進(jìn)行編碼;以及
[0026]在步驟S130中,發(fā)送裝置130向接收端發(fā)送編碼后的所述特征區(qū)域。
[0027]由此可見(jiàn),采用根據(jù)本發(fā)明的視頻通信方法和設(shè)備,在視頻通信過(guò)程中,可以在本端電子設(shè)備中,利用特征區(qū)域檢測(cè)技術(shù)在每一幀的視頻圖像中提取特征區(qū)域,利用與特征區(qū)域?qū)?yīng)的編碼方法對(duì)該特征區(qū)域進(jìn)行編碼,并且向?qū)Χ穗娮釉O(shè)備傳送僅僅包括特征區(qū)域的編碼后的視頻數(shù)據(jù),使得在解碼操作之后,對(duì)方用戶能夠在對(duì)端電子設(shè)備中觀看到僅僅關(guān)心的特征區(qū)域。因此,在本發(fā)明中,可以大大提高特征區(qū)域的清晰度,即使在攝像頭晃動(dòng)較大的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,由于只傳輸特征區(qū)域,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會(huì)大大的減少,這樣可以大大提高視頻通信中用戶更加關(guān)心的特征區(qū)域的清晰度,從而提高了用戶體驗(yàn)。
[0028]在下文中,將參考圖3和圖4來(lái)描述根據(jù)本發(fā)明第一實(shí)施例的視頻通信方法和視頻通信系統(tǒng)。
[0029]圖3圖示了根據(jù)本發(fā)明第一實(shí)施例的視頻通信方法,而圖4圖示了根據(jù)本發(fā)明第一實(shí)施例的視頻通信系統(tǒng)。
[0030]圖3所圖示的根據(jù)本發(fā)明第一實(shí)施例的視頻通信方法可以應(yīng)用于圖4所圖示的視頻通信系統(tǒng)300。如圖4所圖示的,該視頻通信系統(tǒng)300包括:本端視頻通信設(shè)備100和對(duì)端視頻通信設(shè)備200。該本端視頻通信設(shè)備100與該對(duì)端視頻通信設(shè)備200通過(guò)各種方式(諸如,有線網(wǎng)絡(luò)和無(wú)線網(wǎng)絡(luò))而連接在一起,并且按照約定的數(shù)據(jù)格式來(lái)傳輸視頻通信數(shù)據(jù)。
[0031]在此,將移動(dòng)電話作為本端視頻通信設(shè)備100和對(duì)端視頻通信設(shè)備200的示例來(lái)進(jìn)行說(shuō)明。然而,顯然本發(fā)明不限于此。還可以將本發(fā)明應(yīng)用于筆記本計(jì)算機(jī)、平板電腦、個(gè)人數(shù)字助理等相同類型或者不同類型電子設(shè)備之間的視頻通信過(guò)程中。
[0032]該本端視頻通信設(shè)備100包括:提取裝置110、第一編碼裝置120、發(fā)送裝置130、和捕捉裝置140。
[0033]該對(duì)端視頻通信設(shè)備200包括:接收裝置210、第一解碼裝置220和顯示裝置230。
[0034]如圖3所圖示的,根據(jù)本發(fā)明第一實(shí)施例的視頻通信方法包括:
[0035]在步驟S210中,捕捉視頻序列。
[0036]具體地,當(dāng)本方用戶想要與處于其遠(yuǎn)程的對(duì)方用戶進(jìn)行視頻通話時(shí),本方用戶可以利用處于其本地的本端視頻通信設(shè)備100 (例如,本方用戶的移動(dòng)電話),通過(guò)諸如第三代移動(dòng)通信網(wǎng)絡(luò)之類的有線網(wǎng)絡(luò)或無(wú)線網(wǎng)絡(luò)來(lái)向?qū)Ψ接脩舭l(fā)起視頻通話請(qǐng)求。
[0037]此時(shí),處于對(duì)方用戶本地的對(duì)端視頻通信設(shè)備200 (類似地,例如移動(dòng)電話)向?qū)Ψ接脩籼崾颈痉接脩粽谙蚱浒l(fā)起視頻通話請(qǐng)求。在對(duì)方用戶選擇接受通話請(qǐng)求之后,在兩者之間建立起視頻通話連接。
[0038]下面,以在本方用戶端的本端視頻通信設(shè)備100向?qū)Ψ接脩舳说膶?duì)方視頻通信設(shè)備200傳送視頻圖像為例,繼續(xù)說(shuō)明根據(jù)本發(fā)明第一實(shí)施例的視頻通信方法。然而,顯然,對(duì)方用戶端的對(duì)方視頻通信設(shè)備200同樣可以向本方用戶端的本端視頻通信設(shè)備100傳送視頻圖像,此時(shí)在兩者中執(zhí)行的處理將互換。
[0039]例如,在建立視頻通話連接之后,在本端視頻通信設(shè)備100中,捕捉裝置140 (例如,移動(dòng)電話上的攝像頭)捕捉本方用戶的視頻序列,該視頻序列由一系列的圖像幀組成。
[0040]此時(shí),捕捉裝置140將自身分辨率設(shè)置為第一分辨率。優(yōu)選地,該第一分辨率是該捕捉裝置140能夠支持的最大分辨率。這樣,捕捉裝置140采用最大的分辨率來(lái)捕捉一幀視頻圖像,以便獲得一副盡可能高清晰度的視頻圖像,然后它將所捕捉到的視頻圖像發(fā)送到提取裝置110,以進(jìn)行后續(xù)處理。
[0041]在步驟S220中,從圖像中提取特征區(qū)域。
[0042]具體地,在接收到捕捉裝置140所捕捉的視頻圖像之后,提取裝置110對(duì)于該視頻圖像執(zhí)行特征區(qū)域檢測(cè)算法,以得到特征區(qū)域在原始視頻圖像中的位置。
[0043]這里認(rèn)為,一般而言,進(jìn)行視頻通信的雙方比較關(guān)注的是用戶的臉部信息,因此,優(yōu)選地,可以將該特征區(qū)域選取為用戶的人臉區(qū)域,并且該特征區(qū)域檢測(cè)算法可以是人臉檢測(cè)和/或人臉跟蹤算法。然而,顯然本發(fā)明不限于此。還可以將諸如本方用戶肢體或處于本方用戶本地的顯示器之類的其他區(qū)域選取為對(duì)方用戶關(guān)心的特征區(qū)域。
[0044]人臉檢測(cè)算法用于在輸入圖像中檢測(cè)是否存在人臉,并且確定所有人臉的位置、大小、位姿。人臉檢測(cè)是人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù)。根據(jù)利用特征的色彩屬性,可以將人臉檢測(cè)算法分為基于膚色特征的方法和基于灰度特征的方法兩類。
[0045]人臉跟蹤算法通常用于在人臉檢測(cè)的基礎(chǔ)上對(duì)于視頻序列中人臉運(yùn)動(dòng)位置的跟蹤。人臉跟蹤算法包括基于運(yùn)動(dòng)的方法及基于模型的方法。
[0046]需要說(shuō)明的是,提取裝置110可以采用現(xiàn)有的或者將來(lái)開(kāi)發(fā)出的任何一種人臉檢測(cè)和/或人臉跟蹤算法,來(lái)在捕捉裝置140所捕捉到的原始視頻圖像中檢測(cè)人臉區(qū)域,確定該人臉區(qū)域的位置,并且從每一幀圖像中提取該人臉區(qū)域。
[0047]此時(shí),優(yōu)選地,在從每一幀圖像中提取人臉區(qū)域的同時(shí),該提取裝置110還進(jìn)一步監(jiān)視本端視頻通信設(shè)備100中的中央處理器(CPU)在執(zhí)行人臉檢測(cè)和/或人臉跟蹤算法時(shí)所占用的資源,并且判斷該檢測(cè)操作所占用的系統(tǒng)資源是否大于或等于一個(gè)預(yù)定的資源閾值,例如,50%。
[0048]例如,當(dāng)該提取裝置110在對(duì)捕捉裝置140利用最大分辨率捕捉的視頻序列的第一幀圖像進(jìn)行檢測(cè)時(shí),如果該檢測(cè)操作所占用的系統(tǒng)資源超出CPU整體資源的50%,則該提取裝置110認(rèn)為此時(shí)人臉檢測(cè)和/或人臉跟蹤算法占用CPU的資源過(guò)大,可能會(huì)影響在本端視頻通信設(shè)備100中運(yùn)行的其他應(yīng)用。因此,該提取裝置110向捕捉裝置140發(fā)送分辨率改變信號(hào)。所述捕捉裝置根據(jù)所述分辨率改變信號(hào),來(lái)將作為最大分辨率的第一分辨率改變?yōu)樯孕∫恍┑牡诙直媛剩员阍诤罄m(xù)操作中,采用第二分辨率來(lái)捕捉所述視頻序列的第二幀圖像。按照這種方式,該提取裝置Iio可以逐幀地逐漸調(diào)低捕捉裝置140捕捉視頻序列時(shí)的分辨率,直到該檢測(cè)操作所占用的系統(tǒng)資源小于預(yù)定的資源閾值為止。
[0049]同理,當(dāng)用戶由于退出了在本端視頻通信設(shè)備100中運(yùn)行的其他應(yīng)用而導(dǎo)致該檢測(cè)操作所占用較小的系統(tǒng)資源時(shí),該提取裝置110也可以逐漸調(diào)高捕捉裝置140捕捉視頻序列時(shí)的分辨率,使得獲得更加清晰的用戶臉部圖像,直到該分辨率等于最大分辨率為止。
[0050]通過(guò)上述處理,與傳統(tǒng)的視頻電話實(shí)現(xiàn)一般將攝像頭的分辨率直接設(shè)置為要顯示的尺寸相比,本發(fā)明的第一實(shí)施例可以根據(jù)系統(tǒng)資源來(lái)調(diào)整攝像頭的分辨率,從而得到一幅盡可能清晰的原始人臉圖像。
[0051]另外,優(yōu)選地,在從原始視頻序列中檢測(cè)到人臉區(qū)域之后,該提取裝置110還可以將所檢測(cè)到的人臉區(qū)域的尺寸與一個(gè)預(yù)設(shè)的尺寸閾值進(jìn)行比較,其中該尺寸閾值取決于視頻信道的帶寬。如果所檢測(cè)到的人臉區(qū)域的尺寸小于所述尺寸閾值,則對(duì)所檢測(cè)到的人臉區(qū)域進(jìn)行放大處理,使得所檢測(cè)到的人臉區(qū)域的尺寸等于所述尺寸閾值。此場(chǎng)景通常發(fā)生在本方用戶的人像距離攝像頭較遠(yuǎn)的情況下。同理,如果所檢測(cè)到的人臉區(qū)域的尺寸大于所述尺寸閾值,則對(duì)所檢測(cè)到的人臉區(qū)域進(jìn)行縮小處理,使得所檢測(cè)到的人臉區(qū)域的尺寸等于所述尺寸閾值。此場(chǎng)景發(fā)生在人像距離攝像頭較近的情況。
[0052]通過(guò)上述處理,與不進(jìn)行人臉檢測(cè)操作的傳統(tǒng)視頻電話實(shí)現(xiàn)相比,本發(fā)明的第一實(shí)施例可以克服可能出現(xiàn)的人臉圖像在對(duì)端視頻通信設(shè)備200中顯示過(guò)大或者過(guò)小的情況。
[0053]由于在步驟S210中捕捉裝置140將攝像頭設(shè)置為最大分辨率,所以在步驟S220中,該提取裝置110提取裝置110可以根據(jù)顯示視頻編碼的尺寸對(duì)檢測(cè)得到的人臉圖像進(jìn)行適當(dāng)?shù)目s放,從而使得當(dāng)在后續(xù)對(duì)縮放后的人臉視頻流進(jìn)行編碼的過(guò)程中、確保編碼碼率滿足視頻電話傳輸碼率要求的同時(shí),保證在攝像頭清晰成像的范圍內(nèi)得到一張清晰度最聞的人臉圖像。
[0054]最終,該提取裝置110將所提取到的人臉區(qū)域發(fā)送到第一編碼裝置120,以進(jìn)行后續(xù)處理。
[0055]在步驟S230中,使用第一編碼方法來(lái)對(duì)特征區(qū)域進(jìn)行編碼。
[0056]具體地,在接收到提取裝置110所提取到的人臉區(qū)域之后,第一編碼裝置120使用第一編碼方法來(lái)對(duì)該人臉區(qū)域進(jìn)行編碼,以生成要傳送的視頻流。
[0057]例如,該第一編碼裝置120可以使用各種視頻編碼方法(諸如,運(yùn)動(dòng)圖像專家組(MPEG) 4、H.263、H.264)來(lái)對(duì)所提取的人臉區(qū)域進(jìn)行編碼。由于要編碼的視頻圖像僅僅包含人臉區(qū)域、而人臉區(qū)域在整個(gè)視頻通話過(guò)程中的變化很小,所以在視頻流的幀與幀之間的差別會(huì)很小,這樣即使在晃動(dòng)很大的情況下也可以保證很小的編碼碼率。
[0058]然后,該第一編碼裝置120將編碼后的視頻圖像傳送到發(fā)送裝置130,以用于后續(xù)處理。
[0059]在步驟S240中,向接收端發(fā)送編碼后的特征區(qū)域。
[0060]具體地,在接收到編碼后的人臉區(qū)域之后,發(fā)送裝置130通過(guò)例如第三代移動(dòng)通信網(wǎng)絡(luò)向?qū)Χ艘曨l通信設(shè)備200發(fā)送僅僅包括人臉區(qū)域的視頻流。
[0061]在步驟S250中,接收并解碼該編碼后的特征區(qū)域。
[0062]具體地,在對(duì)端視頻通信設(shè)備200中,接收裝置210經(jīng)由例如移動(dòng)通信網(wǎng)絡(luò)而接收僅僅包括人臉區(qū)域的視頻流,并且將它傳送到第一解碼裝置220。
[0063]該第一解碼裝置220可以使用與第一編碼方法對(duì)應(yīng)的第一解碼方法來(lái)對(duì)該視頻流進(jìn)行解碼,以便從中恢復(fù)包括人臉區(qū)域的圖像。
[0064]在步驟S260中,顯示特征區(qū)域。
[0065]具體地,在從該第一解碼裝置220接收到所編碼后的人臉區(qū)域之后,顯示裝置230在對(duì)端視頻通信設(shè)備200中裝備的顯示裝置(諸如,顯示屏)上顯示固定大小的人臉圖像,并且該人臉圖像遠(yuǎn)遠(yuǎn)大于在傳統(tǒng)的視頻通信中實(shí)現(xiàn)的一般顯示大小176X144。實(shí)驗(yàn)證明,根據(jù)本發(fā)明第一實(shí)施例的視頻通信實(shí)現(xiàn)可以達(dá)到176X144X2、甚至更大的數(shù)量級(jí)的顯示大小。
[0066]另外,由于在本端視頻通信設(shè)備100中在人臉圖像的視頻編碼中產(chǎn)生的碼率很小,所以在對(duì)端視頻通信設(shè)備200中可以適當(dāng)?shù)財(cái)U(kuò)大視頻圖像的顯示。這個(gè)操作可以根據(jù)實(shí)際產(chǎn)生的碼率來(lái)進(jìn)行調(diào)節(jié)。因此,在視頻通信系統(tǒng)300中實(shí)現(xiàn)了一種高清人像模式的視頻通信。
[0067]由此可見(jiàn),采用根據(jù)本發(fā)明第一實(shí)施例的視頻通信方法和系統(tǒng),可以利用人臉檢測(cè)技術(shù)在每一幀的視頻圖像中提取人臉圖像,然后僅對(duì)人臉圖像進(jìn)行適當(dāng)?shù)目s放、編碼,這樣可以大大的提高人臉圖像的清晰度。具體來(lái)說(shuō),即使在圖像晃動(dòng)較大的情況下,由于只傳輸人臉圖像,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會(huì)大大的減少,從而可以顯著地提高了視頻電話中人臉圖像的清晰度、尺寸以及連續(xù)性,實(shí)現(xiàn)了高清人像模式的視頻通信。[0068]因此,在本發(fā)明的第一實(shí)施例中,可以將這種視頻通信的高清人像模式作為一種附加選項(xiàng)提供在電子設(shè)備的用戶界面上,使得用戶不但可以通過(guò)傳統(tǒng)的普通模式來(lái)進(jìn)行視頻通信,以便在用戶之間傳輸包括人臉和背景等各種圖像信息的視頻數(shù)據(jù),從而了解到與用戶相關(guān)的全面信息;而且還可以通過(guò)高清人像模式來(lái)進(jìn)行視頻通信,以便對(duì)方用戶可以更清楚地觀察到本方用戶的面部表情等,從而實(shí)現(xiàn)更好的交談體驗(yàn)。
[0069]在下文中,將參考圖5和圖6來(lái)描述根據(jù)本發(fā)明第二實(shí)施例的視頻通信方法和視頻通信系統(tǒng)。
[0070]圖5圖示了根據(jù)本發(fā)明第二實(shí)施例的視頻通信方法,而圖6圖示了根據(jù)本發(fā)明第二實(shí)施例的視頻通信系統(tǒng)。
[0071]圖5所圖示的根據(jù)本發(fā)明第二實(shí)施例的視頻通信方法可以應(yīng)用于圖6所圖示的視頻通信系統(tǒng)300。如圖6所圖示的,該視頻通信系統(tǒng)300包括:本端視頻通信設(shè)備100和對(duì)端視頻通信設(shè)備200。
[0072]該本端視頻通信設(shè)備100包括:提取裝置110、第一編碼裝置120、第二編碼裝置150、發(fā)送裝置130、和捕捉裝置140。
[0073]該對(duì)端視頻通信設(shè)備200包括:接收裝置210、第一解碼裝置220、第二解碼裝置240、和顯示裝置230。
[0074]如圖5所圖示的,根據(jù)本發(fā)明第二實(shí)施例的視頻通信方法包括:
[0075]在步驟S310中,捕捉視頻序列。
[0076]在步驟S320中,從圖像中提取特征區(qū)域。
[0077]在步驟S330中,使用第一編碼方法來(lái)對(duì)特征區(qū)域進(jìn)行編碼,并且使用第二編碼方法來(lái)對(duì)非特征區(qū)域進(jìn)行編碼。
[0078]在步驟S340中,向接收端發(fā)送編碼后的特征區(qū)域。
[0079]在步驟S350中,接收并解碼該編碼后的特征區(qū)域。
[0080]在步驟S360中,顯示特征區(qū)域。
[0081]步驟S310-S360與第一實(shí)施例中的步驟S210-S260大致相同,其區(qū)別之處在于:
[0082]在步驟S320中,除了提取特征區(qū)域之外,提取裝置110進(jìn)一步從圖像中提取非特征區(qū)域,其中該非特征區(qū)域是除了特征區(qū)域之外的區(qū)域,例如,除了人臉區(qū)域之外的背景區(qū)域。
[0083]在步驟S330中,與在步驟S230中一樣,第一編碼裝置120使用第一編碼方法來(lái)對(duì)該人臉區(qū)域進(jìn)行編碼。然而,與此同時(shí)地或者并行地,第二編碼裝置150使用編碼碼率小于第一編碼方法的第二編碼方法來(lái)對(duì)非特征區(qū)域進(jìn)行編碼,以生成既包括人臉區(qū)域、又包括背景區(qū)域的要傳送的視頻流。
[0084]在步驟S350中,與在步驟S250中一樣,第一解碼裝置220使用第一解碼方法來(lái)對(duì)該人臉區(qū)域進(jìn)行解碼。然而,與此同時(shí)地或者并行地,第二解碼裝置240使用與第二編碼方法對(duì)應(yīng)的第二解碼方法來(lái)對(duì)非特征區(qū)域進(jìn)行解碼,使得在步驟S360中,在對(duì)端視頻通信設(shè)備200中裝備的顯示裝置上顯示包括不同清晰度區(qū)域的圖像,即清晰度高的人臉區(qū)域和清晰度低的背景區(qū)域。
[0085]由此可見(jiàn),采用根據(jù)本發(fā)明第二實(shí)施例的視頻通信方法和系統(tǒng),在的提高人臉圖像的清晰度的同時(shí),利用低編碼碼率的編碼方法來(lái)編碼和傳輸非人臉區(qū)域的背景圖像,從而可以在帶寬相對(duì)充足的情況下,或者在對(duì)方用戶希望了解本方用戶所處的環(huán)境的情況下,在視頻電話中提供具有高清晰度、大尺寸以及良好連續(xù)性的人臉圖像的同時(shí),提供具有相對(duì)低高清晰度、小尺寸以及一般連續(xù)性的背景圖像,從而實(shí)現(xiàn)了更為優(yōu)秀的用戶體驗(yàn)。
[0086]需要說(shuō)明的是,盡管在此將使用第一編碼/解碼方法和第二編碼/解碼方法的裝置示出為兩個(gè)編碼/解碼裝置,但是也可以通過(guò)同一個(gè)編碼/解碼裝置來(lái)執(zhí)行這兩種不同的編碼/解碼方法。
[0087]通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助于軟件加必需的硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以全部通過(guò)軟件、或硬件來(lái)實(shí)施?;谶@樣的理解,本發(fā)明的技術(shù)方案對(duì)【背景技術(shù)】做出貢獻(xiàn)的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如R0M/RAM、磁盤、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0088]在上面詳細(xì)描述了本發(fā)明的各個(gè)實(shí)施例。然而,本領(lǐng)域技術(shù)人員應(yīng)該理解,在不脫離本發(fā)明的原理和精神的情況下,可對(duì)這些實(shí)施例進(jìn)行各種修改,組合或子組合,并且這樣的修改應(yīng)落入本發(fā)明的范圍內(nèi)。
【權(quán)利要求】
1.一種視頻通信方法,其特征在于,所述方法包括: 從圖像中提取特征區(qū)域; 使用第一編碼方法來(lái)對(duì)所述特征區(qū)域進(jìn)行編碼;以及 向接收端發(fā)送編碼后的所述特征區(qū)域。
2.根據(jù)權(quán)利要求1的方法,其特征在于,所述從圖像中提取特征區(qū)域的步驟包括: 捕捉視頻序列; 在所述視頻序列的每一幀圖像中檢測(cè)所述特征區(qū)域;以及 從所述每一幀圖像中提取所述特征區(qū)域。
3.根據(jù)權(quán)利要求2的方法,其特征在于,所述捕捉視頻序列的步驟包括: 采用第一分辨率來(lái)捕捉所述視頻序列的第一幀圖像。
4.根據(jù)權(quán)利要求3的方法,其特征在于,所述在所述視頻序列的每一幀圖像中檢測(cè)所述特征區(qū)域的步驟包括: 在所述第一幀圖像中檢測(cè)所述特征區(qū)域; 判斷該檢測(cè)操作所占用的系統(tǒng)資源是否大于或等于資源閾值;以及如果是,則將所述第一分辨率改變?yōu)榈诙直媛?,以便在后續(xù)操作中,采用第二分辨率來(lái)捕捉所述視頻序列的第二 幀圖像, 其中,所述第二分辨率小于所述第一分辨率。
5.根據(jù)權(quán)利要求2的方法,其特征在于,所述從所述每一幀圖像中提取所述特征區(qū)域的步驟包括: 將所檢測(cè)到的特征區(qū)域的尺寸與尺寸閾值進(jìn)行比較; 如果所檢測(cè)到的特征區(qū)域的尺寸小于所述尺寸閾值,則對(duì)所檢測(cè)到的特征區(qū)域進(jìn)行放大處理,使得所檢測(cè)到的特征區(qū)域的尺寸等于所述尺寸閾值;以及 如果所檢測(cè)到的特征區(qū)域的尺寸大于所述尺寸閾值,則對(duì)所檢測(cè)到的特征區(qū)域進(jìn)行縮小處理,使得所檢測(cè)到的特征區(qū)域的尺寸等于所述尺寸閾值。
6.根據(jù)權(quán)利要求5的方法,其特征在于,所述尺寸閾值取決于視頻通信的帶寬。
7.根據(jù)權(quán)利要求1的方法,其特征在于,所述方法還包括: 從圖像中提取除了特征區(qū)域之外的非特征區(qū)域; 使用第二編碼方法來(lái)對(duì)所述非特征區(qū)域進(jìn)行編碼;以及 與所述特征區(qū)域一起,向接收端發(fā)送編碼后的所述非特征區(qū)域, 其中,所述第二編碼方法的編碼碼率小于所述第一編碼方法的編碼碼率。
8.根據(jù)權(quán)利要求1的方法,其特征在于,所述特征區(qū)域是包括人臉的區(qū)域。
9.一種視頻通信設(shè)備,其特征在于,所述設(shè)備包括: 提取裝置,用于從圖像中提取特征區(qū)域; 第一編碼裝置,用于使用第一編碼方法來(lái)對(duì)所述特征區(qū)域進(jìn)行編碼;以及 發(fā)送裝置,用于向接收端發(fā)送編碼后的所述特征區(qū)域。
10.根據(jù)權(quán)利要求9的設(shè)備,其特征在于,所述設(shè)備還包括: 捕捉裝置,用于捕捉視頻序列,并且 所述提取裝置在所述視頻序列的每一幀圖像中檢測(cè)所述特征區(qū)域,并且從所述每一幀圖像中提取所述特征區(qū)域。
11.根據(jù)權(quán)利要求10的設(shè)備,其特征在于,所述捕捉裝置采用第一分辨率來(lái)捕捉所述視頻序列的第一幀圖像。
12.根據(jù)權(quán)利要求11的設(shè)備,其特征在于,所述提取裝置在所述第一幀圖像中檢測(cè)所述特征區(qū)域,判斷該檢測(cè)操作所占用的系統(tǒng)資源是否大于或等于資源閾值,如果是,則向所述捕捉裝置發(fā)送分辨率改變信號(hào),并且 所述捕捉裝置根據(jù)所述分辨率改變信號(hào),來(lái)將所述第一分辨率改變?yōu)榈诙直媛?,以便在后續(xù)操作中,采用第二分辨率來(lái)捕捉所述視頻序列的第二幀圖像, 其中,所述第二分辨率小于所述第一分辨率。
13.根據(jù)權(quán)利要求10的設(shè)備,其特征在于,所述提取裝置將所檢測(cè)到的特征區(qū)域的尺寸與尺寸閾值進(jìn)行比較,如果所檢測(cè)到的特征區(qū)域的尺寸小于所述尺寸閾值,則對(duì)所檢測(cè)到的特征區(qū)域進(jìn)行放大處理,使得所檢測(cè)到的特征區(qū)域的尺寸等于所述尺寸閾值,并且如果所檢測(cè)到的特征區(qū)域的尺寸大于所述尺寸閾值,則對(duì)所檢測(cè)到的特征區(qū)域進(jìn)行縮小處理,使得所檢測(cè)到的特征區(qū)域的尺寸等于所述尺寸閾值。
14.根據(jù)權(quán)利要求13的設(shè)備,其特征在于,所述尺寸閾值取決于視頻通信的帶寬。
15.根據(jù)權(quán)利要求9的設(shè)備,其特征在于,所述設(shè)備還包括第二編碼裝置, 所述提取裝置還用于從圖像中提取除了特征區(qū)域之外的非特征區(qū)域, 所述第二編碼裝置用于使用第二編碼方法來(lái)對(duì)所述非特征區(qū)域進(jìn)行編碼,并且 所述發(fā)送裝置還用于與所述特征區(qū)域一起,向接收端發(fā)送編碼后的所述非特征區(qū)域, 其中,所述第二編碼方法的編碼碼率小于所述第一編碼方法的編碼碼率。`
16.根據(jù)權(quán)利要求9的設(shè)備,其特征在于,所述特征區(qū)域是包括人臉的區(qū)域。
【文檔編號(hào)】H04N19/167GK103517072SQ201210206429
【公開(kāi)日】2014年1月15日 申請(qǐng)日期:2012年6月18日 優(yōu)先權(quán)日:2012年6月18日
【發(fā)明者】陶宇權(quán) 申請(qǐng)人:聯(lián)想(北京)有限公司