一種基于人臉識別的自動調(diào)節(jié)拾音設備及自動調(diào)節(jié)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人工交互自動控制技術(shù)領(lǐng)域,尤其涉及一種基于人臉識別的自動調(diào)節(jié)拾音設備及自動調(diào)節(jié)方法。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)是通過多個麥克同時采集聲音,通過聲音到每支麥克的時間來判斷說話人的位置,然后在調(diào)整拾音參數(shù)。并對這些數(shù)據(jù)進行相關(guān)的處理。
[0003]技術(shù)缺點就是聲音的識別,只識別聲音,有時其它人在邊上說話會對整個系統(tǒng)進行干擾??蛇吷系娜说穆曇舨⒉皇窍到y(tǒng)所想要采集的聲音。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種基于人臉識別的自動調(diào)節(jié)拾音設備及自動調(diào)節(jié)方法,從而解決現(xiàn)有技術(shù)中存在的前述問題。
[0005]為了實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
[0006]一種基于人臉識別的自動調(diào)節(jié)拾音設備,包括圖像采集裝置和由多支拾音單元組成的拾音器陣列,所述圖像采集裝置設置于拾音器的前方或后方或上方或下方,用于采集所述拾音器的使用者的圖像;還包括控制電路,所述控制電路與所述拾音器陣列電連接,還與所述圖像采集裝置電連接。
[0007]優(yōu)選的,所述控制電路與所述多支拾音器單元分別電連接。
[0008]優(yōu)選的,所述多支拾音器單元為三支以上的拾音器單元。
[0009]優(yōu)選的,所述控制電路包括:
[0010]數(shù)據(jù)處理器,用于處理所述圖像采集裝置獲取的圖像數(shù)據(jù),從中得出人臉方位數(shù)據(jù),并根據(jù)所述方位數(shù)據(jù)生成調(diào)節(jié)指令;
[0011]拾音器靈敏度獲取模塊,用于獲取所述拾音器陣列中每個拾音器單元的當前靈敏度及當前拾音音量;
[0012]拾音器靈敏度調(diào)節(jié)模塊用于根據(jù)所述調(diào)節(jié)指令,調(diào)節(jié)所述拾音器陣列中每個拾音器單元的靈敏度和/或拾音音量。
[0013]優(yōu)選的,所述數(shù)據(jù)處理器,包括:
[0014]圖像分析模塊,用于分析所述圖像采集裝置獲取得到的整個圖像,從中尋找人臉圖像,如果找到則提取所述人臉圖像;
[0015]人臉分析模塊,用于分析所述人臉圖像,得出人臉尺寸,并計算得出所述人臉圖像在所述整個圖像中的人臉坐標位置;
[0016]距離分析模塊,用于根據(jù)所述人臉尺寸,獲得所述人臉距離所述拾音器陣列的距離;
[0017]調(diào)節(jié)指令生成模塊,用于根據(jù)所述坐標位置、所述距離和所述每個拾音器單元的當前靈敏度及當前拾音音量,調(diào)節(jié)所述每個拾音器單元的靈敏度和/或拾音音量。
[0018]優(yōu)選的,所述圖像采集裝置為攝像頭,設置于所述拾音器陣列的中分線上。
[0019]所述的基于人臉識別的自動調(diào)節(jié)拾音設備的自動調(diào)節(jié)方法,包括以下步驟:
[0020]SI,圖像采集裝置以預設頻率獲取拾音設備使用者的整個圖像;
[0021]S2,分析所述圖像采集裝置獲取得到的整個圖像,從中尋找人臉圖像,如果沒有找到則繼續(xù)在下一張所述整個圖像中尋找,如果找到則提取所述人臉圖像;
[0022]S3,分析所述人臉圖像,得出人臉尺寸,并計算得出所述人臉在所述整個圖像中的人臉坐標位置XY ;
[0023]S4,根據(jù)所述人臉尺寸獲得所述人臉與所述拾音器陣列的距離;
[0024]S5,根據(jù)所述人臉坐標位置中的位置坐標XY值,獲得人臉相對于所述拾音器陣列的相對角度;
[0025]S6根據(jù)所述相對角度的值和所述距離,調(diào)節(jié)所述拾音器陣列中的相應位置的拾音器單元的靈敏度和/或拾音音量。
[0026]優(yōu)選的,S4具體為根據(jù)人臉面積的大小尺寸計算出實際人臉與所述拾音器陣列的距離,和/或利用測試方法取得人臉面積所對應的距離,和/或利用設置于所述圖像采集裝置旁邊的距離傳感器測得實際人臉與所述拾音器陣列的距離。
[0027]優(yōu)選的,S6具體為,根據(jù)所述相對角度,得到與拾音器使用者直線距離最近的一組拾音器單元做為主拾音區(qū)單元,進而根據(jù)所述距離確定所述主拾音區(qū)單元的靈敏度,距離值越大靈敏度應越大,距離值越小靈敏度應越小,根據(jù)得出的應達到的靈敏度值和當前靈敏度值對所述主拾音區(qū)單元進行調(diào)整;對于非主拾音區(qū)單元,則直接降低其靈敏度或直接將其關(guān)閉。
[0028]優(yōu)選的,根據(jù)所述圖像采集裝置獲取拾音設備使用者的整個圖像的預設頻率,重復執(zhí)行S2-S6,以實現(xiàn)實時自動調(diào)節(jié)。
[0029]本發(fā)明的有益效果是:
[0030]本發(fā)明的基于人臉識別的自動調(diào)節(jié)拾音設備及自動調(diào)節(jié)方法引入圖像采集裝置,對拾音器的使用者的人臉方位進行辨別,再根據(jù)該方位對拾音器進行相關(guān)調(diào)整,從而避免了僅通過聲音識別而控制調(diào)整拾音參數(shù)所帶來的不便。調(diào)整精度更高,操作更為智能。
【附圖說明】
[0031]圖1是本發(fā)明的結(jié)構(gòu)示意圖;
[0032]圖2是圖像采集裝置采集到的整個圖像的示意圖;
[0033]圖3是分析到人臉的整個圖像的示意圖;
[0034]圖4是取得人臉尺寸后的整個圖像的示意圖;
[0035]圖5是取得人臉尺寸及人臉坐標值后的整個圖像的示意圖;
[0036]圖6是當使用者正對拾音器陣列時劃分的主拾音區(qū)示意圖;
[0037]圖7是當使用者斜對拾音器陣列時劃分的主拾音區(qū)示意圖;
[0038]其中:01--本發(fā)明的使用者;02-—拾音器陣列;03-—圖像采集裝置;04-—非主拾音區(qū)域;05-—主拾音區(qū)域;10-—圖像采集裝置采集到的整個圖像;11-一整個圖像中的人臉圖像;12-—人臉圖像中的人眼;14-一整個圖像中的人臉面積示意圖。
【具體實施方式】
[0039]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的【具體實施方式】僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0040]如圖1-7所示,本發(fā)明公開了一種基于人臉識別的自動調(diào)節(jié)拾音設備及自動調(diào)節(jié)方法,所述基于人臉識別的自動調(diào)節(jié)拾音設備,包括圖像采集裝置和由多支拾音單元組成的拾音器陣列,所述圖像采集裝置設置于拾音器的前方或后方或上方或下方,用于采集所述拾音器的使用者的圖像;還包括控制電路,所述控制電路與所述拾音器陣列電連接,還與所述圖像采集裝置電連接。所述控制電路與所述多支拾音單元分別電連接。所述多支拾音單元為三支以上的拾音器單元。
[0041]所述控制電路包括:
[0042]數(shù)據(jù)處理器,用于處理所述圖像采集裝置獲取的圖像數(shù)據(jù),從中得出人臉方位數(shù)據(jù),并根據(jù)所述方位數(shù)據(jù)生成調(diào)節(jié)指令;
[0043]拾音器靈敏度獲取模塊,用于獲取所述拾音器陣列中每個拾音器單元的當前靈敏度及當前拾音音量;
[0044]拾音器靈敏度調(diào)節(jié)模塊用于根據(jù)所述調(diào)節(jié)指令,調(diào)節(jié)所述拾音器陣列中每個拾音器單元的靈敏度和/或拾音音量。
[0045]所述數(shù)據(jù)處理器,包括:
[0046]圖像分析模塊,用于分析所述圖像采集裝置獲取得到的整個圖像,從中尋找人臉圖像,如果找到則提取所述人臉圖像;
[0047]人臉分析模塊,用于分析所述人臉圖像,得出人臉尺寸,并計算得出所述眼睛在所述整個圖像中的人臉坐標位置;
[0048]距離分析模塊,用于根據(jù)所述人臉尺寸,獲得所述人臉距離所述拾音器陣列的距離;
[0049]調(diào)節(jié)指令生