一種基于可穿戴設(shè)備的唇語識別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動通信技術(shù)領(lǐng)域,尤其涉及一種基于可穿戴設(shè)備的唇語識別方法及系統(tǒng)。
【背景技術(shù)】
[0002]人類的語言認知過程是一個多通道的感知過程。除聲音信息通道外,唇動視覺信息可以作為一種語音理解源。作為人機交互的一部分,視覺語言具有許多現(xiàn)在的應(yīng)用,因此通過機器的自動唇語識別技術(shù)成為備受關(guān)注的研究領(lǐng)域。
[0003]近年來,國內(nèi)外對于唇語識別都有相應(yīng)的研究,并且在一些關(guān)鍵技術(shù)上取得了一些突破,但是尚不能與語音識別進行融合且有效地改善識別率。在現(xiàn)有的技術(shù)中,主要是基于二維圖像處理以提取嘴唇的二維輪廓信息,但是嘴唇的二維輪廓信息所能夠表達的特征信息有限,多數(shù)詞語發(fā)音的二位輪廓信息重疊,導(dǎo)致識別能力有限。
[0004]此外,由于無線探測識別技術(shù),包括運動檢測、手勢識別、定位、材料分類等的提高,通過檢測和分析信號的反射,無線探測識別技術(shù)可發(fā)現(xiàn)穿墻運動和識別人的手勢。但是對與用戶說話的識別,只是通過聲學(xué)傳感器或者攝像頭裝置來實現(xiàn),這種方法的系統(tǒng)布置代價高、局限大,而且會出現(xiàn)延遲。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于可穿戴設(shè)備的唇語識別方法及系統(tǒng),通過可穿戴設(shè)備可以隨時隨地快速準確的識別應(yīng)的唇語。
[0006]為了解決上述技術(shù)問題,本發(fā)明提供了一種基于可穿戴設(shè)備的唇語識別方法,所述方法包括:
[0007]向用戶面部投射結(jié)構(gòu)光,通過結(jié)構(gòu)光接收器獲取面部反射的結(jié)構(gòu)光信息;
[0008]對所述面部反射的結(jié)構(gòu)信息進行過濾處理,獲取所述用戶嘴部運動時的嘴部反射的結(jié)構(gòu)光信息;
[0009]對所述嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息,并根據(jù)分段結(jié)構(gòu)光信息,提取所述分段結(jié)構(gòu)光信息的三維模型特征;
[0010]比較所述分段結(jié)構(gòu)光信息的三維模型特征與樣本三維模型特征的相似度,獲取相似度最高的三維模型特征所對應(yīng)的文字信息或語音信息。
[0011 ]優(yōu)選地,所述向用戶面部投射結(jié)構(gòu)光,通過結(jié)構(gòu)光接收器獲取面部反射的結(jié)構(gòu)光信息,包括:
[0012]旋轉(zhuǎn)結(jié)構(gòu)光投射器向所述用戶的面部投射結(jié)構(gòu)光,獲取最優(yōu)投射角度;
[0013]根據(jù)所述最優(yōu)投射角度投射結(jié)構(gòu)光,所述結(jié)構(gòu)光接收器接收完整的面部反射的結(jié)構(gòu)光信息。
[0014]優(yōu)選地,所述對所述面部反射的結(jié)構(gòu)信息進行過濾處理,獲取所述用戶嘴部運動時的嘴部反射的結(jié)構(gòu)光信息,包括:
[0015]對所述面板反射的結(jié)構(gòu)信息進行高通濾波和低通濾波過濾處理,除去所述面部反射的結(jié)構(gòu)信息噪聲,獲取降噪后的面部反射結(jié)構(gòu)光信息;
[0016]通過對所述用戶臉部進行區(qū)域定位,獲取所述用戶的嘴部位置的降噪后的嘴部反射結(jié)構(gòu)光信息。
[0017]優(yōu)選地,所述對所述嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息,包括:
[0018]采用小波變換算法,獲取,所述對所述嘴部反射的結(jié)構(gòu)光信息的波形變換情況;
[0019]根據(jù)所述波形變換情況,以波形的變換周期對所述嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息。
[0020]優(yōu)選地,所述比較所述分段結(jié)構(gòu)光信息的三維模型特征與樣本三維模型特征的相似度,包括:
[0021]采用最小二乘法計算所述分段結(jié)構(gòu)光信息的三維模型特征與所述樣本三維模型特征的相似度。
[0022]本發(fā)明還提供了一種基于可穿戴設(shè)備的唇語識別系統(tǒng),所述系統(tǒng)包括:
[0023]投射接收模塊:用于向用戶面部投射結(jié)構(gòu)光,通過結(jié)構(gòu)光接收器獲取面部反射的結(jié)構(gòu)光信息;
[0024]處理模塊:用于對所述面部反射的結(jié)構(gòu)信息進行過濾處理,獲取所述用戶嘴部運動時的嘴部反射的結(jié)構(gòu)光信息;
[0025]特征提取模塊:用于對所述嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息,并根據(jù)分段結(jié)構(gòu)光信息,提取所述分段結(jié)構(gòu)光信息的三維模型特征;
[0026]相似度對比模塊:用于比較所述分段結(jié)構(gòu)光信息的三維模型特征與樣本三維模型特征的相似度,獲取相似度最高的三維模型特征所對應(yīng)的文字信息或語音信息。
[0027]優(yōu)選地,所述投射接收模塊包括:
[0028]角度旋轉(zhuǎn)單元:用于旋轉(zhuǎn)結(jié)構(gòu)光投射器向所述用戶的面部投射結(jié)構(gòu)光,獲取最優(yōu)投射角度;
[0029]投射接收單元:用于根據(jù)所述最優(yōu)投射角度投射結(jié)構(gòu)光,所述結(jié)構(gòu)光接收器接收完整的面部反射的結(jié)構(gòu)光信息。
[0030]優(yōu)選地,所述處理模塊包括:
[0031]降噪單元:用于對所述面板反射的結(jié)構(gòu)信息進行高通濾波和低通濾波過濾處理,除去所述面部反射的結(jié)構(gòu)信息噪聲,獲取降噪后的面部反射結(jié)構(gòu)光信息;
[0032]定位單元:用于通過對所述用戶臉部進行區(qū)域定位,獲取所述用戶的嘴部位置的降噪后的嘴部反射結(jié)構(gòu)光信息。
[0033]優(yōu)選地,所述對所述嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息,包括:
[0034]采用小波變換算法,獲取,所述對所述嘴部反射的結(jié)構(gòu)光信息的波形變換情況;
[0035]根據(jù)所述波形變換情況,以波形的變換周期對所述對所述嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息。
[0036]優(yōu)選地,所述比較所述分段結(jié)構(gòu)光信息的三維模型特征與樣本三維模型特征的相似度,包括:
[0037]采用最小二乘法計算所述分段結(jié)構(gòu)光信息的三維模型特征與所述樣本三維模型特征的相似度。
[0038]本發(fā)明實施例是基于可穿戴設(shè)備上實現(xiàn)的,可快捷、準確的獲取到用戶唇語的文字信息或語音信息。
【附圖說明】
[0039]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其它的附圖。
[0040]圖1是本發(fā)明實施例中的基于可穿戴設(shè)備的唇語識別方法的方法流程示意圖;
[0041]圖2是本發(fā)明實施例中的基于可穿戴設(shè)備的唇語識別系統(tǒng)的結(jié)構(gòu)組成示意圖。
【具體實施方式】
[0042]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0043]本發(fā)明實施例提供了一種基于可穿戴設(shè)備的唇語識別方法,向用戶面部投射結(jié)構(gòu)光,通過結(jié)構(gòu)光接收器獲取面部反射的結(jié)構(gòu)光信息;對面部反射的結(jié)構(gòu)信息進行過濾處理,獲取用戶嘴部運動時的嘴部反射的結(jié)構(gòu)光信息;對嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息,并根據(jù)分段結(jié)構(gòu)光信息,提取分段結(jié)構(gòu)光信息的三維模型特征;比較分段結(jié)構(gòu)光信息的三維模型特征與樣本三維模型特征的相似度,獲取相似度最高的三維模型特征所對應(yīng)的文字信息或語音信息;可快捷、準確的獲取到用戶唇語的文字信息或語音信息。
[0044]圖1是本發(fā)明實施例中的基于可穿戴設(shè)備的唇語識別方法的方法流程示意圖,如圖1所示,該方法包括:
[0045]S11:向用戶面部投射結(jié)構(gòu)光,通過結(jié)構(gòu)光接收器獲取面部反射的結(jié)構(gòu)光信息;
[0046]S12:對面部反射的結(jié)構(gòu)信息進行過濾處理,獲取用戶嘴部運動時的嘴部反射的結(jié)構(gòu)光信息;
[0047]S13:對嘴部反射的結(jié)構(gòu)光信息進行分段,獲取分段結(jié)構(gòu)光信息,并根據(jù)分段結(jié)構(gòu)光信息,提取分段結(jié)構(gòu)光信息的三維模型特征;
[0048]S14:比較分段結(jié)構(gòu)光信息的三維模型特征與樣本三維模型特征的相似度,獲取相似度最高的三維模型特征所對應(yīng)的文字信息或語音信息。
[0049]對S11作進一步說明:
[0050]通過結(jié)構(gòu)光投射器向用戶的面部投射結(jié)構(gòu)光,并且不斷的旋轉(zhuǎn)結(jié)構(gòu)光投射器來改變投射結(jié)構(gòu)光的角度,從而獲取到最優(yōu)的投射結(jié)構(gòu)光的投射角度;根據(jù)最優(yōu)的投射角度投射結(jié)構(gòu)光,使得結(jié)構(gòu)光接收器能夠完整的接收到面部反射回來的結(jié)構(gòu)光信息。
[0051 ] 對S12作進一步說明:
[0052]將結(jié)構(gòu)光接收器接收回來的結(jié)構(gòu)光信息分別進行高通濾波和低通濾波過濾處理,這樣可以除去接收到的面部反射的結(jié)構(gòu)光信息中的大部分噪聲,使得面部反射的結(jié)構(gòu)光信息中的剩下的噪聲不會對后續(xù)的處理產(chǎn)生影響;
[0053]通過用戶的面部進行區(qū)域分割,根據(jù)分割出來的區(qū)域來確定用戶的嘴部位置,然后提取用戶嘴部位置的反