專利名稱:基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法
基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法。
背景技術(shù):
現(xiàn)有手機(jī)大都是通過(guò)觸摸動(dòng)作,光照判斷,密碼保護(hù)等技術(shù)達(dá)到解除鎖屏狀態(tài)的目的。采用觸摸動(dòng)作,光照判斷等技術(shù)解除手機(jī)鎖屏,手機(jī)不具有安全性,任何人都可以解 鎖手機(jī),而采用密碼保護(hù)的方式解除手機(jī)鎖屏,雖然可以防止其他非授權(quán)用戶使用手機(jī),但操作時(shí)不夠方便快捷。公開(kāi)號(hào)為102148899A,
公開(kāi)日為2011-8-10的發(fā)明專利,是將用戶輸入指令波形與手機(jī)系統(tǒng)已有解鎖聲音指令的波形(也就是時(shí)域信號(hào))進(jìn)行比對(duì),判斷是否吻合來(lái)決定是否解鎖,通過(guò)比對(duì)波形得到吻合或者為80% -100%吻合,這是不可能實(shí)現(xiàn)的,因?yàn)橥粋€(gè)人在不同時(shí)刻講述相同的一個(gè)詞或者一句話,其波形差異也很大,因此,該發(fā)明不具備可實(shí)施性。
發(fā)明內(nèi)容本發(fā)明要解決的技術(shù)問(wèn)題,在于提供一種基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,既方便快捷又保證了手機(jī)使用的安全性,在此基礎(chǔ)上對(duì)差異值的計(jì)算進(jìn)行了規(guī)定,引入分幀加窗,MFCC系數(shù)計(jì)算和矢量量化處理技術(shù),使用戶的聲音特性能夠更準(zhǔn)確的提取和比較,提高了便捷性和安全性上的用戶體驗(yàn)。本發(fā)明通過(guò)以下兩種技術(shù)方案來(lái)解決上述技術(shù)問(wèn)題的方案一一種基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,包括預(yù)置階段和解鎖階段,所述預(yù)置階段包括如下步驟步驟I、用戶輸入預(yù)置語(yǔ)音口令,所述語(yǔ)音口令在手機(jī)中的保存形式為時(shí)域信號(hào);步驟2、將保存形式為時(shí)域信號(hào)的所述預(yù)置語(yǔ)音口令的音頻數(shù)據(jù)執(zhí)行快速傅立葉變換,將所述預(yù)置語(yǔ)音口令的音頻數(shù)據(jù)變換成預(yù)置語(yǔ)音口令的頻域信號(hào);步驟3、在用戶手機(jī)系統(tǒng)中提供一默認(rèn)的通過(guò)閾值或由用戶設(shè)定一通過(guò)閾值;所述解鎖階段包括如下步驟步驟4、用戶輸入解鎖語(yǔ)音口令,所述語(yǔ)音口令在手機(jī)中的保存形式為時(shí)域信號(hào);步驟5、將保存形式為時(shí)域信號(hào)的所述解鎖語(yǔ)音口令的音頻數(shù)據(jù)執(zhí)行快速傅里葉變換,所述解鎖語(yǔ)音口令的音頻數(shù)據(jù)變換成解鎖語(yǔ)音口令的頻域信號(hào)譜;步驟6、計(jì)算所述解鎖語(yǔ)音口令頻域信號(hào)與所述預(yù)置語(yǔ)音口令頻域信號(hào)的差異值;步驟7、判斷所述差異值是否小于所述通過(guò)閾值,如果是,則解除手機(jī)鎖屏狀態(tài),如果否,則提示解鎖失敗。進(jìn)一步地,所述差異值通過(guò)求歐氏距離獲得。方案二 一種基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,包括預(yù)置階段和解鎖階段,所述預(yù)置階段包括如下步驟步驟10、用戶輸入預(yù)置語(yǔ)音口令,所述預(yù)置語(yǔ)音口令在手機(jī)中的保存形式為時(shí)域信號(hào);步驟11、將保存形式為時(shí)域信號(hào)的所述預(yù)置語(yǔ)音口令的音頻數(shù)據(jù)進(jìn)行分幀加窗處理,并計(jì)算預(yù)置語(yǔ)音口令的幀數(shù)量N ;步驟12、對(duì)每一幀預(yù)置語(yǔ)音口令執(zhí)行快速傅里葉變換,每一幀預(yù)置語(yǔ)音口令對(duì)應(yīng)變換成一預(yù)置語(yǔ)音口令的頻域信號(hào);步驟13、用X個(gè)Mel頻標(biāo)上線性分布的三角窗濾波器,對(duì)各預(yù)置語(yǔ)音口令的頻域信號(hào)依次濾波,濾波后,每一預(yù)置語(yǔ)音口令的頻域信號(hào)均獲得對(duì)應(yīng)的X個(gè)能量值;所述X為自 然數(shù),I彡X彡128 ;步驟14、對(duì)前Y1幀預(yù)置語(yǔ)音口令中每一幀預(yù)置語(yǔ)音口令對(duì)應(yīng)的X個(gè)能量值求預(yù)置語(yǔ)音口令的噪聲能量均值,所述Y1為自然數(shù),I ^ Y1 ^ N ;所述求預(yù)置語(yǔ)音口令噪聲能量均值的過(guò)程具體為將第一幀預(yù)置語(yǔ)音口令對(duì)應(yīng)的X個(gè)能量值至第Y1幀預(yù)置語(yǔ)音口令對(duì)應(yīng)的X個(gè)能量值分別求算數(shù)平均值,得到預(yù)置語(yǔ)音口令的X個(gè)噪聲能量均值,所述算術(shù)平均值的求解過(guò)程具體為即先對(duì)第一幀預(yù)置語(yǔ)音口令對(duì)應(yīng)的第一個(gè)能量值至第Y1幀預(yù)置語(yǔ)音口令對(duì)應(yīng)的第一個(gè)能量值求算數(shù)平均值,得到預(yù)置語(yǔ)音口令的第一個(gè)噪聲能量均值,而后依次類推求算數(shù)平均值,完成后共得到預(yù)置語(yǔ)音口令的Y1個(gè)噪聲能量均值;步驟15、在剩余的N-Y1幀預(yù)置語(yǔ)音口令中,每一幀預(yù)置語(yǔ)音口令對(duì)應(yīng)的X個(gè)能量值均分別相對(duì)應(yīng)地減去預(yù)置語(yǔ)音口令的X個(gè)噪聲能量均值,每一幀預(yù)置語(yǔ)音口令均獲得與之對(duì)應(yīng)的X個(gè)降噪能量值;所述N-Y1是指將N幀的預(yù)置語(yǔ)音口令去掉用于求噪聲能量均值的第一幀至第Y1幀預(yù)置語(yǔ)音口令;步驟16、對(duì)剩余N-Y1幀預(yù)置語(yǔ)音口令中每一幀預(yù)置語(yǔ)音口令對(duì)應(yīng)的X個(gè)降噪能量值進(jìn)行離散余弦變換,共獲得預(yù)置語(yǔ)音口令的N-Y1個(gè)Z維MFCC系數(shù);所述Z為自然數(shù),I彡Z彡128 ;步驟17、對(duì)獲得的預(yù)置語(yǔ)音口令的N-Y1個(gè)Z維MFCC系數(shù)進(jìn)行矢量量化,設(shè)置量化碼本的長(zhǎng)度為K,K為自然數(shù),且I < K < 128 ;則獲得一量化碼本,該量化碼本由K個(gè)Z維MFCC組成;步驟18、在用戶手機(jī)系統(tǒng)提供一默認(rèn)的通過(guò)閾值或由用戶設(shè)定一通過(guò)閾值;所述解鎖階段包括如下步驟步驟20、用戶輸入解鎖語(yǔ)音口令;所述解鎖語(yǔ)音口令在手機(jī)中的保存形式為時(shí)域
信號(hào);步驟21、將保存形式為時(shí)域信號(hào)的所述解鎖語(yǔ)音口令的音頻數(shù)據(jù)進(jìn)行分幀加窗處理,并計(jì)算解鎖語(yǔ)音口令的幀數(shù)量M ;步驟22、對(duì)每一幀解鎖語(yǔ)音口令執(zhí)行快速傅里葉變換,每一幀解鎖語(yǔ)音口令對(duì)應(yīng)變換成一解鎖語(yǔ)音口令的頻域信號(hào);步驟23、用所述三角窗濾波器對(duì)各解鎖語(yǔ)音口令的頻域信號(hào)依次濾波,濾波后,每一解鎖語(yǔ)音口令的頻域信號(hào)均獲得對(duì)應(yīng)的解鎖語(yǔ)音口令的X個(gè)能量值; 步驟24、對(duì)前Y2幀解鎖語(yǔ)音口令中每一幀解鎖語(yǔ)音口令對(duì)應(yīng)的X個(gè)能量值求解鎖語(yǔ)音口令的噪聲能量均值,所述求解鎖語(yǔ)音口令噪聲能量均值的過(guò)程具體為將第一幀解鎖語(yǔ)音口令對(duì)應(yīng)的X個(gè)解鎖語(yǔ)音 口令的能量值至第Y2幀解鎖語(yǔ)音口令對(duì)應(yīng)的X個(gè)能量值分別求算數(shù)平均值,得到解鎖語(yǔ)音口令的X個(gè)噪聲能量均值,所述算數(shù)平均值的求解過(guò)程具體為即先對(duì)第一幀解鎖語(yǔ)音口令對(duì)應(yīng)的第一個(gè)能量值至第Y2幀解鎖語(yǔ)音口令對(duì)應(yīng)的第一個(gè)能量值求算數(shù)平均值,得到解鎖語(yǔ)音口令的第一個(gè)噪聲能量均值,而后依次類推求算數(shù)平均值,完成后共得到X個(gè)解鎖語(yǔ)音口令的噪聲能量均值;步驟25、在剩余的M-Y2幀解鎖語(yǔ)音口令中,每一幀解鎖語(yǔ)音口令對(duì)應(yīng)的X個(gè)能量均值分別相對(duì)應(yīng)地減去解鎖語(yǔ)音口令的X個(gè)噪聲能量均值,每一幀解鎖語(yǔ)音口令均獲得與之對(duì)應(yīng)的X個(gè)降噪能量值;所述M-Y2是指將M幀的解鎖語(yǔ)音口令去掉用于求噪聲能量均值的第一幀至第Y2幀解鎖語(yǔ)音口令;步驟26、對(duì)剩余M-Y2幀解鎖語(yǔ)音口令中每一幀解鎖語(yǔ)音口令對(duì)應(yīng)的X個(gè)降噪能量值進(jìn)行離散余弦變換,共獲得解鎖語(yǔ)音口令的M-Y2個(gè)Z維MFCC系數(shù);步驟27、將解鎖語(yǔ)音口令的每個(gè)Z維MFCC系數(shù)分別與所述預(yù)置語(yǔ)音口令的量化碼本進(jìn)行——比對(duì),解鎖語(yǔ)音口令共M-Y2個(gè)Z維MFCC系數(shù),則比對(duì)M-Y2輪,由于該量化碼本由K個(gè)Z維MFCC組成,每一輪比對(duì),均獲得K個(gè)距離值,并選取其中的最小距離值,即每一輪比對(duì)獲得一個(gè)最小距離值,全部比對(duì)完,共獲得M-Y2個(gè)最小距離值,將M-Y2個(gè)最小距離值求和并除以M-Y2,得到平均最小距離;所述比對(duì)為求歐氏距離;步驟28、判斷所述平均最小距離是否小于所述通過(guò)閾值,如果是,則解除手機(jī)鎖屏狀態(tài),如果否,則提示解鎖失敗。進(jìn)一步地,步驟11中,通過(guò)公式N = (1^-20)/10+1向下取整求得所述預(yù)置語(yǔ)音口令的幀數(shù)量N,其中,公式中L1表示所述預(yù)置語(yǔ)音口令的音頻時(shí)長(zhǎng),L1的單位為毫秒,公式中的20表示幀長(zhǎng)度為20毫秒,公式中的10表示幀疊加為10毫秒。進(jìn)一步地,步驟21中,通過(guò)公式M= (L2-20)/10+l向下取整求得所述解鎖語(yǔ)音口令的幀數(shù)量M,其中,公式中L2表示所述解鎖語(yǔ)音口令的音頻時(shí)長(zhǎng),L2的單位為毫秒,公式中的20表示幀長(zhǎng)度為20毫秒,公式中的10表示幀疊加為10毫秒。進(jìn)一步地,輸入所述預(yù)置語(yǔ)音口令和所述解鎖語(yǔ)音口令時(shí),對(duì)所述預(yù)置語(yǔ)音口令和所述解鎖語(yǔ)音口令的信號(hào)采樣率均為16000Hz。進(jìn)一步地,所述三角窗濾波器的Mel頻標(biāo)的個(gè)數(shù)24 < X < 39。進(jìn)一步地,所述三角窗濾波器是用24個(gè)Mel頻標(biāo)上線性分布的三角窗濾波器,即X = 24,所述三角窗濾波器的中心頻率分別為100,200,300,400,500,600,700,800,900,1000,1149,1320,1516,1741,2000,2297,2639,3031,3482,4000,4595,5278,6063,6964,帶寬為100,100,100,100,100,100,100,100,100,124,160,184,211,242,278,320,367,422,484,556,639,734,843,969,以上數(shù)值單位均為 Hz。進(jìn)一步地,所述三角窗濾波器是用39個(gè)Mel頻標(biāo)上線性分布的三角窗濾波器,即X = 39,所述三角窗濾波器的中心頻率分別% :50,100,150,200,260,320,390,460,530,610,700,790,890,990,1100,1210,1340,1480,1610,1770,1930,2100,2280,2480,2680,2900,3140,3380,3650,3930,4230,4560,4900,5260,5650,6060,6500,6970,7470,帶寬為100,100,100,120,127,127,148,148,148,169,190,190,233,233,254,254,296,296,275,339,339,360,381,424,424,466,508,508,572,593,636,699,720,763,826,869,932,996,1060,以上數(shù)值單位均為Hz。
進(jìn)一步地,所述離散余弦變換的計(jì)算公式是
權(quán)利要求
1.ー種基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于包括預(yù)置階段和解鎖階段,所述預(yù)置階段包括如下步驟 步驟I、用戶輸入預(yù)置語(yǔ)音ロ令,所述語(yǔ)音ロ令在手機(jī)中的保存形式為時(shí)域信號(hào); 步驟2、將保存形式為時(shí)域信號(hào)的所述預(yù)置語(yǔ)音ロ令的音頻數(shù)據(jù)執(zhí)行快速傅立葉變換,將所述預(yù)置語(yǔ)音ロ令的音頻數(shù)據(jù)變換成預(yù)置語(yǔ)音ロ令的頻域信號(hào); 步驟3、在用戶手機(jī)系統(tǒng)中提供一默認(rèn)的通過(guò)閾值或由用戶設(shè)定一通過(guò)閾值; 所述解鎖階段包括如下步驟 步驟4、用戶輸入解鎖語(yǔ)音ロ令,所述語(yǔ)音ロ令在手機(jī)中的保存形式為時(shí)域信號(hào); 步驟5、將保存形式為時(shí)域信號(hào)的所述解鎖語(yǔ)音ロ令的音頻數(shù)據(jù)執(zhí)行快速傅里葉變換,所述解鎖語(yǔ)音ロ令的音頻數(shù)據(jù)變換成解鎖語(yǔ)音ロ令的頻域信號(hào)譜; 步驟6、計(jì)算所述解鎖語(yǔ)音ロ令頻域信號(hào)與所述預(yù)置語(yǔ)音ロ令頻域信號(hào)的差異值; 步驟7、判斷所述差異值是否小于所述通過(guò)閾值,如果是,則解除手機(jī)鎖屏狀態(tài),如果否,則提示解鎖失敗。
2.根據(jù)權(quán)利要求I所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于所述差異值通過(guò)求歐氏距離獲得。
3.ー種基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于包括預(yù)置階段和解鎖階段,所述預(yù)置階段包括如下步驟 步驟10、用戶輸入預(yù)置語(yǔ)音ロ令,所述預(yù)置語(yǔ)音ロ令在手機(jī)中的保存形式為時(shí)域信號(hào); 步驟11、將保存形式為時(shí)域信號(hào)的所述預(yù)置語(yǔ)音ロ令的音頻數(shù)據(jù)進(jìn)行分幀加窗處理,并計(jì)算預(yù)置語(yǔ)音ロ令的幀數(shù)量N ; 步驟12、對(duì)每ー幀預(yù)置語(yǔ)音ロ令執(zhí)行快速傅里葉變換,每ー幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)變換成一預(yù)置語(yǔ)音ロ令的頻域信號(hào); 步驟13、用X個(gè)Mel頻標(biāo)上線性分布的三角窗濾波器,對(duì)各預(yù)置語(yǔ)音ロ令的頻域信號(hào)依次濾波,濾波后,每ー預(yù)置語(yǔ)音ロ令的頻域信號(hào)均獲得對(duì)應(yīng)的X個(gè)能量值;所述X為自然數(shù),I彡X彡128 ; 步驟14、對(duì)前Y1幀預(yù)置語(yǔ)音ロ令中每ー幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)能量值求預(yù)置語(yǔ)音ロ令的噪聲能量均值,所述Y1為自然數(shù),I ^ Y1 ^ N ;所述求預(yù)置語(yǔ)音ロ令噪聲能量均值的過(guò)程具體為將第一幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)能量值至第Y1幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)能量值分別求算數(shù)平均值,得到預(yù)置語(yǔ)音ロ令的X個(gè)噪聲能量均值,所述算術(shù)平均值的求解過(guò)程具體為即先對(duì)第一幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)的第一個(gè)能量值至第Y1幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)的第一個(gè)能量值求算數(shù)平均值,得到預(yù)置語(yǔ)音ロ令的第一個(gè)噪聲能量均值,而后依次類推求算數(shù)平均值,完成后共得到預(yù)置語(yǔ)音ロ令的Y1個(gè)噪聲能量均值; 步驟15、在剰余的N-Y1幀預(yù)置語(yǔ)音ロ令中,每ー幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)能量值均分別相對(duì)應(yīng)地減去預(yù)置語(yǔ)音ロ令的X個(gè)噪聲能量均值,每ー幀預(yù)置語(yǔ)音ロ令均獲得與之對(duì)應(yīng)的X個(gè)降噪能量值;所述N-Y1是指將N幀的預(yù)置語(yǔ)音ロ令去掉用于求噪聲能量均值的第一幀至第Y1幀預(yù)置語(yǔ)音ロ令; 步驟16、對(duì)剩余N-Y1幀預(yù)置語(yǔ)音ロ令中每ー幀預(yù)置語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)降噪能量值進(jìn)行離散余弦變換,共獲得預(yù)置語(yǔ)音ロ令的N-Y1個(gè)Z維MFCC系數(shù);所述Z為自然數(shù),I彡Z彡128 ; 步驟17、對(duì)獲得的預(yù)置語(yǔ)音ロ令的N-Y1個(gè)Z維MFCC系數(shù)進(jìn)行矢量量化,設(shè)置量化碼本的長(zhǎng)度為K,K為自然數(shù),且I彡K彡128 ;則獲得一量化碼本,該量化碼本由K個(gè)Z維MFCC組成; 步驟18、在用戶手機(jī)系統(tǒng)提供一默認(rèn)的通過(guò)閾值或由用戶設(shè)定一通過(guò)閾值; 所述解鎖階段包括如下步驟 步驟20、用戶輸入解鎖語(yǔ)音ロ令;所述解鎖語(yǔ)音ロ令在手機(jī)中的保存形式為時(shí)域信 號(hào); 步驟21、將保存形式為時(shí)域信號(hào)的所述解鎖語(yǔ)音ロ令的音頻數(shù)據(jù)進(jìn)行分幀加窗處理,并計(jì)算解鎖語(yǔ)音ロ令的幀數(shù)量M ; 步驟22、對(duì)每ー幀解鎖語(yǔ)音ロ令執(zhí)行快速傅里葉變換,每ー幀解鎖語(yǔ)音ロ令對(duì)應(yīng)變換成一解鎖語(yǔ)音ロ令的頻域信號(hào); 步驟23、用所述三角窗濾波器對(duì)各解鎖語(yǔ)音ロ令的頻域信號(hào)依次濾波,濾波后,每ー解鎖語(yǔ)音ロ令的頻域信號(hào)均獲得對(duì)應(yīng)的解鎖語(yǔ)音ロ令的X個(gè)能量值; 步驟24、對(duì)前Y2幀解鎖語(yǔ)音ロ令中每ー幀解鎖語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)能量值求解鎖語(yǔ)音ロ令的噪聲能量均值,所述求解鎖語(yǔ)音ロ令噪聲能量均值的過(guò)程具體為將第一幀解鎖語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)解鎖語(yǔ)音ロ令的能量值至第Y2幀解鎖語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)能量值分別求算數(shù)平均值,得到解鎖語(yǔ)音ロ令的X個(gè)噪聲能量均值,所述算數(shù)平均值的求解過(guò)程具體為即先對(duì)第一幀解鎖語(yǔ)音ロ令對(duì)應(yīng)的第一個(gè)能量值至第Y2幀解鎖語(yǔ)音ロ令對(duì)應(yīng)的第一個(gè)能量值求算數(shù)平均值,得到解鎖語(yǔ)音ロ令的第一個(gè)噪聲能量均值,而后依次類推求算數(shù)平均值,完成后共得到X個(gè)解鎖語(yǔ)音ロ令的噪聲能量均值; 步驟25、在剩余的M-Y2幀解鎖語(yǔ)音ロ令中,每ー幀解鎖語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)能量均值分別相對(duì)應(yīng)地減去解鎖語(yǔ)音ロ令的X個(gè)噪聲能量均值,每ー幀解鎖語(yǔ)音ロ令均獲得與之對(duì)應(yīng)的X個(gè)降噪能量值;所述M-Y2是指將M幀的解鎖語(yǔ)音ロ令去掉用于求噪聲能量均值的第一幀至第Y2幀解鎖語(yǔ)音ロ令; 步驟26、對(duì)剩余M-Y2幀解鎖語(yǔ)音ロ令中每ー幀解鎖語(yǔ)音ロ令對(duì)應(yīng)的X個(gè)降噪能量值進(jìn)行離散余弦變換,共獲得解鎖語(yǔ)音ロ令的M-Y2個(gè)Z維MFCC系數(shù); 步驟27、將解鎖語(yǔ)音ロ令的每個(gè)Z維MFCC系數(shù)分別與所述預(yù)置語(yǔ)音ロ令的量化碼本進(jìn)行——比對(duì),解鎖語(yǔ)音ロ令共M-Y2個(gè)Z維MFCC系數(shù),則比對(duì)M-Y2輪,由于該量化碼本由K個(gè)Z維MFCC組成,每ー輪比對(duì),均獲得K個(gè)距離值,并選取其中的最小距離值,即每ー輪比對(duì)獲得ー個(gè)最小距離值,全部比對(duì)完,共獲得M-Y2個(gè)最小距離值,將M-Y2個(gè)最小距離值求和并除以M-Y2,得到平均最小距離;所述比對(duì)為求歐氏距離; 步驟28、判斷所述平均最小距離是否小于所述通過(guò)閾值,如果是,則解除手機(jī)鎖屏狀態(tài),如果否,則提示解鎖失敗。
4.根據(jù)權(quán)利要求3中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于步驟11中,通過(guò)公式N = (1^-20)/10+1向下取整求得所述預(yù)置語(yǔ)音ロ令的幀數(shù)量N,其中,公式中L1表示所述預(yù)置語(yǔ)音ロ令的音頻時(shí)長(zhǎng),L1的単位為毫秒,公式中的20表示幀長(zhǎng)度為20毫秒,公式中的10表示幀疊加為10毫秒。
5.根據(jù)權(quán)利要求3中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于步驟21中,通過(guò)公式M= (L2-20)/10+l向下取整求得所述解鎖語(yǔ)音ロ令的巾貞數(shù)量M,其中,公式中L2表示所述解鎖語(yǔ)音ロ令的音頻時(shí)長(zhǎng),L2的單位為毫秒,公式中的20表示幀長(zhǎng)度為20毫秒,公式中的10表示幀疊加為10毫秒。
6.根據(jù)權(quán)利要求3中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于輸入所述預(yù)置語(yǔ)音ロ令和所述解鎖語(yǔ)音ロ令吋,對(duì)所述預(yù)置語(yǔ)音ロ令和所述解鎖語(yǔ)音ロ令的信號(hào)采樣率均為16000Hz。
7.根據(jù)權(quán)利要求3中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于所述三角窗濾波器的Mel頻標(biāo)的個(gè)數(shù)24 < X < 39。
8.根據(jù)權(quán)利要求7中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于所述三角窗濾波器是用24個(gè)Mel頻標(biāo)上線性分布的三角窗濾波器,即X = 24,所述三角窗濾波器的中心頻率分別為100,200,300,400,500,600,700,800,900,1000,1149,1320,1516,1741,2000,2297,2639,3031,3482,4000,4595,5278,6063,6964,帶寬為100,100,100,100,100,100,100,100,100,124,160,184,211,242,278,320,367,422,484,556,639,734,843,969,以上數(shù)值單位均為Hz。
9.根據(jù)權(quán)利要求7中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于所述三角窗濾波器是用39個(gè)Mel頻標(biāo)上線性分布的三角窗濾波器,即X = 39,所述三角窗濾波器的中心頻率分別為50,100,150,200,260,320,390,460,530,610,700,790,890,990,1100,1210,1340,1480,1610,1770,1930,2100,2280,2480,2680,2900,3140,3380,3650,3930,4230,4560,4900,5260,5650,6060,6500,6970,7470,帶寬為100,100,100,120,127,127,148,148,148,169,190,190,233,233,254,254,296,296,275,339,339,360,381,424,424,466,508,508,572,593,636,699,720,763,826,869,932,996,1060,以上數(shù)值單位均為Hz。
10.根據(jù)權(quán)利要求3中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于所述離散余弦變換的計(jì)算公式是 Z^</)C0S[-Ya-]其中En(j)表示第j個(gè)降噪能量值,I≤j≤X,I≤i≤Z,i、j均為自然數(shù)。
11.根據(jù)權(quán)利要求3中所述的基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,其特征在于步驟11和步驟21中的加窗處理均為加漢明窗處理。
全文摘要
本發(fā)明提供一種基于語(yǔ)音短命令和聲紋技術(shù)解除手機(jī)鎖屏的方法,在預(yù)置階段,用戶輸入預(yù)置語(yǔ)音口令,并將其執(zhí)行快速傅立葉變化,然后確定一通過(guò)閾值,在解鎖階段,用戶輸入解鎖語(yǔ)音口令,并將其執(zhí)行快速傅立葉變化,計(jì)算所述解鎖語(yǔ)音口令頻域信號(hào)與所述預(yù)置語(yǔ)音口令頻域信號(hào)的差異值,通過(guò)比較差異值是否小于通過(guò)閾值來(lái)判定是否解鎖手機(jī),通過(guò)語(yǔ)音短命令和聲紋認(rèn)證技術(shù)解除手機(jī)鎖屏狀態(tài),既方便快捷又保證了手機(jī)使用的安全性,在此基礎(chǔ)上對(duì)差異值的計(jì)算進(jìn)行了規(guī)定,引入分幀加窗,MFCC系數(shù)計(jì)算和矢量量化處理技術(shù),使用戶的聲音特性能夠更準(zhǔn)確的提取和比較,提高了便捷性和安全性上的用戶體驗(yàn)。
文檔編號(hào)H04M1/725GK102647521SQ20121009708
公開(kāi)日2012年8月22日 申請(qǐng)日期2012年4月5日 優(yōu)先權(quán)日2012年4月5日
發(fā)明者余志鵬, 關(guān)胤, 劉德建, 吳擁民 申請(qǐng)人:福州博遠(yuǎn)無(wú)線網(wǎng)絡(luò)科技有限公司