聲紋密碼文本生成方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種聲紋密碼文本生成方法及系統(tǒng),該方法包括:確定各聲紋密碼文本字符的說話人區(qū)分性能;選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集;從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。利用本發(fā)明,可以提高聲紋認證的準確性。
【專利說明】
聲紋密碼文本生成方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及身份認證技術(shù)領(lǐng)域,具體涉及一種聲紋密碼文本生成方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著信息技術(shù)的迅猛發(fā)展,通信以及網(wǎng)絡(luò)的全球覆蓋使得信息公開化成為歷史必 然,伴隨著信息透明化,個人隱私的安全性也受到了極大的威脅,如何正確地進行個人身份 的識別進而保護私人數(shù)據(jù)是現(xiàn)代社會需要重點關(guān)注的方向之一。聲紋作為個人身份相關(guān)性 很高的生物特征已被應(yīng)用到身份認證領(lǐng)域中,并且聲紋密碼認證可以利用密碼文本和聲紋 特征兩種加密手段進行加密,具有較強的安全保障,得到了社會廣泛的關(guān)注和應(yīng)用。
[0003] 現(xiàn)有的聲紋密碼生成方法一般分為以下兩種:
[0004] 1)固定密碼文本,即在用戶的注冊階段和認證階段使用相同的密碼文本,如"芝麻 開門",在注冊階段讓用戶朗讀多遍"芝麻開門"完成聲紋模型訓(xùn)練數(shù)據(jù)錄制,在認證階段直 接讓用戶朗讀注冊時密碼文本,進行聲紋密碼認證。
[0005] 2)隨機密碼文本,即在用戶注冊階段和認證階段的密碼文本都是系統(tǒng)隨機產(chǎn)生 的。
[0006] 上述第1)種固定密碼文本,由于密碼文本的公開化,容易被冒認者利用目標說話 人錄音進行冒認。
[0007] 上述第2)種隨機密碼文本的隨機性,經(jīng)常會出現(xiàn)一些區(qū)分性較差的字符作為密 碼文本,如'555',進行聲紋認證時,由于'5'的發(fā)音過于低沉,相對于其它字符文本,較難 將冒認說話人和目標說話人區(qū)分開,從而降低認證效果。另外,現(xiàn)有方法在聲紋認證時,由 于經(jīng)常會存在一些字符組合的發(fā)音很難完全切分開的現(xiàn)象,如零聲母的字符組合'25',在 聲紋模型建模時,容易混入難切分字符的語音,導(dǎo)致模型訓(xùn)練不準確,認證準確度下降,如 對字符'2'進行聲紋模型訓(xùn)練時,訓(xùn)練數(shù)據(jù)中含有字符'5'的語音。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明實施例提供一種聲紋密碼文本生成方法及系統(tǒng),以提高聲紋認證的準確 性。
[0009] 為此,本發(fā)明實施例提供如下技術(shù)方案:
[0010] 一種聲紋密碼文本生成方法,包括:
[0011] 確定各聲紋密碼文本字符的說話人區(qū)分性能;
[0012] 選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集;
[0013] 從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。
[0014] 優(yōu)選地,所述確定各字符的說話人區(qū)分性能包括:
[0015] 收集各聲紋密碼文本字符的語音數(shù)據(jù);
[0016] 利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型;
[0017] 將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證,并根據(jù)認 證結(jié)果確定所述字符的說話人區(qū)分性能。
[0018] 優(yōu)選地,所述說話人區(qū)分性能指標包括以下任意一種或多種組合:等錯誤率、識別 正確率、檢測代價。
[0019] 優(yōu)選地,所述從所述聲紋密碼文本候選字符集挑選字符包括:
[0020] 隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符。
[0021 ] 優(yōu)選地,所述方法還包括:
[0022] 計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率;
[0023] 劃分概率區(qū)間;
[0024] 所述從所述聲紋密碼文本候選字符集挑選字符包括:
[0025] 根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。
[0026] 優(yōu)選地,所述根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符包 括:
[0027] 建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng)關(guān)系;
[0028] 生成隨機數(shù);
[0029] 挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。
[0030] 優(yōu)選地,所述方法還包括:
[0031] 確定聲紋密碼文本字符排列規(guī)則;
[0032] 所述從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本包括:
[0033] 從所述聲紋密碼文本候選字符集挑選字符,并依照所述排列規(guī)則將挑選的字符生 成聲紋密碼文本。
[0034] 優(yōu)選地,所述聲紋密碼文本字符排列規(guī)則包括:
[0035] 相同字符不能相鄰;
[0036] 零聲母字符不能相鄰。
[0037] 一種聲紋密碼文本生成系統(tǒng),包括:
[0038] 區(qū)分性能確定模塊,用于確定各聲紋密碼文本字符的說話人區(qū)分性能;
[0039] 候選字符集生成模塊,用于選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文 本候選字符集;
[0040] 字符挑選模塊,用于從所述聲紋密碼文本候選字符集挑選字符;
[0041] 密碼文本生成模塊,用于將挑選的字符生成聲紋密碼文本。
[0042] 優(yōu)選地,所述區(qū)分性能確定模塊包括:
[0043] 語音數(shù)據(jù)獲取單元,用于收集各聲紋密碼文本字符的語音數(shù)據(jù);
[0044] 訓(xùn)練單元,用于利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型;
[0045] 認證確定單元,用于將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人 聲紋認證,并根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能。
[0046] 優(yōu)選地,所述字符挑選模塊,具體用于隨機從所述聲紋密碼文本候選字符集挑選 設(shè)定個數(shù)的字符。
[0047] 優(yōu)選地,所述系統(tǒng)還包括:
[0048] 計算模塊,用于計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼 文本的概率;
[0049] 區(qū)間劃分模塊,用于劃分概率區(qū)間;
[0050] 所述字符挑選模塊,具體用于根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符 集中挑選字符。
[0051 ] 優(yōu)選地,所述字符挑選模塊包括:
[0052] 對應(yīng)關(guān)系建立單元,用于建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的 對應(yīng)關(guān)系;
[0053] 隨機數(shù)生成單元,用于生成隨機數(shù);
[0054] 選擇單元,用于挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。
[0055] 優(yōu)選地,所述系統(tǒng)還包括:
[0056] 排列規(guī)則確定模塊,用于確定聲紋密碼文本字符排列規(guī)則;
[0057] 所述密碼文本生成模塊,具體用于依照所述排列規(guī)則將挑選的字符生成聲紋密碼 文本。
[0058] 本發(fā)明實施例提供的聲紋密碼文本生成方法及系統(tǒng),選擇說話人區(qū)分性能較好的 字符作為候選字符構(gòu)建聲紋密碼文本候選字符集,從候選字符集中挑選字符生成聲紋密碼 文本。由于生成聲紋密碼文本的各字符具有較好的說話人區(qū)分性能,因此有效地提高了聲 紋密碼認證的效果。
[0059] 進一步地,按照確定的聲紋密碼文本字符排列規(guī)則生成聲紋密碼文本,從而有效 地避免了生成的密碼文本中出現(xiàn)難切分的字符組合的情況,進而提高聲紋密碼認證的效 果。
【附圖說明】
[0060] 為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一 些實施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0061] 圖1是本發(fā)明實施例聲紋密碼文本生成方法的流程圖;
[0062] 圖2是本發(fā)明實施例聲紋密碼文本生成系統(tǒng)的一種結(jié)構(gòu)示意圖;
[0063] 圖3是本發(fā)明實施例聲紋密碼文本生成系統(tǒng)的另一種結(jié)構(gòu)示意圖。
【具體實施方式】
[0064] 為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實施例的方案,下面結(jié)合附圖和實施 方式對本發(fā)明實施例作進一步的詳細說明。
[0065] 如圖1所示,是本發(fā)明實施例聲紋密碼文本生成方法的流程圖,包括以下步驟:
[0066] 步驟101,確定各聲紋密碼文本字符的說話人區(qū)分性能。
[0067] 所述聲紋密碼文本字符可以是漢字、字母、數(shù)字或特殊符號中的一種或多種組合。
[0068] 在本發(fā)明實施例中,可以采用數(shù)據(jù)驅(qū)動的方法計算每個聲紋密碼文本字符針對不 同說話人的區(qū)分性能,具體過程如下:
[0069] 1)收集各聲紋密碼文本字符的語音數(shù)據(jù)。
[0070] 也就是說,所述語音數(shù)據(jù)包含相應(yīng)的字符,而且,對應(yīng)一個字符有多個不同說話人 的語音數(shù)據(jù)。
[0071] 2)利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型。
[0072] 對于每個字符,利用收集到的包含該字符的大量說話人的語音數(shù)據(jù)提取聲學(xué)特 征,利用模型訓(xùn)練準則進行聲紋模型訓(xùn)練,所述訓(xùn)練準則如最大似然準則,所述模型例如 HMM(Hidden Markov Model,隱馬爾可夫模型)、GMM(Gaussian Mixture Model,高斯混合模 型),從而得到對應(yīng)該字符的聲紋模型。
[0073] 3)將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證,并根據(jù) 認證結(jié)果確定所述字符的說話人區(qū)分性能。
[0074] 具體地,對于每個字符,將其作為聲紋密碼文本,利用對應(yīng)該字符的聲紋模型和該 字符對應(yīng)的目標說話人語音,首先進行自適應(yīng)訓(xùn)練得到該目標說話人對應(yīng)的聲紋模型,所 述自適應(yīng)算法例如最大后驗概率;然后利用所述聲紋模型對目標說話人和冒認說話人進行 聲紋認證,根據(jù)認證結(jié)果計算該字符的說話人區(qū)分性能。
[0075] 所述說話人區(qū)分性能可以采用不同的指標來表示,比如:等錯誤率、識別正確率、 檢測代價等,當然還可以采用這些指標的任意組合來計算所述字符的說話人區(qū)分性能。
[0076] 所述等錯誤率是與當前字符的虛警率EfJP漏警率相關(guān)的區(qū)分性能衡量指 標,所述等錯誤率指標表明所有的錯誤(錯誤接受、錯誤拒絕)代價都是相同的,如式(1) 所示。所述虛警率表示錯誤接受冒認說話人語音的比例,所述漏警率表示錯誤拒絕目標說 話人語音的比例,所述虛警率EfJP漏警率Ε"_的計算方式如式(2)和式(3)所示,由式(2) 和式(3)易知當所述虛警率E fJi低時,所述漏警率Ε"_就越高,反之亦然;特殊地,當虛警 率EfJP漏警率Ε 相等時,即為等錯誤率,當前字符語音段等錯誤率越小時,當前字符的 區(qū)分性越好。
[0077] P""= E f== E (1)
[0078]
[0079]
[0080] 其中,nfa指使用冒認說話人語音認證時被當成目標說話人語音被接受的次數(shù); ninpcistCT指使用冒認說話人語音認證次數(shù)。η指目標說話人語音認證時被當成冒認說話人 語音被拒絕的次數(shù),n ta_t指使用目標說話人語音認證次數(shù)。
[0081] 所述識別正確率PralT是與當前字符等錯誤率P _相關(guān)的區(qū)分性能衡量指標,當前 字符的識別正確率越大時,區(qū)分性能越好,具體計算方法如式(4)所示:
[0082] Pcorr=l-Perr (4)
[0083] 所述檢測代價C&是與虛警率E £3和漏警率E 以及應(yīng)用場景有關(guān)的一個區(qū)分性 能評價指標,用于描述認證錯誤后造成損失的大小,一般檢測代價越小,造成的損失越小, 區(qū)分性越好,具體計算方式如式(5)所示:
[0084] Cdet= Cfa*Efa*Ptar+Cniss*E niss*(l-Ptar) (5)
[0085] 其中,Cf,分別是虛警代價和漏警代價,具體取值根據(jù)實際應(yīng)用場景設(shè)定,例 如,特定目標說話人的偵聽工作場景中,會把設(shè)置很大,防止出現(xiàn)太多漏警情況。P 指 實際認證時,當前用戶為目標說話人的概率,具體取值根據(jù)經(jīng)驗或?qū)嶒灲Y(jié)果設(shè)定。l_PtaJ^ 實際認證時,當前用戶為冒認說話人的概率。
[0086] 步驟102,選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集。
[0087] 根據(jù)發(fā)音規(guī)則及語言學(xué)相關(guān)理論,有些文本字符對不同說話人的區(qū)分性較好,而 有些文本字符對不同說話人的區(qū)分性較差。為此,在本發(fā)明實施例中,挑選出區(qū)分性較好的 字符作為聲紋密碼文本的候選字符,構(gòu)建聲紋密碼文本候選字符集。
[0088] 對于不同的指標,所述的要求也是不同的。以等錯誤率匕"為例,如果步驟101計 算得到的當前字符語音段的等錯誤率1\"小于設(shè)定的閾值,則確定該字符滿足要求,否則不 滿足要求。
[0089] 步驟103,從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。
[0090] 需要說明的是,在從所述聲紋密碼文本候選字符集挑選字符時,可以有多種方式, 比如:
[0091] 方式一
[0092] 隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符生成聲紋密碼文本。
[0093] 方式二
[0094] 1)計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率。
[0095] 具體地,可以根據(jù)各字符的說話人區(qū)分性能指標,計算聲紋密碼文本候選字符集 中每個字符被挑選為聲紋密碼文本的概率,以前面提到的等錯誤率區(qū)分性能指標為例,計 算公式如下:
[0096]
[0097] 其中,Pi表示聲紋密碼文本侯選字符集中第i個字符被選中的概率,N表示聲紋密 碼文本侯選字符集中所有字符數(shù)。
[0098] 由式(6)可以看出當前字符被選中的概率與當前字符的等錯誤率成反比,即等錯 誤率越大,說明當前字符的區(qū)分性越差,被選中的概率也就越低。
[0099] 2)劃分概率區(qū)間。
[0100] 具體劃分時,可以將聲紋密碼文本侯選字符集中所有字符根據(jù)其被選中的概率依 次進行區(qū)間劃分,以百分比為單位,具體劃分范圍為[1,100]。如侯選字符集中有3個字 符'A'、'B'、'C',被選中的概率分別為0. 2、0. 3、0. 5??梢詣澐?個概率區(qū)間,分別為:[1, 20]、[21,50]及[51,100],其中,概率區(qū)間[1,20]對應(yīng)字符'A',概率區(qū)間[21,50]對應(yīng)字 符'B',概率區(qū)間[51,100]對應(yīng)字符'C'。當然,每個概率區(qū)間也可以對應(yīng)多個字符。
[0101] 3)根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。
[0102] 在實際應(yīng)用中,可以有多種挑選方式。
[0103] 比如,隨機生成范圍在[1,100]的隨機數(shù),根據(jù)所述隨機數(shù)所屬的概率區(qū)間,選擇 相應(yīng)概率區(qū)間對應(yīng)的字符或字符組合作為當前聲紋密碼文本字符。如生成的隨機數(shù)為25, 則選擇概率區(qū)間[21,50]對應(yīng)的字符'B'作為當前聲紋密碼文本字符。
[0104] 再比如,依照概率區(qū)間由高到低的順序,依次隨機在相應(yīng)區(qū)間中挑選字符或字符 組合。
[0105] 本發(fā)明實施例提供的聲紋密碼文本生成方法,選擇說話人區(qū)分性能較好的字符作 為候選字符構(gòu)建聲紋密碼文本候選字符集,從候選字符集中挑選字符生成聲紋密碼文本。 由于生成聲紋密碼文本的各字符具有較好的說話人區(qū)分性能,因此有效地提高了聲紋密碼 認證的效果。
[0106] 進一步地,在從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本時,為 了避免出現(xiàn)一些字符組合的發(fā)音很難完全切分開的問題,在本發(fā)明方法另一實施例中,還 可以根據(jù)語言學(xué)發(fā)音原理確定一些聲紋密碼文本字符排列規(guī)則,比如:
[0107] 1)相同字符不能相鄰;
[0108] 2)零聲母字符不能相鄰。
[0109] 相應(yīng)地,在將挑選出的字符組合成生成聲紋密碼文本時,就需要依照上述規(guī)則進 行組合,比如,在挑選相應(yīng)的字符后,還要檢查將該字符加入到聲紋密碼文本字符序列中 后,相鄰字符的排列方式是否符合上述規(guī)則,如果不符合,可以放棄該字符重新挑選或調(diào)整 該字符的位置,直到聲紋密碼文本字符序列達到設(shè)定的長度。這樣可以避免因為快速連讀 而出現(xiàn)字符不能完全切分的情況,同時也避免了沒有聲母的字符連讀時不易切分開的情 況。
[0110] 同樣,在采用劃分概率區(qū)間的方式時,如果一個概率區(qū)間對應(yīng)多個字符,在選擇字 符時,字符間的排列也要符合上述排列規(guī)則。
[0111] 需要說明的是,利用本發(fā)明實施例聲紋密碼文本生成方法生成的密碼文本,可以 單獨應(yīng)用于用戶注冊階段或用戶認證階段,也可以同時應(yīng)用于用戶注冊階段和用戶認證階 段,對此本發(fā)明實施例不做限定。
[0112] 相應(yīng)地,本發(fā)明實施例還提供一種聲紋密碼文本生成系統(tǒng),如圖2所示,是該系統(tǒng) 的一種結(jié)構(gòu)示意圖。
[0113] 在該實施例中,所述系統(tǒng)包括:
[0114] 區(qū)分性能確定模塊201,用于確定各聲紋密碼文本字符的說話人區(qū)分性能;
[0115] 候選字符集生成模塊202,用于選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密 碼文本候選字符集;
[0116] 字符挑選模塊203,用于從所述聲紋密碼文本候選字符集挑選字符;
[0117] 密碼文本生成模塊204,用于將挑選的字符生成聲紋密碼文本。
[0118] 上述區(qū)分性能確定模塊201具體可以采用數(shù)據(jù)驅(qū)動的方法計算每個聲紋密碼文 本字符針對不同說話人的區(qū)分性能,該模塊的一種具體結(jié)構(gòu)包括以下各單元:
[0119] 語音數(shù)據(jù)獲取單元,用于收集各聲紋密碼文本字符的語音數(shù)據(jù);
[0120] 訓(xùn)練單元,用于利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型;
[0121] 認證確定單元,用于將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人 聲紋認證,并根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能。
[0122] 在實際應(yīng)用中,所述說話人區(qū)分性能可以采用不同的指標來表示,比如:等錯誤 率、識別正確率、檢測代價等,當然還可以采用這些指標的任意組合來計算所述字符的說話 人區(qū)分性能。
[0123] 相應(yīng)地,上述認證確定單元在根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能時可 以基于上述不同指標來確定,具體可參照前面本發(fā)明方法實施例中的描述,在此不再贅述。
[0124] 上述候選字符集生成模塊202需要挑選出區(qū)分性較好的字符作為聲紋密碼文本 的候選字符,構(gòu)建聲紋密碼文本候選字符集。同樣,對于不同的指標,所述的要求也是不同 的,需要根據(jù)具體的指標做適應(yīng)性調(diào)整。
[0125] 在實際應(yīng)用中,上述字符挑選模塊203可以采用多種方式從所述聲紋密碼文本候 選字符集挑選字符。
[0126] 比如,字符挑選模塊203可以隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù) 的字符。
[0127] 再比如,在圖3所示的本發(fā)明實施例聲紋密碼文本生成系統(tǒng)的另一種結(jié)構(gòu)中,所 述系統(tǒng)還包括:
[0128] 計算模塊301,用于計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋 密碼文本的概率;
[0129] 區(qū)間劃分模塊302,用于劃分概率區(qū)間。
[0130] 相應(yīng)地,在該實施例中,字符挑選模塊203可以根據(jù)劃分的概率區(qū)間從所述聲紋 密碼文本候選字符集中挑選字符。比如,字符挑選模塊203的一種具體結(jié)構(gòu)可以包括以下 各單元:
[0131] 對應(yīng)關(guān)系建立單元,用于建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的 對應(yīng)關(guān)系;
[0132] 隨機數(shù)生成單元,用于生成隨機數(shù);
[0133] 選擇單元,用于挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。
[0134] 當然,字符挑選模塊203還可以采用其它具體方式根據(jù)劃分的概率區(qū)間從所述聲 紋密碼文本候選字符集中挑選字符,比如依照概率區(qū)間由高到低的順序,依次隨機在相應(yīng) 區(qū)間中挑選字符等等,對此本發(fā)明實施例不做限定。
[0135] 本發(fā)明實施例提供的聲紋密碼文本生成系統(tǒng),選擇說話人區(qū)分性能較好的字符作 為候選字符構(gòu)建聲紋密碼文本候選字符集,從候選字符集中挑選字符生成聲紋密碼文本。 由于生成聲紋密碼文本的各字符具有較好的說話人區(qū)分性能,因此有效地提高了聲紋密碼 認證的效果。
[0136] 進一步地,為了避免在生成的聲紋密碼文本中出現(xiàn)一些字符組合的發(fā)音很難完全 切分開的問題,在本發(fā)明系統(tǒng)另一實施例中,還可以包括:排列規(guī)則確定模塊(未圖示),用 于確定聲紋密碼文本字符排列規(guī)則。具體地,可以根據(jù)語言學(xué)發(fā)音原理確定如下一些聲紋 密碼文本字符排列規(guī)則:
[0137] 1)相同字符不能相鄰;
[0138] 2)零聲母字符不能相鄰。
[0139] 相應(yīng)地,密碼文本生成模塊204需要依照所述排列規(guī)則將挑選的字符生成聲紋密 碼文本。具體地,檢查在將挑選的字符加入到聲紋密碼文本字符序列中后,相鄰字符的排列 方式是否符合上述排列規(guī)則,如果不符合,可以放棄該字符重新挑選或調(diào)整該字符的位置, 直到聲紋密碼文本字符序列達到設(shè)定的長度。這樣可以避免因為快速連讀而出現(xiàn)字符不能 完全切分的情況,同時也避免了沒有聲母的字符連讀時不易切分開的情況。
[0140] 本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部 分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實 施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例 的部分說明即可。以上所描述的系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明 的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是 物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要 選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出 創(chuàng)造性勞動的情況下,即可以理解并實施。
[0141] 以上對本發(fā)明實施例進行了詳細介紹,本文中應(yīng)用了【具體實施方式】對本發(fā)明進行 了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及系統(tǒng);同時,對于本領(lǐng)域的 一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所 述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【主權(quán)項】
1. 一種聲紋密碼文本生成方法,其特征在于,包括: 確定各聲紋密碼文本字符的說話人區(qū)分性能; 選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集; 從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定各字符的說話人區(qū)分性能包括: 收集各聲紋密碼文本字符的語音數(shù)據(jù); 利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型; 將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證,并根據(jù)認證結(jié) 果確定所述字符的說話人區(qū)分性能。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述說話人區(qū)分性能指標包括以下任意 一種或多種組合:等錯誤率、識別正確率、檢測代價。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從所述聲紋密碼文本候選字符集挑 選字符包括: 隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率; 劃分概率區(qū)間; 所述從所述聲紋密碼文本候選字符集挑選字符包括: 根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)劃分的概率區(qū)間從所述聲紋密 碼文本候選字符集中挑選字符包括: 建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng)關(guān)系; 生成隨機數(shù); 挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。7. 根據(jù)權(quán)利要求1至6任一項所述的方法,其特征在于,所述方法還包括: 確定聲紋密碼文本字符排列規(guī)則; 所述從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本包括: 從所述聲紋密碼文本候選字符集挑選字符,并依照所述排列規(guī)則將挑選的字符生成聲 紋密碼文本。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述聲紋密碼文本字符排列規(guī)則包括: 相同字符不能相鄰; 零聲母字符不能相鄰。9. 一種聲紋密碼文本生成系統(tǒng),其特征在于,包括: 區(qū)分性能確定模塊,用于確定各聲紋密碼文本字符的說話人區(qū)分性能; 候選字符集生成模塊,用于選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候 選字符集; 字符挑選模塊,用于從所述聲紋密碼文本候選字符集挑選字符; 密碼文本生成模塊,用于將挑選的字符生成聲紋密碼文本。10. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述區(qū)分性能確定模塊包括: 語音數(shù)據(jù)獲取單元,用于收集各聲紋密碼文本字符的語音數(shù)據(jù); 訓(xùn)練單元,用于利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型; 認證確定單元,用于將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋 認證,并根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能。11. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于, 所述字符挑選模塊,具體用于隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字 符。12. 根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 計算模塊,用于計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本 的概率; 區(qū)間劃分模塊,用于劃分概率區(qū)間; 所述字符挑選模塊,具體用于根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中 挑選字符。13. 根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述字符挑選模塊包括: 對應(yīng)關(guān)系建立單元,用于建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng) 關(guān)系; 隨機數(shù)生成單元,用于生成隨機數(shù); 選擇單元,用于挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。14. 根據(jù)權(quán)利要求9至13任一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 排列規(guī)則確定模塊,用于確定聲紋密碼文本字符排列規(guī)則; 所述密碼文本生成模塊,具體用于依照所述排列規(guī)則將挑選的字符生成聲紋密碼文 本。
【文檔編號】G10L17/00GK105991288SQ201510100196
【公開日】2016年10月5日
【申請日】2015年3月6日
【發(fā)明人】方昕, 劉俊華, 魏思, 胡國平, 王影, 胡郁, 劉慶峰
【申請人】科大訊飛股份有限公司