聲紋密碼文本生成方法及系統(tǒng)的制作方法

文檔序號：10626594閱讀：680來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

聲紋密碼文本生成方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種聲紋密碼文本生成方法及系統(tǒng)，該方法包括：確定各聲紋密碼文本字符的說話人區(qū)分性能；選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集；從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。利用本發(fā)明，可以提高聲紋認證的準確性。
【專利說明】
聲紋密碼文本生成方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及身份認證技術(shù)領(lǐng)域，具體涉及一種聲紋密碼文本生成方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著信息技術(shù)的迅猛發(fā)展，通信以及網(wǎng)絡(luò)的全球覆蓋使得信息公開化成為歷史必然，伴隨著信息透明化，個人隱私的安全性也受到了極大的威脅，如何正確地進行個人身份的識別進而保護私人數(shù)據(jù)是現(xiàn)代社會需要重點關(guān)注的方向之一。聲紋作為個人身份相關(guān)性很高的生物特征已被應(yīng)用到身份認證領(lǐng)域中，并且聲紋密碼認證可以利用密碼文本和聲紋特征兩種加密手段進行加密，具有較強的安全保障，得到了社會廣泛的關(guān)注和應(yīng)用。
[0003] 現(xiàn)有的聲紋密碼生成方法一般分為以下兩種：
[0004] 1)固定密碼文本，即在用戶的注冊階段和認證階段使用相同的密碼文本，如"芝麻開門"，在注冊階段讓用戶朗讀多遍"芝麻開門"完成聲紋模型訓(xùn)練數(shù)據(jù)錄制，在認證階段直接讓用戶朗讀注冊時密碼文本，進行聲紋密碼認證。
[0005] 2)隨機密碼文本，即在用戶注冊階段和認證階段的密碼文本都是系統(tǒng)隨機產(chǎn)生的。
[0006] 上述第1)種固定密碼文本，由于密碼文本的公開化，容易被冒認者利用目標說話人錄音進行冒認。
[0007] 上述第2)種隨機密碼文本的隨機性，經(jīng)常會出現(xiàn)一些區(qū)分性較差的字符作為密碼文本，如'555'，進行聲紋認證時，由于'5'的發(fā)音過于低沉，相對于其它字符文本，較難將冒認說話人和目標說話人區(qū)分開，從而降低認證效果。另外，現(xiàn)有方法在聲紋認證時，由于經(jīng)常會存在一些字符組合的發(fā)音很難完全切分開的現(xiàn)象，如零聲母的字符組合'25'，在聲紋模型建模時，容易混入難切分字符的語音，導(dǎo)致模型訓(xùn)練不準確，認證準確度下降，如對字符'2'進行聲紋模型訓(xùn)練時，訓(xùn)練數(shù)據(jù)中含有字符'5'的語音。

【發(fā)明內(nèi)容】

[0008] 本發(fā)明實施例提供一種聲紋密碼文本生成方法及系統(tǒng)，以提高聲紋認證的準確性。
[0009] 為此，本發(fā)明實施例提供如下技術(shù)方案：
[0010] 一種聲紋密碼文本生成方法，包括：
[0011] 確定各聲紋密碼文本字符的說話人區(qū)分性能；
[0012] 選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集；
[0013] 從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。
[0014] 優(yōu)選地，所述確定各字符的說話人區(qū)分性能包括：
[0015] 收集各聲紋密碼文本字符的語音數(shù)據(jù)；
[0016] 利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型；
[0017] 將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證，并根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能。
[0018] 優(yōu)選地，所述說話人區(qū)分性能指標包括以下任意一種或多種組合：等錯誤率、識別正確率、檢測代價。
[0019] 優(yōu)選地，所述從所述聲紋密碼文本候選字符集挑選字符包括：
[0020] 隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符。
[0021 ] 優(yōu)選地，所述方法還包括：
[0022] 計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率；
[0023] 劃分概率區(qū)間；
[0024] 所述從所述聲紋密碼文本候選字符集挑選字符包括：
[0025] 根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。
[0026] 優(yōu)選地，所述根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符包括：
[0027] 建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng)關(guān)系；
[0028] 生成隨機數(shù)；
[0029] 挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。
[0030] 優(yōu)選地，所述方法還包括：
[0031] 確定聲紋密碼文本字符排列規(guī)則；
[0032] 所述從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本包括：
[0033] 從所述聲紋密碼文本候選字符集挑選字符，并依照所述排列規(guī)則將挑選的字符生成聲紋密碼文本。
[0034] 優(yōu)選地，所述聲紋密碼文本字符排列規(guī)則包括：
[0035] 相同字符不能相鄰；
[0036] 零聲母字符不能相鄰。
[0037] 一種聲紋密碼文本生成系統(tǒng)，包括：
[0038] 區(qū)分性能確定模塊，用于確定各聲紋密碼文本字符的說話人區(qū)分性能；
[0039] 候選字符集生成模塊，用于選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集；
[0040] 字符挑選模塊，用于從所述聲紋密碼文本候選字符集挑選字符；
[0041] 密碼文本生成模塊，用于將挑選的字符生成聲紋密碼文本。
[0042] 優(yōu)選地，所述區(qū)分性能確定模塊包括：
[0043] 語音數(shù)據(jù)獲取單元，用于收集各聲紋密碼文本字符的語音數(shù)據(jù)；
[0044] 訓(xùn)練單元，用于利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型；
[0045] 認證確定單元，用于將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證，并根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能。
[0046] 優(yōu)選地，所述字符挑選模塊，具體用于隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符。
[0047] 優(yōu)選地，所述系統(tǒng)還包括：
[0048] 計算模塊，用于計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率；
[0049] 區(qū)間劃分模塊，用于劃分概率區(qū)間；
[0050] 所述字符挑選模塊，具體用于根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。
[0051 ] 優(yōu)選地，所述字符挑選模塊包括：
[0052] 對應(yīng)關(guān)系建立單元，用于建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng)關(guān)系；
[0053] 隨機數(shù)生成單元，用于生成隨機數(shù)；
[0054] 選擇單元，用于挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。
[0055] 優(yōu)選地，所述系統(tǒng)還包括：
[0056] 排列規(guī)則確定模塊，用于確定聲紋密碼文本字符排列規(guī)則；
[0057] 所述密碼文本生成模塊，具體用于依照所述排列規(guī)則將挑選的字符生成聲紋密碼文本。
[0058] 本發(fā)明實施例提供的聲紋密碼文本生成方法及系統(tǒng)，選擇說話人區(qū)分性能較好的字符作為候選字符構(gòu)建聲紋密碼文本候選字符集，從候選字符集中挑選字符生成聲紋密碼文本。由于生成聲紋密碼文本的各字符具有較好的說話人區(qū)分性能，因此有效地提高了聲紋密碼認證的效果。
[0059] 進一步地，按照確定的聲紋密碼文本字符排列規(guī)則生成聲紋密碼文本，從而有效地避免了生成的密碼文本中出現(xiàn)難切分的字符組合的情況，進而提高聲紋密碼認證的效果。
【附圖說明】
[0060] 為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明中記載的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，還可以根據(jù)這些附圖獲得其他的附圖。
[0061] 圖1是本發(fā)明實施例聲紋密碼文本生成方法的流程圖；
[0062] 圖2是本發(fā)明實施例聲紋密碼文本生成系統(tǒng)的一種結(jié)構(gòu)示意圖；
[0063] 圖3是本發(fā)明實施例聲紋密碼文本生成系統(tǒng)的另一種結(jié)構(gòu)示意圖。
【具體實施方式】
[0064] 為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實施例的方案，下面結(jié)合附圖和實施方式對本發(fā)明實施例作進一步的詳細說明。
[0065] 如圖1所示，是本發(fā)明實施例聲紋密碼文本生成方法的流程圖，包括以下步驟：
[0066] 步驟101，確定各聲紋密碼文本字符的說話人區(qū)分性能。
[0067] 所述聲紋密碼文本字符可以是漢字、字母、數(shù)字或特殊符號中的一種或多種組合。
[0068] 在本發(fā)明實施例中，可以采用數(shù)據(jù)驅(qū)動的方法計算每個聲紋密碼文本字符針對不同說話人的區(qū)分性能，具體過程如下：
[0069] 1)收集各聲紋密碼文本字符的語音數(shù)據(jù)。
[0070] 也就是說，所述語音數(shù)據(jù)包含相應(yīng)的字符，而且，對應(yīng)一個字符有多個不同說話人的語音數(shù)據(jù)。
[0071] 2)利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型。
[0072] 對于每個字符，利用收集到的包含該字符的大量說話人的語音數(shù)據(jù)提取聲學(xué)特征，利用模型訓(xùn)練準則進行聲紋模型訓(xùn)練，所述訓(xùn)練準則如最大似然準則，所述模型例如 HMM(Hidden Markov Model，隱馬爾可夫模型）、GMM(Gaussian Mixture Model，高斯混合模型），從而得到對應(yīng)該字符的聲紋模型。
[0073] 3)將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證，并根據(jù) 認證結(jié)果確定所述字符的說話人區(qū)分性能。
[0074] 具體地，對于每個字符，將其作為聲紋密碼文本，利用對應(yīng)該字符的聲紋模型和該字符對應(yīng)的目標說話人語音，首先進行自適應(yīng)訓(xùn)練得到該目標說話人對應(yīng)的聲紋模型，所述自適應(yīng)算法例如最大后驗概率；然后利用所述聲紋模型對目標說話人和冒認說話人進行聲紋認證，根據(jù)認證結(jié)果計算該字符的說話人區(qū)分性能。
[0075] 所述說話人區(qū)分性能可以采用不同的指標來表示，比如：等錯誤率、識別正確率、檢測代價等，當然還可以采用這些指標的任意組合來計算所述字符的說話人區(qū)分性能。
[0076] 所述等錯誤率是與當前字符的虛警率EfJP漏警率相關(guān)的區(qū)分性能衡量指標，所述等錯誤率指標表明所有的錯誤（錯誤接受、錯誤拒絕）代價都是相同的，如式（1) 所示。所述虛警率表示錯誤接受冒認說話人語音的比例，所述漏警率表示錯誤拒絕目標說話人語音的比例，所述虛警率EfJP漏警率Ε"_的計算方式如式（2)和式（3)所示，由式（2) 和式（3)易知當所述虛警率E fJi低時，所述漏警率Ε"_就越高，反之亦然；特殊地，當虛警率EfJP漏警率Ε 相等時，即為等錯誤率，當前字符語音段等錯誤率越小時，當前字符的區(qū)分性越好。
[0077] P""= E f== E (1)
[0078]
[0079]
[0080] 其中，nfa指使用冒認說話人語音認證時被當成目標說話人語音被接受的次數(shù)； ninpcistCT指使用冒認說話人語音認證次數(shù)。η指目標說話人語音認證時被當成冒認說話人語音被拒絕的次數(shù)，n ta_t指使用目標說話人語音認證次數(shù)。
[0081] 所述識別正確率PralT是與當前字符等錯誤率P _相關(guān)的區(qū)分性能衡量指標，當前字符的識別正確率越大時，區(qū)分性能越好，具體計算方法如式（4)所示：
[0082] Pcorr=l-Perr (4)
[0083] 所述檢測代價C&是與虛警率E ￡3和漏警率E 以及應(yīng)用場景有關(guān)的一個區(qū)分性能評價指標，用于描述認證錯誤后造成損失的大小，一般檢測代價越小，造成的損失越小，區(qū)分性越好，具體計算方式如式（5)所示：
[0084] Cdet= Cfa*Efa*Ptar+Cniss*E niss*(l-Ptar) (5)
[0085] 其中，Cf，分別是虛警代價和漏警代價，具體取值根據(jù)實際應(yīng)用場景設(shè)定，例如，特定目標說話人的偵聽工作場景中，會把設(shè)置很大，防止出現(xiàn)太多漏警情況。P 指實際認證時，當前用戶為目標說話人的概率，具體取值根據(jù)經(jīng)驗或?qū)嶒灲Y(jié)果設(shè)定。l_PtaJ^ 實際認證時，當前用戶為冒認說話人的概率。
[0086] 步驟102,選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集。
[0087] 根據(jù)發(fā)音規(guī)則及語言學(xué)相關(guān)理論，有些文本字符對不同說話人的區(qū)分性較好，而有些文本字符對不同說話人的區(qū)分性較差。為此，在本發(fā)明實施例中，挑選出區(qū)分性較好的字符作為聲紋密碼文本的候選字符，構(gòu)建聲紋密碼文本候選字符集。
[0088] 對于不同的指標，所述的要求也是不同的。以等錯誤率匕"為例，如果步驟101計算得到的當前字符語音段的等錯誤率1\"小于設(shè)定的閾值，則確定該字符滿足要求，否則不滿足要求。
[0089] 步驟103,從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。
[0090] 需要說明的是，在從所述聲紋密碼文本候選字符集挑選字符時，可以有多種方式，比如：
[0091] 方式一
[0092] 隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符生成聲紋密碼文本。
[0093] 方式二
[0094] 1)計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率。
[0095] 具體地，可以根據(jù)各字符的說話人區(qū)分性能指標，計算聲紋密碼文本候選字符集中每個字符被挑選為聲紋密碼文本的概率，以前面提到的等錯誤率區(qū)分性能指標為例，計算公式如下：
[0096]
[0097] 其中，Pi表示聲紋密碼文本侯選字符集中第i個字符被選中的概率，N表示聲紋密碼文本侯選字符集中所有字符數(shù)。
[0098] 由式（6)可以看出當前字符被選中的概率與當前字符的等錯誤率成反比，即等錯誤率越大，說明當前字符的區(qū)分性越差，被選中的概率也就越低。
[0099] 2)劃分概率區(qū)間。
[0100] 具體劃分時，可以將聲紋密碼文本侯選字符集中所有字符根據(jù)其被選中的概率依次進行區(qū)間劃分，以百分比為單位，具體劃分范圍為[1，100]。如侯選字符集中有3個字符'A'、'B'、'C'，被選中的概率分別為0. 2、0. 3、0. 5?？梢詣澐?個概率區(qū)間，分別為：[1， 20]、[21，50]及[51，100]，其中，概率區(qū)間[1，20]對應(yīng)字符'A'，概率區(qū)間[21，50]對應(yīng)字符'B'，概率區(qū)間[51，100]對應(yīng)字符'C'。當然，每個概率區(qū)間也可以對應(yīng)多個字符。
[0101] 3)根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。
[0102] 在實際應(yīng)用中，可以有多種挑選方式。
[0103] 比如，隨機生成范圍在[1，100]的隨機數(shù)，根據(jù)所述隨機數(shù)所屬的概率區(qū)間，選擇相應(yīng)概率區(qū)間對應(yīng)的字符或字符組合作為當前聲紋密碼文本字符。如生成的隨機數(shù)為25，則選擇概率區(qū)間[21，50]對應(yīng)的字符'B'作為當前聲紋密碼文本字符。
[0104] 再比如，依照概率區(qū)間由高到低的順序，依次隨機在相應(yīng)區(qū)間中挑選字符或字符組合。
[0105] 本發(fā)明實施例提供的聲紋密碼文本生成方法，選擇說話人區(qū)分性能較好的字符作為候選字符構(gòu)建聲紋密碼文本候選字符集，從候選字符集中挑選字符生成聲紋密碼文本。由于生成聲紋密碼文本的各字符具有較好的說話人區(qū)分性能，因此有效地提高了聲紋密碼認證的效果。
[0106] 進一步地，在從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本時，為了避免出現(xiàn)一些字符組合的發(fā)音很難完全切分開的問題，在本發(fā)明方法另一實施例中，還可以根據(jù)語言學(xué)發(fā)音原理確定一些聲紋密碼文本字符排列規(guī)則，比如：
[0107] 1)相同字符不能相鄰；
[0108] 2)零聲母字符不能相鄰。
[0109] 相應(yīng)地，在將挑選出的字符組合成生成聲紋密碼文本時，就需要依照上述規(guī)則進行組合，比如，在挑選相應(yīng)的字符后，還要檢查將該字符加入到聲紋密碼文本字符序列中后，相鄰字符的排列方式是否符合上述規(guī)則，如果不符合，可以放棄該字符重新挑選或調(diào)整該字符的位置，直到聲紋密碼文本字符序列達到設(shè)定的長度。這樣可以避免因為快速連讀而出現(xiàn)字符不能完全切分的情況，同時也避免了沒有聲母的字符連讀時不易切分開的情況。
[0110] 同樣，在采用劃分概率區(qū)間的方式時，如果一個概率區(qū)間對應(yīng)多個字符，在選擇字符時，字符間的排列也要符合上述排列規(guī)則。
[0111] 需要說明的是，利用本發(fā)明實施例聲紋密碼文本生成方法生成的密碼文本，可以單獨應(yīng)用于用戶注冊階段或用戶認證階段，也可以同時應(yīng)用于用戶注冊階段和用戶認證階段，對此本發(fā)明實施例不做限定。
[0112] 相應(yīng)地，本發(fā)明實施例還提供一種聲紋密碼文本生成系統(tǒng)，如圖2所示，是該系統(tǒng) 的一種結(jié)構(gòu)示意圖。
[0113] 在該實施例中，所述系統(tǒng)包括：
[0114] 區(qū)分性能確定模塊201，用于確定各聲紋密碼文本字符的說話人區(qū)分性能；
[0115] 候選字符集生成模塊202,用于選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集；
[0116] 字符挑選模塊203,用于從所述聲紋密碼文本候選字符集挑選字符；
[0117] 密碼文本生成模塊204,用于將挑選的字符生成聲紋密碼文本。
[0118] 上述區(qū)分性能確定模塊201具體可以采用數(shù)據(jù)驅(qū)動的方法計算每個聲紋密碼文本字符針對不同說話人的區(qū)分性能，該模塊的一種具體結(jié)構(gòu)包括以下各單元：
[0119] 語音數(shù)據(jù)獲取單元，用于收集各聲紋密碼文本字符的語音數(shù)據(jù)；
[0120] 訓(xùn)練單元，用于利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型；
[0121] 認證確定單元，用于將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證，并根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能。
[0122] 在實際應(yīng)用中，所述說話人區(qū)分性能可以采用不同的指標來表示，比如：等錯誤率、識別正確率、檢測代價等，當然還可以采用這些指標的任意組合來計算所述字符的說話人區(qū)分性能。
[0123] 相應(yīng)地，上述認證確定單元在根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能時可以基于上述不同指標來確定，具體可參照前面本發(fā)明方法實施例中的描述，在此不再贅述。
[0124] 上述候選字符集生成模塊202需要挑選出區(qū)分性較好的字符作為聲紋密碼文本的候選字符，構(gòu)建聲紋密碼文本候選字符集。同樣，對于不同的指標，所述的要求也是不同的，需要根據(jù)具體的指標做適應(yīng)性調(diào)整。
[0125] 在實際應(yīng)用中，上述字符挑選模塊203可以采用多種方式從所述聲紋密碼文本候選字符集挑選字符。
[0126] 比如，字符挑選模塊203可以隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù) 的字符。
[0127] 再比如，在圖3所示的本發(fā)明實施例聲紋密碼文本生成系統(tǒng)的另一種結(jié)構(gòu)中，所述系統(tǒng)還包括：
[0128] 計算模塊301，用于計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率；
[0129] 區(qū)間劃分模塊302,用于劃分概率區(qū)間。
[0130] 相應(yīng)地，在該實施例中，字符挑選模塊203可以根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。比如，字符挑選模塊203的一種具體結(jié)構(gòu)可以包括以下各單元：
[0131] 對應(yīng)關(guān)系建立單元，用于建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng)關(guān)系；
[0132] 隨機數(shù)生成單元，用于生成隨機數(shù)；
[0133] 選擇單元，用于挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。
[0134] 當然，字符挑選模塊203還可以采用其它具體方式根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符，比如依照概率區(qū)間由高到低的順序，依次隨機在相應(yīng) 區(qū)間中挑選字符等等，對此本發(fā)明實施例不做限定。
[0135] 本發(fā)明實施例提供的聲紋密碼文本生成系統(tǒng)，選擇說話人區(qū)分性能較好的字符作為候選字符構(gòu)建聲紋密碼文本候選字符集，從候選字符集中挑選字符生成聲紋密碼文本。由于生成聲紋密碼文本的各字符具有較好的說話人區(qū)分性能，因此有效地提高了聲紋密碼認證的效果。
[0136] 進一步地，為了避免在生成的聲紋密碼文本中出現(xiàn)一些字符組合的發(fā)音很難完全切分開的問題，在本發(fā)明系統(tǒng)另一實施例中，還可以包括：排列規(guī)則確定模塊（未圖示），用于確定聲紋密碼文本字符排列規(guī)則。具體地，可以根據(jù)語言學(xué)發(fā)音原理確定如下一些聲紋密碼文本字符排列規(guī)則：
[0137] 1)相同字符不能相鄰；
[0138] 2)零聲母字符不能相鄰。
[0139] 相應(yīng)地，密碼文本生成模塊204需要依照所述排列規(guī)則將挑選的字符生成聲紋密碼文本。具體地，檢查在將挑選的字符加入到聲紋密碼文本字符序列中后，相鄰字符的排列方式是否符合上述排列規(guī)則，如果不符合，可以放棄該字符重新挑選或調(diào)整該字符的位置，直到聲紋密碼文本字符序列達到設(shè)定的長度。這樣可以避免因為快速連讀而出現(xiàn)字符不能完全切分的情況，同時也避免了沒有聲母的字符連讀時不易切分開的情況。
[0140] 本說明書中的各個實施例均采用遞進的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對于系統(tǒng)實施例而言，由于其基本相似于方法實施例，所以描述得比較簡單，相關(guān)之處參見方法實施例的部分說明即可。以上所描述的系統(tǒng)實施例僅僅是示意性的，其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個地方，或者也可以分布到多個網(wǎng)絡(luò)單元上?？梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下，即可以理解并實施。
[0141] 以上對本發(fā)明實施例進行了詳細介紹，本文中應(yīng)用了【具體實施方式】對本發(fā)明進行了闡述，以上實施例的說明只是用于幫助理解本發(fā)明的方法及系統(tǒng)；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在【具體實施方式】及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【主權(quán)項】
1. 一種聲紋密碼文本生成方法，其特征在于，包括：確定各聲紋密碼文本字符的說話人區(qū)分性能；選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集；從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本。2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述確定各字符的說話人區(qū)分性能包括：收集各聲紋密碼文本字符的語音數(shù)據(jù)；利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型；將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證，并根據(jù)認證結(jié) 果確定所述字符的說話人區(qū)分性能。3. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述說話人區(qū)分性能指標包括以下任意一種或多種組合：等錯誤率、識別正確率、檢測代價。4. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述從所述聲紋密碼文本候選字符集挑選字符包括：隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符。5. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括：計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率；劃分概率區(qū)間；所述從所述聲紋密碼文本候選字符集挑選字符包括：根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。6. 根據(jù)權(quán)利要求5所述的方法，其特征在于，所述根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符包括：建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng)關(guān)系；生成隨機數(shù)；挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。7. 根據(jù)權(quán)利要求1至6任一項所述的方法，其特征在于，所述方法還包括：確定聲紋密碼文本字符排列規(guī)則；所述從所述聲紋密碼文本候選字符集挑選字符生成聲紋密碼文本包括：從所述聲紋密碼文本候選字符集挑選字符，并依照所述排列規(guī)則將挑選的字符生成聲紋密碼文本。8. 根據(jù)權(quán)利要求7所述的方法，其特征在于，所述聲紋密碼文本字符排列規(guī)則包括：相同字符不能相鄰；零聲母字符不能相鄰。9. 一種聲紋密碼文本生成系統(tǒng)，其特征在于，包括：區(qū)分性能確定模塊，用于確定各聲紋密碼文本字符的說話人區(qū)分性能；候選字符集生成模塊，用于選擇說話人區(qū)分性能滿足要求的字符構(gòu)建聲紋密碼文本候選字符集；字符挑選模塊，用于從所述聲紋密碼文本候選字符集挑選字符；密碼文本生成模塊，用于將挑選的字符生成聲紋密碼文本。10. 根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述區(qū)分性能確定模塊包括：語音數(shù)據(jù)獲取單元，用于收集各聲紋密碼文本字符的語音數(shù)據(jù)；訓(xùn)練單元，用于利用所述語音數(shù)據(jù)訓(xùn)練所述字符的聲紋模型；認證確定單元，用于將所述字符作為聲紋密碼文本進行目標說話人和冒認說話人聲紋認證，并根據(jù)認證結(jié)果確定所述字符的說話人區(qū)分性能。11. 根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述字符挑選模塊，具體用于隨機從所述聲紋密碼文本候選字符集挑選設(shè)定個數(shù)的字符。12. 根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述系統(tǒng)還包括：計算模塊，用于計算所述聲紋密碼文本候選字符集中每個字符被選中為聲紋密碼文本的概率；區(qū)間劃分模塊，用于劃分概率區(qū)間；所述字符挑選模塊，具體用于根據(jù)劃分的概率區(qū)間從所述聲紋密碼文本候選字符集中挑選字符。13. 根據(jù)權(quán)利要求12所述的系統(tǒng)，其特征在于，所述字符挑選模塊包括：對應(yīng)關(guān)系建立單元，用于建立概率區(qū)間與所述聲紋密碼文本候選字符集中字符的對應(yīng) 關(guān)系；隨機數(shù)生成單元，用于生成隨機數(shù)；選擇單元，用于挑選所述隨機數(shù)所屬的概率區(qū)間對應(yīng)的字符或字符組合。14. 根據(jù)權(quán)利要求9至13任一項所述的系統(tǒng)，其特征在于，所述系統(tǒng)還包括：排列規(guī)則確定模塊，用于確定聲紋密碼文本字符排列規(guī)則；所述密碼文本生成模塊，具體用于依照所述排列規(guī)則將挑選的字符生成聲紋密碼文本。
【文檔編號】G10L17/00GK105991288SQ201510100196
【公開日】2016年10月5日
【申請日】2015年3月6日
【發(fā)明人】方昕, 劉俊華, 魏思, 胡國平, 王影, 胡郁, 劉慶峰
【申請人】科大訊飛股份有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：方昕;劉俊華;魏思;胡國平;王影;胡郁;劉慶峰;
技術(shù)所有人：科大訊飛股份有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

聲紋識別系統(tǒng)相關(guān)技術(shù)

社保聲紋認證系統(tǒng)相關(guān)技術(shù)

聲紋密碼相關(guān)技術(shù)

qq客服在線生成系統(tǒng)相關(guān)技術(shù)

條碼生成系統(tǒng)相關(guān)技術(shù)

試卷生成系統(tǒng)相關(guān)技術(shù)

種子生成系統(tǒng)by雞米花相關(guān)技術(shù)

種子生成系統(tǒng)txt相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

聲紋密碼文本生成方法及系統(tǒng)的制作方法