基于人工智能的聲紋認證方法以及裝置的制造方法
【技術(shù)領域】
[0001] 本發(fā)明設及登錄認證技術(shù)領域,尤其設及一種基于人工智能(Adif icial Intelligence,簡稱為AI)的聲紋認證方法W及裝置。
【背景技術(shù)】
[0002] 目前的網(wǎng)站(或設備)登錄系統(tǒng)主要是通過用戶輸入賬戶和密碼(或手勢動作)進 行身份驗證,驗證通過之后進行登錄。然而,基于密碼及手勢輸入的登錄方式,一旦密碼或 手勢被他人得知,同樣可W完成登錄操作,導致存在安全隱患,并且,為了增加安全性,用戶 通常需要為不同的對象設置不同的且?guī)в刑厥庾址拿艽a,但運無疑給用戶帶來較大的記 憶負擔。
[0003] 因此,如何在保證登錄密碼正確的情況下確保登錄用戶是用戶本人的同時,又能 簡化用戶登錄操作已經(jīng)成為亟待解決的問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問題之一。
[0005] 為此,本發(fā)明的第一個目的在于提出一種基于人工智能的聲紋認證方法。該方法 在注冊的過程中,通過先獲取該用戶的性別標簽,之后根據(jù)該性別標簽使用不同的模型W 生成對應的注冊聲紋模型,使得在登錄時提高了聲紋密碼作為認證手段的可用性,提高了 聲紋匹配的性能,并使得用戶通過語音即可完成注冊,簡化了用戶的操作步驟。
[0006] 本發(fā)明的第二個目的在于提出一種基于人工智能的聲紋認證裝置。
[0007] 為達上述目的,本發(fā)明第一方面實施例的基于人工智能的聲紋認證方法,包括:接 收用戶的注冊請求,并將注冊字符串提供至所述用戶;接收所述用戶閱讀所述注冊字符串 的語音信息,并根據(jù)所述語音信息生成N段語音,其中,N為正整數(shù);根據(jù)性別分類模型和所 述N段語音確定所述用戶的性別標簽;W及根據(jù)所述性別標簽和所述N段語音生成所述用戶 的注冊聲紋模型。
[000引本發(fā)明實施例的基于人工智能的聲紋認證方法,可先接收用戶的注冊請求,并將 注冊字符串提供至用戶,之后,可接收用戶閱讀注冊字符串的語音信息,并根據(jù)語音信息生 成N段語音,然后,根據(jù)性別分類模型和N段語音確定用戶的性別標簽,最后,根據(jù)性別標簽 和N段語音生成用戶的注冊聲紋模型。實現(xiàn)了用戶可W通過語音即可完成注冊,簡化了用戶 的操作步驟,并且,在注冊的過程中,通過先獲取該用戶的性別標簽,之后根據(jù)該性別標簽 使用不同的模型W生成對應的注冊聲紋模型,使得在登錄時提高了聲紋密碼作為認證手段 的可用性,提高了聲紋匹配的性能。
[0009]為達上述目的,本發(fā)明第二方面實施例的基于人工智能的聲紋認證裝置,包括:第 一接收模塊,用于接收用戶的注冊請求;第一提供模塊,用于將注冊字符串提供至所述用 戶;第二接收模塊,用于接收所述用戶閱讀所述注冊字符串的語音信息;第一生成模塊,用 于根據(jù)所述語音信息生成N段語音,其中,N為正整數(shù);確定模塊,用于根據(jù)性別分類模型和 所述N段語音確定所述用戶的性別標簽;W及第二生成模塊,用于根據(jù)所述性別標簽和所述 N段語音生成所述用戶的注冊聲紋模型。
[0010] 本發(fā)明實施例的基于人工智能的聲紋認證裝置,通過第一接收模塊接收用戶的注 冊請求,第一提供模塊將注冊字符串提供至用戶,第二接收模塊接收用戶閱讀注冊字符串 的語音信息,第一生成模塊根據(jù)語音信息生成N段語音,確定模塊根據(jù)性別分類模型和N段 語音確定用戶的性別標簽,第二生成模塊根據(jù)性別標簽和N段語音生成用戶的注冊聲紋模 型。實現(xiàn)了用戶可W通過語音即可完成注冊,簡化了用戶的操作步驟,并且,在注冊的過程 中,通過先獲取該用戶的性別標簽,之后根據(jù)該性別標簽使用不同的模型W生成對應的注 冊聲紋模型,使得在登錄時提高了聲紋密碼作為認證手段的可用性,提高了聲紋匹配的性 能。
[0011] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0012] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得 明顯和容易理解,其中,
[0013] 圖1是根據(jù)本發(fā)明一個實施例的基于人工智能的聲紋認證方法的流程圖;
[0014] 圖2是根據(jù)本發(fā)明一個具體實施例的基于人工智能的聲紋認證方法的流程圖;
[0015] 圖3是根據(jù)本發(fā)明一個實施例的基于人工智能的聲紋認證裝置的結(jié)構(gòu)框圖;
[0016] 圖4是根據(jù)本發(fā)明一個實施例的第二生成模塊的結(jié)構(gòu)框圖;
[0017] 圖5是根據(jù)本發(fā)明另一個實施例的基于人工智能的聲紋認證裝置的結(jié)構(gòu)框圖;W 及
[0018] 圖6是根據(jù)本發(fā)明一個實施例的驗證模塊的結(jié)構(gòu)框圖。
【具體實施方式】
[0019] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0020] 下面參考附圖描述根據(jù)本發(fā)明實施例的基于人工智能的聲紋認證方法W及裝置。
[0021] 圖1是根據(jù)本發(fā)明一個實施例的基于人工智能的聲紋認證方法的流程圖。如圖1所 示,該基于人工智能的聲紋認證方法可W包括:
[0022] S101,接收用戶的注冊請求,并將注冊字符串提供至用戶。
[0023] 舉例而言,假設本發(fā)明實施例的基于人工智能的聲紋認證方法應用于網(wǎng)站登錄系 統(tǒng)中,當用戶打開網(wǎng)站準備注冊時,用戶可通過客戶端向登錄系統(tǒng)發(fā)送注冊請求,登錄系統(tǒng) 在接收到用戶通過客戶端發(fā)送的注冊請求之后,可隨機生成一個注冊字符串,并將該注冊 字符串提供給用戶。
[0024] 可W理解,該注冊字符串的形式可W有很多種:
[0025] 作為一種示例,該注冊字符串可為隨機生成的數(shù)字串。此外,為了能夠覆蓋更大的 樣本空間,注冊字符串中的數(shù)字只出現(xiàn)一次。
[0026] 作為另一種示例,該注冊字符串可為隨機生成的漢字字符串。
[0027] S102,接收用戶閱讀注冊字符串的語音信息,并根據(jù)語音信息生成N段語音,其中, N為正整數(shù)。
[0028] 具體地,在將該注冊字符串提供給用戶之后,用戶可按照提供的注冊字符串進行 朗讀W進行注冊。在用戶閱讀該注冊字符串的過程中,或者在用戶完成閱讀該注冊字符串 時,可接收用戶按照提供的注冊字符串進行朗讀而生成的語音信息,并對該語音信息進行 分段,W得到N段語音。
[0029] S103,根據(jù)性別分類模型和N段語音確定用戶的性別標簽。
[0030] 具體而言,在本發(fā)明的實施例中,可根據(jù)性別分類模型對該N段語音中的第一段語 音進行性別分類,得到該用戶的性別標簽。
[0031] 例如,假設本發(fā)明實施例的基于人工智能的聲紋認證方法應用于網(wǎng)站登錄系統(tǒng) 中,該登錄系統(tǒng)中具有語音識別模塊和性別分類模型,可通過性別分類模型對該N段語音中 的第一段語音進行性別分類,得到該用戶的性別標簽,其中,該性別標簽包括男性或女性。
[0032] 舉例而言,W性別分類模型為高斯混合模型為例,可先對該N段語音中的第一段語 音提取基頻特征W及梅爾頻率倒譜系數(shù)MFCC特征,之后,可基于高斯混合模型對基頻特征 W及MFCC特征進行后驗概率值計算,根據(jù)計算結(jié)果確定該用戶的性別,例如,假設該高斯混 合模型為男性高斯混合模型,則當計算結(jié)果為后驗概率值很高,如大于一定闊值時,可確定 該用戶的性別為男性,當計算結(jié)果為后驗概率值很小,如小于一定闊值時,可確定該用戶的 性別為女性。
[0033] S104,根據(jù)性別標簽和N段語音生成用戶的注冊聲紋模型。
[0034] 具體而言,在本發(fā)明的實施例中,可根據(jù)性別標簽確定對應的目標普通背景模型 UBM,之后,可將N段語音的聲紋特征在目標普通背景模型UBM條件下進行Baum-Welch統(tǒng)計, 并提取N段語音的N個ivector,最后,根據(jù)N段語音的N個ivector生成用戶的注冊聲紋模型。
[0035] 更具體地,可根據(jù)性別標簽確定與該性別標簽對應的目標普通背景模型UBM,之 后,可將每段語音的聲學特征(例如MFCC)在該目標普通背景模型UBM條件下進行Baum- Welch統(tǒng)計