一種號碼發(fā)現(xiàn)方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及聲紋識別技術(shù)領(lǐng)域,具體涉及一種號碼發(fā)現(xiàn)方法及系統(tǒng)。
【背景技術(shù)】
[0002] 聲紋識別即根據(jù)用戶輸入語音信號中所反映的說話人生理特征和行為特征的聲 紋信息,自動識別認證說話人身份的技術(shù)。相比于其他生物認證(如人臉、虹膜等),聲紋認 證具有更簡便、經(jīng)濟及良好擴展性等眾多優(yōu)勢,可廣泛應(yīng)用于安全驗證、控制等各方面,如 刑偵中的目標人號碼發(fā)現(xiàn)。
[0003] 基于通話信息的目標人號碼發(fā)現(xiàn)的應(yīng)用的核心在于聲紋識別,即通過候選測試號 碼的使用人的聲紋與目標人的聲紋的相似度對比,從候選測試號碼中找到目標人使用的號 碼。在聲紋識別過程中,通過目標人聲紋和測試人聲紋做比較,判斷說話人語音的相似性。 在相似度計算過程中,由于諸如目標人語音數(shù)據(jù)不足、信道、環(huán)境噪聲等多方面的影響,從 而導(dǎo)致同一說話人的聲紋特征一致性不高或不同說話人的聲紋特征不一致性不大等情況 的出現(xiàn)。因而現(xiàn)有技術(shù)中,常對相似度得分進行得分規(guī)整,以減小同一說話人的不一致性, 擴大不同說詁人的不一睡·件"現(xiàn)有的得分挪整的常用i+笪公式如式(1)所示:
[0004]
[0005] 其中,L〇(X)是語句X對于說話人模型λ的得分,Ζ;(Λ')是規(guī)整后的得分、μ〇是對于說 話人模型λ的規(guī)整參數(shù),δ〇是非目標人的聲紋模型的均值和方差均值,需要用大量數(shù)據(jù)進行 估計。
[0006] 現(xiàn)有的得分規(guī)整在一定程度上減小了同一說話人的不一致性,擴大了不同說話人 的不一致性。但隨著非目標人數(shù)據(jù)達到一定量時,其效果的提升就趨于穩(wěn)定,無法再進一步 地提升聲紋識別的準確性。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明實施例提供一種號碼發(fā)現(xiàn)方法及系統(tǒng),解決現(xiàn)有技術(shù)中當(dāng)非目標人數(shù)據(jù)達 到一定量時,對相似度得分進行規(guī)整卻無法提升聲紋識別的準確性的問題。
[0008] 為此,本發(fā)明實施例提供如下技術(shù)方案:
[0009] -種號碼發(fā)現(xiàn)方法,包括:
[0010] 預(yù)先根據(jù)收集的目標人的語音數(shù)據(jù)構(gòu)建目標人聲紋模型;
[0011] 獲取目標人的已知使用號碼和候選測試號碼以及各號碼的通話信息;
[0012] 提取所述候選測試號碼的使用人的聲紋特征;
[0013] 計算各候選測試號碼的使用人的聲紋特征與目標人聲紋模型的相似度得分;
[0014] 計算結(jié)束后,基于候選測試號碼的通話信息與目標人的已知使用號碼的通話信息 和/或外界導(dǎo)入的目標人相關(guān)信息的關(guān)聯(lián)度對所述相似度得分進行規(guī)整;
[0015] 根據(jù)規(guī)整后的相似度得分確定目標人使用的號碼。
[0016] 優(yōu)選地,所述候選測試號碼按照預(yù)設(shè)條件選取;所述預(yù)設(shè)條件包括以下任意一個 或多個:號碼的地域信息、使用年限、使用頻率、某個時段的有效語音時長、是否擁有指定 和/或共同的聯(lián)系人。
[0017] 優(yōu)選地,所述基于候選測試號碼的通話信息與目標人的已知使用號碼的通話信息 和/或外界導(dǎo)入的目標人相關(guān)信息的關(guān)聯(lián)度對所述相似度得分進行規(guī)整,包括以下任意一 個或多個步驟:
[0018] 將各相似度得分乘以預(yù)設(shè)的函數(shù)以擴大候選測試號碼的使用人的聲紋特征與目 標人聲紋模型的相似度得分的區(qū)分性;
[0019] 根據(jù)候選測試號碼與目標人的已知使用號碼的通話情況對相似度得分進行規(guī)整;
[0020] 根據(jù)候選測試號碼與目標人的已知使用號碼的地域信息的關(guān)聯(lián)度對相似度得分 進行規(guī)整;
[0021 ]根據(jù)候選測試號碼與外界導(dǎo)入目標人相關(guān)信息的關(guān)聯(lián)度對相似度得分進行規(guī)整 包括以下任意一種或多種:目標人某一時間段所處的地域信息、某一時間段的聯(lián)系人通話 信息、與目標人相關(guān)的案件信息。
[0022]優(yōu)選地,所述預(yù)設(shè)的函數(shù)為分段函數(shù),相似度得分所處不同函數(shù)段對應(yīng)不同的系 數(shù)。
[0023]優(yōu)選地,所述方法還包括:
[0024]將相似度得分大于設(shè)定得分閾值的候選測試號碼作為優(yōu)選測試號碼;
[0025]所述基于候選測試號碼的通話信息與目標人的已知使用號碼的通話信息和/或外 界導(dǎo)入的目標人相關(guān)信息的關(guān)聯(lián)度對相似度得分進行規(guī)整包括:
[0026]基于優(yōu)選測試號碼的通話信息與目標人的已知使用號碼的通話信息和/或外界導(dǎo) 入的目標人相關(guān)信息的關(guān)聯(lián)度對相似度得分進行規(guī)整。
[0027]優(yōu)選地,所述聲紋模型包括以下任意一種:說話人因子向量模型、高斯混合模型、 隱馬爾可夫模型或動態(tài)時間規(guī)整模型。
[0028] 一種號碼發(fā)現(xiàn)系統(tǒng),包括:
[0029] 建模模塊,用于預(yù)先根據(jù)收集的目標人的語音數(shù)據(jù)構(gòu)建目標人聲紋模型;
[0030] 獲取模塊,用于獲取目標人的已知使用號碼和候選測試號碼以及各號碼的通話信 息;
[0031] 特征提取模塊,用于提取所述候選測試號碼的使用人的聲紋特征;
[0032] 相似度獲取模塊,用于計算各候選測試號碼的使用人的聲紋特征與目標人聲紋模 型的相似度得分;
[0033] 規(guī)整模塊,用于在計算結(jié)束后,基于候選測試號碼的通話信息與目標人的已知使 用號碼的通話信息和/或外界導(dǎo)入的目標人相關(guān)信息的關(guān)聯(lián)度對所述相似度得分進行規(guī) 整;
[0034] 查找模塊,用于根據(jù)規(guī)整后的相似度得分確定目標人使用的號碼。
[0035] 優(yōu)選地,所述規(guī)整模塊包括以下任意一個或多個單元:
[0036] 第一規(guī)整單元,用于將各相似度得分乘以預(yù)設(shè)的函數(shù)以擴大候選測試號碼的使用 人的聲紋特征與目標人聲紋模型的相似度得分的區(qū)分性;
[0037] 第二規(guī)整單元,用于根據(jù)候選測試號碼與目標人的已知使用號碼的通話情況對相 似度得分進行規(guī)整;
[0038] 第三規(guī)整單元,用于根據(jù)候選測試號碼與目標人的已知使用號碼的地域信息的關(guān) 聯(lián)度對相似度得分進行規(guī)整;
[0039] 第四規(guī)整單元,用于根據(jù)候選測試號碼與外界導(dǎo)入目標人相關(guān)信息的關(guān)聯(lián)度對相 似度得分進行規(guī)整包括以下任意一種或多種:目標人某一時間段所處的地域信息、某一時 間段的聯(lián)系人通話信息、與目標人相關(guān)的案件信息。
[0040] 優(yōu)選地,所述系統(tǒng)還包括:
[0041]優(yōu)選測試號碼獲取模塊,與所述相似度獲取模塊相連接,將相似度得分大于設(shè)定 得分閾值的候選測試號碼作為優(yōu)選測試號碼;
[0042]所述規(guī)整模塊具體用于基于優(yōu)選測試號碼的通話信息與目標人的已知使用號碼 的通話信息和/或外界導(dǎo)入的目標人相關(guān)信息的關(guān)聯(lián)度對相似度得分進行規(guī)整。
[0043] 優(yōu)選地,所述聲紋模型包括以下任意一種:說話人因子向量模型、高斯混合模型、 隱馬爾可夫模型或動態(tài)時間規(guī)整模型。
[0044] 本發(fā)明實施例提供的號碼發(fā)現(xiàn)方法及系統(tǒng),通過對收集的目標人的語音數(shù)據(jù)構(gòu)建 聲紋模型,然后從獲取的目標人已知使用號碼及候選測試號碼的相關(guān)信息中提取各號碼的 通話信息,并提取各候選測試號碼的使用人的聲紋特征,接著計算各候選測試號碼的使用 人的聲紋特征與目標人聲紋模型的相似度得分,然后根據(jù)候選測試號碼的通話信息與外界 導(dǎo)入的目標人相關(guān)信息和/或目標人的已知使用號碼的通話信息的關(guān)聯(lián)度對所述相似度得 分進行規(guī)整,最終根據(jù)規(guī)整的結(jié)果找到目標人使用的號碼。由于根據(jù)候選測試號碼的通話 信息與外界導(dǎo)入的目標人相關(guān)信息和/或目標人的已知使用號碼的通話信息對所述相似度 得分進行規(guī)整,使得對相似度得分的規(guī)整不僅僅依賴于非目標人的聲紋模型的均值和方差 均值,可以進一步地提升聲紋識別的準確性。
[0045] 進一步地,所述聲紋模型包括:說話人因子向量模型。由于采用說話人因子向量模 型,后續(xù)可以通過概率線性鑒別分析(Probabilistic linear discriminant analysis, PLDA)技術(shù)以去除信道的干擾信息,能夠消除信道干擾對判斷語音信號之間相似度的影響, 從而提升判斷語音信號類之間相似度的準確性。
【附圖說明】
[0046] 為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所 需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一 些實施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0047] 圖1是根據(jù)本發(fā)明實施例提供的一種號碼發(fā)現(xiàn)方法的流程圖;
[0048] 圖2是根據(jù)本發(fā)明實施例提供