一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng),其特征是:由主控模塊和分別與主控模塊相連的存儲模塊、外圍控制模塊、語音采集模塊、音頻輸出模塊、無線模塊、處理模塊組成。本系統(tǒng)采用嵌入式技術,攜帶方便,節(jié)能高效,可以幫助盲人用戶識別對方說話人,發(fā)現(xiàn)周圍的已知聯(lián)系人,添加新的好友。方便了盲人用戶的生活,增加了生活的樂趣。
【專利說明】一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng)
【技術領域】
[0001]本發(fā)明涉及盲人應用設備,具體是一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng)。
【背景技術】
[0002]聲紋識別,生物識別技術的一種,又稱為說話人識別。相比于其他的生物識別技術,聲紋識別有以下優(yōu)點:聲紋特征獲取方便,不需要刻意完成,使用者的接受度較高;獲取設備的成本較低,一般只需要麥克風即可,不易損壞,維護方便;適合遠程登錄,僅需麥克風即可通過網(wǎng)絡進行遠程識別;算法復雜度低,設備負擔??;通過語意加聲紋,可以達到很高的安全性。
[0003]近距離無線通信技術近些年取得了飛速的發(fā)展,各種協(xié)議在生活中承擔了不同的作用,比如ZigBee技術,功耗低,成本低,時延短,網(wǎng)絡容量大,可靠安全。適合數(shù)據(jù)量不大的情況下的近距離無線通信。
[0004]盲人朋友因為失去了視覺信息的采集途徑,很大程度上要依靠聽覺來彌補,相對于其他感官,聽覺記憶數(shù)據(jù)量小,需要依靠多次訓練才能形成穩(wěn)定的記憶?,F(xiàn)有的面向盲人的應用設備,多集中于單一的探測障礙物,幾乎沒有涉及為盲人提供說話人識別能力這一方向,忽視了這一重要的應用場景;同時在結合無線技術應用方面也很欠缺,不能起到很好的互動效果。
【發(fā)明內容】
[0005]本發(fā)明的目的在于提供一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng),用于幫助盲人用戶強化聽覺記憶的可靠性,方便快捷的輔助他們識別說話人,發(fā)現(xiàn)周圍的友人。
[0006]實現(xiàn)本發(fā)明目的的技術方案是:
一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng),由主控模塊和分別與主控模塊相連的存儲模塊、外圍控制模塊、語音采集模塊、音頻輸出模塊、無線模塊、處理模塊組成。其中:語音采集模塊由麥克風陣列組成,負責語音信號的采集,并送處理單元處理;
主控模塊負責整個系統(tǒng)的時序控制,包括控制語音采集,語音處理,無線收發(fā),外圍控制處理,語音輸出等,跟各單元相連,可由高性能單片機承擔;
處理模塊負責進行語音信號的數(shù)字處理,包括模數(shù)和數(shù)模轉換,預處理,特征提取,模式匹配等,可由高性能DSP芯片承擔;
存儲模塊負責存儲用戶的聲紋信息庫以及名稱等相關信息;
外圍控制模塊由鍵盤輸入各種控制信號到主控模塊,比如確認,取消等;
無線模塊用來收發(fā)信息,送給處理模塊進行處理;
音頻輸出模塊由主控單元控制,負責輸出相應的提示信息給用戶。
[0007]本發(fā)明一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng)的工作步驟是:
盲人用戶利用系統(tǒng)的麥克風采集說話人的語音信息,進行預處理,提取特征參數(shù),進行匹配; 若匹配成功,則告知盲人用戶,該說話人的名稱以及簡略備注;若匹配不成功,則告知盲人用戶,選擇是否將該聯(lián)系人加入通信錄;
開啟無線發(fā)現(xiàn)模式時,接收到對方的聲紋信息進行匹配,若匹配成功,則通知用戶,該聯(lián)系人就在附近;若匹配不成功,則可選是否添加該網(wǎng)絡聯(lián)系人到通信錄。
[0008]本發(fā)明的優(yōu)點是:本發(fā)明為盲人用戶提供了一種有效的聽覺記憶增強方案,在方便便捷的前提下,可以幫助盲人用戶在接觸到新的聯(lián)系人時,可以方便的將其加入自己的通信錄,在第二次接觸該聯(lián)系人時,可以幫助他方便的識別出該聯(lián)系人,增強聽覺記憶的可靠性;同時,本設計提供了麥克風陣列語音增強和語音分離功能,抗噪性較好,并可以區(qū)分多個說話人,提高了在復雜環(huán)境下的識別能力,為盲人生活帶來方便;進一步的,本方案提供了無線模塊,可以幫助盲人用戶在未知的前提下發(fā)現(xiàn)周圍近距離的持有同設備的聯(lián)系人,還可以發(fā)現(xiàn)陌生設備持有人,可選擇加為好友關系,增加了盲人用戶生活的樂趣。
【專利附圖】
【附圖說明】
[0009]圖1是系統(tǒng)組成框圖;
圖2是系統(tǒng)功能框圖。
【具體實施方式】
[0010]為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。下面結合附圖進一步說明本發(fā)明的技術解決方案。
[0011]如圖1所示,一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng),由主控模塊和分別與主控模塊相連的存儲模塊、外圍控制模塊、語音采集模塊、音頻輸出模塊、無線模塊、處理模塊組成。其中:
語音采集單元:采用麥克風陣列,采集語音信息,可以有效的進行語音增強與語音分離,將采集的信息傳輸給主控單元。
[0012]主控單元:可由高性能單片機承擔,與各個單元連接,負責系統(tǒng)的控制與各部分的調度合作,實現(xiàn)系統(tǒng)的各項功能,如采集語音信息,進行語音信息數(shù)字處理,存儲信息,接受外部控制信號,無線收發(fā)信息,輸出音頻提示信息等。
[0013]處理單元:可由高效數(shù)字信號處理器承擔,接受主控單元傳來的控制信號和數(shù)據(jù)信息,進行算法執(zhí)行,處理數(shù)據(jù),并將結果回傳給主控單元。
[0014]存儲單元:可由若干種存儲介質構成,如用EEROM存儲系統(tǒng)配置信息,用Flash存儲數(shù)據(jù)信息。與主控單元相連。
[0015]外圍控制單元:由若干按鍵組成,向主控單元輸入用戶控制信息,完成相關操作。
[0016]無線單元:由無線收發(fā)器構成,如ZigBee模塊等,與相同設備建立無線連接,傳輸數(shù)據(jù),并與主控單元相連,輸入或輸出數(shù)據(jù)。
[0017]音頻輸出單元:將主控單元送來的信息通過揚聲器輸出,給用戶提供相應的語音提不音Ο
[0018]如圖2所示,本系統(tǒng)實現(xiàn)的具體功能步驟如下:
用戶開啟設備,進入采集聲紋信息,利用麥克風陣列進行語音增強和語音分離。
[0019]分別提取相應的聲紋特性,利用多個參數(shù)提高識別的準確率。
[0020]采用相關算法將聲紋特征與模板庫進行匹配,利用多層算法,由簡到繁,由廣到細,提高識別精度的同時減少識別的時間。
[0021]若匹配成功,則系統(tǒng)輸出音頻提示用戶該說話人的名字以及備注;
若匹配不成功,則系統(tǒng)詢問用戶是否將該說人加入本地通信錄,用戶通過按鍵輸入是還是否。
[0022]若用戶輸入是,則進一步采集該說話人一定的聲紋信息,訓練成模板,存入本地存儲。并尋求用戶命名該說話人,此時,用戶可在提示下,讀出該名稱,采用錄音給該說話人命名。
[0023]當用戶開啟無線發(fā)現(xiàn)模式時,通過無線模塊和其他設備建立連接。
[0024]用戶可選擇是否發(fā)送自己的聲紋信息給對方,或者是否接受對方的聲紋信息。
[0025]若選擇接受,會將收到的聲紋信息和本地聲紋庫進行比對。
[0026]若匹配成功,則告知用戶該聯(lián)系人在附近,并會詢問是否通知對方,在獲得許可后,會發(fā)送一個通知信息給對方;
若匹配不成功,則詢問用戶是否添加該聯(lián)系人到本地,若用戶確認,則發(fā)出附帶備注的請求,對方若確認,則對方會發(fā)送進一步的聲紋信息以便在本地建立模板入庫,同時本機也會發(fā)送進一步的聲紋信息以便在對方本地建立模板入庫。建立好友關系。
[0027]上述過程被拒絕將會終止識別過程。本機發(fā)送的情況等同于上面實例中的對方用戶,不再贅述。
【權利要求】
1.一種面向盲人的嵌入式聲紋識別與發(fā)現(xiàn)系統(tǒng),其特征是:由主控模塊和分別與主控模塊相連的存儲模塊、外圍控制模塊、語音采集模塊、音頻輸出模塊、無線模塊、處理模塊組成。
2.根據(jù)權利要求1所述的系統(tǒng),其特征是:所述語音采集模塊由麥克風陣列組成,負責語音信號的采集,并送處理單元處理。
3.根據(jù)權利要求1所述的系統(tǒng),其特征是:主控模塊負責整個系統(tǒng)的時序控制,包括控制語音采集,語音處理,無線收發(fā),外圍控制處理,語音輸出,跟各單元相連,由高性能單片機承擔。
4.根據(jù)權利要求1所述的系統(tǒng),其特征是:處理模塊負責進行語音信號的數(shù)字處理,包括模數(shù)和數(shù)模轉換,預處理,特征提取,模式匹配,由高性能DSP芯片承擔。
5.根據(jù)權利要求1所述的系統(tǒng),其特征是:無線模塊用來收發(fā)信息,采用自組網(wǎng)方便的低功耗近距離無線技術,送給處理模塊進行處理。
6.根據(jù)權利要求5所述的系統(tǒng),其特征是:所述低功耗近距離無線技術為藍牙或ZigBee0
7.根據(jù)權利要求1所述的系統(tǒng),其特征是:操作步驟如下: A.盲人用戶利用系統(tǒng)的麥克風采集說話人的語音信息,提取特征參數(shù); B.將采集的特征參數(shù)利用高效算法與系統(tǒng)存儲的模型庫進行匹配; C.利用無線模塊發(fā)射和接收聲紋信息,與本地模型庫進行匹配。
8.根據(jù)權利要求1所述的系統(tǒng),其特征是:系統(tǒng)的匹配過程是: 將采集的到聲紋信息與本地存儲的模板庫進行匹配,若匹配成功,則告知盲人用戶,該說話人的名稱以及簡略備注; 若匹配不成功,則告知盲人用戶,是否建立新的聯(lián)系人,若用戶回答為是,則將該聲紋信息按系統(tǒng)的算法訓練成模板,存儲到本地聲紋庫中,此時可能需要進一步采集該說話人的語音信息,以完成訓練的要求。
9.根據(jù)權利要求1所述的系統(tǒng),其特征是:本系統(tǒng)的無線發(fā)現(xiàn)過程是: 開啟模式時,利用短距離無線技術建立距離范圍內用戶間的連接,用戶可選擇是否與連接用戶發(fā)送自己的信息,包括自己的聲紋信息和名稱,同時可以選擇是否接受對方的識別?目息; 當接收到對方的聲紋信息后,將該信息和本地的聲紋庫進行匹配,若匹配成功,則通知用戶,該聯(lián)系人就在附近,并詢問是否通知對方; 若匹配不成功,則詢問是否添加該網(wǎng)絡聯(lián)系人到本地,若同意添加,則向該用戶發(fā)出請求,對方如果同意添加,則進一步發(fā)送足以訓練出模板的聲紋信息給本機,同時本機也發(fā)送相應的信息給對方,雙方同時更新模板庫,建立好友關系。
【文檔編號】A61H3/06GK104490570SQ201410844914
【公開日】2015年4月8日 申請日期:2014年12月31日 優(yōu)先權日:2014年12月31日
【發(fā)明者】趙峰, 于洋, 陳宏濱, 余凱, 劉軍輝 申請人:桂林電子科技大學