一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系,具體地說一種符合管理行業(yè)長(zhǎng)遠(yuǎn)發(fā)展需求的IT技術(shù)手段。
【背景技術(shù)】
[0002]發(fā)明人研究表明,科學(xué)技術(shù)的發(fā)展與機(jī)器的進(jìn)化是同步進(jìn)行的,機(jī)器是科技被應(yīng)用到現(xiàn)實(shí)生活中的產(chǎn)物,展望未來,隨著計(jì)算機(jī)影響力擴(kuò)大,人與計(jì)算機(jī)的工作關(guān)系越來越密切,在不同的行業(yè)背景下,人機(jī)關(guān)系體現(xiàn)出不同的工作內(nèi)容。
[0003]在某些場(chǎng)景中,人員需要與某種能夠被監(jiān)測(cè)到的設(shè)備實(shí)時(shí)結(jié)合在一起,并且不能人機(jī)分離,目前部分場(chǎng)景示例如下:
[0004]?司法局需要監(jiān)測(cè)社區(qū)校正狀態(tài)的服刑人員在限定范圍內(nèi)活動(dòng);
[0005]?企業(yè)需要根據(jù)員工地位位置實(shí)時(shí)調(diào)度員工,如快遞公司調(diào)度快遞收派人員,開鎖公司調(diào)度開鎖人員,貨運(yùn)公司調(diào)度貨運(yùn)卡車,石油公司監(jiān)控在野外巡視油井的石油工人,甚至邊防部隊(duì)監(jiān)控在邊境線上巡視的邊防軍人;
[0006]在這些情況下,組織(司法局、企業(yè)、邊防部隊(duì))需要手段防止人機(jī)分離的發(fā)生。語音識(shí)別中的說話人識(shí)別技術(shù),因?yàn)槟軌蛴行У乇O(jiān)控到人機(jī)分離的現(xiàn)象,可以在預(yù)防人機(jī)分離方面起到重要作用。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的任務(wù)是,提供一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系,所述具體內(nèi)容是,說話人識(shí)別是根據(jù)語音波形中反映說話人生理和行為的特征的語音參數(shù),自動(dòng)識(shí)別說話人身份的技術(shù),是語音識(shí)別技術(shù)的一個(gè)分支。主要的原理是人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過程,人在講話時(shí)使用的發(fā)聲器官一舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個(gè)人的差異很大,所以任何兩個(gè)人的聲紋圖譜都有差異。每個(gè)人的語音聲學(xué)特征既有相對(duì)穩(wěn)定性,又有變異性,不是絕對(duì)的、一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。盡管如此,由于每個(gè)人的發(fā)音器官都不盡相同,因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。
[0008]目前說話人識(shí)別技術(shù)有兩種應(yīng)用類型,一種是說話人隨意說,一種是說話人在某些選定的發(fā)音中進(jìn)行組合(如念阿拉伯?dāng)?shù)字),顯然后面一種類型識(shí)別準(zhǔn)確性將大幅提升,因?yàn)檎f話人識(shí)別軟件可以提前將說話對(duì)象的這些基礎(chǔ)發(fā)音(如對(duì)10個(gè)基本阿拉伯?dāng)?shù)字)提前錄入,本實(shí)現(xiàn)方法采用阿拉伯?dāng)?shù)字組合,以提高識(shí)別準(zhǔn)確率。
【具體實(shí)施方式】
[0009]監(jiān)控人機(jī)分離采用如下的步驟:
[0010]1、基礎(chǔ)設(shè)施:
[0011]建設(shè)一個(gè)云計(jì)算網(wǎng)站,該網(wǎng)站能夠接收說話人的語音文件,進(jìn)行聲紋分析,識(shí)別出說話人;
[0012]被監(jiān)控者需要持有智能手機(jī)(蘋果手機(jī),或基于Android的智能機(jī)),該手機(jī)上提前安裝有一個(gè)APP應(yīng)用程序;
[0013]智能手機(jī)使用3G或者4G通訊網(wǎng)絡(luò),既能夠通話,也能夠?qū)崿F(xiàn)數(shù)據(jù)通訊。監(jiān)控者通過通訊網(wǎng)絡(luò)能夠?qū)崿F(xiàn)對(duì)智能手機(jī)的實(shí)時(shí)GIS定位;
[0014]2、向被監(jiān)控人的應(yīng)用程序發(fā)送一個(gè)隨機(jī)數(shù)字(同時(shí)提醒被監(jiān)控人進(jìn)行處理),請(qǐng)被監(jiān)控人在三分鐘內(nèi)讀出這個(gè)隨機(jī)數(shù)字,應(yīng)用程序錄下這段錄音,傳輸給網(wǎng)站。
[0015]如果被監(jiān)控人在一段時(shí)間內(nèi)(如三分鐘內(nèi))不能完成朗讀和傳輸,這段隨機(jī)數(shù)字作廢,本次監(jiān)控沒有通過,此時(shí)還可以有一個(gè)補(bǔ)救措施,在十分鐘內(nèi),被監(jiān)控人實(shí)時(shí)請(qǐng)網(wǎng)站再發(fā)送一個(gè)新隨機(jī)數(shù)字,完成朗讀和傳輸,如果被監(jiān)控人補(bǔ)救措施也沒有完成,則本次監(jiān)控沒有通過。
[0016]3、網(wǎng)站接收語音文件,進(jìn)行比對(duì):
[0017]比對(duì)是否為被監(jiān)控人的發(fā)音,從而判斷是否是被監(jiān)控人本人;
[0018]對(duì)比從語音文件翻譯出來的文字是否與隨機(jī)數(shù)字相符,避免是被監(jiān)控人的提前錄好的錄音,而非實(shí)時(shí)讀出來的;
[0019]上述兩個(gè)比對(duì)內(nèi)容均通過,才認(rèn)為比對(duì)成功(監(jiān)控通過),否則認(rèn)為比對(duì)失敗(監(jiān)控沒有通過);
[0020]4、網(wǎng)站在監(jiān)控時(shí)間段內(nèi),發(fā)起一定次數(shù)的監(jiān)控,如果監(jiān)控沒有通過超過一定比例,則進(jìn)行報(bào)警,提醒管理人員介入。例如司法局每天抽查社區(qū)校正人員3次,如果失敗率超過50%,則非常值得關(guān)注,需要進(jìn)一步介入。
[0021]說明:
[0022]1、上述步驟二設(shè)計(jì)了一個(gè)補(bǔ)救措施,充分考慮了任何人都有可能疏忽,錯(cuò)過電話的可能;
[0023]2、上述過程全程自動(dòng)化:網(wǎng)站自動(dòng)發(fā)隨機(jī)數(shù),自動(dòng)接收語音文件,自動(dòng)比對(duì),自動(dòng)進(jìn)行GIS定位,自動(dòng)統(tǒng)計(jì),自動(dòng)報(bào)警;
[0024]3、上述監(jiān)控方法中,被監(jiān)控人在一種情況下可以實(shí)現(xiàn)人機(jī)分離:被監(jiān)控人A將手機(jī)交給B,自己離開;B接到網(wǎng)站的隨機(jī)數(shù)檢測(cè)后,三分鐘內(nèi)撥通A的另外一部電話,請(qǐng)A在電話中對(duì)這部智能手機(jī)讀出隨機(jī)數(shù)。此時(shí)A能夠?qū)崿F(xiàn)人機(jī)分離,但是需要B實(shí)時(shí)配合,從經(jīng)濟(jì)學(xué)的角度來說,成本很高,A人機(jī)分離所得到的收益,大多數(shù)情況下,未必高過請(qǐng)B來實(shí)時(shí)配合所花的成本(無論是金錢或者感情)。所以這種情況下的人機(jī)分離在實(shí)際項(xiàng)目中可以認(rèn)為不影響整個(gè)監(jiān)控項(xiàng)目的運(yùn)轉(zhuǎn)。
【主權(quán)項(xiàng)】
1.一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系,其特征在于,所述一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系的構(gòu)成條件:是建設(shè)一個(gè)云計(jì)算網(wǎng)站,該網(wǎng)站能夠接收說話人的語音文件,進(jìn)行聲紋分析,識(shí)別出說話人;被監(jiān)控者需要持有智能手機(jī)(蘋果手機(jī),或基于Android的智能機(jī)),該手機(jī)上提前安裝有一個(gè)APP應(yīng)用程序。
2.根據(jù)權(quán)利要求所述的一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系,其特征在于,所述的云計(jì)算網(wǎng)站向被監(jiān)控人的應(yīng)用程序發(fā)送一個(gè)隨機(jī)數(shù)字(同時(shí)提醒被監(jiān)控人進(jìn)行處理),請(qǐng)被監(jiān)控人在三分鐘內(nèi)讀出這個(gè)隨機(jī)數(shù)字,應(yīng)用程序錄下這段錄音,傳輸給網(wǎng)站。如果被監(jiān)控人在一段時(shí)間內(nèi)(如三分鐘內(nèi))不能完成朗讀和傳輸,這段隨機(jī)數(shù)字作廢,本次監(jiān)控沒有通過,此時(shí)還可以有一個(gè)補(bǔ)救措施,在十分鐘內(nèi),被監(jiān)控人實(shí)時(shí)請(qǐng)網(wǎng)站再發(fā)送一個(gè)新隨機(jī)數(shù)字,完成朗讀和傳輸,如果被監(jiān)控人補(bǔ)救措施也沒有完成,則本次監(jiān)控沒有通過。網(wǎng)站接收語音文件,進(jìn)行比對(duì):比對(duì)是否為被監(jiān)控人的發(fā)音,從而判斷是否是被監(jiān)控人本人;對(duì)比從語音文件翻譯出來的文字是否與隨機(jī)數(shù)字相符,避免是被監(jiān)控人的提前錄好的錄音,而非實(shí)時(shí)讀出來的;上述兩個(gè)比對(duì)內(nèi)容均通過,才認(rèn)為比對(duì)成功(監(jiān)控通過),否則認(rèn)為比對(duì)失敗(監(jiān)控沒有通過);網(wǎng)站在監(jiān)控時(shí)間段內(nèi),發(fā)起一定次數(shù)的監(jiān)控,如果監(jiān)控沒有通過超過一定比例,則進(jìn)行報(bào)警,提醒管理人員介入。例如司法局每天抽查社區(qū)校正人員3次,如果失敗率超過50%,則非常值得關(guān)注,需要進(jìn)一步介入。
3.根據(jù)權(quán)利要求所述的一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系,其特征在于,所述的智能手機(jī)使用3G或者4G通訊網(wǎng)絡(luò),既能夠通話,也能夠?qū)崿F(xiàn)數(shù)據(jù)通訊。監(jiān)控者通過通訊網(wǎng)絡(luò)能夠?qū)崿F(xiàn)對(duì)智能手機(jī)的實(shí)時(shí)GIS定位。
【專利摘要】本發(fā)明涉及一種用說話人識(shí)別技術(shù)監(jiān)控人機(jī)分離體系。本發(fā)明設(shè)計(jì)了一種機(jī)制,能夠有效地防止人機(jī)分離,最后達(dá)到了通過對(duì)機(jī)器設(shè)備的監(jiān)控實(shí)現(xiàn)對(duì)人的監(jiān)控。本發(fā)明用到了如下技術(shù):云計(jì)算、特定語聲紋識(shí)別、智能手機(jī)(蘋果或者Android)、移動(dòng)互聯(lián)技術(shù)(3G或者4G),蒙特卡洛隨機(jī)數(shù)生成器,統(tǒng)計(jì)學(xué)。本發(fā)明設(shè)計(jì)了一整套流程,將上述技術(shù)做了有機(jī)整合,實(shí)現(xiàn)了對(duì)人機(jī)分離情況的發(fā)現(xiàn)和預(yù)警。
【IPC分類】G10L17-00, G10L17-24
【公開號(hào)】CN104795070
【申請(qǐng)?zhí)枴緾N201410028154
【發(fā)明人】張潮澤, 范華云
【申請(qǐng)人】中安特保(北京)國(guó)際貿(mào)易有限公司
【公開日】2015年7月22日
【申請(qǐng)日】2014年1月21日