一種面向智能機(jī)器人的音頻處理方法和裝置的制造方法

文檔序號(hào)：9930291閱讀：578來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>信息存儲(chǔ)應(yīng)用技術(shù)

一種面向智能機(jī)器人的音頻處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音識(shí)別及處理技術(shù)領(lǐng)域，具體地說(shuō)，涉及一種面向智能機(jī)器人的音頻處理方法和裝置。
【背景技術(shù)】
[0002]智能機(jī)器人是一個(gè)多種高新技術(shù)的集合體，它融合了機(jī)械、電子、傳感器、計(jì)算機(jī)硬件、軟件、人工智能等許多學(xué)科的知識(shí)，涉及到當(dāng)今許多前沿領(lǐng)域的技術(shù)。
[0003]在智能機(jī)器人在與用戶交互過(guò)程中，通常先預(yù)設(shè)一個(gè)固定時(shí)間，在錄音時(shí)，檢測(cè)用戶不說(shuō)話的時(shí)間是否達(dá)到了這個(gè)預(yù)設(shè)的固定時(shí)間。如果達(dá)到了該預(yù)設(shè)的固定時(shí)間，則停止錄音。
[0004]但是，以上通過(guò)預(yù)設(shè)固定時(shí)間停止錄音的方式，會(huì)出現(xiàn)錄音結(jié)束時(shí)機(jī)不準(zhǔn)確的問(wèn)題，進(jìn)而影響智能機(jī)器人答案輸出時(shí)機(jī)，降低應(yīng)答時(shí)間準(zhǔn)確性及用戶體驗(yàn)。

【發(fā)明內(nèi)容】

[0005]為解決以上問(wèn)題，本發(fā)明提供了一種面向智能機(jī)器人的音頻處理方法和裝置，用以優(yōu)化機(jī)器人答案輸出時(shí)機(jī)，提高應(yīng)答準(zhǔn)確性。
[0006]根據(jù)本發(fā)明的一個(gè)方面，提供了一種面向智能機(jī)器人的音頻處理方法，包括:
[0007]音頻信息采集步驟，采集用戶輸入的音頻信息；
[0008]音頻信息處理步驟，對(duì)所述音頻信息進(jìn)行預(yù)處理，得到錄音時(shí)間數(shù)據(jù)，所述錄音時(shí)間數(shù)據(jù)包括平均單字時(shí)間t3和最大單字時(shí)間t4;
[0009]自然語(yǔ)言理解步驟，解析所述音頻信息中的文字，得到自然語(yǔ)言理解結(jié)果；
[0010]錄音時(shí)間判斷步驟，對(duì)所述平均單字時(shí)間t3、所述最大單字時(shí)間t4、零音量持續(xù)時(shí)間t5和自然語(yǔ)言理解結(jié)果進(jìn)行判斷，當(dāng)判斷結(jié)果符合結(jié)束錄音條件時(shí)，生成結(jié)束錄音指示。
[0011]根據(jù)本發(fā)明的一個(gè)實(shí)施例，錄音時(shí)間判斷步驟包括:
[0012]比對(duì)零音量持續(xù)時(shí)間t5與預(yù)設(shè)音頻結(jié)束時(shí)間t0，當(dāng)t5>t0時(shí)，結(jié)束錄音；
[0013]比對(duì)零音量持續(xù)時(shí)間t5與所述平均單字時(shí)間t3，當(dāng)t5>t3且所述自然語(yǔ)言理解結(jié)果指不錄首結(jié)束時(shí)，結(jié)束錄首；
[0014]比對(duì)零音量持續(xù)時(shí)間t5與所述最大單字時(shí)間t4，當(dāng)t5>t4時(shí)結(jié)束錄音，以及，調(diào)整tO值趨近于所述最大單字時(shí)間t4。
[0015]根據(jù)本發(fā)明的一個(gè)實(shí)施例，得到所述最大單字時(shí)間t4，包括:
[0016]在單次錄音中，根據(jù)有音量持續(xù)時(shí)間tl和語(yǔ)音識(shí)別得到的文字個(gè)數(shù)，計(jì)算單次錄音中的單字時(shí)間t2;
[0017]根據(jù)連續(xù)η次錄音中所有單次錄音的單字時(shí)間t2，獲取所述最大單字時(shí)間t4。
[0018]根據(jù)本發(fā)明的一個(gè)實(shí)施例，得到所述平均單字時(shí)間t3，包括:
[0019]在單次錄音中，根據(jù)有音量持續(xù)時(shí)間tl和語(yǔ)音識(shí)別得到的文字個(gè)數(shù)，計(jì)算單次錄音中的單字時(shí)間t2;
[0020]根據(jù)連續(xù)η次錄音中所有單次錄音的單字時(shí)間t2，獲取所述平均單字時(shí)間t3。
[0021]根據(jù)本發(fā)明的一個(gè)實(shí)施例，所述單字時(shí)間t2通過(guò)下式計(jì)算得到:
[0022]t2 = tl/a 或t2 = (tl/a+tl/ (a_l ))/2
[0023]其中，a為有音量持續(xù)時(shí)間tl內(nèi)識(shí)別出來(lái)的文字個(gè)數(shù)。
[0024]根據(jù)本發(fā)明的另一個(gè)方面，還提供了一種面向智能機(jī)器人的音頻處理裝置，包括:
[0025]音頻信息采集模塊，采集用戶輸入的音頻信息；
[0026]音頻信息處理模塊，對(duì)所述音頻信息進(jìn)行預(yù)處理，得到錄音時(shí)間數(shù)據(jù)，所述錄音時(shí)間數(shù)據(jù)包括平均單字時(shí)間t3和最大單字時(shí)間t4;
[0027]自然語(yǔ)言理解模塊，解析所述音頻信息中的文字，得到自然語(yǔ)言理解結(jié)果。
[0028]錄音時(shí)間判斷模塊，對(duì)所述平均單字時(shí)間t3、所述最大單字時(shí)間t4、零音量持續(xù)時(shí)間t5和自然語(yǔ)言理解結(jié)果進(jìn)行判斷，當(dāng)判斷結(jié)果符合結(jié)束錄音條件時(shí)，生成結(jié)束錄音指示。
[0029]根據(jù)本發(fā)明的一個(gè)實(shí)施例，所述錄音時(shí)間判斷模塊用于:
[0030]比對(duì)零音量持續(xù)時(shí)間t5與預(yù)設(shè)音頻結(jié)束時(shí)間t0，當(dāng)t5>t0時(shí)，結(jié)束錄音；
[0031]比對(duì)零音量持續(xù)時(shí)間t5與所述平均單字時(shí)間t3，當(dāng)t5>t3且所述自然語(yǔ)言理解結(jié)果指不錄首結(jié)束時(shí)，結(jié)束錄首；
[0032]比對(duì)零音量持續(xù)時(shí)間t5與所述最大單字時(shí)間t4，當(dāng)t5>t4時(shí)結(jié)束錄音，以及，調(diào)整tO值趨近于所述最大單字時(shí)間t4。
[0033]根據(jù)本發(fā)明的一個(gè)實(shí)施例，所述音頻信息處理模塊包括:
[0034]第一單字時(shí)間計(jì)算單元，在單次錄音中，根據(jù)有音量持續(xù)時(shí)間tl和語(yǔ)音識(shí)別得到的文字個(gè)數(shù)，計(jì)算單次錄音中的單字時(shí)間t2;
[0035]最大單字時(shí)間計(jì)算單元，根據(jù)連續(xù)η次錄音中所有單次錄音的單字時(shí)間t2，獲取所述最大單字時(shí)間t4。
[0036]根據(jù)本發(fā)明的一個(gè)實(shí)施例，所述音頻信息處理模塊包括:
[0037]第二單字時(shí)間計(jì)算單元，在單次錄音中，根據(jù)有音量持續(xù)時(shí)間tl和語(yǔ)音識(shí)別得到的文字個(gè)數(shù)，計(jì)算單次錄音中的單字時(shí)間t2;
[0038]平均單字時(shí)間計(jì)算單元，根據(jù)連續(xù)η次錄音中所有單次錄音的單字時(shí)間t2，獲取所述平均單字時(shí)間t3。
[0039]根據(jù)本發(fā)明的又一個(gè)方面.還提供了一種面向智能機(jī)器人的音頻處理裝置，包括:
[0040]音頻信息采集電路，采集用戶輸入的音頻信息；
[0041]處理器，對(duì)所述音頻信息進(jìn)行預(yù)處理，得到錄音時(shí)間數(shù)據(jù)，所述錄音時(shí)間數(shù)據(jù)包括平均單字時(shí)間t3和最大單字時(shí)間t4，
[0042]解析所述音頻信息中的文字，得到自然語(yǔ)言理解結(jié)果，
[0043]對(duì)所述平均單字時(shí)間t3、所述最大單字時(shí)間t4、零音量持續(xù)時(shí)間t5和自然語(yǔ)言理解結(jié)果進(jìn)行判斷，當(dāng)判斷結(jié)果符合結(jié)束錄音條件時(shí)，生成結(jié)束錄音指示，
[0044]其中，所述處理器對(duì)所述平均單字時(shí)間t3、所述最大單字時(shí)間t4、零音量持續(xù)時(shí)間t5和自然語(yǔ)言理解結(jié)果進(jìn)行判斷，包括:
[0045]比對(duì)零音量持續(xù)時(shí)間t5與預(yù)設(shè)音頻結(jié)束時(shí)間t0，當(dāng)t5>t0時(shí)，結(jié)束錄音；
[0046]比對(duì)零音量持續(xù)時(shí)間t5與所述平均單字時(shí)間t3，當(dāng)t5>t3且所述自然語(yǔ)言理解結(jié)果指不錄首結(jié)束時(shí)，結(jié)束錄首；
[0047]比對(duì)零音量持續(xù)時(shí)間t5與所述最大單字時(shí)間t4，當(dāng)t5>t4時(shí)結(jié)束錄音，以及，調(diào)整tO值趨近于所述最大單字時(shí)間t4。
[0048]本發(fā)明的有益效果:
[0049]本發(fā)明提供的一種面向智能機(jī)器人的音頻處理方法和裝置，通過(guò)判斷多個(gè)表征語(yǔ)速的參量，通過(guò)對(duì)參量的判斷，對(duì)錄音停止時(shí)機(jī)進(jìn)行精確控制，并根據(jù)不同用戶說(shuō)話語(yǔ)速及詞句間隔針對(duì)個(gè)體用戶進(jìn)行語(yǔ)速學(xué)習(xí)，從而優(yōu)化機(jī)器人答案輸出時(shí)機(jī)，提高應(yīng)答準(zhǔn)確性。
[0050]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述，并且，部分地從說(shuō)明書(shū)中變得顯而易見(jiàn)，或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在說(shuō)明書(shū)、權(quán)利要求書(shū)以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
【附圖說(shuō)明】
[0051]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要的附圖做簡(jiǎn)單的介紹:
[0052]圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的方法流程圖；
[0053]圖2是根據(jù)本發(fā)明的一個(gè)實(shí)施例的平均單字時(shí)間t3確定步驟流程圖；
[0054]圖3是根據(jù)本發(fā)明的一個(gè)實(shí)施例的最大單字時(shí)間t4確定步驟流程圖；
[0055]圖4是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種面向智能機(jī)器人的音頻處理裝置結(jié)構(gòu)示意圖；
[0056]圖5是根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信息處理模塊中確定最大單字時(shí)間的結(jié)構(gòu)示意圖；
[0057]圖6是根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信息處理模塊中確定平均單字時(shí)間的結(jié)構(gòu)不意圖；以及
[0058]圖7是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種面向智能機(jī)器人的音頻處理裝置中音頻信息處理模塊結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0059]以下將結(jié)合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式，借此對(duì)本發(fā)明如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題，并達(dá)成技術(shù)效果的實(shí)現(xiàn)過(guò)程能充分理解并據(jù)以實(shí)施。需要說(shuō)明的是，只要不構(gòu)成沖突，本發(fā)明中的各個(gè)實(shí)施例以及各實(shí)施例中的各個(gè)特征可以相互結(jié)合，所形成的技術(shù)方案均在本發(fā)明的保護(hù)范圍之內(nèi)。
[0060]如圖1所示為根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種面向智能機(jī)器人的音頻處理方法流程圖，以下參考圖1來(lái)對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。
[0061]首先，步驟S110，音頻信息采集步驟，即采集用戶輸入的音頻信息。具體的，在該步驟中，在用戶說(shuō)話時(shí)，智能機(jī)器人開(kāi)始采集接收用戶的語(yǔ)音信息。
[0062]接下來(lái)是步驟S120，音頻信息處理步驟，即對(duì)接收的音頻信息進(jìn)行預(yù)處理，得到錄音時(shí)間數(shù)據(jù)。該錄音時(shí)間數(shù)據(jù)包括平均單字時(shí)間t3和最大單字時(shí)

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：郭家;
技術(shù)所有人：北京光年無(wú)限科技有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
2、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
3、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
4、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
5、張老師：1.機(jī)械設(shè)計(jì)的應(yīng)力分析、強(qiáng)度校核的計(jì)算機(jī)仿真 2.生物反應(yīng)器研制 3.生物力學(xué)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

重新裝載音頻裝置相關(guān)技術(shù)

音頻紅外通信裝置設(shè)計(jì)相關(guān)技術(shù)

不停重新裝載音頻裝置相關(guān)技術(shù)

紅外音頻通信裝置相關(guān)技術(shù)

音頻處理器相關(guān)技術(shù)

音頻處理軟件相關(guān)技術(shù)

音頻處理相關(guān)技術(shù)

數(shù)字音頻處理器相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種面向智能機(jī)器人的音頻處理方法和裝置的制造方法