該第二提示信號之間具有時間差,則該語音信息中用戶發(fā)音的時間和標(biāo)簽信息的時間之間也具有時間差。
[0387]截取單元1807,用于依據(jù)預(yù)設(shè)的截取時間范圍,獲取每個標(biāo)簽在所述時間軸中對應(yīng)的語音信息片段。
[0388]其中,截取單元1807根據(jù)該時間軸中的各個標(biāo)簽,對該語音信息進行截取,得到多個語音信息片段。
[0389]其中,該預(yù)設(shè)的截取時間范圍,根據(jù)實際情況而定,包括:提示信號的類型和/或用戶的語速等。
[0390]其中,當(dāng)該標(biāo)簽信息為根據(jù)第一提示信號生成的時,可設(shè)置一截取時間范圍。如該截取時間范圍可以為:將該標(biāo)簽信息為中心,長度為2秒的時間范圍,S卩,根據(jù)該時間軸中任一標(biāo)簽信息對應(yīng)的時間為中心,長度為2秒的時間范圍對應(yīng)的語音信息進行截取,得到多個語音信息片段。
[0391]其中,當(dāng)該標(biāo)簽信息為根據(jù)第二提示信號生成的時,由于該標(biāo)簽信息的時間和語首/[目息米集的時間有一定的時間差,則在截取該標(biāo)簽彳目息對應(yīng)的語首?目息片段時,所以,在根據(jù)標(biāo)簽信息對語音信息進行截取時,設(shè)置的截取時間范圍應(yīng)該與該標(biāo)簽信息的時間參數(shù)具有一定的偏移。如,該截取的時間范圍可以為:以該標(biāo)簽信息的時間參數(shù)后0.5秒為起始點,長度為2秒的時間范圍,即,根據(jù)該時間軸中任一標(biāo)簽信息對應(yīng)的時間后0.5秒為起始點,長度為2秒的時間范圍對應(yīng)的語音信息進行截取,得到多個語音信息片段。
[0392]需要說明的是,該偏移的時間長度,可根據(jù)用戶的反應(yīng)時間進行設(shè)置,默認(rèn)值可為0.5秒,但不限定于該值。
[0393]需要說明的是,該截取的時間范圍的長度,本實施例中設(shè)置為2秒,但不限定于此,實際實施中,該截取的時間范圍的長度可根據(jù)用戶的語速等條件進行設(shè)置。
[0394]需要說明的是,當(dāng)截取過程中,兩個相鄰標(biāo)簽信息對應(yīng)的時間范圍出現(xiàn)重疊情況時,可將重疊部分分別截取到兩個語音信息片段中,使得兩個語音信息片段中均含有該重疊部分。
[0395]與上述本申請?zhí)峁┑囊环N語音信息處理裝置實施例相應(yīng)的,本申請還提供了一種電子設(shè)備,該電子設(shè)備包括:語音采集單元上述實施例1提供的一種語音信息處理裝置,該裝置包括:第一獲取模塊、第二獲取模塊、分段模塊和識別模塊,該語音信息處理裝置各個組成模塊的功能與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0396]優(yōu)選的,上述第二獲取模塊包括:標(biāo)簽單元和時間參數(shù)單元,該語音處理裝置中各個組成模塊、單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0397]優(yōu)選的,上述時間參數(shù)單元包括:接收子單元和第一記錄子單元,該語音處理裝置中各個組成模塊、單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0398]優(yōu)選的,該電子設(shè)備中還設(shè)置有傳感器,該接收子單元包括:第一獲取子單元和第一判斷子單元,該語音處理裝置中各個組成模塊、單元、子單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0399]優(yōu)選的,該接收子單元包括第一檢測子單元,該語音處理裝置中各個組成模塊、單元、子單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0400]優(yōu)選的,該電子設(shè)備中還設(shè)置有觸摸屏,該接收子單元包括第二檢測子單元,該語音處理裝置中各個組成模塊、單元、子單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0401]優(yōu)選的,當(dāng)所述觸摸屏中設(shè)置點擊事件區(qū)域,所述接收子單元還包括:第二獲取子單元和第二判斷子單元,該語音處理裝置中各個組成模塊、單元、子單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0402]優(yōu)選的,該電子設(shè)備還設(shè)置有計時器,該時間參數(shù)單元包括第三獲取子單元和第二記錄子單元,該語音處理裝置中各個組成模塊、單元、子單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0403]優(yōu)選的,該分段模塊包括時間軸單元、添加標(biāo)簽單元和截取單元,,該語音處理裝置中各個組成模塊、單元與上述的一種語音信息處理裝置實施例中相應(yīng)結(jié)構(gòu)的功能一致,本實施例中不再贅述。
[0404]以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。
【主權(quán)項】
1.一種語音信息處理方法,其特征在于,所述方法應(yīng)用于一電子設(shè)備,所述電子設(shè)備包括語音采集單元,所述方法包括: 獲取所述語音采集單元采集的語音信息以及所述語音信息的時間參數(shù); 獲取針對所述時間參數(shù)的標(biāo)簽信息組,所述標(biāo)簽信息組中包含至少一個標(biāo)簽信息,所述標(biāo)簽信息組與所述語音信息的時間參數(shù)中的至少一個時間點相對應(yīng); 依據(jù)所述標(biāo)簽信息組中每個標(biāo)簽信息的時間參數(shù)和所述語音信息的時間參數(shù)對所述語音信息進行分段截取,得到與所述標(biāo)簽信息個數(shù)相同的語音信息片段; 分別對所述語音信息片段進行識別,得到與所述語音信息片段對應(yīng)的發(fā)音。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取針對所述時間參數(shù)的標(biāo)簽信息組包括: 根據(jù)提示信息得到標(biāo)簽信息組; 根據(jù)提示信息的生成時間得到所述標(biāo)簽信息組中每個標(biāo)簽的時間參數(shù),所述提示信息用于提示用戶發(fā)音。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)提示信息的生成時間得到所述標(biāo)簽信息組中每個標(biāo)簽的時間參數(shù)包括: 接收第一提示信號,所述第一提示信號表征用戶發(fā)出語音時在所述電子設(shè)備預(yù)設(shè)區(qū)域的操作動作; 將所述第一提示信號的生成時間作為所述標(biāo)簽信息的時間進行記錄,得到所述標(biāo)簽信息的時間參數(shù)。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述電子設(shè)備還設(shè)置有傳感器,接收第一提示信號包括: 獲取傳感器的檢測數(shù)據(jù),所述檢測數(shù)據(jù)為所述操作動作在所述電子設(shè)備外殼預(yù)設(shè)區(qū)域敲擊產(chǎn)生的壓力值; 將所述壓力值與預(yù)設(shè)的壓力閾值比較; 當(dāng)所述壓力值大于所述壓力閾值時,所述敲擊動作滿足預(yù)設(shè)的操作動作條件,記錄所述敲擊事件,所述敲擊事件包括敲擊動作和敲擊時間; 否則,所述敲擊動作不滿足預(yù)設(shè)的操作動作條件,不記錄。5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述接收第一提示信號包括: 檢測所述電子設(shè)備中預(yù)設(shè)按鍵被按下時的電信號; 當(dāng)檢測到所述電信號時,記錄本次按鍵事件,所述按鍵事件包括按鍵動作和按鍵時間。6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述電子設(shè)備包括觸摸屏,所述接收第一提示信號包括: 檢測用戶點擊所述觸摸屏產(chǎn)生的電信號; 當(dāng)檢測到所述電信號時,記錄所述點擊事件,所述點擊事件包括點擊動作和點擊時間。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,當(dāng)所述觸摸屏中設(shè)置點擊事件區(qū)域,所述當(dāng)檢測到所述電信號之后,記錄所述點擊事件之前,還包括: 獲取所述點擊在所述觸摸屏的坐標(biāo)值; 依據(jù)所述坐標(biāo)值判斷所述點擊位置是否在所述點擊事件區(qū)域內(nèi); 如果所述點擊位置在所述點擊事件區(qū)域內(nèi)時,執(zhí)行所述記錄所述點擊事件步驟。8.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述電子設(shè)備還設(shè)置有計時器,所述根據(jù)提示信息的生成時間得到所述標(biāo)簽信息組中每個標(biāo)簽的時間參數(shù)包括: 獲取預(yù)設(shè)的第二提示信號的生成時間,所述第二提示信號為所述計時器的計時時間值滿足預(yù)設(shè)值時生成; 將所述第二提示信號的生成時間作為所述標(biāo)簽信息的時間進行記錄,得到所述標(biāo)簽信息的時間參數(shù)。9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述標(biāo)簽信息組中每個標(biāo)簽信息的時間參數(shù)和所述語音信息的時間參數(shù)對所述語音信息進行分段截取,得到與所述標(biāo)簽信息個數(shù)相同的語音信息片段包括: 依據(jù)所述語音信息的時間參數(shù),建立所述語音信息的時間軸; 依據(jù)所述標(biāo)簽信息的時間參數(shù)組中每個標(biāo)簽信息的時間參數(shù),將所述標(biāo)簽信息添加到所述時間軸; 依據(jù)預(yù)設(shè)的截取時間范圍,獲取每個標(biāo)簽在所述時間軸中對應(yīng)的語音信息片段。10.一種語音信息處理裝置,應(yīng)用于一電子設(shè)備,其特征在于,所述裝置包括: 第一獲取模塊,用于獲取所述語音采集單元采集的語音信息以及所述語音信息的時間參數(shù); 第二獲取模塊,用于獲取針對所述時間參數(shù)的標(biāo)簽信息組,所述標(biāo)簽信息組中包含至少一個標(biāo)簽信息,所述標(biāo)簽信息組與所述語音信息的時間參數(shù)中的至少一個時間點相對應(yīng); 分段模塊,用于依據(jù)所述標(biāo)簽信息組中每個標(biāo)簽信息的時間參數(shù)和所述語音信息的時間參數(shù)對所述語音信息進行分段截取,得到與所述標(biāo)簽信息個數(shù)相同的語音信息片段; 識別模塊,用于分別對所述語音信息片段進行識別,得到與所述語音信息片段對應(yīng)的及曰。11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述第二獲取模塊包括: 標(biāo)簽單元,用于根據(jù)提示信息得到標(biāo)簽信息組; 時間參數(shù)單元,用于根據(jù)提示信息的生成時間得到所述標(biāo)簽信息組中每個標(biāo)簽的時間參數(shù),所述提示信息用于提示用戶發(fā)音。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述時間參數(shù)單元包括: 接收子單元,用于接收第一提示信號,所述第一提示信號表征用戶發(fā)出語音時在所述電子設(shè)備預(yù)設(shè)區(qū)域的操作動作; 第一記錄子單元,用于將所述第一提示信號的生成時間作為所述標(biāo)簽信息的時間進行記錄,得到所述標(biāo)簽信息的時間參數(shù)。13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述電子設(shè)備還設(shè)置有傳感器,所述接收子單元包括: 第一獲取子單元,用于獲取傳感器的檢測數(shù)據(jù),所述檢測數(shù)據(jù)為所述操作動作在所述電子設(shè)備外殼預(yù)設(shè)區(qū)域敲擊產(chǎn)生的壓力值; 第一判斷子單元,用于將所述壓力值與預(yù)設(shè)的壓力閾值比較;當(dāng)所述壓力值大于所述壓力閾值時,所述敲擊動作滿足預(yù)設(shè)的操作動作條件,觸發(fā)第一記錄子單元記錄所述敲擊事件,所述敲擊事件包括敲擊動作和敲擊時間;否則,所述敲擊動作不滿足預(yù)設(shè)的操作動作條件,不記錄。14.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述接收子單元號包括: 第一檢測子單元,用于檢測所述電子設(shè)備中預(yù)設(shè)按鍵被按下時的電信號;當(dāng)檢測到所述電信號時,觸發(fā)第一記錄子單元記錄本次按鍵事件,所述按鍵事件包括按鍵動作和按鍵時間。15.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述電子設(shè)備包括觸摸屏,所述接收子單元包括: 第二檢測子單元,用于檢測用戶點擊所述觸摸屏產(chǎn)生的電信號;當(dāng)檢測到所述電信號時,觸發(fā)第一記錄子單兀記錄所述點擊事件,所述點擊事件包括點擊動作和點擊時間。16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,當(dāng)所述觸摸屏中設(shè)置點擊事件區(qū)域,所述接收子單元還包括: 第二獲取子單元,用于獲取所述點擊在所述觸摸屏的坐標(biāo)值; 第二判斷子單元,用于依據(jù)所述坐標(biāo)值判斷所述點擊位置是否在所述點擊事件區(qū)域內(nèi);如果所述點擊位置在所述點擊事件區(qū)域內(nèi)時,觸發(fā)第一記錄子單元。17.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述電子設(shè)備還設(shè)置有計時器,所述時間參數(shù)單元包括: 第三獲取子單元,用于獲取預(yù)設(shè)的第二提示信號的生成時間,所述第二提示信號為所述計時器的計時時間值滿足預(yù)設(shè)值時生成; 第二記錄子單元,用于將所述第二提示信號的生成時間作為所述標(biāo)簽信息的時間進行記錄,得到所述標(biāo)簽信息的時間參數(shù)。18.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述分段模塊包括: 時間軸單元,用于依據(jù)所述語音信息的時間參數(shù),建立所述語音信息的時間軸; 添加標(biāo)簽單元,用于依據(jù)所述標(biāo)簽信息的時間參數(shù)組中每個標(biāo)簽信息的時間參數(shù),將所述標(biāo)簽信息添加到所述時間軸; 截取單元,用于依據(jù)預(yù)設(shè)的截取時間范圍,獲取每個標(biāo)簽在所述時間軸中對應(yīng)的語音 息片段。19.一種電子設(shè)備,其特征在于,包括:語音采集單元和如權(quán)利要求10-18任一項所述的語音信息處理裝置。
【專利摘要】本發(fā)明提供的一種語音信息處理方法,應(yīng)用于一電子設(shè)備,該電子設(shè)備中設(shè)置有語音采集單元,獲取語音采集單元采集的語音信息及其時間參數(shù);獲取針對該時間參數(shù)的多個標(biāo)簽信息,標(biāo)簽信息與語音信息的時間參數(shù)中的至少一個時間點相對應(yīng);依據(jù)標(biāo)簽信息組中每個標(biāo)簽信息的時間參數(shù)和所述語音信息的時間參數(shù)對語音信息進行分段截取,得到與標(biāo)簽信息個數(shù)相同的語音信息片段并識別,得到與語音信息片段對應(yīng)的發(fā)音。由于每個語音信息片段對應(yīng)一個發(fā)音,實現(xiàn)對用戶的語音中每個發(fā)音添加一個標(biāo)簽,每個發(fā)音對應(yīng)一個字,識別過程實現(xiàn)了一字一識別,即使用戶出現(xiàn)連音的情況,不會因為發(fā)音無間隔導(dǎo)致錯誤識別,采用本方法,語音識別的準(zhǔn)確度高,提高用戶體驗。
【IPC分類】G06F17/30
【公開號】CN104933048
【申請?zhí)枴緾N201410098994
【發(fā)明人】彭剛
【申請人】聯(lián)想(北京)有限公司
【公開日】2015年9月23日
【申請日】2014年3月17日