亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種分析語言特征的方法及裝置的制造方法_4

文檔序號:8223558閱讀:來源:國知局
0:B將子音頻文件I采用ASR技術(shù)轉(zhuǎn)換為文本1,并根據(jù)室外這種場景類型采用NLP技術(shù)對文件I中與預(yù)設(shè)語音特征信息對應(yīng)的信息進行語義分析,得到第一分析值;
[0229]步驟250:B根據(jù)室外這種場景類型將第一預(yù)設(shè)權(quán)重值設(shè)置為70 %,將第二預(yù)設(shè)權(quán)重值設(shè)置為30 % ;
[0230]步驟260:計算第一分析值和70 %的第一乘積,第二分析值和30 %的第二乘積;
[0231]步驟270:B判斷第一乘積和第二乘積之和是否達到暴力語言特征對應(yīng)的預(yù)設(shè)門限值,若是,則確定子音頻文件I具有暴力語言特征,否則,確定子音頻文件I未具有暴力語言特征。
[0232]上述實施例中,音頻文件和預(yù)設(shè)的語言特征信息是分兩個步驟來執(zhí)行的,在實際應(yīng)用中,也可以是一個步驟來執(zhí)行,其他過程類似,在此不再進行一一詳述。
[0233]如圖3所示,為了更好地理解本發(fā)明實施例,以下給出具體應(yīng)用場景,針對分析成人跟小孩的對話的語言特征的過程,做出進一步詳細描述,A為終端,B為分析語言特征的服務(wù)器:
[0234]步驟300:A進行錄音,得到音頻文件,并將得到的音頻文件發(fā)送至B,及指定音頻文件發(fā)送至B ;
[0235]步驟310:B將接收到的音頻文件劃分為兩個子音頻文件:子音頻文件I和子音頻文件2,并從接收到的指定音頻文件中獲取指定語音特征信息;
[0236]該實施例中,針對子音頻文件I和子音頻文件2的操作過程是相同的,以下以對子音頻文件I的執(zhí)行過程為例進行說明。
[0237]步驟320:B將子音頻文件I采用ASR技術(shù)轉(zhuǎn)換為文本1,并根據(jù)室外這種場景類型采用NLP技術(shù)對文本I中與預(yù)設(shè)語音特征信息對應(yīng)的信息進行語義分析,得到第一分析值;
[0238]步驟330:B對子音頻文件I進行物理屬性分析,獲得物理屬性信息,對子音頻文件I進行非物理屬性分析,獲得非物理屬性信息;
[0239]步驟340:B確定場景類型,并根據(jù)確定的場景類型、物理屬性信息、非物理屬性信息對第一分析值進行調(diào)整;
[0240]步驟350:B確定調(diào)整得到的第一分析值所屬的取值范圍是屬于禮貌語言特征對應(yīng)的取值范圍的話,因此確定子音頻文件I具有禮貌語言特征。
[0241]基于上述相應(yīng)方法的技術(shù)方案,參閱圖4所示,本發(fā)明實施例提供一種分析語言特征的裝置,該裝置包括劃分單元40、第一分析單元41和確定單元42,其中:
[0242]劃分單元40,用于將待分析的音頻文件劃分為至少一個子文件;
[0243]第一分析單元41,用于針對至少一個子文件中的任意一子文件,對任意一子文件進行語義分析,得到第一分析值,第一分析值用于表征任意一子文件在語義維度的語言特征;
[0244]確定單元42,用于根據(jù)第一分析值確定任意一子文件的語言特征。
[0245]本發(fā)明實施例中,進一步的,還包括第一獲取單元,用于獲取預(yù)設(shè)語音特征信息;或者,獲取指定音頻文件,并從指定音頻文件中獲取指定語音特征信息;
[0246]第一分析單元41在對任意一子文件進行語義分析時,具體為:
[0247]將任意一子文件中與預(yù)設(shè)語音特征信息或者與指定語音特征信息對應(yīng)的信息進行語義分析。
[0248]本發(fā)明實施例中,可選的,劃分單元40具體用于:
[0249]將待分析的音頻文件中對應(yīng)的對話主題為同一個對話主題的對話作為一個子文件-M /或
[0250]將待分析的音頻文件中對應(yīng)的對話間隔小于或者等于預(yù)設(shè)間隔的任意兩段對話作為一個子文件。
[0251]本發(fā)明實施例中,進一步的,還包括第二分析單元,用于:
[0252]對任意一子文件進行語音分析,得到第二分析值,第二分析值用于表征任意一子文件在語音維度的語言特征;
[0253]確定單元42在根據(jù)第一分析值確定任意一子文件的語言特征時,具體為:
[0254]計算第一分析值與第一預(yù)設(shè)權(quán)重值的第一乘積,及第二分析值與第二預(yù)設(shè)權(quán)重值的第二乘積;
[0255]根據(jù)第一乘積和第二乘積之和確定任意一子文件的語言特征。
[0256]本發(fā)明實施例中,可選的,第二分析單元在對任意一子文件進行語音分析時,具體為:
[0257]對任意一子文件進行非物理屬性分析,獲得非物理屬性信息;和/或
[0258]對任意一子文件進行物理屬性分析,獲得物理屬性信息。
[0259]本發(fā)明實施例中,進一步的,確定單元42還用于:
[0260]對任意一子文件進行場景識別,確定場景類型。
[0261]本發(fā)明實施例中,可選的,第一分析單元具體用于:
[0262]根據(jù)確定的場景類型對任意一子文件進行語義分析。
[0263]本發(fā)明實施例中,可選的,第二分析單元具體用于:
[0264]根據(jù)確定的場景類型對任意一子文件進行語音分析。
[0265]本發(fā)明實施例中,進一步的,還包括第一調(diào)整單元,用于:
[0266]根據(jù)確定的場景類型調(diào)整第一預(yù)設(shè)權(quán)重值和第二預(yù)設(shè)權(quán)重值。
[0267]本發(fā)明實施例中,可選的,還包括第二獲取單元,用于:
[0268]對任意一子文件進行物理屬性分析,獲得物理屬性信息;
[0269]還包括第二調(diào)整單元,用于:
[0270]根據(jù)物理屬性信息對第一分析值進行調(diào)整。
[0271]本發(fā)明實施例中,進一步的,確定單元42還用于:
[0272]對任意一子文件進行場景識別,確定場景類型;
[0273]第二調(diào)整單元在根據(jù)物理屬性信息對第一分析值進行調(diào)整時,具體為:
[0274]根據(jù)確定的場景類型、物理屬性信息對第一分析值進行調(diào)整。
[0275]本發(fā)明實施例中,進一步的,還包括第三獲取單元,用于:
[0276]對任意一子文件進行非物理屬性分析,獲得非物理屬性信息;
[0277]還包括第三調(diào)整單元,用于:
[0278]根據(jù)非物理屬性信息對得到第一分析值進行調(diào)整。
[0279]本發(fā)明實施例中,進一步的,確定單元42還用于:
[0280]對任意一子文件進行場景識別,確定場景類型。
[0281]本發(fā)明實施例中,具體的,第三獲取單元對任意一子文件進行非物理屬性分析,獲得非物理屬性信息時,具體為:
[0282]根據(jù)確定的場景類型,對任意一子文件進行非物理屬性分析,獲得非物理屬性信息。
[0283]本發(fā)明實施例中,可選的,第三調(diào)整單元根據(jù)非物理屬性信息對得到第一分析值進行調(diào)整時,具體為:
[0284]根據(jù)確定的場景類型、非物理屬性信息對得到第一分析值進行調(diào)整。
[0285]本發(fā)明實施例中,進一步的,還包括第四獲取單元,用于:
[0286]對任意一子文件進行物理屬性分析,獲得物理屬性信息;
[0287]對任意一子文件進行非物理屬性分析,獲得非物理屬性信息;
[0288]還包括第四調(diào)整單元,用于:
[0289]根據(jù)物理屬性信息、非物理屬性信息對第一分析值進行調(diào)整。
[0290]本發(fā)明實施例中,進一步的,確定單元42還用于:
[0291]對任意一子文件進行場景識別,確定場景類型。
[0292]本發(fā)明實施例中,可選的,第四獲取單元對任意一子文件進行非物理屬性分析,獲得非物理屬性信息時,具體為:
[0293]根據(jù)確定的場景類型,對任意一子文件進行非物理屬性分析,獲得非物理屬性信息。
[0294]本發(fā)明實施例中,可選的,第四調(diào)整單元根據(jù)物理屬性信息、非物理屬性信息對第一分析值進行調(diào)整時,具體為:
[0295]根據(jù)確定的場景類型、物理屬性信息、非物理屬性信息對第一分析值進行調(diào)整。
[0296]本發(fā)明實施例中,進一步的,確定單元42根據(jù)第一分析值確定任意一子文件的語言特征時,具體為:
[0297]判斷第一分析值是否達到指定語言特征所對應(yīng)的預(yù)設(shè)門限值,若是,確定任意一子文件具有指定語言特征;否則,確定任意一子文件未具有指定語言特征;或者
[0298]確定第一分析值所屬的取值范圍;并
[0299]確定任意一子文件具有取值范圍對應(yīng)的語言特征。
[0300]本發(fā)明實施例中,進一步的,確定單元42根據(jù)第一乘積和第二乘積之和確定任意一子文件的語言特征時,具體為:
[0301]判斷第一乘積和第二乘積之和是否達到指定語言特征所對應(yīng)的預(yù)設(shè)門限值,若是,確定任意一子文件具有指定語言特征;否則,確定任意一子文件未具有指定語言特征;或者
[0302]確定第一乘積和第二乘積之和所屬的取值范圍;并
[0303]確定任意一子文件具有取值范圍對應(yīng)的語言特征。
[0304]如圖5所示,為本發(fā)明實施例提供的分析語言特征的另一種結(jié)構(gòu)示意圖,包括至少一個處理器501,通信總線502,存儲器503以及至少一個通信接口 504。
[0305]其中,通信總線502用于實現(xiàn)上述組件之間的連接并通信,通信接口 504用于與外部設(shè)備連接并通信。
[0306]其中,存儲器503用于存儲有可執(zhí)行的程序代碼,處理器501通過執(zhí)行這些程序代碼,以用于:
[0307]將待分析的音頻文件劃分為至少一個子文件;
[0308]針對至少一個子文件中的任意一子文件,對任意一子文件進行語義分析,得到第一分析值,第一分析值用于表征任意一子文件在語義維度的語言特征;
[0309]根據(jù)第一分析值確定任意一子文件的語言特征。
[0310]綜上所述,本發(fā)明實施例中,確定待分析的音頻文件的語言特征時,先將所述待分析的音頻文件劃分為至少一個子文件;針對所述至少一個子文件中的任意一子文件,對所述任意一子文件進行語義分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在語義維度的語言特征;根據(jù)所述第一分析值確定所述任意一子文件的語言特征,這樣,避免了人工去判斷音頻文件的語音特征,提高了準確度和效率,尤其在語義分析基礎(chǔ)上綜合語音分析、綜合場景更能較大提升準確度。
[0311]本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方
當前第4頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1