一種基于即時(shí)通訊系統(tǒng)的語音通話方法及系統(tǒng)的制作方法

文檔序號(hào)：2830793閱讀：257來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種基于即時(shí)通訊系統(tǒng)的語音通話方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明屬于通信領(lǐng)域，尤其涉及一種基于即時(shí)通訊系統(tǒng)的語音通話方法及系統(tǒng)。
背景技術(shù)：
隨著即時(shí)通訊技術(shù)的發(fā)展，即時(shí)通訊系統(tǒng)除具備基本的即時(shí)通訊功能外，還具有其他諸多附加功能，如語音通話功能。使用即時(shí)通訊系統(tǒng)進(jìn)行語音通話已經(jīng)成為一般社會(huì)大眾所使用的溝通工具之一，但是現(xiàn)有的語音通話雙方只能采用自己原來的聲音進(jìn)行通話，不能改變通話者的原始語音，功能比較單一，不能隱藏通話方的身份，缺乏新穎性、娛樂性，不能滿足用戶的個(gè)性化需求。
現(xiàn)在還沒有基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話方法。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話方法，旨在解決現(xiàn)在還沒有基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話方法的問題。
本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的，一種基于即時(shí)通訊系統(tǒng)的語音通話方法，所
述方法包括下述步驟
即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求，接收到即
時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后，建立與即時(shí)通訊客戶端B之間的
變調(diào)語音通話通道；
即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理，得到變調(diào)語音；即時(shí)通訊客戶端A通過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)
通訊客戶端B。本發(fā)明實(shí)施例的另一目的在于提供一種基于即時(shí)通訊系統(tǒng)的語音通話系
統(tǒng)，所述系統(tǒng)包括
請(qǐng)求發(fā)送單元，接收用戶輸入的變調(diào)語音通話請(qǐng)求信息，向通話對(duì)方發(fā)送變調(diào)語音通話請(qǐng)求，接收返回的變調(diào)語音通話應(yīng)答，建立變調(diào)語音通話通道，生成變調(diào)信息并發(fā)送；
語音采集單元，采集輸入的語音信息，并將采集到的語音信息轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別和處理的數(shù)字語音信息；
變調(diào)處理單元，接收到所述請(qǐng)求發(fā)送單元發(fā)送的變調(diào)信息后，將所述語音采集單元得到的數(shù)字語音信息進(jìn)行變調(diào)處理，得到與所述數(shù)字語音信息對(duì)應(yīng)的變調(diào)語音；以及
語音發(fā)送單元，通過所述請(qǐng)求發(fā)送單元建立的變調(diào)語音通話通道發(fā)送所述變調(diào)處理單元得到的變調(diào)語音。
在本發(fā)明實(shí)施例中，將即時(shí)通訊系統(tǒng)中采集到的語音信號(hào)先進(jìn)行語音變調(diào) 處理，實(shí)現(xiàn)了基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話，為基于即時(shí)通訊場(chǎng)合下的語音通信帶來極大的娛樂效果，給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn)，增加用戶對(duì)即時(shí)通訊產(chǎn)品的依賴性，從而提升產(chǎn)品竟?fàn)幜Γ⑶覟檎Z音通話用戶提供嶄新的業(yè)務(wù)體驗(yàn)。

圖1是本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話方法的實(shí)現(xiàn)流程
圖2是本發(fā)明另一實(shí)施例提供的語音通信通道基于即時(shí)通訊系統(tǒng)的語音通話方法的實(shí)現(xiàn)流程圖3是本發(fā)明實(shí)施例提供的即時(shí)通訊客戶端B接收到即時(shí)通訊客戶端A發(fā) 送的變調(diào)語音通話凄丈據(jù)的處理流程圖4是本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話系統(tǒng)的結(jié)構(gòu)圖；圖5是本發(fā)明另一實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施例方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下結(jié)合附圖及實(shí) 施例，對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解，此處所描述的具體實(shí)施例^又僅用以解釋本發(fā)明，并不用于限定本發(fā)明。
在本發(fā)明實(shí)施例中，即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送語音變調(diào) 請(qǐng)求，并與即時(shí)通訊客戶端B之間建立了變調(diào)語音通話通道后，對(duì)采集的原始語音進(jìn)行變調(diào)處理，得到與原始語音對(duì)應(yīng)的變調(diào)語音，并將該變調(diào)語音通過建立的變調(diào)語音通話通道發(fā)送至即時(shí)通訊客戶端B， /人而實(shí)現(xiàn)即時(shí)通訊系統(tǒng)中各即時(shí)通訊客戶端之間的變調(diào)語音通話。
圖1示出了本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話方法的實(shí)現(xiàn) 流程，詳述如下
1 、即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求。
2、即時(shí)通訊客戶端B在接收到即時(shí)通訊客戶端A發(fā)送的變調(diào)語音通話請(qǐng) 求后，對(duì)該變調(diào)語音通話請(qǐng)求作出應(yīng)答，并將應(yīng)答信息返回至即時(shí)通訊客戶端 A。當(dāng)即時(shí)通訊客戶端A接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后，建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道。
為了成功建立通話通道，即時(shí)通訊客戶端A和即時(shí)通訊客戶端B在即時(shí)通訊服務(wù)器的協(xié)調(diào)下，建立變調(diào)語音通話通道。當(dāng)然，即時(shí)通訊客戶端A可以透明或者非透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求。如果即時(shí)通訊客戶端A透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求，此過程即時(shí)通訊客戶端B界面上不用顯示。
3、即時(shí)通訊客戶端A對(duì)釆集的原始語音進(jìn)行變調(diào)處理，得到與原始語音對(duì)應(yīng)的變調(diào)語音。在本發(fā)明實(shí)施例中，提供了多種語音變調(diào)方式，如改變語音的音調(diào)、性別變聲(男聲變女聲、女聲變男聲)、年齡變聲(青少年的聲音變老年人的聲音)、將用戶原始話音變?yōu)槟持宋锏穆曇?、在用戶聲音上加入背景聲?嚴(yán)格意義上，在用戶聲音上加入背景聲音并不屬于語音變調(diào)處理，而屬于混音技術(shù)，但本發(fā)明所定義的變調(diào)語音通話包含此類應(yīng)用)等。其中對(duì)采集的原始語音進(jìn)行變調(diào)處理，得到與原始語音對(duì)應(yīng)的變調(diào)語音的具體過程如下A、采集用戶輸入的語音信息，并將采集的語音信息處理成計(jì)算機(jī)可以識(shí) 別和處理的數(shù)字語音信息；B、對(duì)該數(shù)字語音信息進(jìn)行變調(diào)處理，得到與該數(shù)字語音信息對(duì)應(yīng)的變調(diào) 語音。在本實(shí)施例中，語音變調(diào)處理可以使用線性預(yù)測(cè)(LinearPrediction, LP)分析合成語音^)t型將數(shù)字語音信號(hào)分解為譜包絡(luò)部分(由線性預(yù)測(cè)編碼(Linear predictive coding, LPC )系數(shù)表示)和激勵(lì)部分(由LPC的殘差表示)；然后在LPC系數(shù)上提取共振峰頻率和頻譜傾斜參數(shù)，再通過矢量量化碼書法來實(shí)現(xiàn) 語音轉(zhuǎn)換。在轉(zhuǎn)換函數(shù)的選擇上，頻率包絡(luò)轉(zhuǎn)換可以使用矢量量化法，對(duì)韻律 (主要是基音周期)的轉(zhuǎn)換可以使用時(shí)域基音同步疊加(time domain pitch synchronous overlap-add, TD-P S OLA)算法。在本實(shí)施例中，對(duì)原始語音進(jìn)行變調(diào)處理的語音變調(diào)方式可以由用戶根據(jù) 提供的語音變調(diào)方式向即時(shí)通訊客戶端A輸入用戶選4奪信息，由輸入的用戶選才奪信息確定語音變調(diào)方式。為了給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn)，即時(shí)通訊服務(wù)提供商可以將語音變調(diào)或其中的部分語音變調(diào)方式作為增值服務(wù)項(xiàng)目，在本發(fā)明實(shí)施例中，提供的語音變調(diào)方式由變調(diào)方用戶在即時(shí)通訊系統(tǒng)中的授權(quán)變調(diào)信息確定。在即時(shí)通訊客戶端A用戶選擇語音變調(diào)方式前，用戶通過即時(shí)通訊客戶端 A向服務(wù)器發(fā)送用戶的授權(quán)變調(diào)方式查詢信息，服務(wù)器根據(jù)該用戶在即時(shí)通訊系統(tǒng)中的身份標(biāo)識(shí)返回授權(quán)變調(diào)信息，即該用戶可使用的語音變調(diào)方式。即時(shí) 通訊客戶端A根據(jù)服務(wù)器返回的授權(quán)變調(diào)信息輸入用戶選擇信息。當(dāng)然，也可
以根據(jù)用戶選擇信息、授權(quán)變調(diào)信息，用其他的業(yè)務(wù)選擇邏輯確定變調(diào)方式；當(dāng)用戶只有一種可使用的語音變調(diào)方式時(shí)，可以只由授權(quán)變調(diào)信息確定變調(diào)方式。
由于語音變調(diào)處理是以用戶的原始語音信號(hào)作為基礎(chǔ)的，為了向用戶提供更合適的語音變調(diào)方式以保證變調(diào)后的聲音能被通信對(duì)方所辨識(shí)，作用本發(fā)明的另一個(gè)優(yōu)選實(shí)施例，對(duì)原始語音進(jìn)行變調(diào)處理的語音變調(diào)方式還要考慮用戶個(gè)性特征信息，即主要是用戶原始話音中的音段特征。此時(shí)，變調(diào)方式，根據(jù) 用戶選捧信息及用戶個(gè)性特征信息，或者用戶選擇信息、授權(quán)變調(diào)信息及用戶個(gè)性特征信息，由業(yè)務(wù)選擇邏輯確定。在客戶端A接收到用戶選擇信息后，對(duì) 用戶的原始語音信號(hào)進(jìn)行分析，得到其個(gè)性特征信息，當(dāng)其個(gè)性特征信息無法滿足語音變調(diào)處理的要求時(shí)，需要對(duì)用戶的語音變調(diào)方式請(qǐng)求進(jìn)行修正，例如某用戶原始聲音較粗且嘶啞，而其選擇的語音變調(diào)方式為"低齡兒童"，此時(shí) 的變調(diào)效果會(huì)很差(不易為對(duì)方識(shí)別為"童音")，于是系統(tǒng)應(yīng)建議用戶重新選擇語音變調(diào)方式。
為了提高通話接收方所聽到的話音質(zhì)量，向用戶提供更合適的語音變調(diào)方式，作為本發(fā)明的又一個(gè)優(yōu)選實(shí)施例，語音變調(diào)方式確認(rèn)還要考慮對(duì)方語音環(huán) 境信息。此時(shí)，變調(diào)方式，根據(jù)用戶選4奪信息及對(duì)方語音環(huán)境信息，或者用戶選擇信息、授權(quán)變調(diào)信息及對(duì)方語音環(huán)境信息，由業(yè)務(wù)選才奪邏輯確定。即時(shí)通訊客戶端B向即時(shí)通訊客戶端A返回變調(diào)語音通話請(qǐng)求應(yīng)答時(shí)，同時(shí)返回其自身的語音環(huán)境信息。該語音環(huán)境信息可以由即時(shí)通訊客戶端B用戶選擇，或者由即時(shí)通訊客戶端B根據(jù)麥克風(fēng)采集到的聲音信號(hào)分析得到等等。
在本發(fā)明實(shí)施例中，即時(shí)通訊客戶端A的語音變調(diào)方式可以由i受^l變調(diào)信息、用戶個(gè)性特征信息、對(duì)方語音環(huán)境信息等信息的一項(xiàng)或多項(xiàng)及用戶選擇信息，由業(yè)務(wù)選擇邏輯確定。業(yè)務(wù)選擇邏輯為即時(shí)通訊服務(wù)提供商所定義，以明確指出何等的授權(quán)變調(diào)信息、怎樣的語音通信環(huán)境可以享受多少項(xiàng)變調(diào)語音服務(wù)(例如"男聲變女聲"為一項(xiàng)變調(diào)語音服務(wù))等。在本發(fā)明實(shí)施例中，由于采集的語音信息中可能包含回音、噪聲等不利于處理、傳輸和辨別的信號(hào)，因此，為了達(dá)到較好的變調(diào)語音通話效果，改善通話接收方所聽到的話音質(zhì)量，在對(duì)該數(shù)字語音信息進(jìn)行語音變調(diào)處理之前，對(duì) 數(shù)字語音信息進(jìn)行去噪處理，即進(jìn)行回音抵消、噪聲抑制、信號(hào)增益調(diào)節(jié)等一種或者多種組合的處理。4、即時(shí)通訊客戶端A將得到的變調(diào)語音通過已經(jīng)建立的變調(diào)語音通話通道發(fā)送至即時(shí)通訊客戶端B。在本發(fā)明實(shí)施例中，為了便于傳輸變調(diào)語音，即時(shí)通訊客戶端A在發(fā)送變調(diào)語音前，對(duì)變調(diào)語音進(jìn)行分組、打包處理，得到變調(diào)語音凄t據(jù)包，并將變調(diào) 語音數(shù)據(jù)包發(fā)送至即時(shí)通訊客戶端B。在本發(fā)明實(shí)施例中，為了降低變調(diào)語音數(shù)據(jù)傳輸所需要的帶寬，為實(shí)時(shí)變調(diào)語音通話創(chuàng)造條件，在對(duì)采集的原始語音進(jìn)行變調(diào)處理后，按照預(yù)設(shè)的編碼規(guī)則，例如G.729、 G.729A、 G.723.1等，將得到的與原始語音對(duì)應(yīng)的變調(diào)語音進(jìn)^亍壓縮編石馬。在本發(fā)明實(shí)施例中，為了避免變調(diào)語音在網(wǎng)絡(luò)傳輸過程中由于丟包、差錯(cuò) 等原因造成的信號(hào)失真，在對(duì)變調(diào)語音進(jìn)行壓縮編碼后，再利用信道編碼技術(shù)，對(duì)壓縮編碼后得到的變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理。當(dāng)即時(shí)通訊客戶端B向即時(shí)通訊客戶端A發(fā)送變調(diào)語音通話請(qǐng)求時(shí)，其實(shí) 現(xiàn)流程同上，在此不再贅述。可以理解，即時(shí)通訊客戶端A和即時(shí)通訊客戶端 B可以進(jìn)4于單向變調(diào)i吾音通話，也可以進(jìn)4于雙向變調(diào)i吾音通話。上述i吾音通話基于有線互聯(lián)網(wǎng)絡(luò)或無線互聯(lián)網(wǎng)絡(luò)上的即時(shí)通訊系統(tǒng)。如果通訊即時(shí)通訊客戶端A或者即時(shí)通訊客戶端B中的任意一方4是出中斷請(qǐng)求、網(wǎng)絡(luò)發(fā)生故障等時(shí)，通話結(jié)束，釋放變調(diào)語音通話通道。圖2示出了本發(fā)明實(shí)施例提供的當(dāng)即時(shí)通訊客戶端A與即時(shí)通訊客戶端B之間建立語音通信通道，并在即時(shí)通訊客戶端A與即時(shí)通訊客戶端B之間進(jìn)行語音通話方法的實(shí)現(xiàn)流程，詳述如下1 、即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送語音通話請(qǐng)求。2、即時(shí)通訊客戶端B在接收到即時(shí)通訊客戶端A發(fā)送的語音通話請(qǐng)求后，對(duì)該語音通話請(qǐng)求作出應(yīng)答，并將應(yīng)答信息返回至即時(shí)通訊客戶端A。即時(shí)通訊客戶端A接收到即時(shí)通訊客戶端B返回的語音通話應(yīng)答后，建立與即時(shí)通訊客戶端B之間的語音通話通道。i吾音通話通道后，即時(shí)通訊客戶端A和即時(shí)通訊客戶端B之間可以^使用該語音通話通道進(jìn)行語音通話。3 、即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求。4、即時(shí)通訊客戶端B在接收到即時(shí)通訊客戶端A發(fā)送的變調(diào)語音通話請(qǐng) 求后，對(duì)該變調(diào)語音通話請(qǐng)求作出應(yīng)答，并將應(yīng)答信息返回至即時(shí)通訊客戶端 A。即時(shí)通訊客戶端A接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后，建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道。變調(diào)語音通話通道建立后，可以釋放先前建立的語音通話通道。當(dāng)然，即時(shí)通訊客戶端A可以透明或者非透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求。如果即時(shí)通訊客戶端A透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng) 求，此過程即時(shí)通訊客戶端B界面上不用顯示。5、即時(shí)通訊客戶端A對(duì)采集的原始語音進(jìn)行變調(diào)處理，得到與原始語音對(duì)應(yīng)的變調(diào)語音。6、即時(shí)通訊客戶端A將得到的變調(diào)語音通過已經(jīng)建立的變調(diào)語音通話通道發(fā)送至即時(shí)通訊客戶端B 。7、通話結(jié)束，lf;改變調(diào)語音通話通道。如果通訊即時(shí)通訊客戶端A或者即時(shí)通訊客戶端B中的任意一方提出中斷請(qǐng)求、網(wǎng)絡(luò)發(fā)生故障等時(shí)，通話結(jié)束，釋放變調(diào)語音通話通道。其中，即時(shí)通訊客戶端B接收到即時(shí)通訊客戶端A發(fā)送的變調(diào)語音通話數(shù)據(jù)后，對(duì)通話數(shù)據(jù)的處理流程與普通語音通話中的處理流程相同，處理流程如
圖3所示，詳述如下
在步驟S301中，通話數(shù)據(jù)接收、解包；
通過已經(jīng)建立的變調(diào)語音通話通道接收分組通話數(shù)據(jù)，按照與即時(shí)通訊客戶端A相同的網(wǎng)絡(luò)傳輸協(xié)議進(jìn)行數(shù)據(jù)包解包，并將分組數(shù)據(jù)組裝，得到壓縮碼
流o
在步驟S302中，將解包后的數(shù)據(jù)解碼為語音信號(hào)；將解包后的壓縮碼流采用即時(shí)通訊客戶端A編碼運(yùn)算的逆運(yùn)算進(jìn)行解碼，得到可^皮人耳識(shí)別的原始語音信號(hào)。
在步驟S303中，語音信號(hào)增強(qiáng)處理；
由于網(wǎng)絡(luò)傳輸、語音信號(hào)壓縮和語音變調(diào)處理等都可能造成信號(hào)的失真，需要對(duì)解碼得到的原始語音信號(hào)進(jìn)行信號(hào)增強(qiáng)處理。信號(hào)增強(qiáng)處理可以采用卡
爾曼濾波法、短時(shí)譜幅度的最小均方誤差估計(jì)法、或者自適應(yīng)濾波法等。在步驟S304中，輸出增強(qiáng)處理后的語音信號(hào)。
通過輸出設(shè)備，例如耳機(jī)、音箱、聲卡等將增強(qiáng)處理后的語音信號(hào)輸出。
為了得到可正確解碼的語音比特流，在本發(fā)明實(shí)施例中，在數(shù)據(jù)接收、組包后，將解包后的數(shù)據(jù)進(jìn)行逆冗余/容錯(cuò)處理，去除即時(shí)通訊客戶端A加入壓縮碼流中的冗余信號(hào)，》務(wù)改或者丟棄其中的錯(cuò)誤數(shù)據(jù)。
圖4示出了本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的i吾音通話系統(tǒng)的結(jié) 構(gòu)，為了便于說明，僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。
該系統(tǒng)可以用于各種即時(shí)通訊客戶端設(shè)備，例如計(jì)算機(jī)、筆記本電腦、個(gè) 人數(shù)字助理(Personal Digital Assistant, PDA)、智能手機(jī)等，可以是運(yùn)行于這些設(shè)備內(nèi)的軟件單元、硬件單元或者軟硬件相結(jié)合的單元，也可以作為獨(dú)立的掛件集成到這些設(shè)備中或者運(yùn)行于這些設(shè)備的應(yīng)用系統(tǒng)中，其中
請(qǐng)求發(fā)送單元401， 4妄收用戶輸入的變調(diào)語音通話二清求信息，向通話對(duì)方發(fā)送變調(diào)語音通話請(qǐng)求，接收返回的變調(diào)語音通話應(yīng)答，建立變調(diào)語音通話通道，生成變調(diào)信息，并向變調(diào)處理單元403發(fā)送該變調(diào)信息。在本實(shí)施例中，變調(diào)信息包含用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或者兩項(xiàng)。
語音采集單元402，采集輸入的語音信息，并將采集到的語音信息轉(zhuǎn)化成計(jì)算^i可以識(shí)別和處理的^:字語音信息。
變調(diào)處理單元403，接收到請(qǐng)求發(fā)送單元401發(fā)送的變調(diào)信息后，將語音采集單元402得到的該數(shù)字語音信息進(jìn)行變調(diào)處理，得到與該數(shù)字語音信息對(duì) 應(yīng)的變調(diào)語音。
語音發(fā)送單元404,通過請(qǐng)求發(fā)送單元401建立的變調(diào)語音通話通道發(fā)送變調(diào)處理單元403得到的變調(diào)語音。
在本發(fā)明實(shí)施例中，變調(diào)處理單元403包括
變調(diào)信息接收模塊4()31，用于接收請(qǐng)求發(fā)送單元401發(fā)送的變調(diào)信息，并將接收到的變調(diào)信息輸出給業(yè)語音變調(diào)處理模塊4033 。
業(yè)務(wù)邏輯模塊4032,生成語音變調(diào)的業(yè)務(wù)選擇邏輯，并輸出給語音變調(diào)處理模塊4033。語音變調(diào)的業(yè)務(wù)選擇邏輯由即時(shí)通訊服務(wù)提供商所定義，以明確指出何等的授權(quán)變調(diào)信息、怎樣的語音通信環(huán)境可以享受多少項(xiàng)變調(diào)語音服務(wù) (例如"男聲變女聲"為一項(xiàng)變調(diào)語音服務(wù))等。
語音變調(diào)處理模塊4033，接收變調(diào)信息接收模塊4031輸出的變調(diào)信息、業(yè)務(wù)邏輯模塊4032輸出的業(yè)務(wù)選擇邏輯，由接收到的變調(diào)信息、業(yè)務(wù)選擇邏輯確定語音變調(diào)方式，將語音采集單元402得到的數(shù)字語音信息按照語音變調(diào)方式進(jìn)行變調(diào)處理，得到與該數(shù)字語音信息對(duì)應(yīng)的變調(diào)語音并輸出。語音變調(diào)處理模塊4033根據(jù)變調(diào)信息中包含的用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或者兩項(xiàng)，由業(yè)務(wù)選擇邏輯確定語音變調(diào)方式。實(shí)現(xiàn)方式如上所述，不再贅述。
為了向用戶提供更合適的語音變調(diào)方式以保證變調(diào)后的聲音能被通信對(duì)方所辨識(shí)，作用本發(fā)明的一個(gè)優(yōu)選實(shí)施例，變調(diào)處理單元403還包括
用戶特征獲取;f莫塊4034,用于從語音釆集單元402得到的該數(shù)字語音信息中提取用戶個(gè)性特征，生成用戶個(gè)性特征信息并輸出給語音變調(diào)處理模塊4033。語音變調(diào)處理模塊4033解析出接收到的變調(diào)信息中包含的用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或者兩項(xiàng)，結(jié)合接收到的用戶個(gè)性特征信息，由業(yè)務(wù) 選擇邏輯確定語音變調(diào)方式。
為了提高通話接收方所聽到的話音質(zhì)量，向用戶提供更合適的語音變調(diào)方式，作為本發(fā)明的另一個(gè)優(yōu)選實(shí)施例，變調(diào)處理單元403還包括
對(duì)方環(huán)境獲取才莫塊4035,接收請(qǐng)求發(fā)送單元401發(fā)送的對(duì)方語音環(huán)境信息并輸出給語音變調(diào)處理才莫塊4033。在本實(shí)施例中，通話對(duì)方返回的變調(diào)語音通話應(yīng)答中包含有語音環(huán)境信息，請(qǐng)求發(fā)送單元401根據(jù)接收到語音環(huán)境信息生成對(duì)方語音環(huán)境信息，并輸出給語音變調(diào)處理模塊4033。語音變調(diào)處理模塊 4033解析出接收到的變調(diào)信息中包含的用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或者兩項(xiàng)，結(jié)合接收到的對(duì)方語音環(huán)境信息，由業(yè)務(wù)選#^邏輯確定語音變調(diào)方式。
當(dāng)然，語音變調(diào)處理模塊4033可以根據(jù)接收到的授權(quán)變調(diào)信息、用戶個(gè)性特征信息、對(duì)方語音環(huán)境信息等信息的一項(xiàng)或多項(xiàng)及用戶選擇信息，由業(yè)務(wù)選擇邏輯確定。
為了達(dá)到較好的變調(diào)語音通話效果，改善通話接收方所聽到的話音質(zhì)量，作為本發(fā)明的再一優(yōu)選實(shí)施例，語音通話系統(tǒng)還包括
去噪單元405，接收語音采集單元402得到的數(shù)字語音信息，進(jìn)行去噪處理，得到去噪后的數(shù)字語音信息。
為了降低變調(diào)語音數(shù)據(jù)傳輸所需要的帶寬，為實(shí)時(shí)變調(diào)語音通話創(chuàng)造條件，作為本發(fā)明的再一優(yōu)選實(shí)施例，語音通話系統(tǒng)還包括
編碼單元406,將變調(diào)處理單元403得到的變調(diào)語音進(jìn)行壓縮編碼，得到的變調(diào)語音比特流。
為了避免變調(diào)語音在網(wǎng)絡(luò)傳輸過程中由于丟包、差錯(cuò)等原因造成的信號(hào)失真，或者便于傳輸變調(diào)語音，作為本發(fā)明的再一優(yōu)選實(shí)施例，語音通話系統(tǒng)還包括
優(yōu)化單元407，將變調(diào)處理單元403得到的變調(diào)語音或者編碼單元406得到的變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理，和/或分組、打包處理，并將處理后的
變調(diào)語音數(shù)據(jù)輸出給語音發(fā)送單元404。
如圖4所示，在本實(shí)施例中，優(yōu)化單元包括
冗余增強(qiáng)處理模塊4071，利用信道編碼技術(shù)，對(duì)變調(diào)處理單元403得到的變調(diào)語音或者編碼單元406得到的變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理，輸出處理后的變調(diào)語音比特流。
分組、打包模塊4072,將接收到的變調(diào)語音數(shù)據(jù)進(jìn)行分組、打包處理，得到變調(diào)語音數(shù)據(jù)包。分組、打包模塊4072可以接收變調(diào)處理單元403、編碼單元406或者冗余增強(qiáng)處理模塊4071輸出的變調(diào)語音、變調(diào)語音比特流。
當(dāng)然，優(yōu)化單元可以只包括冗余增強(qiáng)處理模塊4071或者分組、打包模塊 4072。
如圖5所示，為了使語音通話系統(tǒng)能夠接收處理語音信息，作為本發(fā)明的再一優(yōu)選實(shí)施例，語音通話系統(tǒng)還包括
請(qǐng)求應(yīng)答單元408，接收變調(diào)語音通話請(qǐng)求，并返回變調(diào)語音通話應(yīng)答，生成語音接收觸發(fā)信息并輸出給語音接收單元409。
語音接收單元409，接收到請(qǐng)求應(yīng)答單元408輸出的語音接收觸發(fā)信息后，接收分組通話數(shù)據(jù)，按照與通話對(duì)方相同的網(wǎng)絡(luò)傳輸協(xié)議進(jìn)行數(shù)據(jù)包解包，并將分組數(shù)據(jù)組裝，得到壓縮碼流并輸出。
解碼單元410,將語音接收單元409得到的數(shù)據(jù)，即壓縮碼流，解碼為語音信號(hào)。
語音信號(hào)增強(qiáng)處理單元411，將解碼單元410得到的數(shù)據(jù)解碼，得到原始語音信號(hào)并進(jìn)行信號(hào)增強(qiáng)處理，得到增強(qiáng)處理后的語音信號(hào)。
語音輸出單元412，將得到的增強(qiáng)處理后的語音信號(hào)輸出，可以為耳機(jī)、音箱、聲卡等。
為了改善通話接收方所聽到的話音質(zhì)量，在本發(fā)明實(shí)施例中，語音通話系統(tǒng)還包括逆冗余/容錯(cuò)處理單元413，去除語音接收單元409得到的通話對(duì)方加入壓縮碼流中的冗余信號(hào)，修改或丟棄其中的錯(cuò)誤數(shù)據(jù)。
在本發(fā)明實(shí)施例中，將即時(shí)通訊系統(tǒng)中采集到的語音信號(hào)先進(jìn)行語音變調(diào) 處理，實(shí)現(xiàn)了基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話，為基于即時(shí)通訊場(chǎng)合下的語音通信帶來極大的娛樂效果，給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn)，增加用戶對(duì)即時(shí)通訊產(chǎn)品的依賴性，^v而l^升產(chǎn)品竟?fàn)幜?。并且為語音通話用戶提供嶄新的業(yè)務(wù)體^r,例如用變調(diào)語音通話來達(dá)到保護(hù)用戶身份信息的目的。
以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā) 明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種基于即時(shí)通訊系統(tǒng)的語音通話方法，其特征在于，所述方法包括下述步驟即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求，接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后，建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道；即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理，得到變調(diào)語音；即時(shí)通訊客戶端A通過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)通訊客戶端B。
2、如權(quán)利要求1所述的方法，其特征在于，所述即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理，得到變調(diào)語音的步驟具體為采集輸入的原始語音，轉(zhuǎn)化成數(shù)字語音信息；對(duì)所述數(shù)字語音信息進(jìn)行變調(diào)處理。
3、如權(quán)利要求1所述的方法，其特征在于，所述即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理的變調(diào)方式，根據(jù)用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或者兩項(xiàng)，由業(yè)務(wù)選擇邏輯確定。
4、如權(quán)利要求3所述的方法，其特征在于，變調(diào)方式還根據(jù)用戶個(gè)性特征信息或者對(duì)方語音環(huán)境信息的一項(xiàng)或者兩項(xiàng)，由業(yè)務(wù)選擇邏輯確定。
5、如權(quán)利要求3或4所述的方法，其特征在于，所述授權(quán)變調(diào)方式由服務(wù) 器根據(jù)即時(shí)通訊客戶端A用戶在即時(shí)通訊系統(tǒng)中的身份標(biāo)識(shí)返回。
6、如權(quán)利要求2所述的方法，其特征在于，在對(duì)所述數(shù)字語音信息進(jìn)行語音變調(diào)處理的步驟之前，所述方法還包括對(duì)所述數(shù)字語音信息進(jìn)行去噪處理。
7、如權(quán)利要求1所述的方法，其特征在于，在所述即時(shí)通訊客戶端A對(duì) 輸入的原始語音信號(hào)進(jìn)行變調(diào)處理，得到變調(diào)語音的步驟之后，所述方法還包括對(duì)所述變調(diào)語音進(jìn)行壓縮編碼和/或冗余增強(qiáng)處理。
8、如權(quán)利要求1所述的方法，其特征在于，在所述即時(shí)通訊客戶端A通過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)通訊客戶端B的步驟之前，所述方法還包括對(duì)變調(diào)語音進(jìn)行分組、打包處理。
9、一種基于即時(shí)通訊系統(tǒng)的語音通話系統(tǒng)，其特征在于，所述系統(tǒng)包括請(qǐng)求發(fā)送單元，接收用戶輸入的變調(diào)語音通話請(qǐng)求信息，向通話對(duì)方發(fā)送變調(diào)語音通話請(qǐng)求，接收返回的變調(diào)語音通話應(yīng)答，建立變調(diào)語音通話通道，生成變調(diào)信息并發(fā)送；語音采集單元，采集輸入的語音信息，并將采集到的語音信息轉(zhuǎn)化為計(jì)算機(jī)可以識(shí)別和處理的數(shù)字語音信息；變調(diào)處理單元，接收到所述請(qǐng)求發(fā)送單元發(fā)送的變調(diào)信息后，將所述語音采集單元得到的數(shù)字語音信息進(jìn)行變調(diào)處理，得到與所述數(shù)字語音信息對(duì)應(yīng)的變調(diào)語音；以及語音發(fā)送單元，通過所述請(qǐng)求發(fā)送單元建立的變調(diào)語音通話通道發(fā)送所述變調(diào)處理單元得到的變調(diào)語音。
10、如權(quán)利要求9所述的語音通話系統(tǒng)，其特征在于，所述變調(diào)處理單元包括變調(diào)信息接收模塊，用于接收所述請(qǐng)求發(fā)送單元發(fā)送的變調(diào)信息，并將接收到的所述變調(diào)信息輸出；業(yè)務(wù)邏輯模塊，生成語音變調(diào)的業(yè)務(wù)選擇邏輯并輸出；以及語音變調(diào)處理模塊，接收所述變調(diào)信息接收模塊輸出的變調(diào)信息、業(yè)務(wù)邏輯模塊輸出的業(yè)務(wù)選擇邏輯，由接收到的所述變調(diào)信息、業(yè)務(wù)選擇邏輯確定語音變調(diào)方式，將所述語音采集單元得到的數(shù)字語音信息按照所述語音變調(diào)方式進(jìn)行變調(diào)處理，得到與所述數(shù)字語音信息對(duì)應(yīng)的變調(diào)語音并輸出。
11、如權(quán)利要求IO所述的語音通話系統(tǒng)，其特征在于，所述變調(diào)處理單元包括用戶特征獲取模塊，用于從所述語音采集單元得到的該數(shù)字語音信息中提取用戶個(gè)性特征，生成用戶個(gè)性特征信息并輸出給所述語音變調(diào)處理模塊；和/ 或?qū)Ψ江h(huán)境獲耳又一莫塊，接收所述請(qǐng)求發(fā)送單元發(fā)送的對(duì)方語音環(huán)境信息并輸出給所述語音變調(diào)處理模塊。
12、如權(quán)利要求9所述的語音通話系統(tǒng)，其特征在于，所述語音通話系統(tǒng) 還包括去噪單元，接收所述語音采集單元得到的數(shù)字語音信息，進(jìn)行去噪處理，得到去噪后的數(shù)字語音信息；編碼單元，將所述變調(diào)處理單元得到的變調(diào)語音進(jìn)行壓縮編碼，得到變調(diào) 語音比特流；或者優(yōu)化單元，將所述變調(diào)處理單元得到的變調(diào)語音或者所述編碼單元得到的變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理，和/或分組、打包處理，并將處理后的變調(diào) 語音數(shù)據(jù)輸出給所述語音發(fā)送單元。
13、如權(quán)利要求9至12任一權(quán)利要求所述的語音通話系統(tǒng)，其特征在于，所述系統(tǒng)還包括請(qǐng)求應(yīng)答單元，接收變調(diào)語音通話請(qǐng)求，并返回變調(diào)語音通話應(yīng)答，生成語音接收觸發(fā)信息并輸出。語音接收單元，接收到所述請(qǐng)求應(yīng)答單元輸出的語音接收觸發(fā)信息后，接收分組通話數(shù)據(jù)，按照與通話對(duì)方相同的網(wǎng)絡(luò)傳輸協(xié)議進(jìn)行數(shù)據(jù)包解包，并將分組lt據(jù)組裝，得到壓縮碼流；解碼單元，將所述語音接收單元得到的數(shù)據(jù)，解碼為語音信號(hào)；語音信號(hào)增強(qiáng)處理單元，將所述解碼單元得到的數(shù)據(jù)解碼，得到原始語音信號(hào)并進(jìn)行信號(hào)增強(qiáng)處理，得到增強(qiáng)處理后的語音信號(hào)；以及語音輸出單元，將所述語音信號(hào)增強(qiáng)處理單元得到的所述增強(qiáng)處理后的語音信號(hào)輸出。
全文摘要
本發(fā)明適用于通信領(lǐng)域，提供了一種基于即時(shí)通訊系統(tǒng)的語音通話方法及系統(tǒng)，所述方法包括下述步驟即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求，接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后，建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道；即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理，得到變調(diào)語音；即時(shí)通訊客戶端A通過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)通訊客戶端B。本發(fā)明將即時(shí)通訊系統(tǒng)中采集到的語音信號(hào)先進(jìn)行語音變調(diào)處理，實(shí)現(xiàn)了基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話，為基于即時(shí)通訊場(chǎng)合下的語音通信帶來極大的娛樂效果，給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn)，增加用戶對(duì)即時(shí)通訊產(chǎn)品的依賴性，從而提升產(chǎn)品競(jìng)爭(zhēng)力。
文檔編號(hào)G10L21/013GK101304391SQ20081006826
公開日2008年11月12日申請(qǐng)日期2008年6月30日優(yōu)先權(quán)日2008年6月30日
發(fā)明者李大龍, 盛馥鐘, 鄭全戰(zhàn) 申請(qǐng)人:騰訊科技(深圳)有限公司

完整全部詳細(xì)技術(shù)資料下載