專利名稱:一種基于即時(shí)通訊系統(tǒng)的語音通話方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于通信領(lǐng)域,尤其涉及一種基于即時(shí)通訊系統(tǒng)的語音通話方法及 系統(tǒng)。
背景技術(shù):
隨著即時(shí)通訊技術(shù)的發(fā)展,即時(shí)通訊系統(tǒng)除具備基本的即時(shí)通訊功能外, 還具有其他諸多附加功能,如語音通話功能。使用即時(shí)通訊系統(tǒng)進(jìn)行語音通話 已經(jīng)成為一般社會(huì)大眾所使用的溝通工具之一,但是現(xiàn)有的語音通話雙方只能 采用自己原來的聲音進(jìn)行通話,不能改變通話者的原始語音,功能比較單一, 不能隱藏通話方的身份,缺乏新穎性、娛樂性,不能滿足用戶的個(gè)性化需求。
現(xiàn)在還沒有基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話方法。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話方 法,旨在解決現(xiàn)在還沒有基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話方法的問題。
本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的, 一種基于即時(shí)通訊系統(tǒng)的語音通話方法,所
述方法包括下述步驟
即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求,接收到即
時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后,建立與即時(shí)通訊客戶端B之間的
變調(diào)語音通話通道;
即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理,得到變調(diào)語音; 即時(shí)通訊客戶端A通過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)
通訊客戶端B。本發(fā)明實(shí)施例的另 一 目的在于提供一種基于即時(shí)通訊系統(tǒng)的語音通話系
統(tǒng),所述系統(tǒng)包括
請(qǐng)求發(fā)送單元,接收用戶輸入的變調(diào)語音通話請(qǐng)求信息,向通話對(duì)方發(fā)送 變調(diào)語音通話請(qǐng)求,接收返回的變調(diào)語音通話應(yīng)答,建立變調(diào)語音通話通道, 生成變調(diào)信息并發(fā)送;
語音采集單元,采集輸入的語音信息,并將采集到的語音信息轉(zhuǎn)化為計(jì)算 機(jī)可以識(shí)別和處理的數(shù)字語音信息;
變調(diào)處理單元,接收到所述請(qǐng)求發(fā)送單元發(fā)送的變調(diào)信息后,將所述語音 采集單元得到的數(shù)字語音信息進(jìn)行變調(diào)處理,得到與所述數(shù)字語音信息對(duì)應(yīng)的 變調(diào)語音;以及
語音發(fā)送單元,通過所述請(qǐng)求發(fā)送單元建立的變調(diào)語音通話通道發(fā)送所述 變調(diào)處理單元得到的變調(diào)語音。
在本發(fā)明實(shí)施例中,將即時(shí)通訊系統(tǒng)中采集到的語音信號(hào)先進(jìn)行語音變調(diào) 處理,實(shí)現(xiàn)了基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話,為基于即時(shí)通訊場(chǎng)合下的語 音通信帶來極大的娛樂效果,給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn), 增加用戶對(duì)即時(shí)通訊產(chǎn)品的依賴性,從而提升產(chǎn)品竟?fàn)幜Γ⑶覟檎Z音通話用 戶提供嶄新的業(yè)務(wù)體驗(yàn)。
圖1是本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話方法的實(shí)現(xiàn)流程
圖2是本發(fā)明另一實(shí)施例提供的語音通信通道基于即時(shí)通訊系統(tǒng)的語音通 話方法的實(shí)現(xiàn)流程圖3是本發(fā)明實(shí)施例提供的即時(shí)通訊客戶端B接收到即時(shí)通訊客戶端A發(fā) 送的變調(diào)語音通話凄丈據(jù)的處理流程圖4是本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話系統(tǒng)的結(jié)構(gòu)圖;圖5是本發(fā)明另一實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施例方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí) 施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例^又 僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
在本發(fā)明實(shí)施例中,即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送語音變調(diào) 請(qǐng)求,并與即時(shí)通訊客戶端B之間建立了變調(diào)語音通話通道后,對(duì)采集的原始 語音進(jìn)行變調(diào)處理,得到與原始語音對(duì)應(yīng)的變調(diào)語音,并將該變調(diào)語音通過建 立的變調(diào)語音通話通道發(fā)送至即時(shí)通訊客戶端B, /人而實(shí)現(xiàn)即時(shí)通訊系統(tǒng)中各 即時(shí)通訊客戶端之間的變調(diào)語音通話。
圖1示出了本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的語音通話方法的實(shí)現(xiàn) 流程,詳述如下
1 、即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求。
2、 即時(shí)通訊客戶端B在接收到即時(shí)通訊客戶端A發(fā)送的變調(diào)語音通話請(qǐng) 求后,對(duì)該變調(diào)語音通話請(qǐng)求作出應(yīng)答,并將應(yīng)答信息返回至即時(shí)通訊客戶端 A。當(dāng)即時(shí)通訊客戶端A接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后, 建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道。
為了成功建立通話通道,即時(shí)通訊客戶端A和即時(shí)通訊客戶端B在即時(shí)通 訊服務(wù)器的協(xié)調(diào)下,建立變調(diào)語音通話通道。當(dāng)然,即時(shí)通訊客戶端A可以透 明或者非透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求。如果即時(shí)通訊客 戶端A透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求,此過程即時(shí)通訊客 戶端B界面上不用顯示。
3、 即時(shí)通訊客戶端A對(duì)釆集的原始語音進(jìn)行變調(diào)處理,得到與原始語音 對(duì)應(yīng)的變調(diào)語音。在本發(fā)明實(shí)施例中,提供了多種語音變調(diào)方式,如改變語音的音調(diào)、性別 變聲(男聲變女聲、女聲變男聲)、年齡變聲(青少年的聲音變老年人的聲音)、 將用戶原始話音變?yōu)槟持宋锏穆曇?、在用戶聲音上加入背景聲?嚴(yán)格意 義上,在用戶聲音上加入背景聲音并不屬于語音變調(diào)處理,而屬于混音技術(shù), 但本發(fā)明所定義的變調(diào)語音通話包含此類應(yīng)用)等。其中對(duì)采集的原始語音進(jìn)行變調(diào)處理,得到與原始語音對(duì)應(yīng)的變調(diào)語音的具體過程如下A、 采集用戶輸入的語音信息,并將采集的語音信息處理成計(jì)算機(jī)可以識(shí) 別和處理的數(shù)字語音信息;B、 對(duì)該數(shù)字語音信息進(jìn)行變調(diào)處理,得到與該數(shù)字語音信息對(duì)應(yīng)的變調(diào) 語音。在本實(shí)施例中,語音變調(diào)處理可以使用線性預(yù)測(cè)(LinearPrediction, LP)分析合成語音^)t型將數(shù)字語音信號(hào)分解為譜包絡(luò)部分(由線性預(yù)測(cè)編碼(Linear predictive coding, LPC )系數(shù)表示)和激勵(lì)部分(由LPC的殘差表示);然后 在LPC系數(shù)上提取共振峰頻率和頻譜傾斜參數(shù),再通過矢量量化碼書法來實(shí)現(xiàn) 語音轉(zhuǎn)換。在轉(zhuǎn)換函數(shù)的選擇上,頻率包絡(luò)轉(zhuǎn)換可以使用矢量量化法,對(duì)韻律 (主要是基音周期)的轉(zhuǎn)換可以使用時(shí)域基音同步疊加(time domain pitch synchronous overlap-add, TD-P S OLA)算法。在本實(shí)施例中,對(duì)原始語音進(jìn)行變調(diào)處理的語音變調(diào)方式可以由用戶根據(jù) 提供的語音變調(diào)方式向即時(shí)通訊客戶端A輸入用戶選4奪信息,由輸入的用戶選 才奪信息確定語音變調(diào)方式。為了給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn),即時(shí)通訊服務(wù)提供商 可以將語音變調(diào)或其中的部分語音變調(diào)方式作為增值服務(wù)項(xiàng)目,在本發(fā)明實(shí)施 例中,提供的語音變調(diào)方式由變調(diào)方用戶在即時(shí)通訊系統(tǒng)中的授權(quán)變調(diào)信息確 定。在即時(shí)通訊客戶端A用戶選擇語音變調(diào)方式前,用戶通過即時(shí)通訊客戶端 A向服務(wù)器發(fā)送用戶的授權(quán)變調(diào)方式查詢信息,服務(wù)器根據(jù)該用戶在即時(shí)通訊系統(tǒng)中的身份標(biāo)識(shí)返回授權(quán)變調(diào)信息,即該用戶可使用的語音變調(diào)方式。即時(shí) 通訊客戶端A根據(jù)服務(wù)器返回的授權(quán)變調(diào)信息輸入用戶選擇信息。當(dāng)然,也可
以根據(jù)用戶選擇信息、授權(quán)變調(diào)信息,用其他的業(yè)務(wù)選擇邏輯確定變調(diào)方式; 當(dāng)用戶只有一種可使用的語音變調(diào)方式時(shí),可以只由授權(quán)變調(diào)信息確定變調(diào)方 式。
由于語音變調(diào)處理是以用戶的原始語音信號(hào)作為基礎(chǔ)的,為了向用戶提供 更合適的語音變調(diào)方式以保證變調(diào)后的聲音能被通信對(duì)方所辨識(shí),作用本發(fā)明 的另一個(gè)優(yōu)選實(shí)施例,對(duì)原始語音進(jìn)行變調(diào)處理的語音變調(diào)方式還要考慮用戶 個(gè)性特征信息,即主要是用戶原始話音中的音段特征。此時(shí),變調(diào)方式,根據(jù) 用戶選捧信息及用戶個(gè)性特征信息,或者用戶選擇信息、授權(quán)變調(diào)信息及用戶 個(gè)性特征信息,由業(yè)務(wù)選擇邏輯確定。在客戶端A接收到用戶選擇信息后,對(duì) 用戶的原始語音信號(hào)進(jìn)行分析,得到其個(gè)性特征信息,當(dāng)其個(gè)性特征信息無法 滿足語音變調(diào)處理的要求時(shí),需要對(duì)用戶的語音變調(diào)方式請(qǐng)求進(jìn)行修正,例如 某用戶原始聲音較粗且嘶啞,而其選擇的語音變調(diào)方式為"低齡兒童",此時(shí) 的變調(diào)效果會(huì)很差(不易為對(duì)方識(shí)別為"童音"),于是系統(tǒng)應(yīng)建議用戶重新 選擇語音變調(diào)方式。
為了提高通話接收方所聽到的話音質(zhì)量,向用戶提供更合適的語音變調(diào)方 式,作為本發(fā)明的又一個(gè)優(yōu)選實(shí)施例,語音變調(diào)方式確認(rèn)還要考慮對(duì)方語音環(huán) 境信息。此時(shí),變調(diào)方式,根據(jù)用戶選4奪信息及對(duì)方語音環(huán)境信息,或者用戶 選擇信息、授權(quán)變調(diào)信息及對(duì)方語音環(huán)境信息,由業(yè)務(wù)選才奪邏輯確定。即時(shí)通 訊客戶端B向即時(shí)通訊客戶端A返回變調(diào)語音通話請(qǐng)求應(yīng)答時(shí),同時(shí)返回其自 身的語音環(huán)境信息。該語音環(huán)境信息可以由即時(shí)通訊客戶端B用戶選擇,或者 由即時(shí)通訊客戶端B根據(jù)麥克風(fēng)采集到的聲音信號(hào)分析得到等等。
在本發(fā)明實(shí)施例中,即時(shí)通訊客戶端A的語音變調(diào)方式可以由i受^l變調(diào)信 息、用戶個(gè)性特征信息、對(duì)方語音環(huán)境信息等信息的一項(xiàng)或多項(xiàng)及用戶選擇信 息,由業(yè)務(wù)選擇邏輯確定。業(yè)務(wù)選擇邏輯為即時(shí)通訊服務(wù)提供商所定義,以明確指出何等的授權(quán)變調(diào)信息、怎樣的語音通信環(huán)境可以享受多少項(xiàng)變調(diào)語音服 務(wù)(例如"男聲變女聲"為一項(xiàng)變調(diào)語音服務(wù))等。在本發(fā)明實(shí)施例中,由于采集的語音信息中可能包含回音、噪聲等不利于 處理、傳輸和辨別的信號(hào),因此,為了達(dá)到較好的變調(diào)語音通話效果,改善通 話接收方所聽到的話音質(zhì)量,在對(duì)該數(shù)字語音信息進(jìn)行語音變調(diào)處理之前,對(duì) 數(shù)字語音信息進(jìn)行去噪處理,即進(jìn)行回音抵消、噪聲抑制、信號(hào)增益調(diào)節(jié)等一 種或者多種組合的處理。4、即時(shí)通訊客戶端A將得到的變調(diào)語音通過已經(jīng)建立的變調(diào)語音通話通 道發(fā)送至即時(shí)通訊客戶端B。在本發(fā)明實(shí)施例中,為了便于傳輸變調(diào)語音,即時(shí)通訊客戶端A在發(fā)送變 調(diào)語音前,對(duì)變調(diào)語音進(jìn)行分組、打包處理,得到變調(diào)語音凄t據(jù)包,并將變調(diào) 語音數(shù)據(jù)包發(fā)送至即時(shí)通訊客戶端B。在本發(fā)明實(shí)施例中,為了降低變調(diào)語音數(shù)據(jù)傳輸所需要的帶寬,為實(shí)時(shí)變 調(diào)語音通話創(chuàng)造條件,在對(duì)采集的原始語音進(jìn)行變調(diào)處理后,按照預(yù)設(shè)的編碼 規(guī)則,例如G.729、 G.729A、 G.723.1等,將得到的與原始語音對(duì)應(yīng)的變調(diào)語音 進(jìn)^亍壓縮編石馬。在本發(fā)明實(shí)施例中,為了避免變調(diào)語音在網(wǎng)絡(luò)傳輸過程中由于丟包、差錯(cuò) 等原因造成的信號(hào)失真,在對(duì)變調(diào)語音進(jìn)行壓縮編碼后,再利用信道編碼技術(shù), 對(duì)壓縮編碼后得到的變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理。當(dāng)即時(shí)通訊客戶端B向即時(shí)通訊客戶端A發(fā)送變調(diào)語音通話請(qǐng)求時(shí),其實(shí) 現(xiàn)流程同上,在此不再贅述。可以理解,即時(shí)通訊客戶端A和即時(shí)通訊客戶端 B可以進(jìn)4于單向變調(diào)i吾音通話,也可以進(jìn)4于雙向變調(diào)i吾音通話。上述i吾音通話 基于有線互聯(lián)網(wǎng)絡(luò)或無線互聯(lián)網(wǎng)絡(luò)上的即時(shí)通訊系統(tǒng)。如果通訊即時(shí)通訊客戶端A或者即時(shí)通訊客戶端B中的任意一方4是出中斷 請(qǐng)求、網(wǎng)絡(luò)發(fā)生故障等時(shí),通話結(jié)束,釋放變調(diào)語音通話通道。圖2示出了本發(fā)明實(shí)施例提供的當(dāng)即時(shí)通訊客戶端A與即時(shí)通訊客戶端B之間建立語音通信通道,并在即時(shí)通訊客戶端A與即時(shí)通訊客戶端B之間進(jìn)行 語音通話方法的實(shí)現(xiàn)流程,詳述如下1 、即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送語音通話請(qǐng)求。2、即時(shí)通訊客戶端B在接收到即時(shí)通訊客戶端A發(fā)送的語音通話請(qǐng)求后, 對(duì)該語音通話請(qǐng)求作出應(yīng)答,并將應(yīng)答信息返回至即時(shí)通訊客戶端A。即時(shí)通 訊客戶端A接收到即時(shí)通訊客戶端B返回的語音通話應(yīng)答后,建立與即時(shí)通訊 客戶端B之間的語音通話通道。i吾音通話通道后,即時(shí)通訊客戶端A和即時(shí)通訊客戶端B之間可以^使用該 語音通話通道進(jìn)行語音通話。3 、即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求。4、 即時(shí)通訊客戶端B在接收到即時(shí)通訊客戶端A發(fā)送的變調(diào)語音通話請(qǐng) 求后,對(duì)該變調(diào)語音通話請(qǐng)求作出應(yīng)答,并將應(yīng)答信息返回至即時(shí)通訊客戶端 A。即時(shí)通訊客戶端A接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后, 建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道。變調(diào)語音通話通道建立后,可以釋放先前建立的語音通話通道。當(dāng)然,即 時(shí)通訊客戶端A可以透明或者非透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話 請(qǐng)求。如果即時(shí)通訊客戶端A透明地向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng) 求,此過程即時(shí)通訊客戶端B界面上不用顯示。5、 即時(shí)通訊客戶端A對(duì)采集的原始語音進(jìn)行變調(diào)處理,得到與原始語音 對(duì)應(yīng)的變調(diào)語音。6、 即時(shí)通訊客戶端A將得到的變調(diào)語音通過已經(jīng)建立的變調(diào)語音通話通 道發(fā)送至即時(shí)通訊客戶端B 。7、 通話結(jié)束,lf;改變調(diào)語音通話通道。如果通訊即時(shí)通訊客戶端A或者即時(shí)通訊客戶端B中的任意一方提出中斷 請(qǐng)求、網(wǎng)絡(luò)發(fā)生故障等時(shí),通話結(jié)束,釋放變調(diào)語音通話通道。其中,即時(shí)通訊客戶端B接收到即時(shí)通訊客戶端A發(fā)送的變調(diào)語音通話數(shù)據(jù)后,對(duì)通話數(shù)據(jù)的處理流程與普通語音通話中的處理流程相同,處理流程如
圖3所示,詳述如下
在步驟S301中,通話數(shù)據(jù)接收、解包;
通過已經(jīng)建立的變調(diào)語音通話通道接收分組通話數(shù)據(jù),按照與即時(shí)通訊客 戶端A相同的網(wǎng)絡(luò)傳輸協(xié)議進(jìn)行數(shù)據(jù)包解包,并將分組數(shù)據(jù)組裝,得到壓縮碼
流o
在步驟S302中,將解包后的數(shù)據(jù)解碼為語音信號(hào); 將解包后的壓縮碼流采用即時(shí)通訊客戶端A編碼運(yùn)算的逆運(yùn)算進(jìn)行解碼, 得到可^皮人耳識(shí)別的原始語音信號(hào)。
在步驟S303中,語音信號(hào)增強(qiáng)處理;
由于網(wǎng)絡(luò)傳輸、語音信號(hào)壓縮和語音變調(diào)處理等都可能造成信號(hào)的失真, 需要對(duì)解碼得到的原始語音信號(hào)進(jìn)行信號(hào)增強(qiáng)處理。信號(hào)增強(qiáng)處理可以采用卡
爾曼濾波法、短時(shí)譜幅度的最小均方誤差估計(jì)法、或者自適應(yīng)濾波法等。 在步驟S304中,輸出增強(qiáng)處理后的語音信號(hào)。
通過輸出設(shè)備,例如耳機(jī)、音箱、聲卡等將增強(qiáng)處理后的語音信號(hào)輸出。
為了得到可正確解碼的語音比特流,在本發(fā)明實(shí)施例中,在數(shù)據(jù)接收、組 包后,將解包后的數(shù)據(jù)進(jìn)行逆冗余/容錯(cuò)處理,去除即時(shí)通訊客戶端A加入壓縮 碼流中的冗余信號(hào),》務(wù)改或者丟棄其中的錯(cuò)誤數(shù)據(jù)。
圖4示出了本發(fā)明實(shí)施例提供的基于即時(shí)通訊系統(tǒng)的i吾音通話系統(tǒng)的結(jié) 構(gòu),為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。
該系統(tǒng)可以用于各種即時(shí)通訊客戶端設(shè)備,例如計(jì)算機(jī)、筆記本電腦、個(gè) 人數(shù)字助理(Personal Digital Assistant, PDA)、智能手機(jī)等,可以是運(yùn)行于這 些設(shè)備內(nèi)的軟件單元、硬件單元或者軟硬件相結(jié)合的單元,也可以作為獨(dú)立的 掛件集成到這些設(shè)備中或者運(yùn)行于這些設(shè)備的應(yīng)用系統(tǒng)中,其中
請(qǐng)求發(fā)送單元401, 4妄收用戶輸入的變調(diào)語音通話二清求信息,向通話對(duì)方 發(fā)送變調(diào)語音通話請(qǐng)求,接收返回的變調(diào)語音通話應(yīng)答,建立變調(diào)語音通話通道,生成變調(diào)信息,并向變調(diào)處理單元403發(fā)送該變調(diào)信息。在本實(shí)施例中, 變調(diào)信息包含用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或者兩項(xiàng)。
語音采集單元402,采集輸入的語音信息,并將采集到的語音信息轉(zhuǎn)化成 計(jì)算^i可以識(shí)別和處理的^:字語音信息。
變調(diào)處理單元403,接收到請(qǐng)求發(fā)送單元401發(fā)送的變調(diào)信息后,將語音 采集單元402得到的該數(shù)字語音信息進(jìn)行變調(diào)處理,得到與該數(shù)字語音信息對(duì) 應(yīng)的變調(diào)語音。
語音發(fā)送單元404,通過請(qǐng)求發(fā)送單元401建立的變調(diào)語音通話通道發(fā)送 變調(diào)處理單元403得到的變調(diào)語音。
在本發(fā)明實(shí)施例中,變調(diào)處理單元403包括
變調(diào)信息接收模塊4()31,用于接收請(qǐng)求發(fā)送單元401發(fā)送的變調(diào)信息,并 將接收到的變調(diào)信息輸出給業(yè)語音變調(diào)處理模塊4033 。
業(yè)務(wù)邏輯模塊4032,生成語音變調(diào)的業(yè)務(wù)選擇邏輯,并輸出給語音變調(diào)處 理模塊4033。語音變調(diào)的業(yè)務(wù)選擇邏輯由即時(shí)通訊服務(wù)提供商所定義,以明確 指出何等的授權(quán)變調(diào)信息、怎樣的語音通信環(huán)境可以享受多少項(xiàng)變調(diào)語音服務(wù) (例如"男聲變女聲"為一項(xiàng)變調(diào)語音服務(wù))等。
語音變調(diào)處理模塊4033,接收變調(diào)信息接收模塊4031輸出的變調(diào)信息、 業(yè)務(wù)邏輯模塊4032輸出的業(yè)務(wù)選擇邏輯,由接收到的變調(diào)信息、業(yè)務(wù)選擇邏輯 確定語音變調(diào)方式,將語音采集單元402得到的數(shù)字語音信息按照語音變調(diào)方 式進(jìn)行變調(diào)處理,得到與該數(shù)字語音信息對(duì)應(yīng)的變調(diào)語音并輸出。語音變調(diào)處 理模塊4033根據(jù)變調(diào)信息中包含的用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或者兩 項(xiàng),由業(yè)務(wù)選擇邏輯確定語音變調(diào)方式。實(shí)現(xiàn)方式如上所述,不再贅述。
為了向用戶提供更合適的語音變調(diào)方式以保證變調(diào)后的聲音能被通信對(duì)方 所辨識(shí),作用本發(fā)明的一個(gè)優(yōu)選實(shí)施例,變調(diào)處理單元403還包括
用戶特征獲取;f莫塊4034,用于從語音釆集單元402得到的該數(shù)字語音信息 中提取用戶個(gè)性特征,生成用戶個(gè)性特征信息并輸出給語音變調(diào)處理模塊4033。語音變調(diào)處理模塊4033解析出接收到的變調(diào)信息中包含的用戶選擇信 息、授權(quán)變調(diào)信息的一項(xiàng)或者兩項(xiàng),結(jié)合接收到的用戶個(gè)性特征信息,由業(yè)務(wù) 選擇邏輯確定語音變調(diào)方式。
為了提高通話接收方所聽到的話音質(zhì)量,向用戶提供更合適的語音變調(diào)方 式,作為本發(fā)明的另一個(gè)優(yōu)選實(shí)施例,變調(diào)處理單元403還包括
對(duì)方環(huán)境獲取才莫塊4035,接收請(qǐng)求發(fā)送單元401發(fā)送的對(duì)方語音環(huán)境信息 并輸出給語音變調(diào)處理才莫塊4033。在本實(shí)施例中,通話對(duì)方返回的變調(diào)語音通 話應(yīng)答中包含有語音環(huán)境信息,請(qǐng)求發(fā)送單元401根據(jù)接收到語音環(huán)境信息生 成對(duì)方語音環(huán)境信息,并輸出給語音變調(diào)處理模塊4033。語音變調(diào)處理模塊 4033解析出接收到的變調(diào)信息中包含的用戶選擇信息、授權(quán)變調(diào)信息的一項(xiàng)或 者兩項(xiàng),結(jié)合接收到的對(duì)方語音環(huán)境信息,由業(yè)務(wù)選#^邏輯確定語音變調(diào)方式。
當(dāng)然,語音變調(diào)處理模塊4033可以根據(jù)接收到的授權(quán)變調(diào)信息、用戶個(gè)性 特征信息、對(duì)方語音環(huán)境信息等信息的一項(xiàng)或多項(xiàng)及用戶選擇信息,由業(yè)務(wù)選 擇邏輯確定。
為了達(dá)到較好的變調(diào)語音通話效果,改善通話接收方所聽到的話音質(zhì)量, 作為本發(fā)明的再一優(yōu)選實(shí)施例,語音通話系統(tǒng)還包括
去噪單元405,接收語音采集單元402得到的數(shù)字語音信息,進(jìn)行去噪處 理,得到去噪后的數(shù)字語音信息。
為了降低變調(diào)語音數(shù)據(jù)傳輸所需要的帶寬,為實(shí)時(shí)變調(diào)語音通話創(chuàng)造條件, 作為本發(fā)明的再一優(yōu)選實(shí)施例,語音通話系統(tǒng)還包括
編碼單元406,將變調(diào)處理單元403得到的變調(diào)語音進(jìn)行壓縮編碼,得到 的變調(diào)語音比特流。
為了避免變調(diào)語音在網(wǎng)絡(luò)傳輸過程中由于丟包、差錯(cuò)等原因造成的信號(hào)失 真,或者便于傳輸變調(diào)語音,作為本發(fā)明的再一優(yōu)選實(shí)施例,語音通話系統(tǒng)還 包括
優(yōu)化單元407,將變調(diào)處理單元403得到的變調(diào)語音或者編碼單元406得到的變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理,和/或分組、打包處理,并將處理后的
變調(diào)語音數(shù)據(jù)輸出給語音發(fā)送單元404。
如圖4所示,在本實(shí)施例中,優(yōu)化單元包括
冗余增強(qiáng)處理模塊4071,利用信道編碼技術(shù),對(duì)變調(diào)處理單元403得到的 變調(diào)語音或者編碼單元406得到的變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理,輸出處 理后的變調(diào)語音比特流。
分組、打包模塊4072,將接收到的變調(diào)語音數(shù)據(jù)進(jìn)行分組、打包處理,得 到變調(diào)語音數(shù)據(jù)包。分組、打包模塊4072可以接收變調(diào)處理單元403、編碼單 元406或者冗余增強(qiáng)處理模塊4071輸出的變調(diào)語音、變調(diào)語音比特流。
當(dāng)然,優(yōu)化單元可以只包括冗余增強(qiáng)處理模塊4071或者分組、打包模塊 4072。
如圖5所示,為了使語音通話系統(tǒng)能夠接收處理語音信息,作為本發(fā)明的 再一優(yōu)選實(shí)施例,語音通話系統(tǒng)還包括
請(qǐng)求應(yīng)答單元408,接收變調(diào)語音通話請(qǐng)求,并返回變調(diào)語音通話應(yīng)答, 生成語音接收觸發(fā)信息并輸出給語音接收單元409。
語音接收單元409,接收到請(qǐng)求應(yīng)答單元408輸出的語音接收觸發(fā)信息后, 接收分組通話數(shù)據(jù),按照與通話對(duì)方相同的網(wǎng)絡(luò)傳輸協(xié)議進(jìn)行數(shù)據(jù)包解包,并 將分組數(shù)據(jù)組裝,得到壓縮碼流并輸出。
解碼單元410,將語音接收單元409得到的數(shù)據(jù),即壓縮碼流,解碼為語 音信號(hào)。
語音信號(hào)增強(qiáng)處理單元411,將解碼單元410得到的數(shù)據(jù)解碼,得到原始 語音信號(hào)并進(jìn)行信號(hào)增強(qiáng)處理,得到增強(qiáng)處理后的語音信號(hào)。
語音輸出單元412,將得到的增強(qiáng)處理后的語音信號(hào)輸出,可以為耳機(jī)、 音箱、聲卡等。
為了改善通話接收方所聽到的話音質(zhì)量,在本發(fā)明實(shí)施例中,語音通話系 統(tǒng)還包括逆冗余/容錯(cuò)處理單元413,去除語音接收單元409得到的通話對(duì)方加入壓 縮碼流中的冗余信號(hào),修改或丟棄其中的錯(cuò)誤數(shù)據(jù)。
在本發(fā)明實(shí)施例中,將即時(shí)通訊系統(tǒng)中采集到的語音信號(hào)先進(jìn)行語音變調(diào) 處理,實(shí)現(xiàn)了基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話,為基于即時(shí)通訊場(chǎng)合下的語 音通信帶來極大的娛樂效果,給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn), 增加用戶對(duì)即時(shí)通訊產(chǎn)品的依賴性,^v而l^升產(chǎn)品竟?fàn)幜?。并且為語音通話用 戶提供嶄新的業(yè)務(wù)體^r,例如用變調(diào)語音通話來達(dá)到保護(hù)用戶身份信息的目 的。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā) 明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明 的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種基于即時(shí)通訊系統(tǒng)的語音通話方法,其特征在于,所述方法包括下述步驟即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求,接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后,建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道;即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理,得到變調(diào)語音;即時(shí)通訊客戶端A通過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)通訊客戶端B。
2、 如權(quán)利要求1所述的方法,其特征在于,所述即時(shí)通訊客戶端A對(duì)輸 入的原始語音信號(hào)進(jìn)行變調(diào)處理,得到變調(diào)語音的步驟具體為采集輸入的原始語音,轉(zhuǎn)化成數(shù)字語音信息; 對(duì)所述數(shù)字語音信息進(jìn)行變調(diào)處理。
3、 如權(quán)利要求1所述的方法,其特征在于,所述即時(shí)通訊客戶端A對(duì)輸 入的原始語音信號(hào)進(jìn)行變調(diào)處理的變調(diào)方式,根據(jù)用戶選擇信息、授權(quán)變調(diào)信 息的一項(xiàng)或者兩項(xiàng),由業(yè)務(wù)選擇邏輯確定。
4、 如權(quán)利要求3所述的方法,其特征在于,變調(diào)方式還根據(jù)用戶個(gè)性特征 信息或者對(duì)方語音環(huán)境信息的一項(xiàng)或者兩項(xiàng),由業(yè)務(wù)選擇邏輯確定。
5、 如權(quán)利要求3或4所述的方法,其特征在于,所述授權(quán)變調(diào)方式由服務(wù) 器根據(jù)即時(shí)通訊客戶端A用戶在即時(shí)通訊系統(tǒng)中的身份標(biāo)識(shí)返回。
6、 如權(quán)利要求2所述的方法,其特征在于,在對(duì)所述數(shù)字語音信息進(jìn)行語 音變調(diào)處理的步驟之前,所述方法還包括對(duì)所述數(shù)字語音信息進(jìn)行去噪處理。
7、 如權(quán)利要求1所述的方法,其特征在于,在所述即時(shí)通訊客戶端A對(duì) 輸入的原始語音信號(hào)進(jìn)行變調(diào)處理,得到變調(diào)語音的步驟之后,所述方法還包 括對(duì)所述變調(diào)語音進(jìn)行壓縮編碼和/或冗余增強(qiáng)處理。
8、 如權(quán)利要求1所述的方法,其特征在于,在所述即時(shí)通訊客戶端A通 過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)通訊客戶端B的步驟之 前,所述方法還包括對(duì)變調(diào)語音進(jìn)行分組、打包處理。
9、 一種基于即時(shí)通訊系統(tǒng)的語音通話系統(tǒng),其特征在于,所述系統(tǒng)包括 請(qǐng)求發(fā)送單元,接收用戶輸入的變調(diào)語音通話請(qǐng)求信息,向通話對(duì)方發(fā)送變調(diào)語音通話請(qǐng)求,接收返回的變調(diào)語音通話應(yīng)答,建立變調(diào)語音通話通道, 生成變調(diào)信息并發(fā)送;語音采集單元,采集輸入的語音信息,并將采集到的語音信息轉(zhuǎn)化為計(jì)算 機(jī)可以識(shí)別和處理的數(shù)字語音信息;變調(diào)處理單元,接收到所述請(qǐng)求發(fā)送單元發(fā)送的變調(diào)信息后,將所述語音 采集單元得到的數(shù)字語音信息進(jìn)行變調(diào)處理,得到與所述數(shù)字語音信息對(duì)應(yīng)的 變調(diào)語音;以及語音發(fā)送單元,通過所述請(qǐng)求發(fā)送單元建立的變調(diào)語音通話通道發(fā)送所述 變調(diào)處理單元得到的變調(diào)語音。
10、 如權(quán)利要求9所述的語音通話系統(tǒng),其特征在于,所述變調(diào)處理單元 包括變調(diào)信息接收模塊,用于接收所述請(qǐng)求發(fā)送單元發(fā)送的變調(diào)信息,并將接 收到的所述變調(diào)信息輸出;業(yè)務(wù)邏輯模塊,生成語音變調(diào)的業(yè)務(wù)選擇邏輯并輸出;以及 語音變調(diào)處理模塊,接收所述變調(diào)信息接收模塊輸出的變調(diào)信息、業(yè)務(wù)邏 輯模塊輸出的業(yè)務(wù)選擇邏輯,由接收到的所述變調(diào)信息、業(yè)務(wù)選擇邏輯確定語 音變調(diào)方式,將所述語音采集單元得到的數(shù)字語音信息按照所述語音變調(diào)方式 進(jìn)行變調(diào)處理,得到與所述數(shù)字語音信息對(duì)應(yīng)的變調(diào)語音并輸出。
11、 如權(quán)利要求IO所述的語音通話系統(tǒng),其特征在于,所述變調(diào)處理單元包括用戶特征獲取模塊,用于從所述語音采集單元得到的該數(shù)字語音信息中提 取用戶個(gè)性特征,生成用戶個(gè)性特征信息并輸出給所述語音變調(diào)處理模塊;和/ 或?qū)Ψ江h(huán)境獲耳又一莫塊,接收所述請(qǐng)求發(fā)送單元發(fā)送的對(duì)方語音環(huán)境信息并輸 出給所述語音變調(diào)處理模塊。
12、 如權(quán)利要求9所述的語音通話系統(tǒng),其特征在于,所述語音通話系統(tǒng) 還包括去噪單元,接收所述語音采集單元得到的數(shù)字語音信息,進(jìn)行去噪處理, 得到去噪后的數(shù)字語音信息;編碼單元,將所述變調(diào)處理單元得到的變調(diào)語音進(jìn)行壓縮編碼,得到變調(diào) 語音比特流;或者優(yōu)化單元,將所述變調(diào)處理單元得到的變調(diào)語音或者所述編碼單元得到的 變調(diào)語音比特流進(jìn)行冗余增強(qiáng)處理,和/或分組、打包處理,并將處理后的變調(diào) 語音數(shù)據(jù)輸出給所述語音發(fā)送單元。
13、 如權(quán)利要求9至12任一權(quán)利要求所述的語音通話系統(tǒng),其特征在于, 所述系統(tǒng)還包括請(qǐng)求應(yīng)答單元,接收變調(diào)語音通話請(qǐng)求,并返回變調(diào)語音通話應(yīng)答,生成 語音接收觸發(fā)信息并輸出。語音接收單元,接收到所述請(qǐng)求應(yīng)答單元輸出的語音接收觸發(fā)信息后,接 收分組通話數(shù)據(jù),按照與通話對(duì)方相同的網(wǎng)絡(luò)傳輸協(xié)議進(jìn)行數(shù)據(jù)包解包,并將 分組lt據(jù)組裝,得到壓縮碼流;解碼單元,將所述語音接收單元得到的數(shù)據(jù),解碼為語音信號(hào);語音信號(hào)增強(qiáng)處理單元,將所述解碼單元得到的數(shù)據(jù)解碼,得到原始語音 信號(hào)并進(jìn)行信號(hào)增強(qiáng)處理,得到增強(qiáng)處理后的語音信號(hào);以及語音輸出單元,將所述語音信號(hào)增強(qiáng)處理單元得到的所述增強(qiáng)處理后的語音信號(hào)輸出。
全文摘要
本發(fā)明適用于通信領(lǐng)域,提供了一種基于即時(shí)通訊系統(tǒng)的語音通話方法及系統(tǒng),所述方法包括下述步驟即時(shí)通訊客戶端A向即時(shí)通訊客戶端B發(fā)送變調(diào)語音通話請(qǐng)求,接收到即時(shí)通訊客戶端B返回的變調(diào)語音通話應(yīng)答后,建立與即時(shí)通訊客戶端B之間的變調(diào)語音通話通道;即時(shí)通訊客戶端A對(duì)輸入的原始語音信號(hào)進(jìn)行變調(diào)處理,得到變調(diào)語音;即時(shí)通訊客戶端A通過所述變調(diào)語音通話通道將所述變調(diào)語音發(fā)送至即時(shí)通訊客戶端B。本發(fā)明將即時(shí)通訊系統(tǒng)中采集到的語音信號(hào)先進(jìn)行語音變調(diào)處理,實(shí)現(xiàn)了基于即時(shí)通訊系統(tǒng)的變調(diào)語音通話,為基于即時(shí)通訊場(chǎng)合下的語音通信帶來極大的娛樂效果,給傳統(tǒng)即時(shí)通訊服務(wù)帶來新的增值服務(wù)增長(zhǎng)點(diǎn),增加用戶對(duì)即時(shí)通訊產(chǎn)品的依賴性,從而提升產(chǎn)品競(jìng)爭(zhēng)力。
文檔編號(hào)G10L21/013GK101304391SQ20081006826
公開日2008年11月12日 申請(qǐng)日期2008年6月30日 優(yōu)先權(quán)日2008年6月30日
發(fā)明者李大龍, 盛馥鐘, 鄭全戰(zhàn) 申請(qǐng)人:騰訊科技(深圳)有限公司