專利名稱:語音通信系統(tǒng)的自動化失真檢測的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的特定實(shí)施例大體涉及語音通信系統(tǒng)。
背景技術(shù):
諸如傳統(tǒng)公共交換電話網(wǎng)(PSTN)電話系統(tǒng)、蜂窩電話系統(tǒng)和陸地移動無線電系 統(tǒng)之類的語音通信系統(tǒng)可能遭遇到由于麥克風(fēng)失真而導(dǎo)致的語音劣化。在具體示例中,即 按即說(push-to-talk, PTT)通信系統(tǒng)可被緊急響應(yīng)人員用于在彼此之間通信。這些用 戶在諸如例如在燃燒的建筑物中、不穩(wěn)定的犯罪現(xiàn)場等等之類的身心壓力很大的狀況中工 作,并且經(jīng)常遭受到人身威脅或者進(jìn)行有氧身體運(yùn)動。壓力下使用的一個后果是語音可能 由于用戶的動作而失真到無法理解的地步。例如,用戶可能將麥克風(fēng)握持得太靠近嘴部,這 樣可能產(chǎn)生太多的呼吸噪聲或者太大的聲壓,以至于無法進(jìn)行適當(dāng)?shù)恼Z音傳輸。另外,用戶 可能由于其所處的情形而太輕柔或者太響亮地說話,例如,用戶可能因?yàn)樘幱谖kU(xiǎn)中而不 能響亮說話,或者用戶可能很興奮從而太響亮地說話。這常常導(dǎo)致失真,并且聽取說話者說 話的其他用戶無法理解說話者在說什么。通常,來自說話者的通信可能非常重要,因此用戶 理解說話者說的話是很重要的。
圖1示出了用于在語音通信系統(tǒng)中提供語音質(zhì)量保證的系統(tǒng)的示例。 圖2示出了語音分析器的更詳細(xì)示例。 圖3示出了用于確定反饋信息的方法的簡化流程圖。 圖4示出了用于分析語音信息的方法的簡化流程圖。
具體實(shí)施方式
fi^ 在一個實(shí)施例中,提供了一種用于提供語音質(zhì)量保證的方法。該方法為語音通信 系統(tǒng)中的一端點(diǎn)確定語音信息。語音信息可來自入口麥克風(fēng)(ingress microphone)。該方 法基于對語音信息的分析來判定是否認(rèn)為語音質(zhì)量劣化。例如,語音信息可表明其失真了、 太響亮、太輕柔、遭遇外部噪聲,等等。如果認(rèn)為語音質(zhì)量劣化,則確定反饋信息,其中反饋 信息被設(shè)計(jì)為在說話用戶的入口點(diǎn)處改善語音質(zhì)量。反饋信息隨后在所述端點(diǎn)處被輸出給 使用所述端點(diǎn)的用戶。
示例件實(shí)施例 圖1示出了用于在語音通信系統(tǒng)中提供語音質(zhì)量保證的系統(tǒng)的示例。在一個實(shí)施 例中,可提供即按即說(PTT)系統(tǒng)。即按即說系統(tǒng)可以是因特網(wǎng)協(xié)議(IP)互用性和協(xié)作系 統(tǒng)(Internet Protocol interoperability andcollaboration system, IPICS)語音通信 系統(tǒng)。IPICS語音通信系統(tǒng)可通過IP網(wǎng)絡(luò)102發(fā)送無線電流量,并且使得用戶能夠與諸如 無線電裝置、固定或移動電話、個人計(jì)算機(jī)等等之類的不同類型的用戶設(shè)備通信。在即按即
4說系統(tǒng)中,用戶可以表明想要講話。例如,用戶可以按壓或選擇講話按鈕。該用戶隨后在適 當(dāng)時(例如,當(dāng)其他用戶當(dāng)前未請求講話并且被給予講話許可時)被允許說話。系統(tǒng)中的 所有用戶于是都可聽見該用戶在說什么。雖然討論了即按即說語音通信系統(tǒng),但是應(yīng)當(dāng)理 解,將會明了其他通信系統(tǒng)。例如,特定的實(shí)施例可用于移動電話交談、視頻會議等等之中。
在語音通信系統(tǒng)中,可設(shè)置各種端點(diǎn)104。例如,端點(diǎn)104不僅可包括即按即說電 話,還可包括無線電手持機(jī)、IP電話、膝上型PC客戶端、PSTN電話、蜂窩電話、智能電話等 等。如圖所示,端點(diǎn)104-1是IP電話,端點(diǎn)104-2是即按即說管理中心(PMC),其包括由用 戶操作的手持機(jī)104-3。 PMC可以是為個人計(jì)算機(jī)用戶實(shí)現(xiàn)即按即說(PTT)功能的應(yīng)用。它
使得用戶可以在辦公室或從遠(yuǎn)程地點(diǎn)通過多條通信信道通信或者監(jiān)視這些通信信道的廣 播。另夕卜,端點(diǎn)104-4是可通過無線電接入網(wǎng)絡(luò)(RAN) 106連接的蜂窩電話。RAN 106可以 是用于移動通信系統(tǒng)的任何接入網(wǎng)絡(luò)。端點(diǎn)104-5可以是無線電設(shè)備,例如陸地移動無線 電裝置,其連接到陸地移動無線電網(wǎng)關(guān)(LMRG) 104-5。 用戶可以在語音通信系統(tǒng)中與彼此通信。在用戶說話時,可能發(fā)生失真。語音質(zhì) 量劣化可能由于用戶對著麥克風(fēng)說話的方式而發(fā)生。如果初始語音信號在麥克風(fēng)入口點(diǎn)處 失真,那么下游端點(diǎn)104處的改善就只是最低限度且很有限的了。例如,如果在出口電路中 的模數(shù)或數(shù)模轉(zhuǎn)換點(diǎn)處有不正確的音量,那么諸如自動增益控制(AGC)之類的傳輸處理技 術(shù)在某些情況下可以改善聲音質(zhì)量?;旧?,AGC增大或減小音量。然而,如果初始模擬信 號在麥克風(fēng)入口點(diǎn)處(即,用戶對著麥克風(fēng)說話之處)失真,那么在下游信號處理單元處能 夠?qū)崿F(xiàn)的改善量就是有限的了 。例如,如果信號在麥克風(fēng)處失真,那么在接收該信號的端點(diǎn) 104處是無法實(shí)質(zhì)上改善該信號的。 語音分析器108被配置為分析來自說話者的端點(diǎn)104的語音信號。如果檢測到語 音質(zhì)量劣化,則語音分析器108可檢測何時在入口點(diǎn)(例如,說話者的麥克風(fēng))處有語音質(zhì) 量劣化。當(dāng)發(fā)生語音質(zhì)量劣化時,生成對說話者的反饋信息。例如,反饋信息可向用戶表明 某種語音質(zhì)量劣化正在發(fā)生并建議進(jìn)行改變或采取動作。反饋信息提供關(guān)于用戶可如何更 改輸入到麥克風(fēng)中的語音信號的信息。例如,語音分析器108可以檢測到由于過度驅(qū)動麥 克風(fēng)而導(dǎo)致的失真,并且提醒用戶相應(yīng)地移動麥克風(fēng)。另外,如果檢測到說話者講話時麥克 風(fēng)太靠近嘴部,則反饋信息可以向說話者表明應(yīng)當(dāng)調(diào)整麥克風(fēng)位置或輸入音量。另外,麥克 風(fēng)處的低功率信號可被檢測到,并且提醒用戶更響亮地說話。這可以減輕交談中的其他端 點(diǎn)放大信號的需求,而放大信號可能產(chǎn)生放大噪聲這一不合需要的副作用。另外,語音分析 器108可以檢測由于端用戶的呼吸而導(dǎo)致的噪聲,并且提醒用戶相應(yīng)地調(diào)整麥克風(fēng)。在另
一實(shí)施例中,系統(tǒng)被配置為檢測心跳信號。在用戶將麥克風(fēng)夾在其胸部附近并且麥克風(fēng)拾 取其跳動的心臟的聲音的情況下,用戶被通知以這一情況并且被建議相應(yīng)地移動麥克風(fēng)。 在另一示例性實(shí)施例中,系統(tǒng)可被編程為檢測外部信號,比如投影儀風(fēng)扇的聲音。在檢測到 該信號的情況下,系統(tǒng)可建議用戶移動麥克風(fēng)以使之遠(yuǎn)離風(fēng)扇。 在一個實(shí)施例中,反饋信息僅被導(dǎo)向引起語音質(zhì)量劣化的說話者。例如,反饋信息 被輸入到該說話者所使用的端設(shè)備104。反饋信息可以以耳語的方式被輸入到端設(shè)備104 的輸出揚(yáng)聲器中,或者可以提供任何其他指示,例如一系列燈。另外,反饋信息可以被發(fā)送 到其他用戶。例如,代理人或調(diào)度員可能希望知道誰在導(dǎo)致語音質(zhì)量劣化以及原因是什么。 另外,反饋信息可被存儲以供以后分析。
5
—旦接收到反饋信息,說話者就可以進(jìn)行調(diào)整。例如,用戶可以調(diào)整麥克風(fēng)或者其 說話的響亮度。因此,通過建議在語音信號在麥克風(fēng)處的入口點(diǎn)之前進(jìn)行改變,可以改善語
音質(zhì)量。 語音分析器108可以設(shè)置于系統(tǒng)中的任何地方。例如,語音分析器108可以在說 話者所使用的端點(diǎn)104中。然而,語音分析器108也可存在于其他組件中,例如PMC 104-2 中,獨(dú)立的語音分析器108中(如服務(wù)器114中所示),等等。另外,語音分析器108可存在 于接收來自說話者的信號的其他端點(diǎn)104中。語音分析器108分析說話者的麥克風(fēng)輸出的 語音信號(即使語音分析器不在說話者的端設(shè)備中也是如此)。因此,希望在說話者端改善 語音質(zhì)量。 圖2示出了語音分析器108的更詳細(xì)示例。語音分析器108可包括語音接收器 202、語音信息分析器204、反饋信息確定器206、以及反饋信息發(fā)送器208。
語音接收器202可接收語音信號。例如,語音信號可以是從說話者的端點(diǎn)104離 開麥克風(fēng)換能器的信號。特定的實(shí)施例希望通過告知說話者其說話的語音質(zhì)量可通過執(zhí)行 某種動作而得到改善,來改善由麥克風(fēng)執(zhí)行的初始聲電轉(zhuǎn)換的質(zhì)量。這是在失真從離開麥 克風(fēng)的信號(其影響交談中的其他用戶)發(fā)生并且在其他端點(diǎn)104處無法被很容易地校正 時。如果離開麥克風(fēng)換能器的信號失真到語音質(zhì)量劣化到高于一定閾值的程度,則可以提 醒說話者這個事實(shí)。用戶可以調(diào)整講話的方式,以改變語音被輸入到麥克風(fēng)中的方式。這 可能是有用的,因?yàn)槿绻Z音質(zhì)量劣化,則語音可能失真,以至于它可能困擾單方或多方交 談中的其他用戶或者甚至使其他用戶無法理解。 語音信號分析器204被配置為分析語音信號以判定信號是否沒有劣化。例如,可 以通過不同的方式來衡量信號劣化。在一個示例中,語音信號分析器204判定信號是否處 于一個被認(rèn)為令人滿意的預(yù)定范圍中。例如,中央系統(tǒng)操作者(例如緊急響應(yīng)情形中的控 制者)選擇語音信號的閾值,例如輸入水平的可接受范圍。輸入水平可以是功率水平。另 外,可以測量動態(tài)范圍,例如測量電壓水平,以判定它是否高于一定水平。在一個實(shí)施例中, 端點(diǎn)104-3的用戶可以利用預(yù)先定義的一組選擇,以可接受的范圍來配置PMC 104-2。另
外,輸入水平的可接受范圍可以通過系統(tǒng)設(shè)定或配置來預(yù)先確定。 語音信號分析器204自動地檢測何時認(rèn)為語音信號劣化。例如,當(dāng)語音信號違犯 一閾值或者偏離輸入水平的可接受范圍時,則語音信號可能劣化了 。例如,利用數(shù)字信號處 理技術(shù)來分析麥克風(fēng)換能器的輸出,以判定是否在發(fā)生語音劣化。數(shù)字信號處理可以分析 信號以判定其是否發(fā)生了劣化。在一個示例中,語音信號可能太響亮、太輕柔、由于物理輸 入(例如說話者的呼吸或者過度的發(fā)送氣音)而失真、存在太多噪聲,等等。如果語音信號 分析器204判定語音信號在可接受范圍之外,則反饋信息確定器206被配置為確定對說話 者的反饋。在另一個示例性實(shí)施例中,語音信號分析器204采用一頻譜分析器,該頻譜分析 器被配置為檢測由于信號的過驅(qū)動而導(dǎo)致的麥克風(fēng)飽和,或者由于低語音信號放大而導(dǎo)致 的基于放大器的噪聲。另外,可利用話音識別來檢測話音的可理解程度。例如,如果話音識 別引擎無法理解大量的字詞,則可以認(rèn)為語音信號發(fā)生了劣化。 在一個實(shí)施例中,可利用非平衡隨機(jī)處理器來濾掉在用戶處于脅迫下時的人類呼 吸突發(fā),并且監(jiān)視傳入話音的平均話音水平,以避免峰值限幅或者低音量情形。這些隨機(jī)處 理器是能夠應(yīng)對非隨機(jī)過程的處理器。例如,可利用音高檢測來檢測呼吸突發(fā),并且可濾掉呼吸突發(fā)。另外,預(yù)測經(jīng)由國際電信聯(lián)盟(ITU)P.563的傳入話音的語音質(zhì)量(平均意見得
分(mean opinion score,M0S)),以檢測可能嚴(yán)重劣化語音質(zhì)量的麥克風(fēng)前飽和。M0S提供
了對傳輸后語音信號的感知質(zhì)量的數(shù)值指示。MOS被表達(dá)為范圍1至5中的單個數(shù)字,其
中1是最低感知質(zhì)量,5是最高感知質(zhì)量。例如,MOS可以預(yù)測所傳輸?shù)恼Z音在用戶聽來是
怎樣的。如果M0S低于一定閾值,比如2,則可以認(rèn)為語音信號發(fā)生了劣化。 語音信號分析器204可以使用一狀態(tài)機(jī),該狀態(tài)機(jī)使用這些技術(shù)來防止假陽性提
醒。例如,該狀態(tài)機(jī)可以使判決基于特定的一組標(biāo)準(zhǔn)。例如,如果用戶太響亮地說話,則系
統(tǒng)可以通過視覺提示來告知用戶以較低的音量說話;然而,如果在向用戶發(fā)送了一定量的
要其降低其音量的信號之后,說話者仍維持其音量水平,則系統(tǒng)可以調(diào)用某種可聽的事物
來吸引說話者的注意。因此,提供了一種用于檢測近端失真的健壯算法。 不同的語音質(zhì)量劣化可能要求不同的通知。這些通知被設(shè)計(jì)為通知端用戶其何時
過驅(qū)動或欠驅(qū)動了麥克風(fēng),并且建議他如何將麥克風(fēng)相對于其嘴部定位在最優(yōu)的位置。例
如,如果說話者太輕柔地說話,則反饋信息應(yīng)當(dāng)表明,說話者應(yīng)當(dāng)更響亮地說話。另外,如
果說話者說話時太靠近麥克風(fēng),則判定反饋信息應(yīng)當(dāng)表明說話者應(yīng)當(dāng)調(diào)整麥克風(fēng)以使之遠(yuǎn)離。 反饋信息可以是一組預(yù)先定義的通知,例如可以提供預(yù)先記錄的語音通知。另外, 可以使用其他反饋信息,例如可以亮起不同的燈模式,以通知用戶采取不同的動作。
當(dāng)反饋信息已被確定時,反饋信息發(fā)送器208將反饋信息輸出到說話者。在一個 實(shí)施例中,只通知說話者,而不通知交談中的其他用戶。在一個示例中,反饋信息可被播放 到或以耳語方式輸入到說話者的輸出揚(yáng)聲器中,例如用戶的耳機(jī)中。例如,預(yù)先記錄的消息 可告知用戶移開麥克風(fēng),更輕柔地說話,移近麥克風(fēng),或者更響亮地說話。另外,被亮起的信 號燈可以提供反饋信息。例如,可點(diǎn)亮不同的燈以表明用戶應(yīng)當(dāng)更響亮或更輕柔地說話。可 以明了其他方法,例如使用多媒體方法,例如顯示、短消息服務(wù)(SMS)消息、即時消息傳遞 (IM)等等。 —旦接收到反饋信息,說話者就可調(diào)整其講話的方式。這可改善通信中的語音質(zhì) 量。因此,這使得交談中的其他用戶無需告知說話者他們無法理解他/她。另外,提供了對 語音質(zhì)量劣化的自動檢測,因此可以非常有效地提醒用戶反饋信息。即,語音質(zhì)量劣化可被 迅速地檢測,從而避免了說話者繼續(xù)講話了很長時間以后才被另外的用戶通知。這在緊急 情形中(此時說話者可能不能自由講話并重復(fù)其所說過的話)可能是非常重要的。
圖3示出了用于確定反饋信息的方法的簡化流程圖。步驟302確定語音信息。例 如,可從麥克風(fēng)接收語音信號。 步驟304可將語音信息發(fā)送到參與講話組的端點(diǎn)104。例如,語音信息被實(shí)時發(fā)送 到交談的其他參與者。此外,執(zhí)行以下分析。在其他實(shí)施例中,語音信息可被排隊(duì),直到該 分析被執(zhí)行為止。 步驟306分析語音信息。例如,語音信息被分析,以查明是否有任何明顯的語音質(zhì) 量劣化,例如失真。 步驟308隨后在檢測到任何語音質(zhì)量劣化的情況下確定反饋信息。所確定的反饋 信息適用于所確定的語音質(zhì)量劣化的類型,并且嘗試校正該問題,從而提高語音質(zhì)量。例 如,提供這樣的智能如果判定用戶說話太輕柔,則反饋信息應(yīng)當(dāng)告知用戶更響亮地說話。類似地,如果系統(tǒng)檢測到用戶在對著麥克風(fēng)呼吸,則用戶被建議將麥克風(fēng)移動到它(麥克 風(fēng))不拾取他呼吸的聲音的地方。 步驟310隨后將反饋信息發(fā)送到說話者。例如,反饋信息可被輸出到說話者。另 外,如果語音分析是在不是說話者所使用的端設(shè)備的設(shè)備中執(zhí)行的,則反饋信息被發(fā)送到 說話者的端設(shè)備,說話者的端設(shè)備隨后可輸出反饋信息。 圖4示出了用于分析語音信息的方法的簡化流程圖。步驟402確定語音質(zhì)量劣化 的原因。語音質(zhì)量劣化可能有很多原因。 步驟404確定針對說話者的消息。該消息可由所檢測到的語音質(zhì)量劣化的種類決 定。該消息可被預(yù)先記錄或者可被動態(tài)生成。例如,取決于語音質(zhì)量劣化的程度,說話者可 被告知在一定方向上將麥克風(fēng)移動一定量。 步驟406隨后確定用于輸出該消息的方法。例如,特定實(shí)施例可分析說話者正在 使用的端點(diǎn)104的類型。然后,確定輸出方法。另外,如果知道用戶所遭遇的情形,則可以 考慮該情形。例如,如果用戶表明其處于任何噪聲都可能有害的情形中,則可以亮燈,而不 是在用戶輸出揚(yáng)聲器中播放消息。 步驟408隨后使得消息被輸出。例如,如果語音分析器108存在于端點(diǎn)104中,則 該消息在端點(diǎn)104處被輸出。如果語音分析器108存在于端點(diǎn)104夕卜,則該消息可通過網(wǎng) 絡(luò)102或通過其他方法被發(fā)送到端點(diǎn)104。端點(diǎn)104隨后可輸出該消息。
雖然已經(jīng)描述了其特定實(shí)施例,但這些特定實(shí)施例只是示例性的,而不是限制性 的。雖然描述了 PTT系統(tǒng),但應(yīng)當(dāng)理解,也可使用其他語音通信系統(tǒng)。 任何適當(dāng)?shù)木幊陶Z言都可用來實(shí)現(xiàn)特定實(shí)施例的例程,所述語言包括C、 C++、 Java、匯編語言等等??梢允褂貌煌木幊碳夹g(shù),例如過程式的或面向?qū)ο蟮?。例程可在?個處理設(shè)備或多個處理器上執(zhí)行。雖然可能以特定的順序來給出步驟、操作或計(jì)算,但是在 不同的特定實(shí)施例中這個順序是可以改變的。在一些特定實(shí)施例中,可以同時執(zhí)行在本說 明書中被示為順序的多個步驟。這里描述的操作序列可以被中斷、暫?;蛘咄ㄟ^其他方式 被另一過程(例如,操作系統(tǒng)、內(nèi)核等等)所控制。例程可在操作系統(tǒng)環(huán)境中工作,或者作 為占用系統(tǒng)處理的所有或?qū)嵸|(zhì)部分的獨(dú)立例程工作??梢酝ㄟ^硬件、軟件或兩者的組合來 執(zhí)行功能。除非另有陳述,否則也可以全部或部分地手工執(zhí)行功能。 在這里的描述中,提供了許多具體細(xì)節(jié),例如組件和/或方法的示例,以幫助全面 理解特定實(shí)施例。但是,有關(guān)領(lǐng)域的技術(shù)人員將會意識到,沒有這些具體細(xì)節(jié)中的一個或多 個,或者利用其他裝置、系統(tǒng)、組合件、方法、組件、素材、部件等等也能實(shí)現(xiàn)特定實(shí)施例。在 其他情況下,沒有具體示出或詳細(xì)描述公知的結(jié)構(gòu)、素材或操作,以避免模糊特定實(shí)施例的 各個方面。 用于特定實(shí)施例的"計(jì)算機(jī)可讀介質(zhì)"可以是任何能夠包含、存儲、傳輸、傳播或傳 送程序以供指令執(zhí)行系統(tǒng)、裝置、系統(tǒng)或設(shè)備使用或與指令執(zhí)行系統(tǒng)、裝置、系統(tǒng)或設(shè)備相 結(jié)合來包含、存儲、傳輸、傳播或傳送程序的介質(zhì)。作為示例而非限制,計(jì)算機(jī)可讀介質(zhì)可以 是電的、磁的、光的、電磁的、紅外的、或半導(dǎo)體的系統(tǒng)、裝置、系統(tǒng)、設(shè)備、傳播介質(zhì)或計(jì)算機(jī)
存儲器。 特定實(shí)施例可以以控制邏輯的形式用軟件或硬件或者兩者的組合來實(shí)現(xiàn)??刂七?輯在被一個或多個處理器執(zhí)行時可以進(jìn)行操作來執(zhí)行特定實(shí)施例所描述的內(nèi)容。
8
"處理器"或"過程"包括任何處理數(shù)據(jù)、信號或其他信息的人類、硬件和/或軟件 系統(tǒng)、機(jī)構(gòu)或組件。處理器可包括具有通用中央處理單元的系統(tǒng)、多個處理單元、用于實(shí)現(xiàn) 功能的專用電路或者其他系統(tǒng)。處理不必限于某個地理位置,也不必有時間限制。例如,處 理器可"實(shí)時地"、"離線地"、"以分批模式"執(zhí)行其功能,等等。處理的一些部分可在不同的 時間、不同的位置、由不同的(或相同的)處理系統(tǒng)執(zhí)行。 本說明書中提到"一個實(shí)施例"、"實(shí)施例"、"具體實(shí)施例"或"特定實(shí)施例"是指結(jié) 合該特定實(shí)施例描述的特定的特征、結(jié)構(gòu)或特性被包括在至少一個實(shí)施例中,但不一定包 括在所有特定實(shí)施例中。因此,本說明書中各處出現(xiàn)的各個短語"在一個實(shí)施例中"、"在實(shí) 施例中"或"在具體實(shí)施例"中不一定指的是同一個實(shí)施例。另外,任何具體實(shí)施例的特定 的特征、結(jié)構(gòu)或特性可以按任何適當(dāng)?shù)姆绞脚c一個或多個其他特定實(shí)施例組合。應(yīng)當(dāng)注意, 基于這里的教導(dǎo)可以對這里描述和圖示出的特定實(shí)施例進(jìn)行其他各種變化和修改,并且這 些變化和修改應(yīng)當(dāng)被認(rèn)為是本發(fā)明的精神和范圍的一部分。 特定實(shí)施例可利用編程的通用數(shù)字計(jì)算機(jī)、專用集成電路、可編程邏輯器件、現(xiàn)場 可編程門陣列來實(shí)現(xiàn),可以使用光的、化學(xué)的、生物的、量子的或納米工程的系統(tǒng)、組件和機(jī) 構(gòu)。 一般來說,特定實(shí)施例的功能可通過本領(lǐng)域已知的任何手段來實(shí)現(xiàn)??梢允褂梅植际?、 聯(lián)網(wǎng)系統(tǒng)、組件和/或電路。數(shù)據(jù)的通信或傳送可以是有線的、無線的或者通過任何其他手 段。 還將明了,根據(jù)特定應(yīng)用,附圖中示出的要素中的一個或多個可以按更分離或更 集成的方式來實(shí)現(xiàn),或者甚至在某些情況下被去除或被停用。實(shí)現(xiàn)可存儲在機(jī)器可讀介質(zhì) 中的程序或代碼以允許計(jì)算機(jī)執(zhí)行上述任何方法也在本發(fā)明的精神和范圍之內(nèi)。
此外,附圖中的任何信號箭頭應(yīng)當(dāng)被認(rèn)為僅是示例性的,而不是限制性的,除非另 有具體指示。另外,除非另有指明,這里使用的術(shù)語"或"一般是要指"和/或"。當(dāng)術(shù)語被 預(yù)見為使分離或組合的能力不清楚時,組件或者步驟的組合也將被認(rèn)為是已經(jīng)記載了的。
這里的描述及權(quán)利要求中各處使用的"a"、"an"和"the"包括復(fù)數(shù)形式,除非上下 文另有清楚記載。另外,這里的描述及所附權(quán)利要求中各處使用的"在...中"的含義包括 "在...中"和"在...上",除非上下文另有清楚記載。 以上對圖示的特定實(shí)施例的描述(包括摘要中描述的內(nèi)容)并不想要毫無遺漏或 者將本發(fā)明限定到這里公開的精確形式。本領(lǐng)域的技術(shù)人員將會意識到并明了,在這里僅 出于示例目的來描述本發(fā)明的具體特定實(shí)施例及其示例,而在本發(fā)明的精神和范圍內(nèi)可以 進(jìn)行各種等同的修改。如上所述,根據(jù)以上對圖示特定實(shí)施例的描述可以對本發(fā)明進(jìn)行這 些修改,并且這些修改將被包括在本發(fā)明的精神和范圍內(nèi)。 因此,雖然已經(jīng)參考本發(fā)明的特定實(shí)施例描述了本發(fā)明,但以上公開中意圖包括 一定范圍的修改、各種變化和替換,并且將會明了,在一些情況下,將會使用特定實(shí)施例的 一些特征,但沒有相應(yīng)地使用其他特征,這不脫離所記載的本發(fā)明的精神和范圍。因此,在 實(shí)質(zhì)范圍和精神內(nèi),可對特定情形或素材進(jìn)行許多修改。希望本發(fā)明不被限制到權(quán)利要求 中使用的特定術(shù)語和/或作為所想到的實(shí)現(xiàn)本發(fā)明的最佳模式而公開的特定實(shí)施例,相反 本發(fā)明將包括落在權(quán)利要求的范圍內(nèi)的任何及所有實(shí)施例和等同物。
9
權(quán)利要求
一種方法,包括為語音通信系統(tǒng)中的端點(diǎn)分析語音信息,以判定語音質(zhì)量是否劣化;如果語音質(zhì)量劣化,則確定反饋信息,該反饋信息被設(shè)計(jì)為在說話的用戶的入口點(diǎn)處改善語音質(zhì)量;以及在所述端點(diǎn)處使所述反饋信息被輸出給使用所述端點(diǎn)的用戶。
2. 如權(quán)利要求1所述的方法,其中,使所述反饋信息被輸出的步驟包括使所述反饋信息在端設(shè)備的輸出揚(yáng)聲器中被輸出。
3. 如權(quán)利要求1所述的方法,其中,使所述反饋信息被輸出的步驟包括使所述反饋信息作為端設(shè)備的視覺輸出被輸出。
4. 如權(quán)利要求1所述的方法,其中,所述反饋信息包括對一動作的建議,所述用戶為了改善語音質(zhì)量應(yīng)當(dāng)執(zhí)行該動作以在進(jìn)入所述入口點(diǎn)之前影響語音。
5. 如權(quán)利要求1所述的方法,其中,分析語音信息的步驟包括將所述語音信息與一閾值相比較;以及判定所述語音信息是否違犯所述閾值。
6. 如權(quán)利要求1所述的方法,其中,確定反饋信息的步驟包括確定語音質(zhì)量劣化的原因;以及基于所確定的發(fā)生語音質(zhì)量劣化的原因,來確定所述反饋信息。
7. 如權(quán)利要求1所述的方法,其中,確定反饋信息和使所述反饋信息被輸出的步驟是在所述用戶的端設(shè)備或者除所述用戶使用的端設(shè)備之外的設(shè)備中執(zhí)行的。
8. 如權(quán)利要求1所述的方法,其中,所述語音信息包括由所述用戶說話時對著的麥克風(fēng)所輸出的語音信號。
9. 如權(quán)利要求1所述的方法,其中,確定反饋信息的步驟包括確定所述語音信息包含說話的用戶的呼吸聲音或心跳聲音,其中所述反饋信息指示基于所述呼吸聲音或心跳聲音來調(diào)整麥克風(fēng)的定位信息。
10. 如權(quán)利要求1所述的方法,其中,對所述語音信息的分析表明被過驅(qū)動或欠驅(qū)動的語音信號,其中,確定反饋信息的步驟包括基于所述被過驅(qū)動或欠驅(qū)動的語音信號來確定用于調(diào)整麥克風(fēng)的定位信息。
11. 如權(quán)利要求1所述的方法,其中,所述語音通信系統(tǒng)是即按即說語音通信系統(tǒng)。
12. 如權(quán)利要求1所述的方法,其中,確定反饋信息的步驟包括基于所述分析來生成所述反饋信息。
13. —種裝置,包括一個或多個處理器;以及被編碼在一個或多個有形介質(zhì)中的邏輯,供所述一個或多個處理器執(zhí)行,并且在被執(zhí)行時可操作以用于為語音通信系統(tǒng)中的端點(diǎn)分析語音信息,以判定語音質(zhì)量是否劣化;如果語音質(zhì)量劣化,則確定反饋信息,該反饋信息被設(shè)計(jì)為在說話的用戶的入口點(diǎn)處改善語音質(zhì)量;以及在所述端點(diǎn)處使所述反饋信息被輸出給使用所述端點(diǎn)的用戶。
14. 如權(quán)利要求13所述的裝置,其中,所述邏輯在被執(zhí)行還可操作以用于使所述反饋信息在端設(shè)備的輸出揚(yáng)聲器中被輸出。
15. 如權(quán)利要求13所述的裝置,其中,所述邏輯在被執(zhí)行還可操作以用于使所述反饋信息作為端設(shè)備的視覺輸出被輸出。
16. 如權(quán)利要求13所述的裝置,其中,所述反饋信息包括對一動作的建議,所述用戶為了改善語音質(zhì)量應(yīng)當(dāng)執(zhí)行該動作以在進(jìn)入所述入口點(diǎn)之前影響語音。
17. 如權(quán)利要求13所述的裝置,其中,所述邏輯在被執(zhí)行還可操作以用于將所述語音信息與一閾值相比較;以及判定所述語音信息是否違犯所述閾值。
18. 如權(quán)利要求13所述的裝置,其中,所述邏輯在被執(zhí)行還可操作以用于確定語音質(zhì)量劣化的原因;以及基于所確定的發(fā)生語音質(zhì)量劣化的原因,來確定所述反饋信息。
19. 如權(quán)利要求13所述的裝置,其中,可操作以用于確定反饋信息和發(fā)送反饋信息的邏輯被設(shè)置在所述用戶的端設(shè)備或者除所述用戶使用的端設(shè)備之外的設(shè)備中。
20. 如權(quán)利要求13所述的裝置,其中,所述語音信息包括由所述用戶說話時對著的麥克風(fēng)所輸出的語音信號。
21. 如權(quán)利要求13所述的裝置,其中,所述邏輯在被執(zhí)行還可操作以用于確定所述語音信息包含說話的用戶的呼吸聲音或心跳聲音,其中所述反饋信息指示基于所述呼吸聲音或心跳聲音來調(diào)整麥克風(fēng)的定位信息。
22. 如權(quán)利要求13所述的裝置,其中,對所述語音信息的分析表明被過驅(qū)動或欠驅(qū)動的語音信號,其中,所述邏輯在被執(zhí)行還可操作以用于基于所述被過驅(qū)動或欠驅(qū)動的語音信號來確定用于調(diào)整麥克風(fēng)的定位信息。
23. 如權(quán)利要求13所述的裝置,其中,所述語音通信系統(tǒng)是即按即說語音通信系統(tǒng)。
24. 如權(quán)利要求13所述的裝置,其中,可操作以用于確定反饋信息的邏輯包括在被執(zhí)行時可操作以用于基于所述分析來生成所述反饋信息的邏輯。
25. —種裝置,包括用于為語音通信系統(tǒng)中的端點(diǎn)分析語音信息以判定語音質(zhì)量是否劣化的裝置;用于在語音質(zhì)量劣化時確定反饋信息的裝置,該反饋信息被設(shè)計(jì)為在說話的用戶的入口點(diǎn)處改善語音質(zhì)量;以及用于在所述端點(diǎn)處使所述反饋信息被輸出給使用所述端點(diǎn)的用戶的裝置。
全文摘要
在一個實(shí)施例中,提供了一種用于提供語音質(zhì)量保證的方法。該方法為語音通信系統(tǒng)中的一端點(diǎn)(104)確定語音信息。語音信息可來自入口麥克風(fēng)。該方法基于對語音信息的分析來判定是否認(rèn)為語音質(zhì)量劣化。例如,語音信息可表明其失真了、太響亮、太輕柔、遭遇外部噪聲,等等。如果認(rèn)為語音質(zhì)量劣化,則確定反饋信息,其中反饋信息被設(shè)計(jì)為在說話用戶的入口點(diǎn)處改善語音質(zhì)量。反饋信息隨后在該端點(diǎn)(104)處被輸出給使用該端點(diǎn)的用戶。
文檔編號H04M3/22GK101766014SQ200880100438
公開日2010年6月30日 申請日期2008年7月15日 優(yōu)先權(quán)日2007年7月26日
發(fā)明者桑莫爾·沙法, 詹姆斯·C·法拉恩塔爾, 邁克爾·P·奧’布賴恩 申請人:思科技術(shù)公司