用于為電話通話的語音到文本轉(zhuǎn)錄確定語言的方法和設(shè)備的制造方法
【專利說明】用于為電話通話的語音到文本轉(zhuǎn)錄確定語言的方法和設(shè)備
[0001]本發(fā)明總體上涉及用于將語音消息轉(zhuǎn)錄成文本的方法、設(shè)備和系統(tǒng)。本發(fā)明更特別地涉及用于確定語音到文本轉(zhuǎn)錄的語言的方法、設(shè)備和系統(tǒng)。
[0002]已經(jīng)開發(fā)了許多轉(zhuǎn)錄系統(tǒng)和方法。例如當(dāng)呼叫者建立連接以給接收者留消息時,通話可能會被轉(zhuǎn)錄代理監(jiān)控或者被轉(zhuǎn)錄算法分析以識別出正確的轉(zhuǎn)錄語言。語音消息然后被代理手動地或者通過轉(zhuǎn)錄算法轉(zhuǎn)錄成文本文件。由現(xiàn)有解決方案提供的手動的語音到文本轉(zhuǎn)錄系統(tǒng)的一個缺點在于需要人力來轉(zhuǎn)錄,由于成本的原因這限制了語音到文本轉(zhuǎn)錄服務(wù)(VTTS)的可用性并且抑制了 VTTS在國家和國際層面上的傳播。由于會涉及不同語言,手動VTTS的傳播需要大量的人力。此外,由于語音到文本轉(zhuǎn)錄(VTT)的算法性能不夠,可用的自動VTTS是不可靠的。語音識別系統(tǒng)領(lǐng)域中的首要問題是語言識別。在不能識別出正確的語言的情況下,這導(dǎo)致自動轉(zhuǎn)錄的所有在后處理步驟的訛誤。抑制VTTS的地域擴(kuò)展的另一個原因是,在實際接收者不可及或者不方便的情況下,用于接收通話的應(yīng)答機(jī)不提供可接受的語言以與呼叫者通信和以根據(jù)正確的語言轉(zhuǎn)錄語音消息。
[0003]因此,需要用于通過基于不同的規(guī)范或條件而確定正確的語言來將語音消息轉(zhuǎn)錄成文本的方法、設(shè)備和系統(tǒng),以增強(qiáng)轉(zhuǎn)錄性能。
[0004]本發(fā)明的另一個目標(biāo)在于向呼叫者和/或接收者提供期望的語言用于轉(zhuǎn)錄語音消息。
[0005]本發(fā)明的又一目標(biāo)在于提供用于電話、特別是用于手機(jī)的語音到文本轉(zhuǎn)錄模式,其能夠由接收者激活,使得當(dāng)接收者不方便應(yīng)答語音通話時,轉(zhuǎn)錄語言被選擇為使得接收者在任何情況下都能夠接收文本形式的被轉(zhuǎn)錄的語音消息。
[0006]通過以下方法實現(xiàn)本發(fā)明的前述目標(biāo)和其他目標(biāo),所述方法用于從可用于由應(yīng)答機(jī)系統(tǒng)提供的對呼叫者和接收者之間的電話通話進(jìn)行語音到文本轉(zhuǎn)錄的多種語言中確定語言,其特征在于,基于以下選項中的至少兩個向呼叫者建議所述可用語言中的至少兩種:
[0007]-與所述呼叫者對應(yīng)的電話國家代碼,
[0008]-與所述接收者對應(yīng)的電話國家代碼,
[0009]-在可用于由所述應(yīng)答機(jī)系統(tǒng)進(jìn)行的轉(zhuǎn)錄的一組語言中包含的語言,
[0010]-基于由呼叫者或接收者設(shè)定的參數(shù)而自動選擇的語言,
[0011]-由所述呼叫者定義的語言,
[0012]-由所述接收者定義的語言。
[0013]其中所述呼叫者選擇與所述應(yīng)答機(jī)系統(tǒng)交互的所述語言,并且相應(yīng)的語音消息被轉(zhuǎn)錄成所選語言的文本用于傳送給所述接收者。
[0014]在基于前述條件建議了一種或更多種語言后,呼叫者通過輸入相應(yīng)的號碼或者通過語音命令來選擇語言,使得語音消息被轉(zhuǎn)錄成文本。還能夠基于由呼叫者或接收者設(shè)定的參數(shù)自動選擇用于語音到文本轉(zhuǎn)錄的語言。
[0015]考慮以下詳細(xì)描述和附圖,本發(fā)明的以上和其他的方面和優(yōu)點會變得明顯,在附圖中:
[0016]圖1表示實施方法并且包括根據(jù)本發(fā)明的一些實施例的用于將語音消息轉(zhuǎn)錄成文本的設(shè)備和系統(tǒng)的電話網(wǎng)絡(luò)的框圖。
[0017]在用于確定語音消息到文本的轉(zhuǎn)錄(VTTS)中的語言的系統(tǒng)中起著重要作用的實體是:呼叫者的電話3、實際與呼叫者的電話3聯(lián)系的服務(wù)提供者4(不管服務(wù)提供者4是否進(jìn)行漫游服務(wù))、連接全世界服務(wù)提供者的全球網(wǎng)絡(luò)6、實際與接收者的電話5和應(yīng)答機(jī)聯(lián)系的服務(wù)提供者1,其中所述應(yīng)答機(jī)包含在正接收來自呼叫者的電話通話的服務(wù)提供者I的服務(wù)器中托管(host)的語音到文本轉(zhuǎn)錄VTT 2。
[0018]因此,基于本發(fā)明,技術(shù)問題在于,當(dāng)呼叫者進(jìn)行電話通話而接收者未應(yīng)答并且服務(wù)提供者I想向接收者提供不僅聽取呼叫者的消息而且將由呼叫者留下的語音消息的呼叫者語言轉(zhuǎn)錄成文本的可能性時,具有VTT設(shè)施的服務(wù)器側(cè)要做什么。然而,能夠僅使用伴隨呼叫者的電話3的少量信息(例如國家代碼)或根據(jù)在接收者的服務(wù)提供者I的服務(wù)器中存儲的一些信息來選擇轉(zhuǎn)錄語言。例如,在接收者與服務(wù)提供者I簽訂電話協(xié)議的時刻,可以設(shè)定他/她想要用于VTTS的轉(zhuǎn)錄語言。
[0019]根據(jù)本發(fā)明的一些有用的實施例,服務(wù)器能夠存儲呼叫者和接收者先前選擇的語言和/或設(shè)置。根據(jù)存儲的信息,服務(wù)器向呼叫者和/或接收者建議優(yōu)選的語言,或者其自動選擇由同一呼叫者在先前通話期間使用的VTT2的語言。存儲相關(guān)信息的一個有利的實施例是存儲與特定電話號碼相關(guān)的語音到文本轉(zhuǎn)錄語言。在這種情況下,服務(wù)提供者I記錄呼叫者的電話號碼和同一呼叫者之前使用的用于轉(zhuǎn)錄的語言,應(yīng)答機(jī)具有自動選擇用于未應(yīng)答來電并且用于執(zhí)行語音到文本轉(zhuǎn)錄的語言的可能性,而不需要搜索可用于轉(zhuǎn)錄的所有語言。
[0020]存在幾個有利的可選方案來限定依賴關(guān)系以建議優(yōu)選的語言。第一可選方案是根據(jù)呼叫者的電話號碼建議所選語言。在這種情況下,使用從特定的呼叫者到特定的接收者的先前通話中的語言選擇來建議優(yōu)選的語言。第二可選方案是根據(jù)特定的接收者來建議所選語言。根據(jù)該可選方案,建議與接收者的國家代碼相關(guān)的語言或者以前使用的語言,而不管呼叫人的電話號碼和在服務(wù)器中所存儲的語言。該可選方案具有如下優(yōu)點,在使用語音到文本轉(zhuǎn)錄系統(tǒng)一段時間之后,根據(jù)特定的接收者的所有可使用的語言都被存儲在服務(wù)器上,這提高了為將來的語言到文本轉(zhuǎn)錄而建議和選擇合適語言的效率和速度。
[0021]存在數(shù)種可能性來限定電話國家代碼。電話國家代碼得自在呼叫者或接收者的相應(yīng)電話號碼中包含的電話國家代碼(例如德國是+41,英國是+44,法國是+33等),所述國家代碼對VTT來說是已知的,這是由于其例如是來電時由電信網(wǎng)絡(luò)6發(fā)送到VTT的。
[0022]電話國家代碼還與所使用的SIM卡的來源國有關(guān)(或者對應(yīng)于所述呼叫者或接收者在通話期間的當(dāng)前位置),或者還與MCC(移動國家代碼)和MNC(移動網(wǎng)絡(luò)代碼)有關(guān),這兩種代碼結(jié)合形成國際移動用戶識別碼(IMSI),其唯一地標(biāo)識移動電話運營商/承載商,并且由此隱含地標(biāo)識通話源自哪個國家或呼叫者的國家。
[0023]使用與術(shù)語“語言”相關(guān)的術(shù)語“建議”來表示提供可視或可聽的信息或指示(如語音消息),其指定一種或更多種語言或者指定包括一種或更多種語言的列表以用于手動或自動選擇。短語“國家代碼”的使用等同于電話國家代碼。
[0024]使用與呼叫者或接收者對應(yīng)的國家代碼作為條件,在兩端(即在呼叫者端和接收者端)都涉及數(shù)種可能性。依賴于呼叫者的一個可選方案是驗證呼叫者的電話號碼的國家代碼。這意味著如果呼叫者的電話號碼源自特定國家或基地在特定國家的特定電信公司,那么相應(yīng)地使用和建議這些國家中的一個的國家代碼,其通常為同一國家代碼。當(dāng)呼叫者停留在他/她居住和說