本公開(kāi)涉及一種執(zhí)行基于參數(shù)的文本到語(yǔ)音(TTS)的電子裝置。更具體地,本公開(kāi)涉及一種利用支持多語(yǔ)言/說(shuō)話(huà)人的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的使用所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)執(zhí)行TTS轉(zhuǎn)換的電子裝置及其轉(zhuǎn)換TTS的方法。
背景技術(shù):
基于參數(shù)的文本到語(yǔ)音(TTS)轉(zhuǎn)換可具有語(yǔ)言處理器和針對(duì)每種語(yǔ)言的語(yǔ)音數(shù)據(jù),基于輸入句子的句子分析結(jié)果選擇合適的語(yǔ)音數(shù)據(jù),并基于其連接和轉(zhuǎn)換產(chǎn)生合成聲音。由于TTS轉(zhuǎn)換不接收語(yǔ)音作為輸入(如編解碼器(CODEC)),而接收文本作為輸入,因此可首先執(zhí)行以下處理:估計(jì)適合于文本的語(yǔ)音數(shù)據(jù)并以聲學(xué)模形的形式存儲(chǔ)估計(jì)出的語(yǔ)音數(shù)據(jù)?;趨?shù)的TTS可具有針對(duì)每種語(yǔ)言和每個(gè)說(shuō)話(huà)人的聲學(xué)模型,每個(gè)聲學(xué)模型的大小大約為5MB。
在提供針對(duì)多語(yǔ)言的TTS商業(yè)服務(wù)的情況下,隨著服務(wù)語(yǔ)言的數(shù)量和支持說(shuō)話(huà)人的語(yǔ)言的數(shù)量的增加,針對(duì)某類(lèi)語(yǔ)言或某類(lèi)說(shuō)話(huà)人的聲學(xué)模型的語(yǔ)音數(shù)據(jù)隨之增加,因此可能出現(xiàn)電子裝置容量負(fù)擔(dān)增加的問(wèn)題。此外,基于決策樹(shù)的聲學(xué)模型可在音素單元被劃分的細(xì)分音素單元中大量產(chǎn)生代表聲學(xué)數(shù)據(jù)的葉節(jié)點(diǎn),細(xì)分音素單元中的聲學(xué)信號(hào)不易被人耳區(qū)分。在異質(zhì)語(yǔ)言和說(shuō)話(huà)人間可顯著地出現(xiàn)具有相似形式的葉節(jié)點(diǎn)被大量產(chǎn)生的現(xiàn)象,這會(huì)導(dǎo)致在由語(yǔ)言和說(shuō)話(huà)人劃分并存儲(chǔ)的聲學(xué)模型本身包括高冗余的問(wèn)題。
上述信息僅作為背景信息被呈現(xiàn)以幫助理解本公開(kāi)。至于上述信息中的任何信息是否可用作針對(duì)本公開(kāi)的現(xiàn)有技術(shù),尚未做出決定,也未做出斷定。
技術(shù)實(shí)現(xiàn)要素:
本公開(kāi)的多個(gè)方面在于至少解決上述問(wèn)題和/或缺點(diǎn)并且至少提供以下描述的優(yōu)點(diǎn)。因此,本公開(kāi)的一方面提供用于將文本轉(zhuǎn)換到語(yǔ)音(TTS)的方法和設(shè)備,所述方法和設(shè)備可配置由多語(yǔ)言/說(shuō)話(huà)人共享的超級(jí)群集型通用聲學(xué)數(shù)據(jù)(SCCAD),并通過(guò)基于支持多語(yǔ)言/說(shuō)話(huà)人的超級(jí)群集型通用聲學(xué)數(shù)據(jù)執(zhí)行基于參數(shù)的TTS轉(zhuǎn)換以大大降低容量。
根據(jù)本公開(kāi)的一方面,提供了一種電子裝置。所述電子裝置包括:處理器;存儲(chǔ)器,與處理器電連接,其中,存儲(chǔ)器被配置為存儲(chǔ)超級(jí)群集型通用聲學(xué)數(shù)據(jù)集,其中,存儲(chǔ)器還被配置為存儲(chǔ)使處理器能夠執(zhí)行以下操作的指令:獲取至少一個(gè)文本、選擇與所獲取的文本被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息,當(dāng)所選擇的信息是第一信息時(shí),選擇多條第一路徑中的至少一條第一路徑,基于所選擇的至少一條第一路徑來(lái)加載所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一個(gè)元素,并基于加載的所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的所述至少一個(gè)元素來(lái)產(chǎn)生第一聲學(xué)信號(hào),當(dāng)所選擇的信息是第二信息時(shí),選擇多條第二路徑中的至少一條第二路徑,基于所選擇的至少一條第二路徑來(lái)加載所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一個(gè)元素或至少一個(gè)其它元素,并基于加載的所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的所述至少一個(gè)元素或所述至少一個(gè)其它元素來(lái)產(chǎn)生第二聲學(xué)信號(hào)。
根據(jù)本公開(kāi)的另一方面,提供了一種電子裝置。所述電子裝置包括:處理器;存儲(chǔ)器,與處理器電連接,其中,存儲(chǔ)器被配置為存儲(chǔ)使處理器能夠執(zhí)行以下操作的指令:獲取與關(guān)于語(yǔ)音的第一信息相應(yīng)的第一聲學(xué)數(shù)據(jù)集和與關(guān)于所述語(yǔ)音的第二信息相應(yīng)的第二聲學(xué)數(shù)據(jù)集;確定第一聲學(xué)數(shù)據(jù)集的至少一個(gè)元素和/或第二聲學(xué)數(shù)據(jù)集的至少一個(gè)元素之間的相似度;基于所述被確定來(lái)產(chǎn)生與第一聲學(xué)數(shù)據(jù)集的所述至少一個(gè)元素和/或第二聲學(xué)數(shù)據(jù)集的所述至少一個(gè)元素相關(guān)聯(lián)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。
根據(jù)本發(fā)明的另一方面,提供了一種電子裝置的轉(zhuǎn)換TTS的方法。所述方法包括:獲取至少一個(gè)文本,選擇與獲取的文本被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息,當(dāng)所選擇的信息是第一信息時(shí),選擇多條第一路徑中的至少一條第一路徑,基于所選擇的至少一條第一路徑來(lái)加載所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一個(gè)元素,并基于加載的所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的所述至少一個(gè)元素來(lái)產(chǎn)生第一聲學(xué)信號(hào),當(dāng)所選擇的信息是第二信息時(shí),選擇多條第二路徑中的至少一條第二路徑,基于所選擇的至少一條第二路徑來(lái)加載所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一個(gè)元素或至少一個(gè)其它元素,基于加載的所述超級(jí)群集型通用聲學(xué)信號(hào)集的所述至少一個(gè)元素或所述至少一個(gè)其它元素來(lái)產(chǎn)生第二聲學(xué)信號(hào)。
根據(jù)本發(fā)明的另一方面,提供了一種電子裝置的轉(zhuǎn)換TTS的方法。所述方法包括:獲取與關(guān)于至少一個(gè)文本被轉(zhuǎn)換成的語(yǔ)音的第一信息相應(yīng)的第一聲學(xué)數(shù)據(jù)集和/或與關(guān)于所述語(yǔ)音的第二信息相應(yīng)的第二聲學(xué)數(shù)據(jù)集,確定第一聲學(xué)數(shù)據(jù)集的至少一個(gè)元素和/或第二聲學(xué)數(shù)據(jù)集的至少一個(gè)元素之間的相似度;基于所述確定來(lái)產(chǎn)生與第一聲學(xué)數(shù)據(jù)集的所述至少一個(gè)元素和/或第二聲學(xué)數(shù)據(jù)集的所述至少一個(gè)元素相應(yīng)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。
根據(jù)本公開(kāi)的各種實(shí)施例,所述電子裝置可基于一個(gè)支持多語(yǔ)言/說(shuō)話(huà)人的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)執(zhí)行TTS轉(zhuǎn)換,從而減少了存儲(chǔ)多個(gè)聲學(xué)數(shù)據(jù)集所需的存儲(chǔ)空間。
根據(jù)本公開(kāi)的各種實(shí)施例,當(dāng)針對(duì)新的語(yǔ)言或說(shuō)話(huà)人的聲學(xué)模型被額外安裝在所述電子裝置中時(shí),所述電子裝置僅下載針對(duì)已產(chǎn)生的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的額外聲學(xué)模型的鏈接器,從而減少了所述電子裝置的數(shù)據(jù)傳輸所需的負(fù)擔(dān)。
從以下的結(jié)合附圖公開(kāi)本公開(kāi)的各種實(shí)施例的詳細(xì)描述,對(duì)于本領(lǐng)域技術(shù)人員而言,本公開(kāi)的其它方面、優(yōu)點(diǎn)和顯著特征將變得清楚。
附圖說(shuō)明
從以下結(jié)合附圖的描述,本公開(kāi)的特定實(shí)施例的以上和其它方面、特征和優(yōu)點(diǎn)將更容易理解,其中,在附圖中:
圖1是示出根據(jù)本公開(kāi)的實(shí)施例的包括電子裝置的網(wǎng)絡(luò)環(huán)境的示圖;
圖2是根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置的框圖;
圖3是根據(jù)本公開(kāi)的各種實(shí)施例的編程模塊的框圖;
圖4是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置選擇關(guān)于文本將被轉(zhuǎn)換成的語(yǔ)音的信息并基于所選擇的信息來(lái)產(chǎn)生聲學(xué)信號(hào)的操作的流程圖;
圖5是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置將聲學(xué)數(shù)據(jù)集的至少一條路徑映射到超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一部分的操作的示圖;
圖6是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)的操作的流程圖;
圖7A是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置確定第一聲學(xué)數(shù)據(jù)集的至少一部分和第二聲學(xué)數(shù)據(jù)集的至少一部分之間的相似度并基于對(duì)相似度的確定來(lái)產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的操作的示圖:
圖7B是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置在收集至少一個(gè)聲學(xué)數(shù)據(jù)集的完全聲學(xué)數(shù)據(jù)集中執(zhí)行群集算法的操作的示圖;
圖8是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集并將特定聲學(xué)數(shù)據(jù)的多個(gè)路徑匹配到超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的操作的示圖;
圖9是根據(jù)本公開(kāi)的各種實(shí)施例的第一電子裝置的框圖和第二電子裝置的框圖。
在所有圖中,相同的標(biāo)號(hào)將被理解為相同的部分、組件和結(jié)構(gòu)。
具體實(shí)施方式
參照附圖的以下描述被提供以有助于全面理解由權(quán)利要求和它們的等同物所限定的本公開(kāi)的各種實(shí)施例。所述描述包括各種具體細(xì)節(jié)來(lái)幫助理解,但這些將僅被視為示例性的。因此,本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到:在不脫離本公開(kāi)的范圍和精神的情況下,可對(duì)在此描述的各種實(shí)施例做出各種改變和修改。此外,為了清晰及簡(jiǎn)明,可省略對(duì)公知的功能和結(jié)構(gòu)的描述。
在以下描述和權(quán)利要求中所使用的術(shù)語(yǔ)和詞匯不限于書(shū)面的含義,而是僅被發(fā)明者使用以使本公開(kāi)能夠被清楚和一致地理解。因此,對(duì)于本領(lǐng)域技術(shù)人員而言應(yīng)該清楚的是:提供本公開(kāi)的各種實(shí)施例的以下描述僅用于說(shuō)明目的,而并非為了限制由權(quán)利要求及其等同物所限定的本公開(kāi)的目的。
應(yīng)該理解:除非上下文清楚地另有指示,否則單數(shù)形式包括復(fù)數(shù)指示物。因此,例如,提到“組件表面”包括提到一個(gè)或更多個(gè)這樣的表面。
這里使用的表述“具有”、“可具有”、“包括”或“可包括”指示相應(yīng)的特征(例如,數(shù)值、功能、操作或構(gòu)成元件(諸如組件))的存在,并且不排除存在一個(gè)或更多個(gè)額外的特征。
在本公開(kāi),表述“A或B”、“A和/或B中的至少一個(gè)”或“A和/或B中的一個(gè)或更多個(gè)”可包括所列出項(xiàng)的所有可能的組合。例如,表述“A或B”、“A和B中的至少一個(gè)”或“A或B中的一個(gè)或更多個(gè)”指下列所有情況:(1)包括至少一個(gè)A(2)包括至少一個(gè)B、或(3)包括至少一個(gè)A和至少一個(gè)B兩者。
在本公開(kāi)的各種實(shí)施例中使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修飾各種組件而不考慮順序和/或重要性,并且不限制相應(yīng)組件。例如,第一用戶(hù)裝置和第二用戶(hù)裝置指示不同的用戶(hù)裝置,雖然它們二者都是用戶(hù)裝置。例如,在不脫離本公開(kāi)的范圍的情況下,第一元件可被稱(chēng)為第二元件,類(lèi)似地,第二元件可被稱(chēng)為第一元件。
應(yīng)該被理解的是當(dāng)一元件(例如,第一元件)被描述為(以操作方式或通信方式)“連接”或“耦合”到另一元件(例如,第二元件)時(shí),該元件可直接連接或直接耦合到所述另一元件,或者任何其他元件(例如,第三元件)可以是它們之間的中介層。相反地,應(yīng)該理解的是當(dāng)一元件(例如,第一元件)被描述為“直接連接”或“直接耦合”到另一元件(第二元件)時(shí),在該元件和所述另一元件之間不存在元件(例如,第三元件)。
在本公開(kāi)中使用的表述“被配置為”可根據(jù)情況與例如“適合于”、“具有……的能力”、“被設(shè)計(jì)為”、“適應(yīng)于”、“被制造為”或“能夠”進(jìn)行替換。術(shù)語(yǔ)“被配置為”可不一定表示在硬件中“被專(zhuān)門(mén)設(shè)計(jì)為”??蛇x地,在一些情況下,表述“被配置為...的裝置”可表示該裝置可與其他裝置或組件一起“能夠…”。例如,短語(yǔ)“適用于(或配置)為執(zhí)行A、B和C的處理器”可表示僅用于執(zhí)行相應(yīng)操作的專(zhuān)用處理器(諸如,嵌入式處理器)或可通過(guò)執(zhí)行存儲(chǔ)在存儲(chǔ)器裝置的一個(gè)或更多個(gè)軟件程序來(lái)執(zhí)行相應(yīng)操作的通用處理器(諸如,中央處理器(CPU)或應(yīng)用處理器(AP))。
除非另有定義,否則在此使用的所有術(shù)語(yǔ)(包括技術(shù)術(shù)語(yǔ)和科學(xué)術(shù)語(yǔ))具有與本領(lǐng)域技術(shù)人員通常理解的含義相同的含義。如在通常使用的字典中定義的這樣的術(shù)語(yǔ)被認(rèn)為具有與相關(guān)領(lǐng)域的上下文的含義相同的含義,并且除非在本公開(kāi)被清楚地定義,否則將不被理解為理想的或過(guò)于正式的含義。在某些情況下,在本公開(kāi)定義的術(shù)語(yǔ)不能被理解為排除本公開(kāi)的實(shí)施例。
在本公開(kāi),電子裝置可以是包含通信功能的裝置。例如,電子裝置可以是智能電話(huà)、平板個(gè)人電腦(PC)、移動(dòng)電話(huà)、視頻電話(huà)、電子書(shū)閱讀器、臺(tái)式PC、膝上型PC、上網(wǎng)本計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、便攜式多媒體播放器(PMP)、運(yùn)動(dòng)圖像專(zhuān)家組1期或2期(MPEG-1或MPEG-2)音頻層3(MP3)播放器、便攜式醫(yī)療裝置、數(shù)碼相機(jī)或者可穿戴裝置(例如,諸如電子眼鏡的頭戴式裝置(HMD)、電子服裝、電子手鐲、電子項(xiàng)鏈、電子配件、電子紋身、智能鏡子或智能手表)。
根據(jù)一些實(shí)施例,電子裝置可以是包含通信功能的智能家用電器。例如,電子裝置可以是電視(TV)、數(shù)字通用盤(pán)(DVD)播放器、音頻設(shè)備、冰箱、空調(diào)、吸塵器、烤箱、微波爐、洗衣機(jī)、空氣凈化器、機(jī)頂盒、TV盒(例如,Samsung HomeSyncTM,Apple TVTM,Google TVTM,等等)、游戲機(jī)、電子詞典、電子鑰匙、攝像機(jī)或電子相框。
根據(jù)另一實(shí)施例,電子裝置包括下列項(xiàng)中的至少一項(xiàng):各種醫(yī)療裝置(例如,各種便攜式醫(yī)療測(cè)量裝置(血糖監(jiān)測(cè)裝置、心率監(jiān)測(cè)裝置、血壓測(cè)量裝置、體溫測(cè)量裝置等)、磁共振血管造影(MRA)、磁共振成像(MRI)、計(jì)算機(jī)斷層掃描(CT)機(jī)和超聲波機(jī))、導(dǎo)航裝置、全球定位系統(tǒng)(GPS)接收器,事件數(shù)據(jù)記錄器(EDR)、飛行數(shù)據(jù)記錄器(FDR)、車(chē)載信息娛樂(lè)裝置、船用電子裝置(例如,船用導(dǎo)航裝置和陀螺羅盤(pán))、航空電子設(shè)備、安全裝置、汽車(chē)頭單元、家用或工業(yè)用的機(jī)器人、銀行里的自動(dòng)取款機(jī)(ATM)、商店里的銷(xiāo)售點(diǎn)(POS)或物聯(lián)網(wǎng)裝置(例如,燈泡、各種傳感器、電子或燃?xì)獗?,自?dòng)噴水滅火裝置、火災(zāi)報(bào)警、自動(dòng)調(diào)溫器、路燈、烤面包機(jī)、體育用品、熱水箱、加熱器、鍋爐等)
根據(jù)一些實(shí)施例,電子裝置可以是具有通信功能的家具或者建筑或結(jié)構(gòu)的一部分、電子板、電子簽名接收裝置、投影儀、或各種測(cè)量?jī)x器(例如,水表、電表、煤氣表、測(cè)波表等等)。這里公開(kāi)的電子裝置可以是上述裝置或其任何組合之一。
在下文中,將參照附圖描述根據(jù)各種實(shí)施例的電子裝置。在此使用的術(shù)語(yǔ)“用戶(hù)”可指使用電子裝置的人、使用電子裝置的裝置(例如,人工智能電子裝置)。
圖1示出根據(jù)本公開(kāi)的各種實(shí)施例的包括電子裝置的網(wǎng)絡(luò)環(huán)境。
參照?qǐng)D1,在網(wǎng)絡(luò)環(huán)境100中的電子裝置101包括:總線(xiàn)110、處理器120、存儲(chǔ)器130、輸入/輸出接口150、顯示器160和通信接口170。根據(jù)一些實(shí)施例,電子裝置101可省略至少一個(gè)組件或還包括另一組件。
總線(xiàn)110可以是連接上述組件并在上述組件之間傳輸信息(例如,控制消息)的電路。
處理器120可包括CPU、AP或通信處理器(CP)中的一個(gè)或更多個(gè)。例如,處理器120可控制電子裝置101的至少一個(gè)組件和/或執(zhí)行與通信或數(shù)據(jù)處理相關(guān)的計(jì)算。
存儲(chǔ)器130可包括易失性存儲(chǔ)器和/或非易失性存儲(chǔ)器。例如,存儲(chǔ)器130可存儲(chǔ)與電子裝置101的至少一個(gè)組件相關(guān)的命令或數(shù)據(jù)。根據(jù)一些實(shí)施例,存儲(chǔ)器可存儲(chǔ)軟件和/或程序140。例如,程序140可包括:內(nèi)核141、中間件143、應(yīng)用編程接口(API)145和/或應(yīng)用147等。內(nèi)核141、中間件143和API 145的至少一部分被定義為操作系統(tǒng)(OS)。
內(nèi)核141控制或管理系統(tǒng)資源(例如,總線(xiàn)110、處理器120或存儲(chǔ)器130),其中,所述系統(tǒng)資源用于執(zhí)行由其余的其他程序(例如,中間件143、API 145或應(yīng)用147)實(shí)現(xiàn)的操作或功能。此外,內(nèi)核141提供用于從中間件143、API 145或應(yīng)用147訪(fǎng)問(wèn)電子裝置101的各個(gè)組件的接口以控制或管理所述組件。
中間件143執(zhí)行使API 145或應(yīng)用147能夠與內(nèi)核141通信以交換數(shù)據(jù)的中繼功能。此外,在從應(yīng)用147接收的操作請(qǐng)求中,中間件143通過(guò)使用將優(yōu)先級(jí)分配給應(yīng)用147的方法執(zhí)行針對(duì)操作請(qǐng)求(例如,調(diào)度和負(fù)載平衡)的控制,其中,電子裝置的系統(tǒng)資源(例如,總線(xiàn)110、處理器120、存儲(chǔ)器130等)可根據(jù)優(yōu)先級(jí)被使用。
API 145是這樣的接口:應(yīng)用147通過(guò)該接口可控制由內(nèi)核141或中間件142提供的功能,并且API 145包括例如用于文件控制、窗口控制、圖像處理或字符控制的至少一個(gè)接口或功能(例如,命令)。
輸入/輸出接口150可以是用于將由用戶(hù)或另一外部裝置輸入的命令或數(shù)據(jù)發(fā)送到電子裝置101的另一組件(另一些組件)的接口。此外,輸入/輸出接口150可將從電子裝置的另一組件(另一些組件)接收的命令或數(shù)據(jù)輸出到用戶(hù)或其他外部裝置。
顯示器160可包括:例如,液晶顯示器(LCD)、發(fā)光二極管(LED)、有機(jī)LED(OLED)、微電子機(jī)械系統(tǒng)(MEMS)顯示器或電子紙顯示器。顯示器160可向用戶(hù)顯示例如各種內(nèi)容(文本、圖像、視頻、圖標(biāo)或符號(hào)等)。顯示器160可包括觸摸屏,并可接收使用用戶(hù)身體部位進(jìn)行的觸摸輸入、手勢(shì)輸入、接近輸入或懸停輸入。
通信接口170可建立電子裝置101和外部裝置(例如,第一外部裝置102、第二外部裝置104或服務(wù)器106)的通信。例如,通信接口170可通過(guò)無(wú)線(xiàn)通信或有線(xiàn)通信與網(wǎng)絡(luò)162連接,并與外部裝置(例如,第二外部裝置104或服務(wù)器106)通信。
無(wú)線(xiàn)通信使用以下項(xiàng)的至少一項(xiàng)作為蜂窩通信協(xié)議:例如,長(zhǎng)期演進(jìn)(LTE)、先進(jìn)LTE(LTE-A)、碼分多址(CDMA)、寬帶CDMA(WCDMA)、通用移動(dòng)電信系統(tǒng)(UMTS)、無(wú)線(xiàn)寬帶(WiBro)、全球移動(dòng)通信系統(tǒng)(GSM)等。短距離通信164包括:例如,Wi-Fi、藍(lán)牙(BT)、近場(chǎng)通信(NFC)、磁性安全傳輸或近場(chǎng)磁數(shù)據(jù)帶傳動(dòng)(MST)和全球?qū)Ш叫l(wèi)星系統(tǒng)(GNSS)等的至少一個(gè)。
MST模塊能夠使用電磁信號(hào)產(chǎn)生與傳輸數(shù)據(jù)相應(yīng)的脈沖,從而脈沖能夠產(chǎn)生磁場(chǎng)信號(hào)。電子裝置101將磁場(chǎng)信號(hào)發(fā)送到POS終端(讀取器)。POS終端(讀取器)通過(guò)MST讀取器檢測(cè)磁場(chǎng)信號(hào),將檢測(cè)到的磁場(chǎng)信號(hào)轉(zhuǎn)換為電信號(hào),從而恢復(fù)數(shù)據(jù)。
GNSS包括:例如,GPS、全球?qū)Ш叫l(wèi)星系統(tǒng)(格洛納斯)、北斗導(dǎo)航衛(wèi)星系統(tǒng)(下文稱(chēng)“北斗”)和伽利略(歐洲的基于全球衛(wèi)星的導(dǎo)航系統(tǒng))。在下文中,本公開(kāi)中的“GPS”可與“GNSS”可互換使用。有線(xiàn)通信可包括:例如,通用串行總線(xiàn)(USB)、高清多媒體接口(HDMI)、推薦標(biāo)準(zhǔn)-232(RS-232)、普通老式電話(huà)服務(wù)(POTS)等中的至少一個(gè)。網(wǎng)絡(luò)162可包括電信網(wǎng)絡(luò),例如,計(jì)算機(jī)網(wǎng)絡(luò)(例如,局域網(wǎng)(LAN)或無(wú)線(xiàn)區(qū)域網(wǎng)(WAN))、互聯(lián)網(wǎng)和電話(huà)網(wǎng)絡(luò)中的至少一個(gè)。
第一外部裝置102和第二外部裝置104中的每個(gè)外部裝置可以是與電子裝置101相同類(lèi)型或不同類(lèi)型的電子裝置。根據(jù)一些實(shí)施例,服務(wù)器106可包括一個(gè)或更多個(gè)服務(wù)器群。根據(jù)各種實(shí)施例,由電子裝置執(zhí)行的執(zhí)行的至少一部分可由一個(gè)或更多個(gè)電子裝置(例如,外部電子裝置102、104或服務(wù)器106)執(zhí)行。根據(jù)一些實(shí)施例,當(dāng)電子裝置101應(yīng)自動(dòng)執(zhí)行功能或服務(wù)時(shí),電子裝置101可向其他裝置(例如,外部電子裝置102、104或服務(wù)器106)請(qǐng)求執(zhí)行至少一個(gè)功能。針對(duì)上述情況,可使用例如云計(jì)算技術(shù)、分布式計(jì)算技術(shù)或客戶(hù)端-服務(wù)器計(jì)算技術(shù)。
圖2示出根據(jù)本公開(kāi)的實(shí)施例的電子裝置的框圖。
參照?qǐng)D2,電子裝置201可配置例如圖1所示的電子裝置101的全部或一部分。電子裝置201包括一個(gè)或更多個(gè)AP 210、通信模塊220、用戶(hù)識(shí)別模塊(SIM)卡224、存儲(chǔ)器230、傳感器模塊240、輸入裝置250、顯示器260、接口270、音頻模塊280、相機(jī)模塊291、電源管理模塊295、電池296、指示器297和電機(jī)298。
AP 210操作OS或應(yīng)用程序以控制與AP 210連接的多個(gè)硬件或軟件組件元件,并執(zhí)行包括多媒體數(shù)據(jù)的各種數(shù)據(jù)處理和計(jì)算。AP 210可由例如片上系統(tǒng)(SoC)被實(shí)現(xiàn)。根據(jù)實(shí)施例,處理器210可還包括圖形處理單元(GPU)和/或圖像信號(hào)處理器。AP 210可包括圖2示出的組件(例如,蜂窩模塊221)的至少一部分。AP 210可加載從至少一個(gè)另外組件(例如,非易失性存儲(chǔ)器)接收的命令或數(shù)據(jù),將各種數(shù)據(jù)存儲(chǔ)在易失性存儲(chǔ)器中。
通信模塊220可包括與圖1的通信接口170相同或相似的組件。通信模塊220可包括:例如,蜂窩模塊221、Wi-Fi模塊223、BT模塊225、GPS模塊227、NFC模塊228和射頻(RF)模塊229。
蜂窩模塊221可通過(guò)通信網(wǎng)絡(luò)(例如,LTE、LTE-A、CDMA、WCDMA、UMTS、WiBro、GSM等)提供語(yǔ)音、呼叫、視頻呼叫、短消息服務(wù)(SMS)或互聯(lián)網(wǎng)服務(wù)。此外,蜂窩模塊221可通過(guò)使用SIM(例如,SIM卡224)對(duì)通信網(wǎng)絡(luò)中的電子裝置進(jìn)行區(qū)分和驗(yàn)證。根據(jù)實(shí)施例,蜂窩模塊221執(zhí)行可由AP 210提供的功能中的至少一些功能。例如,蜂窩模塊221可執(zhí)行多媒體控制功能中的至少一些功能。根據(jù)實(shí)施例,蜂窩模塊221可包括CP。
Wi-Fi模塊223、BT模塊225、GPS模塊227和NFC模塊228中的每一個(gè)模塊可包括:例如,用于處理通過(guò)相應(yīng)模塊發(fā)送/接收的數(shù)據(jù)的處理器。根據(jù)一個(gè)實(shí)施例,雖然蜂窩模塊221、Wi-Fi模塊223、BT模塊225,GPS模塊227和NFC模塊228是單獨(dú)的模塊,但是蜂窩模塊221、Wi-Fi模塊223、BT模塊225,GPS模塊227和NFC模塊228中的至少一些(例如,兩個(gè)或兩個(gè)以上)可被包括在一個(gè)集成芯片(IC)或一個(gè)IC封裝中。例如,與蜂窩模塊221、Wi-Fi模塊223、BT模塊225、GPS模塊227和NFC模塊228相應(yīng)的處理器中的至少一些處理器(例如,與蜂窩模塊221相應(yīng)的CP和與Wi-Fi模塊223相應(yīng)的Wi-Fi處理器)可由一個(gè)SoC來(lái)實(shí)現(xiàn)。
RF模塊229發(fā)送/接收數(shù)據(jù)(例如,RF信號(hào))。盡管沒(méi)被示出,RF模塊229可包括:例如,收發(fā)器、功率放大器模塊(PAM)、頻率濾波器、低噪聲放大器(LNA)等。此外,RF模塊229還可包括用于在無(wú)線(xiàn)通信的自由空間中發(fā)送/接收電磁波的組件,例如,導(dǎo)體、導(dǎo)體線(xiàn)等。雖然蜂窩模塊221、Wi-Fi模塊223、BT模塊225、GPS模塊227和NFC模塊228共享一個(gè)RF模塊229,但是根據(jù)一個(gè)實(shí)施例,蜂窩模塊221、Wi-Fi模塊223、BT模塊225、GPS模塊227和NFC模塊228中的至少一個(gè)模塊可通過(guò)單獨(dú)的RF模塊發(fā)射/接收RF信號(hào)。
SIM卡224是包括SIM的卡,并可被插入電子裝置的特定位置處形成的插槽中。SIM卡224包括唯一的識(shí)別信息(例如,IC卡標(biāo)識(shí)符(ICCID))或用戶(hù)信息(例如,國(guó)際移動(dòng)用戶(hù)身份(IMSI))。
存儲(chǔ)器230(例如,存儲(chǔ)器130)可包括內(nèi)部存儲(chǔ)器232或外部存儲(chǔ)器234。內(nèi)部存儲(chǔ)器232可包括以下項(xiàng)中的至少一個(gè):例如,易失性存儲(chǔ)器(例如,隨機(jī)存取存儲(chǔ)器(RAM)、動(dòng)態(tài)RAM(DRAM)、靜態(tài)RAM(SRAM)、同步動(dòng)態(tài)RAM(SDRAM)等)和非易失性存儲(chǔ)器(例如,只讀存儲(chǔ)器(ROM)、一次可編程ROM(OTPROM)、可編程ROM(PROM)、可擦除可編程ROM(EPROM)、電可擦除可編程ROM(EEPROM)、掩膜ROM、閃存ROM、與非(NAND)閃存、或非(NOR)閃存等)。
根據(jù)實(shí)施例,內(nèi)部存儲(chǔ)器232可以是固態(tài)硬盤(pán)(SSD)。外部存儲(chǔ)器234還可包括閃存驅(qū)動(dòng)器,例如,緊湊型閃存(CF)、安全數(shù)字(SD)、微型SD、迷你SD、極速數(shù)字(xD)或記憶棒。外部存儲(chǔ)器234可通過(guò)各種接口功能性地連接到電子裝置201。根據(jù)實(shí)施例,電子裝置201還可包括諸如硬盤(pán)驅(qū)動(dòng)器的存儲(chǔ)裝置(或存儲(chǔ)介質(zhì))。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器230可存儲(chǔ)這樣的指令:該指令使處理器210能夠執(zhí)行以下操作:獲取至少一個(gè)文本,選擇與獲取的文本被轉(zhuǎn)換成的語(yǔ)音關(guān)聯(lián)的信息,當(dāng)被選擇的信息是第一信息時(shí),選擇多條第一路徑中的至少一條第一路徑,基于被選擇的至少一條第一路徑來(lái)加載超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分,并基于加載的一部分超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)產(chǎn)生第一聲學(xué)信號(hào),當(dāng)被選擇的信息是第二信息時(shí),選擇多條第二路徑中的至少一條第二路徑,基于被選擇的至少一條第二路徑來(lái)加載所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分或另外一部分,并基于被加載的一部分或另外一部分超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)產(chǎn)生第二聲學(xué)信號(hào)。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器230可存儲(chǔ)這樣的指令:該指令使處理器210能夠執(zhí)行以下操作:從用戶(hù)獲取至少一個(gè)文本或從外部裝置接收包括至少一個(gè)文本的文本消息。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器230可存儲(chǔ)這樣的指令:該指令使處理器210能夠執(zhí)行以下操作:基于輸入的文本來(lái)選擇超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分中的至少一部分,并基于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分中的至少一部分來(lái)額外地產(chǎn)生第一聲學(xué)信號(hào)或第二聲學(xué)信號(hào)。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器230可存儲(chǔ)這樣的指令:該指令使處理器210能夠執(zhí)行以下操作:獲取與關(guān)于語(yǔ)音的第一信息相應(yīng)的第一聲學(xué)數(shù)據(jù)集和/或與關(guān)于語(yǔ)音的第二信息相應(yīng)的第二聲學(xué)數(shù)據(jù)集,確定第一聲學(xué)數(shù)據(jù)集中的至少一些和/或第二聲學(xué)數(shù)據(jù)集中的至少一些之間的相似度,并基于所述確定來(lái)產(chǎn)生與第一聲學(xué)數(shù)據(jù)集中的至少一部分和/或第二聲學(xué)數(shù)據(jù)集中的至少一部分關(guān)聯(lián)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器230可存儲(chǔ)這樣的指令:該指令使處理器210能夠執(zhí)行以下操作:基于所述確定,當(dāng)相似度等于或大于被選擇的閾值時(shí),決定與第一聲學(xué)數(shù)據(jù)集中的至少一部分和第二聲學(xué)數(shù)據(jù)集中的至少一部分二者相應(yīng)的第一參數(shù),當(dāng)相似度小于所述閾值時(shí),決定與第一聲學(xué)數(shù)據(jù)集中的至少一部分相應(yīng)的第二參數(shù)和與第二聲學(xué)數(shù)據(jù)集中的至少一部分相應(yīng)的第三參數(shù);并基于第一參數(shù)、第二參數(shù)或第三參數(shù)來(lái)產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。
根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器230可存儲(chǔ)超級(jí)群集型通用聲學(xué)數(shù)據(jù)集、關(guān)于至少一個(gè)決策樹(shù)的信息和由決策樹(shù)的索引指示的至少一個(gè)聲學(xué)數(shù)據(jù)集。
傳感器模塊240可測(cè)量物理量或檢測(cè)電子裝置201的操作狀態(tài),并將測(cè)量或檢測(cè)到的信息轉(zhuǎn)換成電信號(hào)。傳感器模塊240可包括以下項(xiàng)中的至少一項(xiàng):例如,手勢(shì)傳感器240A、陀螺儀傳感器240B、大氣壓力(氣壓)傳感器240C、磁傳感器240D、加速度傳感器240E、握持傳感器240F、接近傳感器240G、顏色傳感器240H(例如,紅綠藍(lán)(RGB)傳感器)、生物傳感器240I、溫度/濕度傳感器240J、照度(光)傳感器240K和紫外線(xiàn)(UV)傳感器240M。另外地/可選地,傳感器模塊240可包括:例如,電子鼻傳感器、肌電圖(EMG)傳感器、腦電圖(EEG)傳感器、心電圖(ECG)傳感器、紅外(IR)傳感器、虹膜傳感器、指紋傳感器(未示出)等。傳感器模塊240還可包括用于控制傳感器模塊140中所包括的一個(gè)或更多個(gè)傳感器的控制電路。
輸入裝置250包括觸摸面板252、(數(shù)字)筆傳感器254、按鍵256和超聲輸入裝置258。例如,觸摸面板252可識(shí)別電容類(lèi)型、電阻類(lèi)型、紅外類(lèi)型和超聲波類(lèi)型中的至少一種類(lèi)型的觸摸輸入。觸摸面板252還可包括控制電路。在電容類(lèi)型的情況下,觸摸面板252除了可識(shí)別直接觸摸之外還可識(shí)別接近觸摸。觸摸面板252還可包括觸覺(jué)層。在這種情況下,觸摸面板252可向用戶(hù)提供觸覺(jué)反應(yīng)。
(數(shù)字)筆傳感器254可使用例如與接收用戶(hù)的觸摸輸入的方法相同或相似的方法來(lái)實(shí)現(xiàn)或通過(guò)使用單獨(dú)的識(shí)別片來(lái)實(shí)現(xiàn)。例如,按鍵256可包括物理按鈕、光學(xué)鍵或鍵盤(pán)。超聲輸入裝置258是可通過(guò)由電子裝置201的麥克風(fēng)(例如,麥克風(fēng)288)通過(guò)產(chǎn)生超聲信號(hào)的輸入工具檢測(cè)超聲波以識(shí)別數(shù)據(jù)并可執(zhí)行無(wú)線(xiàn)識(shí)別的裝置。根據(jù)實(shí)施例,電子裝置201通過(guò)使用通信模塊220從連接到電子裝置201的外部裝置(例如,計(jì)算機(jī)或服務(wù)器)接收用戶(hù)輸入。
顯示器260(例如,顯示器260)包括面板262、全息圖裝置264和投影儀266。面板262可以是例如LCD或有源矩陣OLED(AM-OLED)。面板262可被實(shí)現(xiàn)為例如柔性的、透明的或可穿戴的。面板262可用觸摸面板252和一個(gè)模塊來(lái)構(gòu)造。全息圖裝置264通過(guò)使用光的干涉在空中顯示立體圖像。投影儀266將光投射到屏幕上以顯示圖像。例如,屏幕可位于電子裝置201的內(nèi)部或外部。根據(jù)本公開(kāi)的實(shí)施例,顯示器260還可包括用于控制面板262、全息圖裝置264和投影儀266的控制電路。
接口270包括:例如,HDMI 272、USB 274、光學(xué)接口276和D-超小型(D-sub)278。接口270可包括在例如在圖1中示出的通信界面170中。另外地或可選地,接口270可包括:例如,移動(dòng)高清晰鏈接(MHL)接口、SD卡/多媒體卡(MMC)或紅外數(shù)據(jù)協(xié)會(huì)(IrDA)標(biāo)準(zhǔn)接口。
音頻模塊280可將聲音和電信號(hào)雙向轉(zhuǎn)換。音頻模塊280的至少一些組件可被包括在例如在圖1中示出的輸入/輸出接口150中。音頻模塊280對(duì)通過(guò)例如揚(yáng)聲器282、接收器284、耳機(jī)286、麥克風(fēng)288等輸入或輸出的聲音信息進(jìn)行處理。
相機(jī)模塊291是可拍攝靜態(tài)圖像和視頻的裝置。根據(jù)實(shí)施例,相機(jī)模塊291可包括一個(gè)或更多個(gè)圖像傳感器(例如,前置傳感器或后置傳感器)、圖像信號(hào)處理器(ISP)(未示出)或閃光燈(例如,LED或氙氣燈)。
電源管理模塊295管理電子裝置201的電源。盡管未示出,但電源管理模塊295可包括例如電源管理集成電路(PMIC)、充電器IC或電池或燃料表。
PMIC可被安裝在例如集成電路或SoC半導(dǎo)體中。充電方法可被分為有線(xiàn)方法和無(wú)線(xiàn)方法。充電器IC對(duì)電池充電,并防止來(lái)自充電器的過(guò)電壓或過(guò)電流。根據(jù)實(shí)施例,充電器IC包括用于有線(xiàn)充電方法和無(wú)線(xiàn)充電方法中的至少一種方法的充電器IC。無(wú)線(xiàn)充電方法包括例如磁共振方法、磁感應(yīng)法和電磁波法,并可添加用于無(wú)線(xiàn)充電的附加電路(例如,諸如線(xiàn)圈回路、諧振電路或整流器的電路等)。
電池量表測(cè)量例如電池296的剩余電量或在充電期間的電壓、電流和/或溫度。電池296可存儲(chǔ)電力或產(chǎn)生電力,并可通過(guò)使用存儲(chǔ)或產(chǎn)生的電力對(duì)電子裝置201供電。電池296可包括可再充電電池或太陽(yáng)能電池。
指示器297顯示電子裝置201或電子裝置201的一部分(例如,AP 210)的特定狀態(tài)(例如,啟動(dòng)狀態(tài)、消息狀態(tài)、充電狀態(tài)等)。電機(jī)298將電信號(hào)轉(zhuǎn)換成機(jī)械振動(dòng)。盡管未示出,但電子裝置201可包括用于支持移動(dòng)TV的處理單元(例如,GPU)。用于支持移動(dòng)TV的處理單元可根據(jù)數(shù)字多媒體廣播(DMB)、數(shù)字視頻廣播(DVB)或媒體流等的標(biāo)準(zhǔn)來(lái)對(duì)例如媒體數(shù)據(jù)進(jìn)行處理。
根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置的組件中的每個(gè)組件可用一個(gè)或更多個(gè)組件來(lái)實(shí)現(xiàn),并且相應(yīng)組件的名稱(chēng)可根據(jù)電子裝置的種類(lèi)而變化。根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置可包括上述組件中的至少一個(gè)組件,可省略上述組件中的一些組件,或還可包括額外組件。此外,根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置中的組件中一些組件被組合以形成單一的實(shí)體,因此可同等地執(zhí)行相應(yīng)組件在組合之前的功能。
圖3是示出根據(jù)本公開(kāi)的實(shí)施例的編程模塊的框圖。
參照?qǐng)D3,編程模塊310可被包括在(例如,被存儲(chǔ)在)電子設(shè)備101(例如,如圖1中示出的存儲(chǔ)器130)中??捎绍浖?、固件、硬件和/或其中的兩個(gè)或更多個(gè)的組合配置編程模塊310的至少一部分(例如,程序140)。編程模塊310可包括在硬件(例如,硬件200)中實(shí)現(xiàn)的用于控制關(guān)于電子裝置(例如,電子裝置101)的資源的OS和/或在OS上驅(qū)動(dòng)的各種應(yīng)用(例如,應(yīng)用370)。例如,OS可以是Android、iOS、Windows、Symbian、Tizen、Bada等。參照?qǐng)D3,編程模塊310可包括內(nèi)核320、中間件330、API 360和應(yīng)用370(例如,應(yīng)用147)。編程模塊310的至少一部分可被預(yù)加載在電子裝置上或從服務(wù)器(例如,電子裝置102、104和服務(wù)器106等)被下載。
內(nèi)核320可像內(nèi)核141一樣,可包括系統(tǒng)資源管理器321和/或裝置驅(qū)動(dòng)器323。系統(tǒng)資源管理器321可包括:例如,進(jìn)程管理器、存儲(chǔ)器管理器和文件系統(tǒng)管理器。系統(tǒng)資源管理器321可控制、分配和/或收集系統(tǒng)資源。裝置驅(qū)動(dòng)器323可包括:例如,顯示驅(qū)動(dòng)器、機(jī)相驅(qū)動(dòng)器、BT驅(qū)動(dòng)器、共享存儲(chǔ)器驅(qū)動(dòng)器,USB驅(qū)動(dòng)器、鍵盤(pán)驅(qū)動(dòng)器、Wi-Fi驅(qū)動(dòng)器和音頻驅(qū)動(dòng)器。此外,根據(jù)實(shí)施例,裝置驅(qū)動(dòng)器323可包括進(jìn)程間通信(IPC)驅(qū)動(dòng)器(未示出)。
中間件330可包括預(yù)先實(shí)現(xiàn)的用于提供由應(yīng)用370常用的功能的多個(gè)模塊。此外,中間件330可通過(guò)API 360提供這些功能,使得應(yīng)用370可有效地使用電子設(shè)備內(nèi)的有限的系統(tǒng)資源。例如,如圖3所示,中間件330可包括以下項(xiàng)中的至少一項(xiàng):運(yùn)行時(shí)庫(kù)335、應(yīng)用管理器341、窗口管理器342、多媒體管理器343、資源管理器344、電源管理器345、數(shù)據(jù)庫(kù)管理器346、包管理器347、連接管理器348、通知管理器349、位置管理器350、圖形管理器351、安全管理器352和支付管理器354。
運(yùn)行時(shí)庫(kù)335可包括編譯器在應(yīng)用370中的一個(gè)應(yīng)用被執(zhí)行時(shí)用于通過(guò)編程語(yǔ)言添加新的功能的庫(kù)模塊。根據(jù)實(shí)施例,運(yùn)行時(shí)庫(kù)335可執(zhí)行輸入/輸出、存儲(chǔ)器管理和/或針對(duì)算術(shù)功能的功能。
應(yīng)用管理器341可管理應(yīng)用370中的至少一個(gè)應(yīng)用的生命周期。窗口管理器342可管理由屏幕使用的圖形用戶(hù)界面(GUI)資源。多媒體管理器343可檢測(cè)用于各種媒體文件的再現(xiàn)的格式,并可通過(guò)使用適合于相應(yīng)格式的編解碼器來(lái)執(zhí)行對(duì)媒體文件的編碼和/或解碼。資源管理器344可管理資源(諸如,源代碼、存儲(chǔ)器和應(yīng)用370中的至少一個(gè)應(yīng)用的存儲(chǔ)空間)。
電源管理器345可管理電池和/或電源,同時(shí)和基本輸入/輸出系統(tǒng)(BIOS)一起操作,并可提供用于操作的電源信息。數(shù)據(jù)庫(kù)管理器346可管理將被應(yīng)用370中的至少一個(gè)應(yīng)用使用的數(shù)據(jù)庫(kù)的生成、搜索和/或更改。軟件包管理器347可管理以包文件的形式分布的應(yīng)用的安裝和/或更新。
例如,連接管理器348可管理諸如Wi-Fi或BT的無(wú)線(xiàn)連接。通知管理器349可以以不打擾用戶(hù)的方式顯示和/或通知事件(諸如,到來(lái)的消息、承諾或鄰近通知等)。位置管理器350可管理電子設(shè)備的位置信息。圖形管理器351可管理將要提供給用戶(hù)的圖形效果和/或與圖形效果相關(guān)的用戶(hù)界面。安全管理器352可提供用于系統(tǒng)安全和/或用戶(hù)認(rèn)證的所有安全功能。根據(jù)實(shí)施例,當(dāng)電子設(shè)備(例如,電子設(shè)備101)具有電話(huà)呼叫功能,中間件330還可包括用于管理電子設(shè)備的語(yǔ)音和/或視頻通信功能的電話(huà)管理器(未示出)。支付管理器354能夠?qū)⒅Ц缎畔膽?yīng)用370傳遞給應(yīng)用370或內(nèi)核320??蛇x地,支付管理器354能夠?qū)耐獠垦b置接收的與支付相關(guān)的信息存儲(chǔ)在電子裝置200或?qū)⒋鎯?chǔ)在電子裝置200中的信息發(fā)送到外部裝置。
中間件330可通過(guò)上述內(nèi)部元件模塊的各種功能的組合來(lái)生成和使用新的中間件模塊。中間件330可根據(jù)OS的類(lèi)型提供專(zhuān)用的模塊以提供不同的功能。此外,中間件330可動(dòng)態(tài)地刪除一些現(xiàn)有的元件和/或添加新的元件。因此,中間件330可以排除在本公開(kāi)的各種實(shí)施例中所描述的一些元件,還包括其他的元件,和/或用具有不同名稱(chēng)并執(zhí)行與相似功能的元件來(lái)替代這些元件。
API 360可與API 133相似,是一組API編程功能,并可根據(jù)OS而被提供不同的構(gòu)造。例如,在A(yíng)ndroid或iOS的情況下,一個(gè)API組可針對(duì)各個(gè)平臺(tái)被提供,在Tizen的情況下,兩個(gè)或更多個(gè)API組可被提供。
可包括與應(yīng)用147類(lèi)似的應(yīng)用的應(yīng)用370可包括,例如,預(yù)加載的應(yīng)用程序和/或第三方應(yīng)用程序。應(yīng)用370可包括下列項(xiàng)中的一個(gè)或更多個(gè):主頁(yè)應(yīng)用371、撥號(hào)器應(yīng)用372、SMS/多媒體消息(MMS)應(yīng)用373、即時(shí)消息(IM)應(yīng)用374、瀏覽器應(yīng)用375、相機(jī)應(yīng)用376、鬧鐘應(yīng)用377、聯(lián)系人應(yīng)用378、語(yǔ)音撥號(hào)應(yīng)用379、電子郵件應(yīng)用380、日歷應(yīng)用381、媒體播放器的應(yīng)用382、相冊(cè)應(yīng)用383、時(shí)鐘應(yīng)用384、支付應(yīng)用385、醫(yī)療應(yīng)用(例如,血壓和運(yùn)動(dòng)強(qiáng)度的測(cè)量等)、提供環(huán)境信息(例如,大氣壓力、濕度、溫度等)的應(yīng)用等。然而,本實(shí)施例不限于此,應(yīng)用370可包括任何其他類(lèi)似和/或適用的應(yīng)用。
根據(jù)實(shí)施例,應(yīng)用370能夠包括用于支持電子裝置(例如,電子裝置101)和外部裝置(例如,電子裝置102和104)之間的信息交換的應(yīng)用(下文中稱(chēng)為“信息交換應(yīng)用”)。信息交換應(yīng)用能夠包括用于將特定信息轉(zhuǎn)發(fā)到外部裝置的通知轉(zhuǎn)發(fā)應(yīng)用或用于管理外部裝置的裝置管理應(yīng)用。
例如,通知轉(zhuǎn)發(fā)應(yīng)用能夠包括用于將在電子裝置的其他應(yīng)用(例如,SMS/MMS應(yīng)用、電子郵件應(yīng)用、醫(yī)療應(yīng)用和環(huán)境信息應(yīng)用等)中創(chuàng)建的通知信息轉(zhuǎn)發(fā)到外部裝置(例如,電子裝置102和104)的功能。此外,通知轉(zhuǎn)發(fā)應(yīng)用能夠從外部裝置接收通知信息以將接收到的信息提供給用戶(hù)。
裝置管理應(yīng)用能夠管理(例如,安裝,刪除或更新)與電子裝置通信的外部裝置(例如,電子裝置102和104)的至少一個(gè)功能。所述功能的示例是打開(kāi)/關(guān)閉外部裝置或外部裝置的一部分的功能、控制顯示器的亮度(或分辨率)的功能、在外部裝置上運(yùn)行的應(yīng)用、由外部裝置提供的服務(wù)等。所述服務(wù)的示例是呼叫服務(wù)、消息服務(wù)等。
根據(jù)實(shí)施例,應(yīng)用370能夠包括指定外部裝置(例如,電子裝置102和104)的屬性的應(yīng)用(例如,移動(dòng)醫(yī)療裝置的醫(yī)療應(yīng)用等)。根據(jù)實(shí)施例,應(yīng)用370能夠包括從外部裝置(例如,服務(wù)器106、電子裝置102和104)接收的應(yīng)用。根據(jù)實(shí)施例,應(yīng)用370能夠包括預(yù)加載的應(yīng)用或可從服務(wù)器下載的第三方應(yīng)用。應(yīng)該理解的是,編程模塊310的組件可根據(jù)操作系統(tǒng)的類(lèi)型被稱(chēng)為不同的名稱(chēng)。
根據(jù)各種實(shí)施例,編程模塊310的至少一部分可用軟件、固件、硬件或它們中兩個(gè)或兩個(gè)以上的任何組合來(lái)實(shí)現(xiàn)。編程模塊310的至少一部分可以由處理器(例如,處理器210)來(lái)實(shí)現(xiàn)(例如,執(zhí)行)。編程模塊310的至少一部分可包括模塊、程序、例行程序、指令集或進(jìn)程等,以執(zhí)行一個(gè)或更多個(gè)功能。
圖4是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201選擇與文本將被轉(zhuǎn)化成的語(yǔ)音相關(guān)聯(lián)的信息并基于所選擇的信息產(chǎn)生聲學(xué)信號(hào)的操作的流程圖。
參照?qǐng)D4,在操作401,電子裝置201可獲取至少一個(gè)文本。電子裝置201可通過(guò)輸入裝置250從用戶(hù)獲取至少一個(gè)文本,并從外部裝置接收包括至少一個(gè)文本的文本消息。
在操作403,電子設(shè)備201可選擇與獲取的文本將被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息。與語(yǔ)音相關(guān)聯(lián)的信息可包括所述語(yǔ)音的語(yǔ)言信息或所述語(yǔ)音的說(shuō)話(huà)人信息。例如,語(yǔ)音的語(yǔ)言信息可包括關(guān)于聲學(xué)數(shù)據(jù)集是由哪個(gè)國(guó)家的語(yǔ)言(例如,韓語(yǔ)、英語(yǔ)、法語(yǔ)等)組成的信息,語(yǔ)音的說(shuō)話(huà)人信息可包括關(guān)于聲學(xué)數(shù)據(jù)集是由哪個(gè)說(shuō)話(huà)人(例如,男性說(shuō)話(huà)人、女性說(shuō)話(huà)人、根據(jù)年齡的說(shuō)話(huà)人或根據(jù)地區(qū)的說(shuō)話(huà)人(例如,講方言的說(shuō)話(huà)人)等)的說(shuō)話(huà)方式組成的信息。電子裝置201可從用戶(hù)接收與語(yǔ)音相關(guān)聯(lián)的信息以選擇與語(yǔ)音關(guān)聯(lián)的信息,或者電子裝置201可通過(guò)分析獲取的文本來(lái)確定與語(yǔ)音關(guān)聯(lián)的信息。例如,電子裝置201可從用戶(hù)接收對(duì)于獲取的文本將被轉(zhuǎn)換成的語(yǔ)音是被再現(xiàn)為韓語(yǔ)還是被再現(xiàn)為男性聲音的選擇,或可通過(guò)分析所述文本來(lái)確定所述文本是否由任何國(guó)家的語(yǔ)言組成。根據(jù)本公開(kāi)的各種實(shí)施例,操作403可在文本被獲取之前(即,在操作401之前)被用戶(hù)選擇。根據(jù)本公開(kāi)的各種實(shí)施例,所選擇的信息可被存儲(chǔ)在存儲(chǔ)器230中。
在操作405,電子裝置201可檢查所選擇的信息。電子裝置201可確定所選擇的信息是第一信息還是第二信息。電子裝置201可檢查與所選擇的信息相應(yīng)的決策樹(shù)。電子裝置201可從外部裝置(例如,超級(jí)群集型通用聲學(xué)數(shù)據(jù)提供服務(wù)器)接收關(guān)于決策樹(shù)的數(shù)據(jù),并將接收到的數(shù)據(jù)存儲(chǔ)在存儲(chǔ)器230中。決策樹(shù)可由多條路徑組成,并且每條路徑的末端(葉節(jié)點(diǎn))可包括指示超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的特定聲學(xué)數(shù)據(jù)的索引信息。
圖5是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置將聲學(xué)數(shù)據(jù)集的至少一條路徑映射到超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一部分的操作的示圖。
參照?qǐng)D5,第一決策樹(shù)510可由多條路徑組成,其中,所述多條路徑指示由女性聲音講的英語(yǔ)的語(yǔ)言處理結(jié)果,每條路徑的末端可包括指示音素單元中的聲學(xué)數(shù)據(jù)(例如,與女性聲音講的“g”相應(yīng)的聲學(xué)數(shù)據(jù))的索引信息。根據(jù)本公開(kāi)的各種實(shí)施例,包括在決策樹(shù)中的索引信息可指示音素單元中的聲學(xué)數(shù)據(jù),或指示音素單元中的聲學(xué)數(shù)據(jù)被劃分為預(yù)定的時(shí)間間隔的細(xì)分音素單元中的聲學(xué)數(shù)據(jù)。
在操作407,當(dāng)與文本將被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息是第一信息時(shí),電子裝置201可選擇多條第一路徑中的至少一條第一路徑。第一信息可包括以下項(xiàng)中的至少一項(xiàng):語(yǔ)音的語(yǔ)言信息和語(yǔ)音的說(shuō)話(huà)人信息。例如,參照?qǐng)D5,當(dāng)所選擇的信息是由女性聲音講的英語(yǔ),獲取的文本是“go”,并且與所選擇的信息相關(guān)的第一決策樹(shù)510由指示關(guān)于女性聲音講英音的聲學(xué)數(shù)據(jù)的索引信息組成時(shí),電子裝置201可選擇關(guān)于包括在第一決策樹(shù)510中的女性聲音“g”的路徑(例如,到索引A4的路徑)以將獲取的文本轉(zhuǎn)換為語(yǔ)音信號(hào),并選擇包括在第一決策樹(shù)510中的女性聲音“o”的路徑(例如,到索引An-1的路徑)。決策樹(shù)的至少一個(gè)索引可指示構(gòu)造超級(jí)群集型通用數(shù)據(jù)集的至少一個(gè)聲學(xué)數(shù)據(jù)。根據(jù)本公開(kāi)的各種實(shí)施例,多條第一路徑可指示所述超級(jí)群集型通用數(shù)據(jù)集中的一部分。例如,參照?qǐng)D5,第一決策樹(shù)510的一條路徑(到索引A1的路徑)可指示超級(jí)群集型通用聲學(xué)數(shù)據(jù)集500的聲學(xué)數(shù)據(jù)S2,另一索引(到索引A2的路徑)可指示超級(jí)群集型通用聲學(xué)數(shù)據(jù)集500的聲學(xué)數(shù)據(jù)S3。可基于至少一個(gè)聲學(xué)數(shù)據(jù)集產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集(SCCAD)。將參照下面的圖6描述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的產(chǎn)生的內(nèi)容。
在操作409,電子裝置201可基于所選擇的至少一條第一路徑來(lái)產(chǎn)生第一聲學(xué)信號(hào)。電子裝置201可基于所選擇的至少一條第一路徑加載超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分,并基于加載的一部分超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)產(chǎn)生第一聲學(xué)信號(hào)。超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分可以是與語(yǔ)音的特定說(shuō)話(huà)人信息或特定語(yǔ)言信息相應(yīng)的聲學(xué)數(shù)據(jù)集。電子裝置201可基于輸入的文本選擇超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的至少一部分,并基于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分的至少一部分來(lái)產(chǎn)生第一聲學(xué)信號(hào)。超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分的至少一部分代表與聲學(xué)信號(hào)的元素相應(yīng)的聲學(xué)數(shù)據(jù),并與下列項(xiàng)中的至少一項(xiàng)相應(yīng):聲學(xué)信號(hào)中的至少一些聲學(xué)信號(hào)的頻譜、音調(diào)和噪音。例如,參照?qǐng)D5,要將由電子裝置201獲取的文本“go”轉(zhuǎn)換為聲學(xué)信號(hào),電子裝置201可選擇針對(duì)包括在第一決策樹(shù)510中的“g”的路徑(到索引A4的路徑)和針對(duì)包括在決策樹(shù)510中的“o”的路徑(到索引An-1的路徑),并可從超級(jí)群集型通用聲學(xué)數(shù)據(jù)集選擇與所選擇的至少一條第一路徑相應(yīng)的至少一個(gè)聲學(xué)數(shù)據(jù)(由所選擇的索引指示的聲學(xué)數(shù)據(jù))。電子裝置201可加載所選擇的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一個(gè)聲學(xué)數(shù)據(jù),并基于加載的聲學(xué)數(shù)據(jù)產(chǎn)生第一聲學(xué)信號(hào)。電子裝置201可通過(guò)揚(yáng)聲器282輸出第一聲學(xué)信號(hào)。根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可按音素單元分析輸入的文本句子,或分析音素被劃分成的細(xì)分音素單元。電子裝置201可選擇針對(duì)每個(gè)音素單元或每個(gè)細(xì)分音素單元的聲學(xué)數(shù)據(jù),并將所選擇的聲學(xué)數(shù)據(jù)合成以產(chǎn)生針對(duì)整個(gè)文本的合成聲音。電子裝置201可通過(guò)揚(yáng)聲器282輸出針對(duì)整個(gè)文本的合成聲音。
在操作411,當(dāng)與文本將被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息是第二信息時(shí),電子裝置201可選擇多條第二路徑中的至少一條。第二信息是與第一信息不同的信息,第二信息可包括下列項(xiàng)中的至少一項(xiàng):語(yǔ)音的語(yǔ)言信息和語(yǔ)音的說(shuō)話(huà)人信息。例如,參照?qǐng)D5,當(dāng)所選擇的信息是關(guān)于男性聲音講的韓語(yǔ)的信息,并存在與所選擇的信息相應(yīng)的第二決策樹(shù)520時(shí),決策樹(shù)的至少一個(gè)索引可指示構(gòu)成超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一個(gè)聲學(xué)數(shù)據(jù)。根據(jù)本公開(kāi)的各種實(shí)施例,多條第二路徑可指示超級(jí)群集型通用數(shù)據(jù)集中的一部分。例如,參照?qǐng)D5,第二決策樹(shù)520的一條路徑(到索引B1的路徑)可指示超級(jí)群集型通用聲學(xué)數(shù)據(jù)集500的聲學(xué)數(shù)據(jù)S4,另一路徑(到索引B2的路徑)可指示超級(jí)群集型超級(jí)通用聲學(xué)數(shù)據(jù)集500的聲學(xué)數(shù)據(jù)S5。
在操作413,電子裝置201可基于所選擇的至少一條第二路徑產(chǎn)生第二聲學(xué)信號(hào)。電子裝置201可基于所選擇的至少一條第二路徑加載超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分(在操作409基于第一路徑被加載的聲學(xué)數(shù)據(jù))或另外一部分,并基于加載的一部分超級(jí)群集型通用聲學(xué)數(shù)據(jù)集或另外一部分超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)產(chǎn)生第二聲學(xué)信號(hào)。例如,參照?qǐng)D5,第一決策樹(shù)510的一條路徑(到索引A4的路徑)和第二決策樹(shù)520的一條路徑(到索引B2的路徑)可指示相同的聲學(xué)數(shù)據(jù)S5。超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的一部分或另外一部分可以是與語(yǔ)音的特定說(shuō)話(huà)人信息或語(yǔ)音的特定語(yǔ)言信息相應(yīng)的聲學(xué)數(shù)據(jù)集。電子裝置201可基于輸入的文本選擇超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的至少一部分,并基于超級(jí)群集型通用數(shù)據(jù)集中的一部分的至少一部分額外地產(chǎn)生第二聲學(xué)信號(hào)。超級(jí)群集型通用數(shù)據(jù)集中的一部分的至少一部分代表與聲學(xué)信號(hào)的元素相應(yīng)的聲學(xué)數(shù)據(jù),并與下列項(xiàng)中的至少一項(xiàng)相應(yīng):聲學(xué)信號(hào)中的至少一些聲學(xué)信號(hào)的頻譜、音調(diào)和噪音。電子裝置201可加載所選擇的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的至少一個(gè)聲學(xué)數(shù)據(jù),并基于加載的聲學(xué)數(shù)據(jù)產(chǎn)生第二聲學(xué)信號(hào)。電子裝置201可通過(guò)揚(yáng)聲器282輸出第二聲學(xué)信號(hào)。根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可按音素單元分析輸入的文本句子或分析音素被劃分成的細(xì)分音素單元。電子裝置201可選擇針對(duì)每個(gè)音素單元或每個(gè)細(xì)分音素單元的聲學(xué)數(shù)據(jù),并將所選擇的聲學(xué)數(shù)據(jù)合成以產(chǎn)生針對(duì)整個(gè)文本的合成聲音。電子裝置201可通過(guò)揚(yáng)聲器282輸出針對(duì)整個(gè)文本的合成聲音。
圖6是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)的操作的流程圖。
電子裝置201可獲取與關(guān)于語(yǔ)音的第一信息相應(yīng)的第一聲學(xué)數(shù)據(jù)集以及與關(guān)于語(yǔ)音的第二信息相應(yīng)的第二聲學(xué)數(shù)據(jù)集。第一信息或第二信息可包括語(yǔ)音的語(yǔ)言信息或說(shuō)話(huà)人信息。
圖7A是示出根據(jù)本公開(kāi)的各種實(shí)施例的確定第一聲學(xué)數(shù)據(jù)集的至少一部分和第二聲學(xué)數(shù)據(jù)集的至少一部分之間的相似度,并基于對(duì)相似度的確定而產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的操作的示圖。
參照?qǐng)D7A,電子裝置201可獲取第一聲學(xué)數(shù)據(jù)集710和第二聲學(xué)數(shù)據(jù)集720,其中,第一聲學(xué)數(shù)據(jù)集710是與由女性聲音(第一信息)講的英語(yǔ)相應(yīng)的聲學(xué)數(shù)據(jù)的集,第二聲學(xué)數(shù)據(jù)集720是與由男性聲音(第二信息)講的韓語(yǔ)相應(yīng)的聲學(xué)數(shù)據(jù)的集。
將描述在操作601中將超級(jí)群集型通用聲學(xué)數(shù)據(jù)配置為第一聲學(xué)數(shù)據(jù)集和第二聲學(xué)數(shù)據(jù)集的方法,但也可獲取超過(guò)上述聲學(xué)數(shù)據(jù)集的聲學(xué)數(shù)據(jù)集。可獲取多個(gè)聲學(xué)數(shù)據(jù)集,并且可對(duì)多個(gè)聲學(xué)數(shù)據(jù)集執(zhí)行在操作603中的處理。
在操作603,電子裝置201可確定第一聲學(xué)數(shù)據(jù)中的至少一部分和第二聲學(xué)數(shù)據(jù)中的至少一部分之間的相似度。電子裝置201可確定聲學(xué)數(shù)據(jù)集的至少一部分的頻譜、音調(diào)和噪音中的至少一個(gè)相似度。例如,電子裝置201可基于向量量化將與聲學(xué)數(shù)據(jù)集中的至少一部分相應(yīng)的聲學(xué)數(shù)據(jù)向量化以確定相似度。電子裝置201可將聲學(xué)信號(hào)的頻譜、音調(diào)和噪音中的至少一個(gè)向量化,并基于向量化的值確定相似度。例如,參照?qǐng)D7A,電子裝置201可獲取收集了第一聲學(xué)數(shù)據(jù)集710的至少一部分和/或第二聲學(xué)數(shù)據(jù)集720的至少一個(gè)的完全聲學(xué)數(shù)據(jù)集701。電子裝置201可確定完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)A2 711和完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)B2 721之間的相似度。為確定相似度,電子裝置201可將聲學(xué)數(shù)據(jù)A2 711的頻譜712向量化以獲取向量值713,并將聲學(xué)數(shù)據(jù)B2 721的頻譜722向量化以獲取向量值723。電子裝置201可將A2的語(yǔ)音向量值521與B3的語(yǔ)音向量值522進(jìn)行比較以確定聲學(xué)數(shù)據(jù)之間的相似度。根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可執(zhí)行k-均值的算法、模糊算法、高斯混合模型(GMM)算法、勞埃德算法等來(lái)確定在第一聲學(xué)數(shù)據(jù)集中的至少一部分和/或第二聲學(xué)數(shù)據(jù)集中的至少一部分之間的相似度。根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可獲取收集了第一聲學(xué)數(shù)據(jù)集710和第二聲學(xué)數(shù)據(jù)集720的至少一部分的完全聲學(xué)數(shù)據(jù)集701,(1)確定完全聲學(xué)數(shù)據(jù)集701的第一聲學(xué)數(shù)據(jù)集710的聲學(xué)數(shù)據(jù)和完全聲學(xué)數(shù)據(jù)集701的第二聲學(xué)數(shù)據(jù)集720的聲學(xué)數(shù)據(jù)之間的相似度,(2)確定完全聲學(xué)數(shù)據(jù)集701的第一聲學(xué)數(shù)據(jù)集710的聲學(xué)數(shù)據(jù)之間的相似度,或(3)確定完全聲學(xué)數(shù)據(jù)集701的第二聲學(xué)數(shù)據(jù)集720的聲學(xué)數(shù)據(jù)之間的相似度。
根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可獲取收集了至少一個(gè)聲學(xué)數(shù)據(jù)集的完全聲學(xué)數(shù)據(jù)集,并將完全聲學(xué)數(shù)據(jù)集劃分成預(yù)定數(shù)量的包括多個(gè)聲學(xué)數(shù)據(jù)的群集。
圖7B是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置在收集了至少一個(gè)聲學(xué)數(shù)據(jù)集的完全聲學(xué)數(shù)據(jù)集中執(zhí)行群集算法的操作的示圖。
參照?qǐng)D7B的<730>,電子裝置201可從收集了至少一個(gè)聲學(xué)數(shù)據(jù)集的完全聲學(xué)數(shù)據(jù)集710隨機(jī)選擇代表聲學(xué)數(shù)據(jù)731、732和733。參照<740>,電子裝置201可針對(duì)每個(gè)聲學(xué)數(shù)據(jù)基于代表聲學(xué)數(shù)據(jù)731、732和733的平均距離劃分群集741、742和743。參照<750>,電子裝置201可確定各個(gè)聲學(xué)數(shù)據(jù)和代表聲學(xué)數(shù)據(jù)731、732和733之間的相似度,以將各個(gè)聲學(xué)數(shù)據(jù)劃分為具有高相似度的代表聲學(xué)數(shù)據(jù)。參照<760>,電子裝置201可基于劃分的聲學(xué)數(shù)據(jù)重新調(diào)整群集。電子裝置201可執(zhí)行重復(fù)處理<730>到處理<760>的群集算法以形成具有高相似度的聲學(xué)數(shù)據(jù)的群集。電子裝置201可基于在操作605中的相似度確定來(lái)產(chǎn)生與第一聲學(xué)數(shù)據(jù)集中的一部分和第二聲學(xué)數(shù)據(jù)集中的至少一部分相關(guān)聯(lián)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。當(dāng)相似度等于或大于所選擇的閾值時(shí),電子裝置201可確定與第一聲學(xué)數(shù)據(jù)集中的至少一部分和第二聲學(xué)數(shù)據(jù)集中的至少一部分二者相應(yīng)的第一參數(shù),當(dāng)相似度小于所選擇的閾值時(shí),電子裝置201確定與第一聲學(xué)數(shù)據(jù)集中的至少一部分相應(yīng)的第二參數(shù)和與第二聲學(xué)數(shù)據(jù)集中的至少一部分相應(yīng)的第三參數(shù)。第一參數(shù)、第二參數(shù)或第三參數(shù)可與下列項(xiàng)中的至少一項(xiàng)相應(yīng):語(yǔ)音中的至少一些語(yǔ)音的頻譜、音調(diào)和噪音。例如,參照?qǐng)D7A,當(dāng)完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)A2 711的頻譜712和完全聲學(xué)數(shù)據(jù)集720的聲學(xué)數(shù)據(jù)B2 721的頻譜722之間的相似度等于或大于閾值時(shí),電子裝置201可產(chǎn)生與聲學(xué)數(shù)據(jù)A2 711的頻譜712和聲學(xué)數(shù)據(jù)B2 721的頻譜722兩者相應(yīng)的聲學(xué)數(shù)據(jù)S1 530a的頻譜。當(dāng)完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)A2 711的頻譜712和完全聲學(xué)數(shù)據(jù)集720的聲學(xué)數(shù)據(jù)B2 721的頻譜722之間的相似度等于或大于閾值時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可將聲學(xué)數(shù)據(jù)A2 711的頻譜712和聲學(xué)數(shù)據(jù)B2 721的頻譜722之一確定為超級(jí)群集型通用聲學(xué)數(shù)據(jù)集500的聲學(xué)數(shù)據(jù)S1 501。
當(dāng)完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)A2 711的頻譜和完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)B2 721的頻譜之間的相似度小于閾值時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可產(chǎn)生與聲學(xué)數(shù)據(jù)A2 711的頻譜相應(yīng)的聲學(xué)數(shù)據(jù)S2 502的頻譜和與聲學(xué)數(shù)據(jù)B2 721的頻譜相應(yīng)的聲學(xué)數(shù)據(jù)S3 503的頻譜。當(dāng)完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)A2 711的頻譜和完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)B2 721的頻譜之間的相似度小于閾值時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可將聲學(xué)數(shù)據(jù)A2 711的頻譜確定為聲學(xué)數(shù)據(jù)S2 502的頻譜,并將聲學(xué)數(shù)據(jù)B2 721的頻譜確定為聲學(xué)數(shù)據(jù)S3 503的頻譜。根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201可在超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的聲學(xué)數(shù)據(jù)之間設(shè)置足夠的閾值以防止聲音質(zhì)量的下降,并基于該閾值對(duì)超級(jí)群集型數(shù)據(jù)集的聲學(xué)數(shù)據(jù)進(jìn)行群集。電子裝置201可執(zhí)行k-均值算法、模糊算法、GMM算法,勞埃德算法等以確定相似度等于或大于閾值的聲學(xué)數(shù)據(jù),并確定表示該聲學(xué)數(shù)據(jù)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)。電子裝置201可確定相似度小于閾值的聲學(xué)數(shù)據(jù),并確定與各個(gè)聲學(xué)數(shù)據(jù)相應(yīng)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)。
圖8是示出根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置201產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集并將特定聲學(xué)數(shù)據(jù)的多條路徑匹配到超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的操作的示圖。
參照?qǐng)D8,電子裝置201可使用至少一個(gè)聲學(xué)數(shù)據(jù)集產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)(SCCAD)500。電子裝置201可確定收集了各個(gè)聲學(xué)數(shù)據(jù)集的完全聲學(xué)數(shù)據(jù)集的聲學(xué)數(shù)據(jù)之間的相似度??赏ㄟ^(guò)比較語(yǔ)音的頻譜、音調(diào)和噪音等的至少一個(gè)來(lái)執(zhí)行對(duì)聲學(xué)數(shù)據(jù)之間的相似度的確定。當(dāng)聲學(xué)數(shù)據(jù)之間的相似度等于或大于所選擇的閾值時(shí),電子裝置201可確定與所有聲學(xué)數(shù)據(jù)相應(yīng)的參數(shù),當(dāng)聲學(xué)數(shù)據(jù)之間的相似度小于所選擇的閾值時(shí),電子裝置201可確定與各個(gè)聲學(xué)數(shù)據(jù)相應(yīng)的參數(shù)。例如,參照?qǐng)D7A,電子裝置201可確定完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)A3和完全聲學(xué)數(shù)據(jù)集701的聲學(xué)數(shù)據(jù)B2之間的相似度,以在相似度等于或大于閾值的情況下確定與聲學(xué)數(shù)據(jù)A3和聲學(xué)數(shù)據(jù)B2兩者相應(yīng)的第一參數(shù),并在相似度小于閾值的情況下確定與聲學(xué)數(shù)據(jù)A3相應(yīng)的第二參數(shù)和與聲學(xué)數(shù)據(jù)B2相應(yīng)的第三參數(shù)。電子裝置201可基于第一參數(shù)、第二參數(shù)或第三參數(shù)產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集500的聲學(xué)數(shù)據(jù)。
電子裝置201除了可獲取現(xiàn)存的聲學(xué)模型之外還可另外獲取新的聲學(xué)模型,新獲取的聲學(xué)模型可包括決策樹(shù)和與該決策樹(shù)匹配的聲學(xué)數(shù)據(jù)集。當(dāng)獲取新的聲學(xué)模型時(shí),電子裝置201可將聲學(xué)模型的決策樹(shù)和超級(jí)群集型通用聲學(xué)數(shù)據(jù)集重新匹配。例如,參照?qǐng)D8,電子裝置201可獲取包括P決策樹(shù)726和P聲學(xué)數(shù)據(jù)的P聲學(xué)模型,當(dāng)P決策樹(shù)726由多條路徑(到索引P1、P2、P3和P4的路徑)組成時(shí),電子裝置201可檢查由P決策樹(shù)726的索引P1 801指示的P聲學(xué)數(shù)據(jù)集的聲學(xué)數(shù)據(jù)。電子裝置201可在超級(jí)群集型通用聲學(xué)數(shù)據(jù)集500中搜索與由P1 801最初指示的聲學(xué)數(shù)據(jù)具有最高相似度的聲學(xué)數(shù)據(jù),并用指示通用聲學(xué)數(shù)據(jù)的聲學(xué)數(shù)據(jù)的索引S8 811來(lái)代替P決策樹(shù)726的索引P1 801。相似地,電子裝置201可用指示超級(jí)群集型通用聲學(xué)數(shù)據(jù)的聲學(xué)數(shù)據(jù)的索引S21 812來(lái)代替P決策樹(shù)726的索引P2 802,用指示所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)的聲學(xué)數(shù)據(jù)的索引S3 813來(lái)代替P決策樹(shù)726的索引P3 803,并用指示超級(jí)群集型通用聲學(xué)數(shù)據(jù)的聲學(xué)數(shù)據(jù)的索引S30 814來(lái)代替P決策樹(shù)726的索引P4 804。P決策樹(shù)726的每個(gè)索引都可被指示與最初指示的聲學(xué)數(shù)據(jù)具有最大相似度的聲學(xué)數(shù)據(jù)(超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的聲學(xué)數(shù)據(jù))的索引代替。
圖9是根據(jù)本公開(kāi)的各種實(shí)施例的第一電子裝置的框圖和第二電子裝置的框圖。
參照?qǐng)D9,第一電子裝置901可包括處理器910、存儲(chǔ)器920、輸入裝置930和通信模塊940。第二電子裝置902可包括處理器950、存儲(chǔ)器960和通信模塊970。雖然未在圖9中被示出,根據(jù)本公開(kāi)的各種實(shí)施例的第一電子裝置901和第二電子裝置902可包括在圖2中示出的電子裝置201的所有組件。
根據(jù)本公開(kāi)的各種實(shí)施例的第一電子裝置901的處理器910可執(zhí)行圖2的電子裝置201的處理器210的功能。處理器910可包括文本分析器911、鏈接器912和合成聲音生成器913。
文本分析器911可分析由電子裝置901獲取的至少一個(gè)文本,并選擇與獲取的文本將被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息。例如,文本分析器911可分析文本以選擇關(guān)于文本是被再現(xiàn)為韓語(yǔ)還是被再現(xiàn)為男性聲音的信息。
鏈接器912可確定所選擇的信息是第一信息還第二信息。鏈接器912可檢查與所選擇的信息相應(yīng)的決策樹(shù)。當(dāng)與文本將被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息是第一信息時(shí),鏈接器912可選擇包括在決策樹(shù)中的多條第一路徑中的至少一條第一路徑。鏈接器912可基于所選擇的至少一條第一路徑加載超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分。當(dāng)與文本將被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息是第二信息時(shí),鏈接器912可選擇包括決策樹(shù)中的多條第二路徑中的至少一條第二路徑。鏈接器912可基于所選擇的至少一條第二路徑加載超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分或另一部分。合成聲音生成器913可基于所選擇的至少一條第一路徑產(chǎn)生第一聲學(xué)信號(hào)。合成聲音生成器913可基于輸入的文本選擇超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的至少一部分,并基于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分的至少一部分額外地產(chǎn)生第一聲學(xué)信號(hào)。合成聲音生成器913可通過(guò)揚(yáng)聲器282輸出第一聲學(xué)信號(hào)。合成聲音生成器913可基于由鏈接器912選擇的多條第一路徑加載多個(gè)超級(jí)群集型通用聲學(xué)數(shù)據(jù),合成加載的聲學(xué)數(shù)據(jù)以在一個(gè)句子單元輸出語(yǔ)音,然后輸出被合成的聲學(xué)數(shù)據(jù)。
合成聲音生成器913可基于所選擇的至少一條第二路徑產(chǎn)生第二聲學(xué)信號(hào)。合成聲音生成器913可基于輸入的文本選擇超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的至少一部分,并基于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分的至少一部分額外地產(chǎn)生第二聲學(xué)信號(hào)。合成聲音生成器913可通過(guò)揚(yáng)聲器282輸出第二聲學(xué)信號(hào)。合成聲音生成器913可基于由鏈接器912選擇的多條第二路徑加載多個(gè)超級(jí)群集型通用聲學(xué)數(shù)據(jù),合成加載的聲學(xué)數(shù)據(jù)以在一個(gè)句子單元輸出語(yǔ)音,然后輸出合成的聲學(xué)數(shù)據(jù)。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置901的存儲(chǔ)器920可存儲(chǔ)這樣的指令:該指令可使處理器910能夠執(zhí)行以下操作:獲取至少一個(gè)文本,選擇與獲取的文本將被轉(zhuǎn)換成的語(yǔ)音相關(guān)聯(lián)的信息,當(dāng)所選擇的信息是第一信息時(shí),選擇多條第一路徑中的至少一條第一路徑,基于所選擇的至少一條第一路徑加載超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分,并基于加載的一部分超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)產(chǎn)生第一聲學(xué)信號(hào),當(dāng)所選擇的信息是第二信息,選擇多條第二路徑中的至少一條第二路徑,基于所選擇的至少一條第二路徑加載超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分或另外一部分,并基于加載的一部分或另外一部分超級(jí)群集型通用聲學(xué)數(shù)據(jù)集來(lái)產(chǎn)生第二聲學(xué)信號(hào)。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器920可存儲(chǔ)這樣的指令:該指令可使處理器910能夠執(zhí)行以下操作:從用戶(hù)獲取至少一個(gè)文本,或從外部裝置接收包括至少一個(gè)文本的文本消息。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器920可存儲(chǔ)這樣的指令:該指令可使處理器910能夠執(zhí)行以下操作:基于輸入的文本選擇超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分的至少一部分,并基于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集中的一部分的至少一部分額外地產(chǎn)生第一聲學(xué)信號(hào)或第二聲學(xué)信號(hào)。
根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器920可存儲(chǔ)關(guān)于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的信息和至少一個(gè)決策樹(shù)。
根據(jù)本公開(kāi)的各種實(shí)施例的第一電子裝置901的輸入裝置930可執(zhí)行圖2的電子裝置201的輸入裝置250的功能。輸入裝置250可從用戶(hù)獲取將被轉(zhuǎn)換為語(yǔ)音的至少一個(gè)文本。
根據(jù)本公開(kāi)的各種實(shí)施例的第一電子裝置901的通信模塊940可執(zhí)行圖2的電子裝置201的通信模塊220的功能。通信模塊940可將請(qǐng)求關(guān)于決策樹(shù)的信息和/或關(guān)于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的信息的請(qǐng)求信息發(fā)送到第二電子裝置902,并從第二電子裝置902接收關(guān)于決策樹(shù)和/或超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的信息。
根據(jù)本公開(kāi)的各種實(shí)施例的第二電子裝置902可產(chǎn)生超級(jí)群集型通用聲學(xué)數(shù)據(jù)集,并可用作提供超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的服務(wù)器。
根據(jù)本公開(kāi)的各種實(shí)施例的第二電子裝置902的處理器950可執(zhí)行圖2的電子裝置201的處理器210的功能。處理器950可包括超級(jí)群集型通用聲學(xué)數(shù)據(jù)集生成器951和索引匹配器952。
根據(jù)本公開(kāi)的各種實(shí)施例的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集生成器951可獲取與關(guān)于語(yǔ)音的第一信息相應(yīng)的第一聲學(xué)數(shù)據(jù)集和與關(guān)于語(yǔ)音的第二信息相應(yīng)的第二聲學(xué)數(shù)據(jù)集。超級(jí)群集型通用聲學(xué)數(shù)據(jù)集生成器951可通過(guò)除了獲取第一聲學(xué)數(shù)據(jù)集和第二聲學(xué)數(shù)據(jù)集還獲取多個(gè)聲學(xué)數(shù)據(jù)集來(lái)執(zhí)行下面的操作。在操作603,超級(jí)群集型通用聲學(xué)數(shù)據(jù)集生成器951可確定第一聲學(xué)數(shù)據(jù)的至少一部分和/或第二聲學(xué)數(shù)據(jù)集的至少一部分之間的相似度。在操作605,超級(jí)群集型通用聲學(xué)數(shù)據(jù)集生成器951可基于相似度確定產(chǎn)生與第一聲學(xué)數(shù)據(jù)集的一部分和第二聲學(xué)數(shù)據(jù)集的至少一部分相關(guān)聯(lián)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。當(dāng)相似度等于或大于所選擇的閾值時(shí),超級(jí)群集型通用聲學(xué)數(shù)據(jù)集生成器951可確定與第一聲學(xué)數(shù)據(jù)集的至少一部分和第二聲學(xué)數(shù)據(jù)的至少一部分兩者相應(yīng)的第一參數(shù),當(dāng)相似度小于所述閾值時(shí),確定與第一聲學(xué)數(shù)據(jù)集的至少一部分相應(yīng)的第二參數(shù)和與第二聲學(xué)數(shù)據(jù)集的至少一部分相應(yīng)的第三參數(shù)。第一參數(shù)、第二參數(shù)或第三參數(shù)可與語(yǔ)音的至少一些語(yǔ)音的頻譜、音調(diào)和噪聲中的至少一個(gè)相應(yīng)。
當(dāng)獲取新的聲學(xué)模型時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的索引匹配器952可將聲學(xué)模型的決策樹(shù)與超級(jí)群集型通用聲學(xué)數(shù)據(jù)集進(jìn)行重新匹配。新獲取的聲學(xué)模型可包括決策樹(shù)和由該決策樹(shù)指示的聲學(xué)數(shù)據(jù)集。索引匹配器952可確定包括在新獲取的聲學(xué)模型中的聲學(xué)數(shù)據(jù)集和超級(jí)群集型通用聲學(xué)數(shù)據(jù)集之間的相似度,并可將索引替換為使新獲取的聲學(xué)模型的決策樹(shù)能夠指示超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的與新獲取的聲學(xué)數(shù)據(jù)集具有最高相似度的數(shù)據(jù)。
根據(jù)本公開(kāi)的各種實(shí)施例的電子裝置902的存儲(chǔ)器960可執(zhí)行圖2的電子裝置201的存儲(chǔ)器230的功能。在執(zhí)行時(shí),存儲(chǔ)器960可存儲(chǔ)這樣的指令:該指令可使處理器950能夠執(zhí)行以下操作:獲取與關(guān)于語(yǔ)音的第一信息相應(yīng)的第一聲學(xué)數(shù)據(jù)集和/或與關(guān)于語(yǔ)音的第二信息相應(yīng)的第二聲學(xué)數(shù)據(jù)集,確定第一聲學(xué)數(shù)據(jù)集的至少一部分和/或第二聲學(xué)數(shù)據(jù)集的至少一部分之間的相似度,并基于所述確定產(chǎn)生與第一聲學(xué)數(shù)據(jù)集的至少一部分和/或第二聲學(xué)數(shù)據(jù)集的至少一部分相關(guān)聯(lián)的超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。
在執(zhí)行時(shí),根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器960可存儲(chǔ)這樣的指令:該指令可使處理器950能夠執(zhí)行以下操作:基于所述確定,當(dāng)相似處等于或大于所選擇的閾值時(shí),確定與第一聲學(xué)數(shù)據(jù)集中的至少一部分和第二聲學(xué)數(shù)據(jù)集中的至少一部分兩者相應(yīng)的第一參數(shù),當(dāng)相似度小于閾值時(shí),確定與第一聲學(xué)數(shù)據(jù)集中的至少一部分相應(yīng)的第二參數(shù)和與第二聲學(xué)數(shù)據(jù)集中的至少一部分相應(yīng)的第三參數(shù),并基于第一參數(shù)、第二參數(shù)或第三參數(shù)產(chǎn)生所述超級(jí)群集型通用聲學(xué)數(shù)據(jù)集。
根據(jù)本公開(kāi)的各種實(shí)施例的存儲(chǔ)器960可存儲(chǔ)超級(jí)群集型通用聲學(xué)數(shù)據(jù)集、關(guān)于至少一個(gè)決策樹(shù)的信息和由該決策樹(shù)的索引所指示的至少一個(gè)聲學(xué)數(shù)據(jù)集。
根據(jù)本公開(kāi)的各種實(shí)施例的第二電子裝置902的通信模塊970可執(zhí)行圖2的電子裝置201的通信模塊220的功能。通信模塊940可從第一電子裝置901接收請(qǐng)求關(guān)于決策樹(shù)的信息和/或關(guān)于超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的信息的請(qǐng)求信息,并將關(guān)于決策樹(shù)和/或超級(jí)群集型通用聲學(xué)數(shù)據(jù)集的信息發(fā)送到第一裝置901。
在本公開(kāi)中,術(shù)語(yǔ)“模塊”表示包括硬件、軟件和固件或它們的組合的“單元”。例如,術(shù)語(yǔ)“模塊”可與“單元”、“邏輯”、“邏輯塊”、“組件”、“電路”等互換地使用?!澳K”可以是集成組件的最小單元或者其一部分?!澳K”可以是能夠執(zhí)行一個(gè)或更多個(gè)功能的最小單元或其一部分?!澳K”可被機(jī)械地和/或電子地實(shí)現(xiàn)。例如,“模塊”可包括以下項(xiàng)中的至少一項(xiàng):能夠執(zhí)行已知或?qū)⒈婚_(kāi)發(fā)的功能的專(zhuān)用集成電路(ASIC)芯片、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)和可編程邏輯器件。
根據(jù)各種實(shí)施例的方法(例如,操作)和/或裝置(例如,模塊或功能)的至少一部分,可使用能夠通過(guò)各種類(lèi)型的計(jì)算機(jī)執(zhí)行并存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中的指令來(lái)實(shí)現(xiàn),例如作為各種類(lèi)型的編程模塊。一個(gè)或更多個(gè)處理器(例如,處理器120)可執(zhí)行命令指令,從而執(zhí)行功能。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的示例可以是存儲(chǔ)器130。
計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的示例包括:磁性介質(zhì)(諸如硬盤(pán)、軟盤(pán)和磁帶)、光學(xué)介質(zhì)(諸如緊湊盤(pán)只讀存儲(chǔ)器(CD-ROM)和DVD)、磁光介質(zhì)(諸如軟光盤(pán))、以及硬件裝置(諸如ROM、隨機(jī)存取存儲(chǔ)器(RAM)和閃存等)。程序指令的示例包括由匯編語(yǔ)言產(chǎn)生的機(jī)器代碼指令(諸如編譯器)和由在計(jì)算機(jī)使用解釋器可運(yùn)行的高級(jí)編碼語(yǔ)言創(chuàng)建的代碼指令等。所描述的硬件裝置可被配置為作為一個(gè)或更多個(gè)軟件模塊來(lái)執(zhí)行上述各種實(shí)施例的操作,反正亦然。
根據(jù)各種實(shí)施例的模塊或編程模塊可包括一個(gè)或更多個(gè)組件,可移除上述組件中的一部分,或可還包括新的組件。由根據(jù)各種實(shí)施例的模塊、編程模塊或其他組件執(zhí)行的操作可按照順序的、并行的、重復(fù)的或啟發(fā)式的方法來(lái)執(zhí)行。一些操作可按照不同的順序被執(zhí)行或者可被跳過(guò),或可使用添加的操作來(lái)執(zhí)行。
雖然已經(jīng)參照本公開(kāi)的各種實(shí)施例示出并描述了本公開(kāi),但是本領(lǐng)域技術(shù)人員將理解的是,在不脫離本公開(kāi)的精神和范圍的情況下可在這里做出形式和細(xì)節(jié)上的各種改變,本公開(kāi)的精神和范圍由權(quán)利要求及其等同物所限定。