亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

用于自動調(diào)整音頻數(shù)據(jù)的播放速度的方法和裝置的制作方法

文檔序號:6781031閱讀:194來源:國知局
專利名稱:用于自動調(diào)整音頻數(shù)據(jù)的播放速度的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明的實施例涉及用于播放音頻數(shù)據(jù)的々某體播放器。更具體地 說,本發(fā)明的實施例涉及用于自動調(diào)整音頻數(shù)據(jù)的播^t速度的方法和 裝置。
背景技術(shù)
存在具有允許以比正常速率快的速率播放音頻和音頻-視頻會話 的記錄的功能部件的媒體播放器。這允許用戶在較短的時間周期內(nèi)收 聽或觀看這些會話。這些功能部件的使用在商業(yè)應(yīng)用中很常見,例如 在員工觀看和/或收聽培訓(xùn)會話、會議、會談和報告時。這些功能部件 的使用在娛樂應(yīng)用中也很常見,例如在用戶聽收音機或播客、或看電
視時。這些功能部件允許快速回放而無音頻和視頻小故障(glitch)。 通常,用戶認(rèn)為以正?;亍肺乃俾实募s1.2-1.9倍的回》文速率回i文音 頻數(shù)據(jù)是可以聽清楚和理解的。但是,由于發(fā)言者的語速、背景噪聲、 沉默或填補式停頓的存在、和在音頻數(shù)據(jù)回放過程中發(fā)生改變的其它 標(biāo)準(zhǔn),最佳速率會在回放期間改變。
現(xiàn)有的々某體播放器允許用戶手動地調(diào)整音頻數(shù)據(jù)的回放速率。當(dāng) 最佳回放速率在回放音頻數(shù)據(jù)的過程中頻繁改變時,手動做出調(diào)整會 很不方便。此外,當(dāng)做出手動調(diào)整時,收聽者只會對音頻數(shù)據(jù)的變化 做出反應(yīng)。在檢測音頻數(shù)據(jù)的變化和對此做出反應(yīng)時體驗到的延遲會 導(dǎo)致以收聽者不可理解的速率回放音頻數(shù)據(jù)的部分。這會使收聽者重 新播放音頻數(shù)據(jù),并且因此否定了快速播放的一些益處。


舉例說明了本發(fā)明的實施例的特征和優(yōu)點,不希望它們將本發(fā)明 的實施例的范圍限制在所示的特定實施例。
圖1是可以在其中實現(xiàn)本發(fā)明的一個示范實施例的示例性系統(tǒng)的 框圖。
圖2是根據(jù)本發(fā)明的一個示范實施例的播放速度調(diào)整單元的框圖。
圖3是根據(jù)本發(fā)明的一個示范實施例的變化速率積分器單元的框圖。
圖4是說明根據(jù)本發(fā)明的第 一實施例用于管理音頻數(shù)據(jù)的方法的 流程圖。
圖5是說明根據(jù)本發(fā)明的第二實施例用于管理音頻數(shù)據(jù)的方法的 流程圖。
圖6是說明根據(jù)本發(fā)明的一個實施例用于生成播放速度控制值的 方法的流程圖。
具體實施例方式
在以下描述中,出于說明的目的,闡述了特定術(shù)語,以便充分理 解本發(fā)明的實施例。但是,本領(lǐng)域的技術(shù)人員將明白,不需要這些具 體細(xì)節(jié)也可以實現(xiàn)本發(fā)明的實施例。在其它情況下,以框圖形式示出 熟知的電路、設(shè)備和過程,以免不必要地使本發(fā)明的實施例晦澀難懂。
圖1是可以在其中實現(xiàn)本發(fā)明的實施例的系統(tǒng)的第一實施例的框 圖。該系統(tǒng)是計算機系統(tǒng)100。計算機系統(tǒng)IOO包括用于處理數(shù)據(jù)信 號的一個或多個處理器。如圖所示,計算機系統(tǒng)100包括第一處理器 和第n個處理器105,其中n可以;l任何數(shù)字。處理器101和105可 以是復(fù)雜指令集計算機微處理器、精簡指令集計算微處理器、超長指 令字微處理器、用于實現(xiàn)指令集的組合的處理器或其它處理器設(shè)備。 處理器101和105可以是在每個芯片上具有多個處理器核的多核處理器。處理器101和105耦合到CPU總線110, CPU總線IIO用于在處 理器101和105與計算機系統(tǒng)100內(nèi)的其它組件之間傳送數(shù)據(jù)信號。
計算機系統(tǒng)100包括存儲器113。存儲器113包括可以是動態(tài)隨 機存取存儲器(DRAM)設(shè)備的主存儲器。存儲器113可以存儲由數(shù) 據(jù)信號表示的指令和代碼,這些指令和代碼可由處理器101和105執(zhí) 行。高速緩存存儲器(處理器高速緩存)可駐留在每個處理器101和 105內(nèi)以存儲來自存儲器113的數(shù)據(jù)信號。高速緩存可以通過利用它 的存取局部性來加速處理器101和105的存儲器存取。在計算機系統(tǒng) 100的一個備選實施例中,高速緩存可駐留在處理器101和105的外 部。
橋存儲器控制器111耦合到CPU總線110和存儲器113。橋存儲 器控制器111指揮處理器101和105、存儲器113與計算機系統(tǒng)100 內(nèi)的其它組件之間的數(shù)據(jù)信號,并橋接CPU總線llO、存儲器113與 第一輸入輸出(10)總線120之間的數(shù)據(jù)信號。
第一IO總線120可以是單個總線或多個總線的組合。第一IO總 線120提供計算機系統(tǒng)100中的組件之間的通信鏈接。網(wǎng)絡(luò)控制器121 耦合到第一 10總線120。網(wǎng)絡(luò)控制器121可以將計算機系統(tǒng)100鏈接 到計算機網(wǎng)絡(luò)(未示出),并支持機器間的通信。顯示設(shè)備控制器122 耦合到第一 10總線120。顯示設(shè)備控制器122允許將顯示設(shè)備(未示 出)耦合到計算機系統(tǒng)100,并充當(dāng)顯示設(shè)備與計算機系統(tǒng)100之間 的接口。
笫二 10總線130可以是單個總線或多個總線的組合。第二 10總 線130提供計算機系統(tǒng)100中的組件之間的通信鏈接。數(shù)據(jù)存儲設(shè)備 131耦合到第二 10總線130。數(shù)據(jù)存儲設(shè)備131可以是硬盤驅(qū)動器、 軟盤驅(qū)動器、CD-ROM設(shè)備、閃存設(shè)備或其它大容量存儲設(shè)備。輸入 接口 132耦合到第二IO總線130。輸入接口 132可以是例如鍵盤和/ 或鼠標(biāo)控制器或其它輸入接口。輸入接口 132可以是專用設(shè)備,或者 可以駐留在諸如總線控制器或其它控制器的另 一 設(shè)備內(nèi)。輸入接口132允許將輸入設(shè)備耦合到計算機系統(tǒng)100,并將數(shù)據(jù)信號從輸入設(shè) 備傳送到計算機系統(tǒng)100。音頻控制器133耦合到第二 10總線130。 音頻控制器133進(jìn)行操作以便協(xié)調(diào)聲音的記錄和播放??偩€橋123將 第一 10總線120耦合到第二 10總線130??偩€橋123進(jìn)行操作以便 緩沖和橋接第一 IO總線120與第二 10總線130之間的數(shù)據(jù)信號。
根據(jù)本發(fā)明的一個實施例,可以在計算機系統(tǒng)100上實現(xiàn)播放速 度調(diào)整單元140。根據(jù)一個實施例,響應(yīng)處理器101執(zhí)行存儲器113 中由播放速度調(diào)整單元140表示的指令序列,計算機系統(tǒng)100執(zhí)行音 頻數(shù)據(jù)管理。這些指令可從諸如數(shù)據(jù)存儲設(shè)備131的其它計算機可讀 介質(zhì)或從經(jīng)由網(wǎng)絡(luò)控制器112連接到網(wǎng)絡(luò)的計算機讀入到存儲器113 中。存儲器113中的指令序列的執(zhí)行使處理器支持音頻數(shù)據(jù)的管理。 根據(jù)本發(fā)明的一個實施例,播放速度調(diào)整單元140識別音頻數(shù)據(jù)的狀 況。響應(yīng)識別到狀況,播^:速度調(diào)整單元140自動調(diào)整音頻數(shù)據(jù)的回 放速率。狀況可以是例如語速(rateofspeech)、背景噪聲、填補式停頓 (filled pause)或其它狀況。
圖2是根據(jù)本發(fā)明的一個示范實施例的播放速度調(diào)整單元200的 框圖。播放速度調(diào)整單元200可用于實現(xiàn)如圖l所示的播放速度調(diào)整 單元140。應(yīng)明白,播放速度調(diào)整單元200可駐留在其它類型的系統(tǒng) 中。播放速度調(diào)整單元200包括能以軟件實現(xiàn)的多個模塊。在備選實 施例中,硬接線電路可以替代軟件或與軟件組合用于執(zhí)行音頻數(shù)據(jù)管 理。因此,本發(fā)明的實施例不限于硬件電路和軟件的任何特定組合。
播放速度調(diào)整單元200包括特征提取器單元210。特征提取器單 元210從它接收的音頻數(shù)據(jù)中提取特征。根據(jù)本發(fā)明的一個實施例, 特征提取器單元210將音頻數(shù)據(jù)從時域變^:到頻域,并在頻域中識別 特征。在一個實施例中,特征可以基于子帶能量。在該實施例中,可 以利用Mel頻率倒鐠系數(shù)或通過利用其它技術(shù)或過程來識別特征。根 據(jù)一個備選實施例,特征可以基于音位特性。在該實施例中,音位特 性可通過利用隱馬爾可夫才莫型、維特比排列或動態(tài)時間規(guī)整相對于基
7準(zhǔn)語音信號進(jìn)行才莫式匹配或^^莫式分類、或通過利用其它技術(shù)或過程來 識別。應(yīng)明白,特征可以基于其它性質(zhì)并利用其它技術(shù)來識別。
播放速度調(diào)整單元200包括變化速率積分器單元220。變化速率 積分器單元220辨識其中音頻數(shù)據(jù)包含以發(fā)生變化的速率產(chǎn)生的語音 的狀況。根據(jù)一個實施例,變化速率積分器單元220產(chǎn)生對應(yīng)于來自 單元210的特征的在時間上平均的變化速率的輸出。變化速率積分器 220可以生成可用于調(diào)整音頻數(shù)據(jù)的回放速率的播放速度控制值。根 據(jù)其中特征是基于子帶能量的實施例,變化速率積分器單元220可以 測量特征的連續(xù)樣本之間的差。通過對來自多個特征的測量結(jié)果取平 均值,識別特征的總的變化速率。變化速率可用于確定語音變化速率 和要生成的合適的播放速度控制值。根據(jù)其中特征是基于音位的實施
速度控制值。
播放速度調(diào)整單元200可包括比較器單元230。比較器單元230 辨識音頻數(shù)據(jù)中何時存在其它狀況。比較器單元230可以生成一個或 多個播放速度控制值,這個或這些控制值可用于基于狀況調(diào)整音頻數(shù) 據(jù)的回放速率。根據(jù)播放速度調(diào)整單元200的一個實施例,比較器單 元230可以將音頻數(shù)據(jù)的特征與反映不同狀況的語音模型中的特征進(jìn) 行比較??梢詫⒁纛l數(shù)據(jù)的特征與反映背景噪聲的高、低量的語音才莫 型進(jìn)行比較,以便確定音頻數(shù)據(jù)中存在的背景噪聲的程度和錄音的質(zhì) 量。根據(jù)本發(fā)明的一個實施例,如果音頻數(shù)據(jù)中存在較大程度的背景 噪聲,則比較器單元230生成減緩回放速率的播放速度控制值。可以 將音頻數(shù)據(jù)的特征與反映語音停頓或用不會對音頻數(shù)據(jù)的內(nèi)容造成 影響的措辭填補的停頓的語音模型進(jìn)行比較,以便確定音頻數(shù)據(jù)的一 部分是否可在回》文期間加速或進(jìn)行編輯。應(yīng)明白,還可類似地檢測其 它狀況。例如,比較器單元230可以生成用于基于視頻圖像的變化來 調(diào)整音頻數(shù)據(jù)的回放速率的播放速度控制值。
播》欠速度調(diào)整單元200包括音頻數(shù)據(jù)處理單元240。音頻數(shù)據(jù)處理單元240接收一個或多個播放速度控制值。當(dāng)音頻數(shù)據(jù)處理單元240 接收到多于一個播放速度控制值時,它可以取這些值的平均值,計算 這些值的加權(quán)平均值,或取最小或最大值。音頻數(shù)據(jù)處理單元240還 接收待播放的音頻數(shù)據(jù),并響應(yīng)上述一個或多個播》文速度控制值而調(diào) 整音頻數(shù)據(jù)的回放速率。根據(jù)本發(fā)明的一個實施例,音頻數(shù)據(jù)處理單 元240可以通過執(zhí)行選擇性采樣、同步重疊相加(synchronized overlap-add)、諧波定標(biāo)(harmonic scaling)、或通過執(zhí)行其它過程或技 術(shù)來調(diào)整回;^文速率。
播》文速度調(diào)整單元200可包括時間延遲單元250。時間延遲單元 250延遲音頻數(shù)據(jù)處理單元240接收音頻數(shù)據(jù)的時間。通過插入延遲,
通過音頻數(shù)據(jù)處理單元240播放音頻數(shù)據(jù)之前分析音頻數(shù)據(jù)的特征并 生成合適的播放速度控制值。
根據(jù)播放速度調(diào)整單元200的一個實施例,特征提取器單元210、 變化速率積分器單元220、比較器單元230、音頻數(shù)據(jù)處理單元240 和時間延遲單元250可利用任何合適的過程、技術(shù)或電路來實現(xiàn)。應(yīng) 明白,所示的一些組件是可選的.,如比較器單元230和時間延遲單元 250。
圖3 ;l根據(jù)本發(fā)明的一個示范實施例的變化速率積分器單元300 的框圖。變化速率積分器單元300可以作為如圖2所示的變化速率積 分器單元220的一個實施例來實現(xiàn)。變化速率積分器單元300包括多 個差單元。根據(jù)變化速率積分器單元300的一個實施例,為通過變化 速率積分器單元300處理的每個特征類型提供一個差(difference)單 元。方框310表示第一差單元。方框311表示第n個差單元,其中n 可以是任何數(shù)字。差單元310和311將在不同時間周期從特征提取器 單元接收的特征的性質(zhì)進(jìn)行比較,并計算差的絕對值(絕對差值)。 例如,差單元310可以計算在時間t識別的第一類型的特征與在t-l 識別的第一類型的特征的絕對差值。差單元311可以計算在時間t識別的第二類型的特征與在t-l識別的第二類型的特征的絕對差值。
變化速率積分器單元300可包括多個可選的加權(quán)單元。根據(jù)變化 速率積分器單元300的一個實施例,為通過變化速率積分器單元300 處理的每個特征類型提供一個加權(quán)單元。方框320表示第一加權(quán)單元。 方框321表示第n個加權(quán)單元。每個加權(quán)單元對特征類型的絕對差值 加權(quán)。加權(quán)單元320和321可以基于特征的性質(zhì)對絕對差值加權(quán)。
變化速率積分器單元300包括求和單元330。求和單元330將由 加權(quán)單元320和321接收的加權(quán)后的絕對差值求和。
變化速率積分器單元300包括播放速度控制單元340。播放速度 控制單元340根據(jù)加權(quán)后的絕對差值的和生成播放速度控制值。根據(jù) 變化速率積分器單元300的一個實施例,播》丈速度控制單元340對加 權(quán)后的絕對差值的和取平均值。根據(jù)一個備選實施例,播放速度控制 單元340在一定時間周期內(nèi)對加權(quán)后的絕對差值的和求積分。
圖4是說明根據(jù)本發(fā)明的第一實施例用于管理音頻數(shù)據(jù)的方法的 流程圖。在401,將音頻數(shù)據(jù)從時域變換到頻域。根據(jù)本發(fā)明的一個 實施例,可以對音頻數(shù)據(jù)施加快速傅里葉變換以將它從時域變換到頻 域。
在402,從變換到頻域的音頻數(shù)據(jù)識別特征。根據(jù)本發(fā)明的一個 實施例,特征可以基于子帶能量。在該實施例中,利用Mel頻率倒譜 系數(shù)來識別特征。根據(jù)本發(fā)明的一個備選實施例,頻率可以基于音位 特性(phoneme characteristics)。
在403,生成特征的變化速率的測量值(measure)。根據(jù)本發(fā)明的 一個實施例,可以通過分析音頻數(shù)據(jù)的特征來生成特征的變化速率的 測量值。特征的變化速率的測量值可用于識別其中發(fā)言者的語速發(fā)生 改變的狀況。根據(jù)本發(fā)明的一個實施例,生成播放速度控制值。
在404,調(diào)整音頻數(shù)據(jù)的回^L速率。該調(diào)整可以基于在403確定 的如播;故速度控制值所反映的特征的變化速率。根據(jù)本發(fā)明的一個實 施例,可以通過執(zhí)行選擇性采樣、同步重疊相加、諧波定標(biāo)、或通過執(zhí)行其它過程來調(diào)整音頻的回放速率。
圖5是說明根據(jù)本發(fā)明的第二實施例用于管理音頻數(shù)據(jù)的方法的
流程圖。在501,將音頻數(shù)據(jù)從時域變換到頻域。根據(jù)本發(fā)明的一個 實施例,可以對音頻數(shù)據(jù)施加快速傅里葉變換以將它從時域變換到頻 域。
在502,從變換到頻域的音頻數(shù)據(jù)識別特征。根據(jù)本發(fā)明的一個 實施例,特征可以基于子帶能量。在該實施例中,利用Mel頻率倒譜 系數(shù)來識別特征。根據(jù)本發(fā)明的一個實施例,特征也可以基于音位特 性。
在503,生成特征的變化速率的測量值。根椐本發(fā)明的一個實施 例,可以通過分析音頻數(shù)據(jù)的特征來生成特征的變化速率的測量值。 特征的變化速率的測量值可用于識別其中發(fā)言者的語速發(fā)生改變的 狀況。根據(jù)本發(fā)明的一個實施例,生成播放速度控制值。
在504,將在502識別的音頻數(shù)據(jù)的特征與反映不同狀況的語音 才莫型中的特征進(jìn)行比較,以便確定狀況的存在。例如,可以將音頻數(shù) 據(jù)的特征與反映背景噪聲的高、低量的語音模型進(jìn)行比較,以便確定 音頻數(shù)據(jù)中存在的背景噪聲的程度。也可以將音頻數(shù)據(jù)的特征與反映 語音停頓或用不會對音頻數(shù)據(jù)的內(nèi)容造成影響的措辭填補的停頓的 語音才莫型進(jìn)行比較,以便確定音頻數(shù)據(jù)的一部分是否可在回放過程中 加速或剪去或刪去。應(yīng)明白,還可檢測其它狀況。根據(jù)本發(fā)明的一個 實施例,生成一個或多個播放速度控制值。
在505,根據(jù)所生成的播放速度控制值來確定播放速度調(diào)整。根 據(jù)本發(fā)明的一個實施例,對播放速度控制值求平均值以便確定要對音 頻數(shù)據(jù)的回放速率做出調(diào)整的程度。根據(jù)本發(fā)明的一個備選實施例, 取播放速度控制值的加權(quán)平均值以便確定要對音頻數(shù)據(jù)的回放速率 做出調(diào)整的程度。
在506,調(diào)整音頻數(shù)據(jù)的回放速率。該調(diào)整可以基于所生成的播 放速度控制值的平均值或加權(quán)平均值。根據(jù)本發(fā)明的一個實施例,可以通過執(zhí)行選擇性釆樣、同步重疊相加、諧波定標(biāo)、或通過執(zhí)行其它 過程來調(diào)整音頻的回放速率。
圖6是說明根據(jù)本發(fā)明的一個實施例用于生成播》文速度控制值的
方法的流程圖。如圖6所示的方法可用于實現(xiàn)如圖4和5所示的403 和503。在601,確定多個特征類型的絕對差值。根據(jù)本發(fā)明的一個 實施例,取在第 一時間和第二時間測量的每個特征類型的差的絕對 值。
在602,對特征類型的絕對差值加權(quán)。根據(jù)本發(fā)明的一個實施例, 基于特征的性質(zhì)對特征類型的絕對差值加權(quán)。 在603,對加沖又后的絕對差值一起求和。
在604,根據(jù)加權(quán)后的絕對差值的和生成播放速度控制值。根據(jù) 本發(fā)明的一個實施例,取加權(quán)后的絕對差值的和的平均值。根據(jù)一個 備選實施例,在一定時間周期內(nèi)對加權(quán)后的絕對差值的和求積分。
根據(jù)本發(fā)明的一個實施例,用于管理音頻數(shù)據(jù)的方法包括識別 音頻數(shù)據(jù)的狀況;以及響應(yīng)識別狀況,自動調(diào)整音頻數(shù)據(jù)的回放速率。 狀況可以包括產(chǎn)生語音的速率的變化、背景噪聲的存在、語音中停頓 或填補式停頓的存在。通過自動調(diào)整回放速率,本發(fā)明的實施例允i午 收聽者專心于正在播放的音頻數(shù)據(jù),而不必因必須手動調(diào)整回放速度 而分神。
圖4-6是說明根據(jù)本發(fā)明的實施例的方法的流程圖。這些圖中說 明的一些技術(shù)可以連續(xù)、并行或按照與所描述的順序不同的順序執(zhí) 行。應(yīng)明白,不需要執(zhí)行所描述的所有技術(shù),可以增加額外的技術(shù), 并且可以用其它技術(shù)來代替所說明的 一些技術(shù)。
本發(fā)明的實施例可以作為計算機程序產(chǎn)品或軟件提供,它可以包 括具有指令的機器可訪問或機器可讀介質(zhì)上的制造品。機器可訪問或 機器可讀介質(zhì)上的指令可用于對計算機系統(tǒng)或其它電子設(shè)備編程。機 器可讀介質(zhì)可包括但不限于軟盤、光盤、CD-ROM和磁-光盤或其它 類型的適于存儲或傳送電子指令的介質(zhì)/機器可讀介質(zhì)。本文描述的技
12術(shù)不限于任何特定的軟件配置。它們可以應(yīng)用于任何計算或處理環(huán) 境。本文所用的術(shù)語"機器可訪問介質(zhì)"或"機器可讀介質(zhì)"應(yīng)包括 能夠存儲、編碼或傳送可供機器執(zhí)行并使機器執(zhí)行本文描述的任何一 種方法的指令序列的任何介質(zhì)。此外,本領(lǐng)域中常說一種或另一種形 式的軟件(例如,程序、過程、進(jìn)程、應(yīng)用程序、模塊、單元、邏輯 等)采取動作或?qū)е陆Y(jié)果。這些表述只是用來陳述通過處理系統(tǒng)執(zhí)行 軟件而使處理器執(zhí)行動作或產(chǎn)生結(jié)果的一種簡略的方式。
在以上說明書中,參照其具體示例性實施例描述了本發(fā)明的實施 例。但是,很明顯,在不偏離本發(fā)明的實施例的廣泛精神和范圍的情 況下,可以對此作出各種修改和改變。因此,應(yīng)將說明書和附圖視為 是具說明性而不是限制性意義的。
權(quán)利要求
1. 一種用于管理音頻數(shù)據(jù)的方法,包括識別所述音頻數(shù)據(jù)中的狀況;以及響應(yīng)識別所述狀況,自動調(diào)整所述音頻數(shù)據(jù)的回放速率。
2. 如權(quán)利要求l所述的方法,其中所述狀況是語速。
3. 如權(quán)利要求l所述的方法,其中所述狀況是噪聲。
4. 如權(quán)利要求l所述的方法,其中所述狀況是填補式停頓。
5. 如權(quán)利要求l所述的方法,其中識別所述狀況包括 將所述音頻數(shù)據(jù)從時域轉(zhuǎn)換到頻域; 在所述頻域中提取所述音頻數(shù)據(jù)的特征;以及 分析所述音頻數(shù)據(jù)的特征。
6. 如權(quán)利要求l所述的方法,其中識別所述狀況包括 將所述音頻數(shù)據(jù)從時域轉(zhuǎn)換到頻域; 在所述頻域中提取所述音頻數(shù)據(jù)的特征;以及 將所迷音頻數(shù)據(jù)的特征與4莫型進(jìn)行比較。
7..如權(quán)利要求5所述的方法,其中所述特征包括子帶能量。
8. 如權(quán)利要求5所述的方法,其中所述特征包括音位特性。
9. 如權(quán)利要求1所述的方法,還包括 識別所述音頻數(shù)據(jù)的第二狀況;以及響應(yīng)識別所述第一和第二狀況,自動調(diào)整所述音頻數(shù)據(jù)的回i丈速率。
10. 如權(quán)利要求1所述的方法: 率包括執(zhí)行選擇性釆樣。
11. 如權(quán)利要求1所述的方法, 率包括執(zhí)行同步重疊相加。
12. 如權(quán)利要求1所述的方法, 率包括執(zhí)行諧波定標(biāo)。其中調(diào)整所述音頻數(shù)據(jù)的回i丈速其中調(diào)整所述音頻數(shù)據(jù)的回放速其中調(diào)整所述音頻數(shù)據(jù)的回放速
13. —種包括機器可訪問介質(zhì)的制造品,所述機器可訪問介質(zhì)包括指令序列,所述指令序列包括在執(zhí)行時使所述機器執(zhí)行以下操作的 指令識別音頻數(shù)據(jù)中的狀況;以及響應(yīng)識別所述狀況,自動調(diào)整所述音頻數(shù)據(jù)的回》文速率。
14. 如權(quán)利要求13所述的制造品,其中識別所迷狀況包括 將所述音頻數(shù)據(jù)從時域轉(zhuǎn)換到頻域; 在所述頻域中提取所述音頻數(shù)據(jù)的特征;以及 分析所述音頻數(shù)據(jù)的特征。
15. 如權(quán)利要求13所述的制造品,還包括在執(zhí)行時使所述機器執(zhí) 行以下操作的指令識別所述音頻數(shù)據(jù)的第二狀況;以及響應(yīng)識別所述第一和第二狀況,自動調(diào)整所述音頻數(shù)據(jù)的回》文速率。
16. 如權(quán)利要求13所述的制造品,其中所述狀況是語速。
17. —種播放速度調(diào)整單元,包括用于識別音頻數(shù)據(jù)的語速變化的變化速率積分器單元;以及 用于響應(yīng)所述語速變化而調(diào)整所述音頻數(shù)據(jù)的回放速率的音頻 數(shù)據(jù)處理單元。
18. 如權(quán)利要求17所述的播放速度調(diào)整單元,還包括用于識別所 述音頻數(shù)據(jù)中的狀況的比較器單元,其中所述音頻數(shù)據(jù)處理單元響應(yīng) 所述語速變化和所述狀況而調(diào)整回;^速率。
19. 如權(quán)利要求17所述的播放速度調(diào)整單元,其中所述狀況是背 景噪聲。
20. 如權(quán)利要求17所述的播i丈速度調(diào)整單元,還包括用于識別所 述音頻數(shù)據(jù)中的特征的特征提取器單元。
全文摘要
一種管理音頻數(shù)據(jù)的方法包括識別音頻數(shù)據(jù)中的狀況。響應(yīng)識別狀況,自動調(diào)整音頻數(shù)據(jù)的回放速率。還公開其它實施例。
文檔編號G11B20/10GK101427314SQ200780014500
公開日2009年5月6日 申請日期2007年4月19日 優(yōu)先權(quán)日2006年4月25日
發(fā)明者G·希爾斯 申請人:英特爾公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1