亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

智能自動音頻錄制調(diào)平器的制造方法

文檔序號:7541451閱讀:296來源:國知局
智能自動音頻錄制調(diào)平器的制造方法
【專利摘要】本發(fā)明針對用于在錄制音頻后調(diào)節(jié)音頻屬性的系統(tǒng)、方法以及計算機程序產(chǎn)品。示范性的方法包括:利用音頻捕獲系統(tǒng)錄制音頻,其中錄制的音頻與音頻電平相關(guān)聯(lián);確定與錄制的音頻相關(guān)聯(lián)的一種或多種音頻信號屬性;比較音頻電平與第一預(yù)定閾值電平;以及響應(yīng)于確定音頻電平大于第一預(yù)定閾值電平,至少部分基于修改一種或多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟在跟隨錄制步驟之后的有限時間間隔執(zhí)行。
【專利說明】智能自動苜頻錄制調(diào)平器【背景技術(shù)】
[0001]音頻可以在每個音頻源產(chǎn)生與不同音頻屬性相關(guān)聯(lián)的音頻的地點錄制。音頻屬性的例子是音頻電平。此外,每個音頻源的音頻屬性可以在錄制時段期間改變。音頻可以是孤立的音頻錄制,或者是與視頻錄制相關(guān)聯(lián)的音頻。收聽其中每個音頻源產(chǎn)生與不同音頻屬性相關(guān)聯(lián)的音頻的音頻、或者其中在錄制時段期間特定音頻源的音頻改變的音頻的聽眾可能有不適的收聽體驗。例如,在錄制時段期間,一個音頻源可能產(chǎn)生關(guān)聯(lián)于比另一音頻源更高的音頻電平的音頻。作為另一個例子,在錄制時段期間,音頻源的音頻可能在音頻電平方面變化。因此,需要一種處理系統(tǒng),其調(diào)節(jié)音頻屬性以使音頻的聽眾具有更佳的收聽體驗。

【發(fā)明內(nèi)容】

[0002]本發(fā)明的實施方案針對用于在錄制音頻后調(diào)節(jié)音頻屬性的系統(tǒng)、方法和計算機程序產(chǎn)品。示范性方法包括;利用音頻捕獲系統(tǒng)錄制音頻,其中錄制的音頻與音頻電平相關(guān)聯(lián);確定與錄制的音頻相關(guān)聯(lián)的一種或者多種音頻信號屬性;比較音頻電平與第一預(yù)定閾值電平;以及響應(yīng)于確定音頻電平大于第一預(yù)定閾值電平,至少部分基于修改一種或者多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟在跟隨錄制步驟之后的有限時間間隔執(zhí)行。
[0003]在某些實施方案中,調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平減小。 [0004]在某些實施方案中,確定步驟與錄制步驟同時執(zhí)行。在其他實施方案中,確定步驟在錄制步驟之后執(zhí)行。
[0005]在某些實施方案中,該方法還包括編碼錄制的音頻。
[0006]在某些實施方案中,調(diào)節(jié)包括至少部分基于把換算系數(shù)應(yīng)用至編碼后的音頻而調(diào)節(jié)該編碼后的音頻。在某些實施方案中,換算系數(shù)作為元數(shù)據(jù)被存儲在包括該編碼后的音頻的文件中。
[0007]在某些實施方案中,該方法還包括解碼編碼后的音頻;并且調(diào)節(jié)步驟包括:至少部分基于把增益系數(shù)應(yīng)用至解碼后的音頻而調(diào)節(jié)該解碼后的音頻。
[0008]在某些實施方案中,調(diào)節(jié)步驟或是由音頻錄制系統(tǒng)或是由分開的計算系統(tǒng)執(zhí)行。
[0009]在某些實施方案中,調(diào)節(jié)步驟或是直接在所錄制音頻的回放之前執(zhí)行,或是在所錄制音頻的回放期間實時執(zhí)行。
[0010]在某些實施方案中,該方法還包括:訪問數(shù)據(jù)庫,該數(shù)據(jù)庫包括一組或多組音頻信號屬性;從數(shù)據(jù)庫中選取一組音頻信號屬性;至少部分基于選取的音頻信號屬性組來確定增益系數(shù)或者換算系數(shù);以及至少部分基于所確定的增益系數(shù)或者換算系數(shù)而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟或是直接在所錄制音頻的回放之前執(zhí)行,或是在所錄制音頻的回放期間實時執(zhí)行。
[0011]在某些實施方案中,該方法還包括:比較音頻電平與第二預(yù)定閾值電平;并響應(yīng)于確定音頻電平小于第二預(yù)定閾值電平,至少部分基于修改一種或者多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平增大。
[0012]在某些實施方案中,信號屬性包括以下的至少一種:均方根電平、峰值電平、平均電平以及峰間電平(peak-to-peak level)。
[0013]在某些實施方案中,調(diào)節(jié)步驟減小與錄制的音頻相關(guān)聯(lián)的動態(tài)范圍。
[0014]在某些實施方案中,調(diào)節(jié)步驟減小錄制的音頻中的聽覺人工產(chǎn)物(audibleartifact)。
[0015]在某些實施方案中,該方法還包括:比較音頻電平與第三預(yù)定閾值電平;并響應(yīng)于確定音頻電平小于第三預(yù)定閾值電平,至少部分基于修改一種或者多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平減小。
[0016]在某些實施方案中,該方法還包括:比較音頻電平與第四預(yù)定閾值電平;并響應(yīng)于確定音頻電平大于第四預(yù)定閾值電平,至少部分基于修改一種或者多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平增大。
[0017]在某些實施方案中,調(diào)節(jié)步驟包括:把一個或者多個增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得單獨的增益系數(shù)或者換算系數(shù)被應(yīng)用至所錄制音頻的每個子時段,或者應(yīng)用至與所錄制音頻中每個音頻源相關(guān)聯(lián)的音頻。
[0018]在某些實施方案中,調(diào)節(jié)后的音頻與錄制的音頻分開地存儲。
[0019]在某些實施方案中,還提供了用于調(diào)節(jié)音頻的系統(tǒng)。示范性的系統(tǒng)包括音頻捕獲系統(tǒng),其被配置為:錄制音頻,其中錄制的音頻與音頻電平相關(guān)聯(lián);確定與錄制的音頻相關(guān)聯(lián)的一種或者多種音頻信號屬性;比較音頻電平與第一預(yù)定閾值電平;并響應(yīng)于確定音頻電平大于第一預(yù)定閾值電平,至少部分基于修改一種或者多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟在跟隨錄制步驟之后的有限時間間隔執(zhí)行。
[0020]在某些實施方案中,還提供用于調(diào)節(jié)音頻的計算機程序產(chǎn)品。示范性的計算機程序產(chǎn)品包括非瞬時的計算機可讀介質(zhì),其包括代碼,該代碼被配置成使計算機:錄制音頻,其中錄制的音頻與音頻電平相關(guān)聯(lián);確定與錄制的音頻相關(guān)聯(lián)的一種或者多種音頻信號屬性;比較音頻電平與第一預(yù)定閾值電平;并響應(yīng)于確定音頻電平大于第一預(yù)定閾值電平,至少部分基于修改一種或者多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟在跟隨錄制步驟之后的有限時間間隔執(zhí)行。
【專利附圖】

【附圖說明】
[0021]在已經(jīng)這樣概括地描述了本發(fā)明的實施方案后,現(xiàn)在將參考附圖,其中:
圖1是依照本發(fā)明實施方案的、用于調(diào)節(jié)音頻的示范性處理流程;
圖2是依照本發(fā)明實施方案的、用于錄制音頻和/或調(diào)節(jié)所錄制音頻的示范性設(shè)備;圖3是一個簡圖,其舉例說明依照本發(fā)明的實施方案,圖2所描繪的用于錄制音頻和/或調(diào)節(jié)所錄制音頻的設(shè)備的示范性外部組件的后視圖;以及
圖4是一個簡圖,其舉例說明依照本發(fā)明的實施方案,圖2所描繪的用于錄制音頻和/或調(diào)節(jié)所錄制音頻的設(shè)備的示范性內(nèi)部組件?!揪唧w實施方式】
[0022]現(xiàn)在,下文可以參考附圖更充分地描述本發(fā)明的實施方案,附圖中顯示了本發(fā)明的一些而非全部實施方案。實際上,本發(fā)明可以以許多不同形式體現(xiàn),并且不應(yīng)被詮釋為限于本文所闡明的實施方案;相反,提供這些實施方案,是使得本公開內(nèi)容能滿足適用的法律要求。貫穿全文,同樣的標(biāo)號指同樣的元素。
[0023]當(dāng)在本文中使用時,音頻屬性指一種或者多種與由音頻源輸出的音頻相關(guān)聯(lián)的屬性。音頻屬性也可以被稱為聲音屬性。這些屬性可以包括均方根(RMS)電平、峰值電平或者振幅(正峰值或者負(fù)峰值)、峰間值(正峰值與負(fù)峰值之間的差值)、平均值、頻率、波長、波數(shù)、相位等。信號屬性不限于本文所描述的信號屬性。其他音頻或者聲音屬性可以包括聲壓、聲音強度、聲速、聲音方向、聲音方位等。
[0024]音頻屬性的實時動態(tài)處理是在錄制音頻時實時處理音頻屬性。存在與音頻屬性的實時動態(tài)處理相關(guān)聯(lián)的缺點。例如,實時處理可造成錄制的音頻中的聽覺人工產(chǎn)物。當(dāng)在本文中使用時,聽覺人工產(chǎn)物指在音頻的最初錄制中不存在的聲音或者音效(例如,抽氣效應(yīng)(pumping))ο有時,當(dāng)回放處理后的音頻時,從音頻輕柔部分(例如,與低或者中音頻電平相關(guān)聯(lián))到音頻響亮部分(例如,與高音頻電平相關(guān)聯(lián))的實時處理的過渡可能聽起來不自然。這是因為實時過渡導(dǎo)致音頻的增益突然增大。相似地,當(dāng)回放處理后的音頻時,從音頻響亮部分(例如,與高音頻電平相關(guān)聯(lián))到音頻輕柔部分(例如,與低或者中音頻電平相關(guān)聯(lián))的實時處理的過渡可能聽起來不自然。這是因為實時過渡導(dǎo)致音頻的增益突然減小。這些聽覺人工產(chǎn)物是不合需要的,而本發(fā)明的系統(tǒng)、方法以及計算機程序產(chǎn)品針對減小或者消除這些不合需要的聽覺人工產(chǎn)物。
[0025]因為一種或者多種音頻屬性(例如,音頻電平或者音量級)可能在錄制時段期間改變,所以實時處理可造成聽覺人工產(chǎn)物(例如,抽氣效應(yīng))。實時動態(tài)處理的例子是動態(tài)范圍壓縮。動態(tài)范圍壓縮包括向下壓縮和向上壓縮兩者。向下壓縮減小高于某一閾值電平的響亮聲音的聲級。向上壓縮增大低于某一閾值電平的聲音的聲級。向上壓縮和向下壓縮兩者都減小音頻信號的動態(tài)范圍。動態(tài)處理的另一個例子是動態(tài)擴展。動態(tài)擴展擴大音頻信號的動態(tài)范圍。向下擴展減小低于某一閾值電平的聲音的聲級(使安靜的聲音更安靜)。向上擴展增大高于某一閾值電平的聲音的聲級(使響亮的聲音更響亮)。當(dāng)音頻信號的動態(tài)壓縮或者動態(tài)擴展變得可以聽見時,會出現(xiàn)抽氣效應(yīng)或者聽覺人工產(chǎn)物的引入。當(dāng)在本文中使用時,動態(tài)范圍指與系統(tǒng)相關(guān)聯(lián)的和/或與由系統(tǒng)錄制或者播放的特定音頻文件相關(guān)聯(lián)的最響亮與最安靜的音頻電平之間的差值。當(dāng)在本文中使用時,音頻電平也可以指聲級或者音量級。
[0026]本發(fā)明的實施方案針對增強(boosting)錄制的音頻剪輯。在某些實施方案中,增強過程可以由錄制音頻的設(shè)備或者由分開的后處理設(shè)備執(zhí)行。在某些實施方案中,錄制的音頻包括中和低電平(例如,輕柔的)音頻信號,并且不包括高電平(例如,響亮的)音頻信號。在這樣的實施方案中,增益系數(shù)(或者換算系數(shù))被應(yīng)用至中及低電平音頻信號兩者。在某些實施方案中,錄制的音頻也包括高電平音頻信號。在這樣的實施方案中,可以把本文所描述的設(shè)備配置成把增益系數(shù)(或者換算系數(shù))應(yīng)用至中及低電平音頻信號,但不把增益系數(shù)(或者換算系數(shù))應(yīng)用至高電平音頻信號。在這樣的實施方案中,可以把本文所描述的設(shè)備配置成確定及區(qū)分低電平、中電平以及高電平音頻信號,以使得可分開地配置或者調(diào)節(jié)每個類型的音頻信號。在本發(fā)明的某些實施方案中,本文所描述的錄制設(shè)備按支持單一增益系數(shù)(或者換算系數(shù))的文件格式來錄制(和/或編碼)音頻,以使得單一增益系數(shù)(或者換算系數(shù))被應(yīng)用至中和低電平音頻信號,而不被應(yīng)用至高電平音頻電平信號。當(dāng)在本文中使用時,本文所描述的各種音頻信號可以是與錄制的音頻或者視頻相關(guān)聯(lián)的音頻信號。本發(fā)明的實施方案針對用于在錄制音頻后的有限時間間隔自動調(diào)節(jié)音頻屬性的系統(tǒng)、方法以及計算機程序產(chǎn)品。在本發(fā)明的某些實施方案中,在錄制音頻期間確定或者收集一種或者多種信號屬性。例如,這些信號屬性可以包括RMS電平、峰值電平、或者本文列舉或本文未列舉的其他任何信號屬性。在本發(fā)明的某些實施方案中,在錄制音頻后的有限時間間隔做出這些屬性的調(diào)節(jié)。
[0027]在其他實施方案中,在錄制音頻期間不確定或者收集這些信號屬性。替代地,在錄制音頻后確定這些信號屬性。因此,本文所描述的系統(tǒng)可以訪問錄制的音頻并確定用于該錄制的音頻的信號屬性(例如,RMS電平、峰值電平等)。一旦確定信號屬性,系統(tǒng)就可以修改這些屬性。
[0028]當(dāng)在本文中使用時,執(zhí)行音頻錄制的系統(tǒng)或者設(shè)備可以是任一種計算設(shè)備或者非計算設(shè)備。音頻錄制系統(tǒng)的例子包括,但不局限于:移動計算設(shè)備(例如,移動電話)、圖像捕獲設(shè)備(例如,相機)、游戲設(shè)備、膝上型電腦、便攜式媒體播放器、平板電腦、電子閱讀器、掃描儀、其他便攜式或者非便攜式計算或者非計算設(shè)備,以及在某些實施方案中,還包括其的一個或者多個組件和/或一個或者多個與其相關(guān)聯(lián)的外圍設(shè)備。錄制音頻的系統(tǒng)或者設(shè)備可以與在其上調(diào)節(jié)音頻信號屬性的系統(tǒng)或者設(shè)備相同或者不同。
[0029]當(dāng)在本文中使用時,執(zhí)行對已錄制音頻的音頻信號屬性的調(diào)節(jié)的系統(tǒng)或者設(shè)備可以是任一種計算或者非計算設(shè)備。音頻調(diào)節(jié)系統(tǒng)的例子包括,但不局限于:移動計算設(shè)備(例如,移動電話)、圖像捕獲設(shè)備(例如,相機)、游戲設(shè)備、膝上型電腦、便攜式媒體播放器、平板電腦、電子閱讀器、掃描儀、其他便攜式或者非便攜式計算或者非計算設(shè)備,以及在某些實施方案中,還包括其的一個或者多個組件和/或一個或者多個與其相關(guān)聯(lián)的外圍設(shè)備。
[0030]本發(fā)明的實施方案不局限于在錄制音頻與調(diào)節(jié)音頻屬性之間的任何特定時間間隔。在某些實施方案中,調(diào)節(jié)過程可僅在已經(jīng)錄制完整的音頻文件(即,音頻已經(jīng)被寫入存儲器或者存儲裝置驅(qū)動器的臨時或者永久部分)后開始。在其他實施方案中,調(diào)節(jié)過程甚至可在已經(jīng)錄制完整的音頻文件前開始。在這樣的實施方案中,本文所描述的系統(tǒng)調(diào)節(jié)與已經(jīng)錄制的音頻相關(guān)聯(lián)的音頻信號屬性。因此,在音頻正被寫入文件的同時,本文所描述的系統(tǒng)調(diào)節(jié)與已經(jīng)被寫入文件的音頻相關(guān)聯(lián)的音頻信號屬性。因此,例如,本文所描述的系統(tǒng)調(diào)節(jié)與比當(dāng)前正被錄制到音頻文件的音頻早有限時間間隔(例如,幾秒鐘或者甚至更小的時間單位,例如以毫秒、微秒、納秒、皮秒等的量級)被錄制的音頻相關(guān)聯(lián)的信號屬性。在某些實施方案中,調(diào)節(jié)后的音頻蓋寫之前未調(diào)節(jié)的音頻。在這樣的實施方案中,在跟隨音頻錄制完成之后的有限時間間隔后,首頻文件僅包括調(diào)節(jié)后的首頻。在其他實施方案中,把調(diào)節(jié)后的音頻保存至不同文件,以使得在音頻錄制完成后,在錄制音頻的系統(tǒng)上存在有兩個可用的音頻文件:未調(diào)節(jié)的最初的音頻文件和調(diào)節(jié)后的音頻文件。
[0031]本發(fā)明的實施方案提供幾種不同的方式來調(diào)節(jié)與錄制的音頻相關(guān)聯(lián)的音頻屬性。在某些實施方案中,本文所描述的系統(tǒng)錄制音頻文件。在某些實施方案中,錄制的音頻文件是原始(raw)音頻文件。與系統(tǒng)相關(guān)聯(lián)的編解碼器可以編碼原始音頻文件。按照本文所述的實施方案,編碼是指基于音頻文件格式或者流媒體文件格式來處理原始音頻文件數(shù)據(jù)(其可以是模擬音頻數(shù)據(jù)或者數(shù)字音頻數(shù)據(jù)),以使得處理后的音頻文件數(shù)據(jù)可以由能播放所選音頻文件格式或者流媒體文件格式的軟件回放。在某些實施方案中,系統(tǒng)可以自動確定用于編碼原始音頻文件數(shù)據(jù)的文件格式。在其他實施方案中,編碼時,系統(tǒng)可以經(jīng)由系統(tǒng)的用戶界面提示系統(tǒng)用戶去指定文件格式。在此外的其他實施方案中,先于編碼的時間,系統(tǒng)可以允許用戶存儲用戶的對于一個或者多個音頻文件格式的首選項,而在編碼時,系統(tǒng)可以至少部分基于用戶存儲的首選項來自動編碼音頻文件。在某些實施方案中,編碼后的音頻文件可以作為與最初的原始音頻文件分開的音頻文件被存儲。本文所描述的編解碼器可以是硬件模塊、軟件模塊、或者包括硬件及軟件組件的模塊。
[0032]在錄制并編碼音頻文件后,與本文所描述的相同的系統(tǒng)或者不同的系統(tǒng)解碼編碼后的音頻文件。與系統(tǒng)相關(guān)聯(lián)的編解碼器可以解碼編碼后的音頻文件。用于解碼步驟的編解碼器可以是用于對音頻文件編碼的相同編解碼器,或者可以是與用來編碼原始音頻文件的編解碼器不同的。按照本文所述的實施方案,解碼指按照音頻文件格式或者流媒體文件格式解碼編碼后的音頻文件數(shù)據(jù)(其可以是模擬音頻數(shù)據(jù)或者數(shù)字音頻數(shù)據(jù))的過程。在某些實施方案中,系統(tǒng)可以自動確定用于解碼原始音頻文件數(shù)據(jù)的文件格式。在其他實施方案中,在解碼時,系統(tǒng)可以經(jīng)由系統(tǒng)的用戶界面提示系統(tǒng)用戶去指定文件格式。在此外的其他實施方案中,先于解碼的時間,系統(tǒng)可以允許用戶存儲用戶的對于一個或者多個音頻文件格式的首選項,而在解碼時,系統(tǒng)可以至少部分基于用戶存儲的首選項來自動解碼編碼后的音頻文件。在某些實施方案中,解碼后的音頻文件數(shù)據(jù)可以鏡像(miiTor)最初的原始音頻文件數(shù)據(jù),而在其他實施方案中,解碼后的音頻文件數(shù)據(jù)可與最初的原始音頻文件數(shù)據(jù)不同(輕微不同或者嚴(yán)重不同)。在某些實施方案中,解碼后的音頻文件可以作為與最初的原始音頻文件或者編碼后的音頻文件分開的文件被存儲。
[0033]然后,系統(tǒng)把增益(或者增益系數(shù))應(yīng)用至解碼后的文件。在某些實施方案中,應(yīng)用增益至解碼后的文件改變了存儲在解碼后的文件中的音頻信號的一種或者多種信號屬性(例如,RMS電平、峰值電平等)。在某些實施方案中,應(yīng)用增益改變了音頻文件的動態(tài)范圍。
[0034]在某些實施方案中,應(yīng)用增益減小了音頻文件的動態(tài)范圍(壓縮)。在這樣的實施方案中,應(yīng)用大于一的增益增大了小于第一閾值電平的聲音的電平(例如,RMS電平、峰值電平等)(向上壓縮)。此外,在這樣的實施方案中,應(yīng)用小于一的增益減小了大于第二閾值電平的聲音的電平(向下壓縮)。在某些實施方案中,第一閾值電平可等于第二閾值電平,然而在其他實施方案中,第一閾值電平與第二閾值電平不同。
[0035]在某些實施方案中,應(yīng)用增益增大了音頻文件的動態(tài)范圍(擴展)。在這樣的實施方案中,應(yīng)用小于一的增益減小了小于第三閾值電平的聲音的電平(向下擴展)。此外,在這樣的實施方案中,應(yīng)用大于一的增益增大了高于第四閾值電平的聲音的電平(向上擴展)。在某些實施方案中,第三閾值電平可等于第四閾值電平,然而在其他實施方案中,第三閾值電平與第四閾值電平不同。
[0036]在某些實施方案中,用戶可以預(yù)定義要根據(jù)情況(例如,向下壓縮、向上壓縮、向下擴展、向上擴展等)而被應(yīng)用的一個或者多個增益系數(shù),然而在其他實施方案中,系統(tǒng)可以自動定義要根據(jù)情況而被應(yīng)用的一個或者多個增益系數(shù)。此外,在某些實施方案中,用戶可以預(yù)定義本文所描述的各種閾值電平,或者在其他實施方案中,系統(tǒng)可以自動確定本文所描述的各種閾值電平。
[0037]在某些實施方案中,增益的值至少部分基于先前確定或者收集的、與錄制的音頻相關(guān)聯(lián)的信號屬性。在某些實施方案中,增益的值可另外地至少部分基于用來解碼編碼后的音頻文件的解碼類型,和/或用來編碼原始音頻文件的編碼類型。在某些實施方案中,增益的值可能已經(jīng)由系統(tǒng)用戶預(yù)先選取。在某些實施方案中,增益的值至少部分基于由用戶指定的或者由系統(tǒng)自動確定的期望的輸出音頻電平。如前所述,音頻文件可以包括由多個音頻源輸出的音頻。在某些實施方案中,把單一增益系數(shù)應(yīng)用至整個音頻文件,以使得每個音頻源的音頻電平(例如,音量級)基于該單一增益系數(shù)而被修改。在某些實施方案中,該單一應(yīng)用的增益系數(shù)導(dǎo)致由每個音頻源輸出的音頻處在預(yù)定的音頻電平范圍內(nèi)。在某些實施方案中,該單一應(yīng)用的增益系數(shù)導(dǎo)致由每個音頻源輸出的音頻大致處在相似的音頻電平。在其他實施方案中,多個變化的增益系數(shù)被應(yīng)用至音頻文件。在這樣的實施方案中,系統(tǒng)可能能夠確定顯著不同的音頻源(基于分析音頻信號的信號特征的改變),并可能能夠應(yīng)用單獨的增益系數(shù)至每個音頻源的音頻電平。通過應(yīng)用單獨的增益系數(shù)至每個音頻源的音頻電平,系統(tǒng)可以將與每個音頻源相關(guān)聯(lián)的音頻電平帶入預(yù)定的音頻電平范圍內(nèi)。替換地,通過應(yīng)用單獨的增益系數(shù)至每個音頻源的音頻電平,系統(tǒng)使與每個音頻源相關(guān)聯(lián)的音頻電平基本上和諧(harmonize)或者均衡(equalize),以使得由每個音頻源輸出的音頻大致在相似的音頻電平。
[0038]在某些實施方案中,單一音頻源的音頻電平可在錄制時段期間變化。在這些實施方案中,系統(tǒng)可能能夠在錄制時段期間分析錄制的音頻并確定一個或者多個子時段,其中每個子時段包括屬于大致單一音頻電平的(或者在預(yù)定的窄的音頻電平范圍內(nèi)的)并與單一音頻源相關(guān)聯(lián)的(或者可以與多個音頻源相關(guān)聯(lián)的)音頻。在這樣的實施方案中,系統(tǒng)可以應(yīng)用單獨的增益系數(shù)至每個子時段。通過應(yīng)用單獨的增益系數(shù)到每個子時段,系統(tǒng)可以將與每個子時段相關(guān)聯(lián)的音頻電平帶入預(yù)定的音頻電平范圍內(nèi)。替換地,通過應(yīng)用單獨的增益系數(shù)至每個子時段,系統(tǒng)使與每個子時段相關(guān)聯(lián)的音頻電平基本上和諧或者均衡,以使得當(dāng)與其他子時段相比時,在每個子時段期間輸出的音頻大致在相似的音頻電平。
[0039]應(yīng)用一個或者多個增益系數(shù)至解碼后的音頻文件的過程減小或者消除了可能的聽覺人工產(chǎn)物,該聽覺人工產(chǎn)物可能是在使用動態(tài)處理(例如,調(diào)平(leveling))時引入的。在某些實施方案中,具有新增益系數(shù)的解碼后的音頻文件可以作為與具有舊增益系數(shù)的解碼后的音頻文件分開的不同文件被存儲。
[0040]隨后,跟隨在應(yīng)用增益至解碼后的音頻文件的步驟之后,系統(tǒng)再次編碼文件。本文所描述的編解碼器可以被用來再次編碼文件。在某些實施方案中,系統(tǒng)可以自動確定用于編碼原始音頻文件數(shù)據(jù)的文件格式。在某些實施方案中,該文件格式可以與之前用于編碼原始音頻文件的文件格式相同,而在其他實施方案中,該文件格式可以與之前用來編碼音頻文件的文件格式不同。在其他實施方案中,在編碼時,系統(tǒng)可以經(jīng)由系統(tǒng)用戶界面提示系統(tǒng)用戶去指定文件格式。在此外的其他實施方案中,先于編碼的時間,系統(tǒng)可以允許用戶存儲用戶的對于一個或者多個音頻文件格式的首選項,而在編碼時,系統(tǒng)可以至少部分基于用戶存儲的首選項來自動編碼音頻文件。[0041]在某些實施方案中,在如前所述的錄制和編碼音頻文件之后,與系統(tǒng)(調(diào)節(jié)系統(tǒng)或者錄制系統(tǒng))相關(guān)聯(lián)的編解碼器不解碼編碼后的文件。如前所述,編碼后的音頻文件可以是處理后的音頻文件。該處理后的音頻文件與換算系數(shù)相關(guān)聯(lián)。在某些實施方案中,系統(tǒng)或是修改該換算系數(shù)或是直接把換算系數(shù)應(yīng)用至編碼后的文件。在某些實施方案中,修改換算系數(shù)或者應(yīng)用新?lián)Q算系數(shù)至編碼后的文件改變了存儲在編碼后的文件中的音頻信號的一種或者多種信號屬性(例如,RMS電平、峰值電平等)。在某些實施方案中,修改換算系數(shù)或者應(yīng)用新?lián)Q算系數(shù)改變了音頻文件的動態(tài)范圍。
[0042]在某些實施方案中,修改換算系數(shù)或者應(yīng)用新?lián)Q算系數(shù)減小了音頻文件的動態(tài)范圍(壓縮)。在這樣的實施方案中,應(yīng)用大于一的換算系數(shù)增大了小于第一閾值電平的聲音的電平(例如,RMS電平、峰值電平等)(向上壓縮)。此外,在這樣的實施方案中,應(yīng)用小于一的換算系數(shù)減小了大于第二閾值電平的聲音的電平(向下壓縮)。在某些實施方案中,第一閾值電平可與第二閾值電平相等,然而在其他實施方案中,第一閾值電平與第二閾值電平不同。
[0043]在某些實施方案中,應(yīng)用換算系數(shù)增大了音頻文件的動態(tài)范圍(擴展)。在這樣的實施方案中,應(yīng)用小于一的換算系數(shù)減小了小于第三閾值電平的聲音的電平(向下擴展)。此外,在這樣的實施方案中,應(yīng)用大于一的換算系數(shù)增大了高于第四閾值電平的聲音的電平(向上擴展)。在某些實施方案中,第三閾值電平可與第四閾值電平相等,然而在其他實施方案中,第三閾值電平與第四閾值電平不同。
[0044]在某些實施方案中,用戶可以預(yù)定義要根據(jù)情況(例如,向下壓縮、向上壓縮、向下擴展、向上擴展等)而被應(yīng)用的一個或者多個換算系數(shù),然而在其他實施方案中,系統(tǒng)可以自動定義要根據(jù)情況而被應(yīng)用的一個或者多個換算系數(shù)。此外,在某些實施方案中,用戶可以預(yù)定義本文所述的各種閾值電平,或者在其他實施方案中,系統(tǒng)可以自動確定本文所述的各種閾值電平。
[0045]在某些實施方案中,系統(tǒng)確定新?lián)Q算系數(shù)或者修改換算系數(shù)的值是至少部分基于之前確定的或者收集的、與錄制的音頻相關(guān)聯(lián)的信號屬性。在其他實施方案中,也可以至少部分基于應(yīng)用至原始音頻文件的編碼類型而修改換算系數(shù)的值。在某些實施方案中,新?lián)Q算系數(shù)或者要被應(yīng)用至編碼后的音頻文件的換算系數(shù)的修改量可以由系統(tǒng)用戶預(yù)先選取。在某些實施方案中,要被應(yīng)用的換算系數(shù)的值是至少部分基于由用戶指定的或者由系統(tǒng)自動確定的期望的輸出音頻電平。如前所述,音頻文件可以包括由多個音頻源輸出的音頻。在某些實施方案中,修改應(yīng)用至整個編碼后音頻文件的換算系數(shù),以使得每個音頻源的音頻電平(例如,音量級)基于修改后的換算系數(shù)被修改。在某些實施方案中,單一應(yīng)用的修改后的換算系數(shù)導(dǎo)致由每個音頻源輸出的音頻處在預(yù)定的音頻電平范圍內(nèi)。在某些實施方案中,單一應(yīng)用的修改后的換算系數(shù)導(dǎo)致由每個音頻源輸出的音頻大致在相似的音頻電平。在其他實施方案中,修改應(yīng)用至音頻文件的換算系數(shù)以使得多個變化的換算系數(shù)被應(yīng)用至音頻文件。在這樣的實施方案中,系統(tǒng)可能能夠確定顯著不同的音頻源(基于分析音頻信號的信號特征的改變),并且可能能夠應(yīng)用單獨的換算系數(shù)到每個音頻源的音頻電平。通過應(yīng)用單獨的增益系數(shù)至每個音頻源的音頻電平,系統(tǒng)可以將與每個音頻源相關(guān)聯(lián)的音頻電平帶入預(yù)定的音頻電平范圍內(nèi)。替換地,通過應(yīng)用單獨的換算系數(shù)至每個音頻源的音頻電平,系統(tǒng)使與每個音頻源相關(guān)聯(lián)的音頻電平基本上和諧或者均衡,以使得由每個音頻源輸出的音頻大致在相似的音頻電平。
[0046]在某些實施方案中,單一音頻源的音頻電平可以在錄制時段期間變化。在這些實施方案中,系統(tǒng)可能能夠在錄制時段期間分析錄制的音頻并確定一個或者多個子時段,其中每個子時段包括屬于大致單一音頻電平的(或者在預(yù)定的窄的音頻電平范圍內(nèi)的)并與單一音頻源相關(guān)聯(lián)的(或者可與多個音頻源相關(guān)聯(lián)的)音頻。在這樣的實施方案中,系統(tǒng)可以應(yīng)用單獨的換算系數(shù)至每個子時段。通過應(yīng)用單獨的增益系數(shù)至每個子時段,系統(tǒng)可以將與每個子時段相關(guān)聯(lián)的音頻電平帶入預(yù)定的音頻電平范圍內(nèi)。替換地,通過應(yīng)用單獨的換算系數(shù)至每個子時段,系統(tǒng)使與每個子時段相關(guān)聯(lián)的音頻電平基本上和諧或者均衡,以使得當(dāng)與其他子時段比較時,在每個子時段期間輸出的音頻大致在相似的音頻電平。
[0047]因此,在某些實施方案中,當(dāng)與系統(tǒng)相關(guān)聯(lián)的解碼器被使用來解碼(或者回放)具有修改后換算系數(shù)的編碼后音頻文件時,該解碼器回放音頻文件,其中由每個音頻源輸出的音頻處在預(yù)定的音頻電平范圍內(nèi)。在錄制和編碼音頻文件之后修改編碼后音頻文件的換算系數(shù)的過程減小或者消除了可能的聽覺人工產(chǎn)物,該聽覺人工產(chǎn)物可能是在使用動態(tài)處理(例如,調(diào)平)時引入的。在某些實施方案中,具有修改后的或者新的換算系數(shù)的編碼后音頻文件可以作為與最初的編碼后音頻文件分開的文件被存儲。
[0048]在某些實施方案中,在錄制音頻的系統(tǒng)內(nèi)存儲信號屬性的數(shù)據(jù)庫。該數(shù)據(jù)庫可以包括多組信號屬性。信號屬性可以包括與本文所描述的音頻信號的各種信號屬性相關(guān)聯(lián)的值。例如,信號屬性組包括均方根(RMS)電平、峰值電平或者振幅(正峰值或者負(fù)峰值)、峰間值(正峰值與負(fù)峰值之間的差值)、平均值、頻率、波長、波數(shù)等。其他可以存儲在與音頻信號相關(guān)聯(lián)的特定信號屬性組中的值是聲壓、聲音強度、聲速、聲音方向、聲音方位等。在某些實施方案中,數(shù)據(jù)庫也存儲與音頻信號相關(guān)聯(lián)的期望的增益和/或期望的換算系數(shù)。這些值可以存儲在數(shù)據(jù)庫的每個信號屬性組中,或者可以與數(shù)據(jù)庫的信號屬性組分開地存儲。在其他實施方案中,系統(tǒng)不在數(shù)據(jù)庫中存儲期望的增益和/或期望的換算系數(shù)。而是,系統(tǒng)基于從數(shù)據(jù)庫訪問的所選取的信號屬性組來計算增益和/或換算系數(shù)。
[0049]數(shù)據(jù)庫中的每組信號屬性可以針對音頻文件的所期望回放的特定類型。在某些實施方案中,系統(tǒng)用戶可以預(yù)先配置多組信號屬性的每一組,并且可以為選擇特定信號屬性組來指定一種或者多種條件。當(dāng)錄制的音頻文件(其可以是錄制的原始音頻文件或者編碼后的音頻文件)將要由系統(tǒng)(錄制音頻文件的系統(tǒng)或者不同的系統(tǒng))回放時,系統(tǒng)可以自動選擇特定的信號屬性組以使得正在回放的音頻文件至少部分基于所選擇的信號屬性組來被配置。因此,在這個實施方案中,音頻文件不在音頻文件的錄制后被自動處理;而是,音頻文件或者是基于在回放期間實時選擇的信號屬性而被配置,或者是基于直接在回放前選擇的信號屬性而被配置。在某些實施方案中,“配置音頻文件”指基于選定的信號屬性組來確定增益系數(shù)(和/或換算系數(shù))并且把該增益系數(shù)應(yīng)用至音頻文件的過程。在某些實施方案中,把單一增益系數(shù)應(yīng)用至整個音頻文件以使得每個音頻源的音頻電平(例如,音量級)基于單一增益系數(shù)而被修改。在某些實施方案中,單一應(yīng)用的增益系數(shù)導(dǎo)致由每個音頻源輸出的音頻處在預(yù)定的音頻電平范圍內(nèi)。在某些實施方案中,單一應(yīng)用的增益系數(shù)導(dǎo)致由每個音頻源輸出的音頻大致在相似的音頻電平。在其他實施方案中,把多個變化的增益系數(shù)應(yīng)用至音頻文件。在這樣的實施方案中,系統(tǒng)可能能夠確定顯著不同的音頻源(基于分析音頻信號中信號特征的改變),或者可能能夠把單獨的增益系數(shù)應(yīng)用至每個音頻源的音頻電平(其中基于選定的信號屬性組計算每個單獨的增益系數(shù))。通過應(yīng)用單獨的增益系數(shù)至每個子時段,系統(tǒng)可以將與每個子時段相關(guān)聯(lián)的音頻電平帶入預(yù)定的音頻電平范圍內(nèi)。替換地,通過應(yīng)用單獨的增益系數(shù)至每個音頻源的音頻電平,系統(tǒng)使與每個音頻源相關(guān)聯(lián)的音頻電平基本上和諧或者均衡,以使得由每個音頻源輸出的音頻大致在相似的音頻電平。應(yīng)用一個或者多個增益系數(shù)至解碼后的音頻文件的過程減小或者消除了可能的聽覺人工產(chǎn)物,該聽覺人工產(chǎn)物可能是在使用錄制音頻時的動態(tài)處理(例如,調(diào)平)時被引入的。
[0050]系統(tǒng)可以基于一個或者多個預(yù)先配置的用戶首選項而自動選擇特定的信號屬性組,其中所述首選項是關(guān)于期望的回放的類型(快回放、慢回放等)或者與回放相關(guān)聯(lián)的環(huán)境(例如,安靜的環(huán)境、擁擠的環(huán)境等)。在某些實施方案中,系統(tǒng)可以自動選擇導(dǎo)致在回放期間聽覺人工產(chǎn)物的最佳減小的特定信號屬性組。在其他實施方案中,當(dāng)錄制的音頻文件將要由系統(tǒng)回放時,系統(tǒng)可以提示用戶去選取特定的信號屬性組來應(yīng)用至正由系統(tǒng)回放的音頻文件。因此,系統(tǒng)基于所選定的信號屬性組來配置錄制的音頻,并且回放配置后的錄制的音頻,其中該信號屬性組或者是由系統(tǒng)自動選擇,或者是由系統(tǒng)的用戶選擇。在某些實施方案中,配置錄制的音頻的過程不影響最初錄制的文件的屬性。在其他實施方案中,配置錄制的音頻的過程改變了最初錄制的音頻文件的屬性,以使得最初錄制的音頻文件現(xiàn)在包括配置后的音頻。
[0051]在某些實施方案中,當(dāng)用戶選取要由系統(tǒng)回放的錄制的音頻文件時,用戶的選取自動觸發(fā)對信號屬性組數(shù)據(jù)庫的訪問,以使得當(dāng)回放音頻時,回放的音頻基于所選定的信號屬性組來配置?;谒x定的信號屬性組來回放錄制的音頻文件的過程減小或者消除了人工產(chǎn)物,如果回放錄制的音頻文件而未選取某個選定的音頻屬性組,或者如果在錄制音頻期間動態(tài)處理錄制的音頻文件,則該人工產(chǎn)物可被聽見。
[0052]在某些實施方案中,本文所描述的數(shù)據(jù)庫與錄制的音頻文件分開地存儲。在這樣的實施方案中,當(dāng)用戶傳送錄制的音頻文件至不同的系統(tǒng)時,如果用戶希望回放該錄制的音頻文件的話,則用戶也需要傳送數(shù)據(jù)庫至那個不同的系統(tǒng),以使得至少部分基于從數(shù)據(jù)庫中選取的所選定信號屬性組來回放音頻文件。
[0053]在其他實施方案中,數(shù)據(jù)庫與錄制的音頻文件一起存儲。在某些實施方案中,數(shù)據(jù)庫被存儲在錄制的音頻文件中,以使得當(dāng)傳送錄制的音頻文件至不同的系統(tǒng)時,也傳送數(shù)據(jù)庫至那個不同的系統(tǒng)。在其他實施方案中,數(shù)據(jù)庫與錄制的音頻文件分開地存儲,但是與錄制的音頻文件緊密地相關(guān)聯(lián),以使得當(dāng)傳送錄制的音頻文件至不同的系統(tǒng)時,也自動傳送數(shù)據(jù)庫至那個不同的系統(tǒng)。
[0054]在某些實施方案中,在捕獲音頻的系統(tǒng)中發(fā)生的對音頻的處理(基于本文所述的數(shù)據(jù)庫)可以是非正式的(casual)處理,該非正式的處理使系統(tǒng)用戶能夠聽到處理后的音頻(具有很少或者最少的音頻人工產(chǎn)物),而無需由錄制音頻的系統(tǒng)進(jìn)行大量的音頻處理。隨后可以經(jīng)由一個或者多個傳輸機制把錄制的音頻傳送到不同的系統(tǒng),以對錄制的音頻執(zhí)行更大量的處理。
[0055]在某些實施方案中,換算系數(shù)或者增益系數(shù)作為元數(shù)據(jù)被存儲在編碼后的音頻文件中。如本文所述,換算系數(shù)或者增益系數(shù)可被應(yīng)用于編碼后的音頻文件或者解碼后的音頻文件。此外,如本文所述,元數(shù)據(jù)可以由錄制音頻的系統(tǒng)或者不同的后處理系統(tǒng)訪問。
[0056]現(xiàn)在參考圖1,圖1給出了用于在錄制音頻后調(diào)節(jié)音頻屬性的處理流程100。在方塊110處,本文所述的音頻捕獲系統(tǒng)錄制音頻。錄制的音頻可以與一個或者多個音頻電平相關(guān)聯(lián)。在方塊120處,音頻捕獲系統(tǒng)或者一個單獨的系統(tǒng)確定與錄制的音頻相關(guān)聯(lián)的一種或者多種音頻信號屬性。在方塊130處,音頻捕獲系統(tǒng)或者一個單獨的系統(tǒng)比較與錄制的音頻相關(guān)聯(lián)的音頻電平和第一預(yù)定閾值電平。在方塊140處,響應(yīng)于確定音頻電平大于第一預(yù)定閾值電平,音頻捕獲系統(tǒng)或者一個單獨的系統(tǒng)至少部分基于修改一種或者多種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟在錄制步驟之后的有限時間間隔執(zhí)行。
[0057]現(xiàn)在參考圖2,圖2為簡圖,其舉例說明用于錄制音頻和/或調(diào)節(jié)所錄制的音頻的示范性設(shè)備的外部組件的前視圖。如圖2所例示,設(shè)備112可以包括外殼305、麥克風(fēng)310、揚聲器320、小鍵盤330、功能鍵340、顯示器350以及相機按鈕360。
[0058]外殼305可以包括被配置成包含或者至少部分包含設(shè)備112的組件的結(jié)構(gòu)。例如,外殼305可以由塑料、金屬、或者其他自然或合成的材料、或者材料的組合形成,并且可以被配置成支持麥克風(fēng)310、揚聲器320、小鍵盤330、功能鍵340、顯示器350以及相機按鈕360。
[0059]麥克風(fēng)310可以包括能把氣壓波轉(zhuǎn)換成對應(yīng)的電信號的任何組件。例如,用戶可以在電話呼叫期間對著麥克風(fēng)310說話。麥克風(fēng)310可以被使用來接收來自用戶或者來自設(shè)備112周圍環(huán)境的音頻。揚聲器320可以包括能把電信號轉(zhuǎn)換成對應(yīng)的聲波的任何組件。例如,用戶可以通過揚聲器320聽音樂。
[0060]小鍵盤330可以包括能提供輸入至設(shè)備112的任何組件。小鍵盤330可以包括標(biāo)準(zhǔn)電話小鍵盤。小鍵盤330也可以包括一個或者多個特定用途鍵。在一種實現(xiàn)中,小鍵盤330的每個鍵例如可以是按鈕。小鍵盤330也可以包括觸摸屏。用戶可以利用小鍵盤330輸入諸如文本或者電話號碼的信息,或者激活特定的功能。
[0061]功能鍵340可以包括能提供輸入至設(shè)備112的任何組件。功能鍵340可以包括允許用戶使設(shè)備112執(zhí)行一個或者多個操作的鍵。與功能鍵340的鍵相關(guān)聯(lián)的功能性可以根據(jù)設(shè)備112的模式而改變。例如,功能鍵340可以執(zhí)行各種各樣的操作,諸如錄制音頻、進(jìn)行電話呼叫、播放各種媒體、設(shè)置各種相機特性(例如,聚焦、變焦等)或者訪問應(yīng)用。功能鍵340可以包括提供光標(biāo)功能以及選擇功能的鍵。在一種實現(xiàn)中,功能鍵340的每個鍵例如可以是按鈕。
[0062]顯示器350可以包括能提供視覺信息的任何組件。例如,在一種實現(xiàn)中,顯示器350可以是液晶顯示器(IXD)。在另一種實現(xiàn)中,顯示器350可以是其他顯示器技術(shù)的任一種,諸如等離子顯示板(PDP)、場發(fā)射顯示器(FED)、薄膜晶體管(TFT)顯示器等。顯示器350可以用來顯示例如文本、圖像和/或視頻信息。顯示器350也可以作為取景器操作,如后面將描述的。顯示器350也可以被用作為用戶界面,以使得用戶能夠配置錄制音頻和/或調(diào)節(jié)所錄制的音頻的過程。相機按鈕360可以是使得用戶能夠拍攝圖像的按鈕。
[0063]由于在圖2中舉例說明的設(shè)備112本質(zhì)上是示范性的,所以設(shè)備112打算廣泛地被解釋為包括任何類型的電子設(shè)備,包括圖像捕獲組件。例如,設(shè)備112可以包括無線電話、個人數(shù)字助理(PDA)、便攜式計算機、相機或者手表。在其他實例中,設(shè)備112可以包括例如安全設(shè)備或者軍用設(shè)備。相應(yīng)地,雖然圖3舉例說明了設(shè)備112的示范性外部組件,但在其他實現(xiàn)中,設(shè)備112可以包含與圖2所描繪的外部組件相比更少的、不同的、或者附加的外部組件。附加地或者替換地,設(shè)備112的一個或者多個外部組件可以包括設(shè)備112的一個或者多個其他外部組件的能力。例如,顯示器350可以是輸入組件(例如,觸摸屏)。附加地或者替換地,外部組件可以與圖2所描繪的外部組件不同地被安排。
[0064]現(xiàn)在參考圖3,圖3為簡圖,其舉例說明了示范性設(shè)備的外部組件的后視圖。如所例示的,除了之前所述的組件之外,設(shè)備112還可以包括相機470、鏡頭組(less assembly)472、近程傳感器476以及閃光燈474。
[0065]相機470可以包括能捕捉圖像或者圖像流(視頻)的任何組件。相機470可以是數(shù)字相機或者數(shù)字?jǐn)z像機。當(dāng)設(shè)備112的用戶操作相機470時,顯示器350可以作為取景器操作。相機470可以供給相機設(shè)置的自動和/或手動調(diào)節(jié)。在一種實現(xiàn)中,設(shè)備112可以包括相機軟件,該相機軟件可顯示在顯示器350上以允許用戶調(diào)節(jié)相機設(shè)置。例如,用戶可能能夠通過操作功能鍵340來調(diào)節(jié)相機設(shè)置。
[0066]鏡頭組472可以包括能夠操縱光以使得圖像可以被捕獲的任何組件。鏡頭組472可以包括多個光學(xué)鏡頭元件。光學(xué)鏡頭元件可以有不同形狀(例如,凸面的、兩面凸的、平凸的、凹面的等)以及不同的分開距離。光學(xué)鏡頭元件可以由玻璃、塑料(例如,丙烯酸)或者樹脂玻璃制成。光學(xué)鏡頭可以被多層涂覆(例如,防反射涂料或者紫外線(UV)涂料)以便最小化不需要的效果,諸如鏡頭眩光以及不準(zhǔn)確的顏色。在一種實現(xiàn)中,鏡頭組472可以永久地固定在相機470上。在其他實現(xiàn)中,鏡頭組472可以與其他具有不同光學(xué)特性的鏡頭互換。鏡頭組472可以供給可變孔徑尺寸(例如,可調(diào)節(jié)的光圈值)。
[0067]近程傳感器476 (在圖3中未示出)可以包括能夠收集并提供可以用于使相機470能夠適當(dāng)?shù)夭东@圖像的距離信息的任何組件。例如,近程傳感器476可以包括紅外(IR)近程傳感器,該紅外近程傳感器允許相機470基于例如反射的紅外強度、調(diào)制的紅外或者三角測量來計算到目標(biāo)一例如人臉一的距離。在另一種實現(xiàn)中,近程傳感器476可以包括聲學(xué)近程傳感器。聲學(xué)近程傳感器可以包括用來測量超聲波的回聲返回的計時電路。在包括近程傳感器476的實施方案中,近程傳感器可以被使用來確定至一個或者多個移動物體的距離,該移動物體在場景的圖像幀的捕獲之前、期間或者之后可能在或者可能不在焦點上。
[0068]閃光燈474可以包括當(dāng)相機470捕獲圖像時提供照明的任何類型的發(fā)光組件。例如,閃光燈474可以是發(fā)光二極管(LED)閃光燈(例如,白LED)或者氙閃光燈。在另一種實現(xiàn)中,閃光燈474可以包括閃光模塊。
[0069]雖然圖3示出示范性外部組件,但在其他實現(xiàn)中,設(shè)備112可以包括與圖3描繪的示范性外部組件相比更少的、附加的、和/或不同的組件。例如,在其他實現(xiàn)中,相機470可以是膠片攝影機。附加地或者替換地,取決于設(shè)備112,閃光燈474可以是便攜式閃光槍(flashgun)。附加地或者替換地,設(shè)備112可以是單鏡頭反射式照相機。在此外的其他實現(xiàn)中,設(shè)備112的一個或者多個外部組件可以被不同地安排。
[0070]現(xiàn)在參考圖4,圖4為簡圖,其舉例說明用于錄制音頻和/或調(diào)節(jié)所錄制的音頻的示范性系統(tǒng)的內(nèi)部組件。如所例示的,設(shè)備112可以包括麥克風(fēng)310、揚聲器320、小鍵盤330、功能鍵340、顯示器350、存儲器500、收發(fā)器520以及控制單元530。
[0071]存儲器500可以包括用來存儲與設(shè)備112的操作及使用有關(guān)的數(shù)據(jù)和指令的任何類型的存儲組件。例如,存儲器500可以包括存儲器組件,諸如隨機存取存儲器(RAM)、只讀存儲器(ROM)和/或可編程只讀存儲器(PROM)。此外,存儲器500可以包括存儲裝置組件,諸如磁存儲裝置組件(例如,硬盤驅(qū)動器)或者其他類型的計算機可讀或者計算機可執(zhí)行介質(zhì)。存儲器500也可以包括外部存儲組件,諸如通用串行總線(USB)記憶棒、數(shù)字照相機存儲卡、和/或用戶身份模塊(SIM)卡。
[0072]存儲器500可以包括代碼組件510,該代碼組件510包括計算機可讀或者計算機可執(zhí)行指令,以用來執(zhí)行一個或者多個功能。這些功能包括發(fā)起和/或執(zhí)行圖1所例示的過程。然而,功能不局限于在圖1所例示的那些。代碼組件510可以與和設(shè)備112相關(guān)聯(lián)的一個或者多個其他硬件或者軟件組件一起工作,以便發(fā)起和/或執(zhí)行圖1所例示的過程或者本文所描述的其他過程。此外,代碼組件510可以包括計算機可讀或者計算機可執(zhí)行的指令,以提供除了本文所述之外的其他功能性。
[0073]收發(fā)器520可以包括能夠無線地或者經(jīng)由有線連接地傳送及接收信息的任何組件。例如,收發(fā)器520可以包括提供與網(wǎng)絡(luò)或者其他設(shè)備的無線通信的無線電電路。
[0074]控制單元530可以包括可解譯及執(zhí)行指令的任何邏輯,以及可以控制設(shè)備112的整體操作。當(dāng)在本文中使用時,邏輯可以包括硬件、軟件和/或硬件及軟件的組合??刂茊卧?30可以包括例如通用處理器、微處理器、數(shù)據(jù)處理器、協(xié)處理器和/或網(wǎng)絡(luò)處理器??刂茊卧?30可以從存儲器500、從設(shè)備112的其他組件、和/或從設(shè)備112的外部源(例如,網(wǎng)絡(luò)或者其他設(shè)備)訪問指令。
[0075]控制單元530可以供給與設(shè)備112相關(guān)聯(lián)的不同操作模式。例如,第一模式是音頻和/或視頻錄制模式,并且第二模式是音頻調(diào)節(jié)模式。此外,控制單元530可以同時在多種模式下操作。例如,控制單元530可以在相機模式、隨身聽模式和/或電話模式下操作。例如,當(dāng)在相機模式時,邏輯可以使設(shè)備112能夠捕獲視頻和/或音頻。
[0076]雖然圖4舉例說明了示范性內(nèi)部組件,但在其他實現(xiàn)中,設(shè)備112可以包括與圖4所描繪的示范性內(nèi)部組件相比更少的、附加的、和/或不同的組件。例如,在一種實現(xiàn)中,設(shè)備112可能不包括收發(fā)器520。在此外的其他實現(xiàn)中,設(shè)備112的一個或者多個內(nèi)部組件可以包括設(shè)備112的一個或者多個其他組件的能力。例如,收發(fā)器520和/或控制單元530可以包括它們自己的機載(on-board)存儲器。
[0077]依照本發(fā)明的實施方案,相對于系統(tǒng)(或者設(shè)備)的術(shù)語“模塊”可以指系統(tǒng)的硬件組件、系統(tǒng)的軟件組件、或者系統(tǒng)的包括硬件及軟件兩者的組件。當(dāng)在本文中使用時,模塊可以包括一個或者多個模塊,其中每個模塊可以駐留在硬件或者軟件的單獨部分(piece)內(nèi)。
[0078]當(dāng)在本文中使用時,術(shù)語“自動的”指在事件或條件發(fā)生而無用戶介入后由計算機軟件執(zhí)行的功能、過程、方法或其任何部分。
[0079]雖然上文描述了本發(fā)明的許多實施方案,但本發(fā)明可以以很多不同的形式來體現(xiàn),并且本發(fā)明不應(yīng)被解釋為局限于本文所闡明的實施方案;相反,這些實施方案被提供來使得本公開內(nèi)容將滿足適用的法律要求。同樣,將理解的是,在可能的情況下,這里所描述的和/或預(yù)期的本發(fā)明的任何實施方案的任何優(yōu)點、特征、功能、設(shè)備和/或操作方面可以被包括在這里所描述的和/或預(yù)期的本發(fā)明的任何其他實施方案中,并且/或者反之亦然。此外,除非另外明確地表述,否則在可能的情況下,本文中以單數(shù)形式表達(dá)的任何術(shù)語也旨在包括復(fù)數(shù)形式,并且/或者反之亦然。當(dāng)在本文中使用時,“至少一個”應(yīng)意指“一個或者多個”,并且這些短語被規(guī)定為可互換。相應(yīng)地,術(shù)語“一”和/或“一個”(“a”和/或“an”)應(yīng)意指“至少一個”或者“一個或者多個”,即便短語“一個或者多個”或者“至少一個”也在本文中使用。貫穿全文,同樣的標(biāo)號指同樣的元素。
[0080]正如本領(lǐng)域技術(shù)人員鑒于本公開內(nèi)容將會意識到的,本發(fā)明可以包括和/或被體現(xiàn)為設(shè)備(包括例如系統(tǒng)、機器、設(shè)備、計算機程序產(chǎn)品等)、方法(包括例如商業(yè)方法、計算機實現(xiàn)的過程等)、或前述的任何組合。相應(yīng)地,本發(fā)明的實施方案可以采取以下形式:全部商業(yè)方法實施方案、全部軟件實施方案(包括固件、駐留軟件、微代碼、在數(shù)據(jù)庫中存儲的過程,等等)、全部硬件實施方案、或者組合商業(yè)方法、軟件以及硬件方面的實施方案——其在本文中可以一般性地稱為“系統(tǒng)”。此外,本發(fā)明的實施方案可以采取計算機程序產(chǎn)品的形式,該計算機程序產(chǎn)品包括在其中存儲有一個或者多個計算機可執(zhí)行程序代碼部分的計算機可讀存儲介質(zhì)。當(dāng)在本文中使用時,處理器一其可以包括一個或者多個處理器一可以被“配置成”以各種各樣的方式執(zhí)行某一功能,包括例如通過執(zhí)行在計算機可讀介質(zhì)中體現(xiàn)的一個或者多個計算機可執(zhí)行程序代碼部分而使一個或者多個通用電路執(zhí)行該功能,和/或使一個或者多個專用電路執(zhí)行該功能。
[0081]應(yīng)理解的是,可以利用任何適合的計算機可讀介質(zhì)。計算機可讀介質(zhì)可以包括但不局限于:非瞬時的計算機可讀介質(zhì),例如有形的電子的、磁的、光學(xué)的、電磁的、紅外線的;和/或半導(dǎo)體系統(tǒng)、設(shè)備和/或其他裝置。例如,在某些實施方案中,非瞬時的計算機可讀介質(zhì)包括有形的介質(zhì),諸如便攜式計算機軟磁盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM),可擦除可編程只讀存儲器(EPROM或者閃存)、壓縮盤只讀存儲器(⑶-ROM)、和/或某些其他有形的光學(xué)和/或磁存儲設(shè)備。然而,在本發(fā)明的其他實施方案中,計算機可讀介質(zhì)可以是瞬時性的,諸如像在其中包括所體現(xiàn)的計算機可執(zhí)行程序代碼部分的傳播信號。
[0082]用于實行本發(fā)明的操作的一個或者多個計算機可執(zhí)行程序代碼部分可以包括面向?qū)ο蟮?、腳本的和/或非腳本的編程語言,諸如像Java、Perl、Smalltalk、C++、SAS、SQL、PythoruObjective C、JavaScript等等。在某些實施方案中,用于實行本發(fā)明的實施方案的操作的一個或者多個計算機可執(zhí)行程序代碼部分以傳統(tǒng)過程程序設(shè)計語言編寫,諸如“C”編程語言和/或類似的編程語言。計算機程序代碼可替換地或附加地以一種或者多種多范型(mult1-paradigm)編程語言-諸如像F#-來編寫。
[0083]在本文中,參考設(shè)備和/或方法的流程圖圖解和/或方框圖,描述了本發(fā)明的某些實施方案。將理解的是,包括在流程圖圖解和/或方框圖中的每個方塊、和/或包括在流程圖圖解和/或方框圖中的方塊的組合,可以由一個或者多個計算機可執(zhí)行程序代碼部分來實現(xiàn)。這些一個或者多個計算機可執(zhí)行程序代碼部分可以被提供給通用計算機、專用計算機和/或某些其他可編程數(shù)據(jù)處理設(shè)備的處理器以便產(chǎn)生特定的機器,以使得經(jīng)由計算機和/或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的一個或者多個計算機可執(zhí)行程序代碼部分創(chuàng)建用于實施由流程圖和/或方框圖方塊代表的步驟和/或功能的機制。
[0084]一個或者多個計算機可執(zhí)行程序代碼部分可以被存儲在瞬時的和/或非瞬時的計算機可讀介質(zhì)(例如,存儲器等),該介質(zhì)可以指導(dǎo)、指示和/或?qū)е掠嬎銠C和/或其他可編程數(shù)據(jù)處理設(shè)備以特定的方式起作用,以使得存儲在計算機可讀介質(zhì)的計算機可執(zhí)行程序代碼部分產(chǎn)生制造品,該制造品包括指令機制,該指令機制實現(xiàn)在流程圖和/或方框圖方塊中規(guī)定的步驟和/或功能。[0085]一個或者多個計算機可執(zhí)行程序代碼部分也可以被加載到計算機和/或其他可編程數(shù)據(jù)處理設(shè)備上,以導(dǎo)致一系列的操作步驟在計算機和/或其他可編程設(shè)備上被執(zhí)行。在某些實施方案中,這產(chǎn)生了計算機實現(xiàn)的過程,以使得在計算機和/或其他可編程設(shè)備上執(zhí)行的一個或者多個計算機可執(zhí)行程序代碼部分提供操作步驟,來實現(xiàn)在流程圖中規(guī)定的步驟和/或在方框圖方塊中規(guī)定的功能。替換地,計算機實現(xiàn)的步驟可以與操作者和/或人工實現(xiàn)的步驟相結(jié)合,和/或被后者替代,以便實行本發(fā)明的實施方案。
[0086]雖然已經(jīng)描述并且在附圖中顯示了某些示范性實施方案,但應(yīng)當(dāng)理解的是,這樣的實施方案對于廣義的發(fā)明只是說明性的而不是限制性的,并且本發(fā)明不局限于所顯示以及所描述的特定構(gòu)造和安排,因為除了上面段落所闡明的那些構(gòu)造和安排之外,各種其他改變、組合、省略、修改以及置換都是可能的。本領(lǐng)域的技術(shù)人員將會意識到,剛才所述的實施方案的各種改編、修改以及組合能夠被配置,而并不背離本發(fā)明的范圍和精神。因此,應(yīng)當(dāng)理解的是,在所附權(quán)利要求的范圍內(nèi),本發(fā)明可以與本文所明確描述的那些不同地被實踐。
【權(quán)利要求】
1.一種用于調(diào)節(jié)音頻的方法,該方法包括: 利用音頻捕獲系統(tǒng)錄制音頻,其中錄制的音頻與音頻電平相關(guān)聯(lián); 確定與錄制的音頻相關(guān)聯(lián)的至少一種音頻信號屬性; 比較該音頻電平與第一預(yù)定閾值電平;以及 響應(yīng)于確定該音頻電平大于第一預(yù)定閾值電平,至少部分基于修改至少一種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟在跟隨錄制步驟之后的有限時間間隔執(zhí)行。
2.權(quán)利要求1的方法,其中調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平減小。
3.權(quán)利要求1的方法,其中確定步驟與錄制步驟同時執(zhí)行。
4.權(quán)利要求1的方法,其中確定步驟在錄制步驟之后執(zhí)行。
5.權(quán)利要求1的方法,還包括編碼所述錄制的音頻。
6.權(quán)利要求5的方法,其中調(diào)節(jié)步驟包括至少部分基于把換算系數(shù)應(yīng)用至編碼后的音頻而調(diào)節(jié)該編碼后的音頻。
7.權(quán)利要求6的方法,其中換算系數(shù)作為元數(shù)據(jù)被存儲在包括該編碼后的音頻的文件中。
8.權(quán)利要求5的方法,還包括: 解碼所述編碼后的音頻;以及 其中調(diào)節(jié)步驟包括至少部分基于把增益系數(shù)應(yīng)用至解碼后的音頻而調(diào)節(jié)該解碼后的音頻。
9.權(quán)利要求1的方法,其中調(diào)節(jié)步驟或是由音頻錄制系統(tǒng)或是由分開的計算系統(tǒng)執(zhí)行。
10.權(quán)利要求1的方法,其中調(diào)節(jié)步驟或是直接在所錄制音頻的回放之前執(zhí)行,或是在所錄制音頻的回放期間實時執(zhí)行。
11.權(quán)利要求1的方法,還包括: 訪問包括至少一組音頻信號屬性的數(shù)據(jù)庫; 從數(shù)據(jù)庫中選取一組音頻信號屬性; 至少部分基于所選取的音頻信號屬性組來確定增益系數(shù)或者換算系數(shù);以及至少部分基于所確定的增益系數(shù)或者換算系數(shù)而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟或是直接在所錄制音頻的回放之前執(zhí)行,或是在所錄制音頻的回放期間實時執(zhí)行。
12.權(quán)利要求1的方法,還包括: 比較音頻電平與第二預(yù)定閾值電平;以及 響應(yīng)于確定音頻電平小于第二預(yù)定閾值電平,至少部分基于修改至少一種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平增大。
13.權(quán)利要求1的方法,其中所述信號屬性包括以下的至少一種:均方根電平、峰值電平、平均電平以及峰間電平。
14.權(quán)利要求1的方法,其中調(diào)節(jié)步驟減小與錄制的音頻相關(guān)聯(lián)的動態(tài)范圍。
15.權(quán)利要求1的方法,其中調(diào)節(jié)步驟減小錄制的音頻中的聽覺人工產(chǎn)物。
16.權(quán)利要求1的方法,還包括:比較音頻電平與第三預(yù)定閾值電平;以及 響應(yīng)于確定音頻電平小于第三預(yù)定閾值電平,至少部分基于修改至少一種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平減小。
17.權(quán)利要求1的方法,還包括: 比較音頻電平與第四預(yù)定閾值電平;以及 響應(yīng)于確定音頻電平大于第四預(yù)定閾值電平,至少部分基于修改至少一種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟包括把增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得與錄制的音頻相關(guān)聯(lián)的音頻電平增大。
18.權(quán)利要求1的方法,其中調(diào)節(jié)步驟包括把至少一個增益系數(shù)或者換算系數(shù)應(yīng)用至錄制的音頻,以使得單獨的增益系數(shù)或者換算系數(shù)或是應(yīng)用至所錄制音頻的每個子時段,或是應(yīng)用至與所錄制音頻中每個音頻源相關(guān)聯(lián)的音頻。
19.一種用于調(diào)節(jié)音頻的系統(tǒng),該系統(tǒng)包括: 音頻捕獲系統(tǒng),其被配置為: 錄制音頻,其中錄制的音頻與音頻電平相關(guān)聯(lián); 確定與錄制的音頻相關(guān)聯(lián)的至少一種音頻信號屬性; 比較音頻電平與第一預(yù)定閾值電平;以及 響應(yīng)于確定音頻電平大于第一預(yù)定閾值電平,至少部分基于修改至少一種確定的音頻信號屬性而調(diào)節(jié)該錄制的音頻,其中調(diào)節(jié)步驟以跟隨錄制步驟之后的有限時間間隔執(zhí)行。
20.一種用于調(diào)節(jié)音頻的計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括: 非瞬時的計算機可讀介質(zhì),其包括代碼,該代碼被配置成使得計算機: 錄制音頻,其中錄制的音頻與音頻電平相關(guān)聯(lián); 確定與錄制的音頻相關(guān)聯(lián)的至少一種音頻信號屬性; 比較該音頻電平與第一預(yù)定閾值電平;以及 響應(yīng)于確定該音頻電平大于第一預(yù)定閾值電平,至少部分基于修改至少一種確定的音頻信號屬性而調(diào)節(jié)錄制的音頻,其中調(diào)節(jié)步驟以跟隨錄制步驟之后的有限時間間隔執(zhí)行。
【文檔編號】H03G3/32GK104025192SQ201280066032
【公開日】2014年9月3日 申請日期:2012年1月6日 優(yōu)先權(quán)日:2012年1月6日
【發(fā)明者】P.伊斯貝里, B.格羅恩 申請人:索尼愛立信移動通訊股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1