本申請涉及音頻數(shù)據(jù)處理領(lǐng)域,尤其涉及一種音頻文件生成方法及裝置。
背景技術(shù):
隨著科技的飛速發(fā)展,電子產(chǎn)品進(jìn)入智能化時代,如智能手機(jī),ipad等。智能化電子產(chǎn)品具有獨立的操作系統(tǒng),可由用戶根據(jù)自己的需要自行安裝各種第三方服務(wù)商提供的應(yīng)用程序,通過此類應(yīng)用程序,可以擴(kuò)展智能化電子產(chǎn)品的功能。智能化電子產(chǎn)品的開放性及可操作性強等特性決定了其應(yīng)用范圍廣泛。
目前,電子產(chǎn)品能夠在本地運行各種即時通訊應(yīng)用程序?qū)崿F(xiàn)即時通訊,當(dāng)用戶通過電子產(chǎn)品進(jìn)行實時語音通信時,語音通信界面僅包含語音錄制功能,即用戶通過該即時通訊工具僅可以實現(xiàn)錄制語音信息的目的;當(dāng)用戶需要將在錄制的語音信息中添加其他音頻信息時,需要借助專門的音頻文件編輯應(yīng)用程序來實現(xiàn)。
現(xiàn)有的音頻文件編輯軟件擁有音頻格式轉(zhuǎn)換,音頻合并等強大的功能,但是對于用戶來說,采用音頻文件編輯軟件對音頻文件進(jìn)行編輯的操作較為復(fù)雜;并且,在即時通訊時需要調(diào)用該音頻文件編輯軟件才能實現(xiàn)音頻文件的生成,在電子產(chǎn)品中任意一應(yīng)用軟件的啟動和運行,均將增加信息處理時長,從而導(dǎo)致即時通訊時效性差的問題。
由此可見,目前在音頻文件生成的過程中,存在操作復(fù)雜度高,以及時效性差的問題。
技術(shù)實現(xiàn)要素:
本申請實施例提供一種音頻文件生成方法及裝置,用以解決目前在音頻文件生成的過程中,存在操作復(fù)雜度高,以及時效性差的問題。
本申請實施例提供的具體技術(shù)方案如下:
一種音頻文件生成方法,包括:在音頻錄制過程中,當(dāng)檢測到用戶在音頻文件生成操作區(qū)中輸入的音頻標(biāo)簽添加指示時,獲取所述音頻標(biāo)簽添加指示中包含的音頻標(biāo)簽標(biāo)識和添加音頻標(biāo)簽文件的指定位置;其中,所述音頻文件生成操作區(qū)位于音頻錄制操作界面中;獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;根據(jù)用戶指示,將音頻標(biāo)簽文件添加到錄音文件中的指定位置,生成音頻文件。
可選的,在本地查找所述音頻標(biāo)簽標(biāo)識;當(dāng)本地包含所述音頻標(biāo)簽標(biāo)識時,從本地獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;當(dāng)本地不包含所述音頻標(biāo)簽標(biāo)識時,若檢測本地能夠獲取網(wǎng)絡(luò)資源,則啟動搜索引擎,從網(wǎng)絡(luò)資源中獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;若檢測本地不能夠獲取網(wǎng)絡(luò)資源,則啟動聯(lián)網(wǎng)功能,并在網(wǎng)絡(luò)連接成功后,從網(wǎng)絡(luò)資源中獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
進(jìn)一步的,將音頻標(biāo)簽文件添加到錄音文件中的指定位置之前,當(dāng)檢測到用戶在音頻錄制操作界面中輸入的播放指示時,播放所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻文件。
可選的,當(dāng)所述錄音文件和所述音頻標(biāo)簽文件的格式相同時,將所述錄音文件作為第一音頻子文件,以及將所述音頻標(biāo)簽文件作為第二音頻子文件;當(dāng)所述錄音文件和所述音頻標(biāo)簽文件的格式不同時,將所述錄音文件作為第一音頻子文件,以及將所述音頻標(biāo)簽文件進(jìn)行格式轉(zhuǎn)換,生成與所述錄音文件格式相同的音頻標(biāo)簽文件,并格式轉(zhuǎn)換后的音頻標(biāo)簽文件作為第二音頻子文件;將所述第二音頻子文件添加至所述第一音頻子文件的指定位置,生成音頻文件。
進(jìn)一步的,所述生成音頻文件之前,當(dāng)所述第二音頻子文件中包含語音信息時,獲取所述第一音頻子文件中包含的語音信息;其中,所述語音信息中包 含音色;將所述第二音頻子文件包含的音色轉(zhuǎn)換為所述第一音頻子文件中包含的音色。
可選的,所述生成音頻文件之后,為生成的所述音頻文件設(shè)置文件屬性;其中,所述文件屬性為所述音頻標(biāo)簽文件的音頻標(biāo)簽。
進(jìn)一步的,所述生成音頻文件之后,接收用戶在音頻錄制操作界面中輸入的編輯指示;其中,所述編輯指示中包含待編輯的音頻子文件標(biāo)識和編輯類型;當(dāng)所述編輯類型為刪除指示類型時,將所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件進(jìn)行刪除;當(dāng)所述編輯類型為修改指示類型時,獲取所述編輯指示中包含的時間段,保留所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件中所述時間段內(nèi)的部分;當(dāng)所述編輯類型為替換指示類型時,獲取所述編輯指示中包含的替換音頻標(biāo)簽標(biāo)識,將所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件替換為所述替換音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
一種音頻文件生成裝置,包括:音頻標(biāo)簽標(biāo)識獲取單元,用于在音頻錄制過程中,當(dāng)檢測到用戶在音頻文件生成操作區(qū)中輸入的音頻標(biāo)簽添加指示時,獲取所述音頻標(biāo)簽添加指示中包含的音頻標(biāo)簽標(biāo)識;其中,所述音頻文件生成操作區(qū)位于音頻錄制操作界面中;音頻標(biāo)簽文件獲取單元,用于獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;音頻文件生成單元,用于根據(jù)用戶指示,將音頻標(biāo)簽文件添加到錄音文件中的指定位置,生成音頻文件。
可選的,所述音頻標(biāo)簽文件獲取單元,具體用于:在本地查找所述音頻標(biāo)簽標(biāo)識;當(dāng)本地包含所述音頻標(biāo)簽標(biāo)識時,從本地獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;當(dāng)本地不包含所述音頻標(biāo)簽標(biāo)識時,若檢測本地能夠獲取網(wǎng)絡(luò)資源,則啟動搜索引擎,從網(wǎng)絡(luò)資源中獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;若檢測本地不能夠獲取網(wǎng)絡(luò)資源,則啟動聯(lián)網(wǎng)功能,并在網(wǎng)絡(luò)連接成功后,從網(wǎng)絡(luò)資源中獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
進(jìn)一步的,還包括播放單元,用于:將音頻標(biāo)簽文件添加到錄音文件中的指定位置之前,當(dāng)檢測到用戶在音頻錄制操作界面中輸入的播放指示時,播放 所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻文件。
可選的,所述音頻文件生成單元,具體用于:當(dāng)所述錄音文件和所述音頻標(biāo)簽文件的格式相同時,將所述錄音文件作為第一音頻子文件,以及將所述音頻標(biāo)簽文件作為第二音頻子文件;當(dāng)所述錄音文件和所述音頻標(biāo)簽文件的格式不同時,將所述錄音文件作為第一音頻子文件,以及將所述音頻標(biāo)簽文件進(jìn)行格式轉(zhuǎn)換,生成與所述錄音文件格式相同的音頻標(biāo)簽文件,并格式轉(zhuǎn)換后的音頻標(biāo)簽文件作為第二音頻子文件;將所述第二音頻子文件添加至所述第一音頻子文件的指定位置,生成音頻文件。
進(jìn)一步的,還包括音色轉(zhuǎn)換單元,用于:生成音頻文件之前,當(dāng)所述第二音頻子文件中包含語音信息時,獲取所述第一音頻子文件中包含的語音信息;其中,所述語音信息中包含音色;將所述第二音頻子文件包含的音色轉(zhuǎn)換為所述第一音頻子文件中包含的音色。
可選的,所述音頻文件生成單元,還用于:生成音頻文件之后,為生成的所述音頻文件設(shè)置文件屬性;其中,所述文件屬性為所述音頻標(biāo)簽文件的音頻標(biāo)簽。
進(jìn)一步的,還包括編輯單元,用于:生成音頻文件之后,接收用戶在音頻錄制操作界面中輸入的編輯指示;其中,所述編輯指示中包含待編輯的音頻子文件標(biāo)識和編輯類型;當(dāng)所述編輯類型為刪除指示類型時,將所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件進(jìn)行刪除;當(dāng)所述編輯類型為修改指示類型時,獲取所述編輯指示中包含的時間段,保留所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件中所述時間段內(nèi)的部分;當(dāng)所述編輯類型為替換指示類型時,獲取所述編輯指示中包含的替換音頻標(biāo)簽標(biāo)識,將所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件替換為所述替換音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
本申請實施例中,快速音頻文件生成場景中,若需要進(jìn)行音頻錄制,則在音頻錄制過程中,將用戶指示添加的音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件添加至錄音文件中的指定位置,進(jìn)而生成音頻文件。采用本申請技術(shù)方案,在音頻錄 制操作界面中設(shè)置音頻文件生成操作區(qū),該音頻文件生成操作區(qū)中包含音頻標(biāo)簽文件添加選項,在音頻錄制過程中,終端可以響應(yīng)用戶在該音頻文件生成操作區(qū)的操作進(jìn)而在錄音文件中添加任意一音頻標(biāo)簽文件,從而實現(xiàn)了邊錄音邊添加音頻標(biāo)簽文件的過程,無須啟動第三方音頻文件編輯應(yīng)用程序,即時性得到了有效提高;并且,相較于音頻文件編輯應(yīng)用程序,對音頻文件生成操作區(qū)的操作簡單快捷,復(fù)雜度低。
附圖說明
圖1為本申請實施例中音頻文件生成流程圖;
圖2a至圖2d為本申請實施例中音頻文件編輯示意圖;
圖3a至圖3c為本申請實施例中具體應(yīng)用場景下即時通訊工具的音頻錄制操作界面;
圖4為本申請實施例中具體應(yīng)用場景下音頻文件的生成流程圖;
圖5a至圖5c為本申請實施例中具體應(yīng)用場景下音頻文件生成操作區(qū)示意圖;
圖6a為本申請實施例中具體應(yīng)用場景下錄音選項示意圖;
圖6b為本申請實例中具體應(yīng)用場景下音頻標(biāo)簽標(biāo)識示意圖;
圖7為本申請實施例中音頻文件生成裝置結(jié)構(gòu)示意圖。
具體實施方式
為了解決目前在音頻文件生成的過程中,存在操作復(fù)雜度高,以及時效性差的問題。本申請實施例中,快速音頻文件生成場景中,若需要進(jìn)行音頻錄制,則在語音錄制過程中,將用戶指示添加的音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件添加至錄音文件中的指定位置,進(jìn)而生成音頻文件。采用本申請技術(shù)方案,在音頻錄制操作界面中設(shè)置音頻文件生成操作區(qū),該音頻文件生成操作區(qū)中包含音頻標(biāo)簽文件添加選項,在音頻錄制過程中,終端可以響應(yīng)用戶在該音頻文件生 成操作區(qū)中的操作添加任意一音頻標(biāo)簽文件,進(jìn)而實現(xiàn)了邊錄音邊添加音頻標(biāo)簽文件的過程,無須啟動第三方音頻文件編輯應(yīng)用程序,即時性得到了有效提高;并且,相較于音頻文件編輯應(yīng)用程序,對音頻文件生成操作區(qū)的操作簡單快捷,復(fù)雜度低。
下面結(jié)合附圖對本申請優(yōu)選的實施方式進(jìn)行詳細(xì)說明。
參閱圖1所示,本申請實施例中生成音頻文件的過程包括:
步驟100:在音頻錄制過程中,當(dāng)檢測到用戶在音頻文件生成操作區(qū)中輸入的音頻標(biāo)簽添加指示時,獲取該音頻標(biāo)簽添加指示中包含的音頻標(biāo)簽標(biāo)識和添加音頻標(biāo)簽文件的指定位置;其中,上述音頻文件生成操作區(qū)位于音頻錄制操作界面中。
本申請實施例中,電子產(chǎn)品包含具備音頻錄制功能的應(yīng)用程序,在該具備音頻錄制功能的應(yīng)用程序中添加音頻文件生成功能,當(dāng)電子產(chǎn)品運行該具備音頻錄制功能的應(yīng)用程序時,在電子產(chǎn)品的屏幕上呈現(xiàn)該音頻錄制操作界面;當(dāng)電子產(chǎn)品檢測到用戶在該音頻錄制操作界面中輸入音頻文件生成觸發(fā)指示時,電子產(chǎn)品啟動音頻文件生成功能,即在音頻錄制操作界面中呈現(xiàn)音頻文件生成操作區(qū);該音頻文件生成操作區(qū)中至少包含音頻標(biāo)簽添加選項;此外,該音頻文件生成操作區(qū)中還可以包括音頻文件編輯選項,以及音頻文件進(jìn)度條;上述具備音頻錄制功能的應(yīng)用程序可以為即時通訊工具,錄音機(jī)等。
可選的,上述音頻文件生成觸發(fā)指示可以為用戶在上述音頻錄制操作界面中輸入的音頻錄制指示,如用戶在音頻錄制操作界面中選中音頻錄制選項。當(dāng)電子產(chǎn)品檢測到用戶在該音頻錄制操作界面中輸入音頻文件生成觸發(fā)指示時,啟動麥克風(fēng)應(yīng)用程序,由麥克風(fēng)應(yīng)用程序接收用戶輸入的音頻信息,并在本地保存上述音頻信息;以及啟動計時器,記錄音頻錄制時間長度,并在上述音頻文件進(jìn)度條中顯示音頻錄制時長。
為了保證添加的音頻標(biāo)簽文件中的聲音不受外界聲音的影響,較佳的,在添加音頻標(biāo)簽文件之前,應(yīng)當(dāng)關(guān)閉電子產(chǎn)品的麥克風(fēng)應(yīng)用程序,具體為:當(dāng)電 子產(chǎn)品檢測到用戶在音頻錄制操作界面中輸入音頻錄制暫停指示時,電子產(chǎn)品關(guān)閉麥克風(fēng)應(yīng)用程序;當(dāng)檢測到用戶在音頻文件生成操作區(qū)中選中音頻標(biāo)簽添加選項時,電子產(chǎn)品獲取待添加的音頻標(biāo)簽標(biāo)識,每一個音頻標(biāo)簽標(biāo)識對應(yīng)一個音頻標(biāo)簽文件。其中,電子產(chǎn)品可以在音頻錄制操作界面中呈現(xiàn)輸入框,并接收用戶輸入的音頻標(biāo)簽標(biāo)識,該音頻標(biāo)簽標(biāo)識可以是用戶希望搜索的音頻標(biāo)簽標(biāo)識,此外,電子產(chǎn)品可以根據(jù)本地包含的音頻標(biāo)簽文件生成音頻標(biāo)簽標(biāo)識列表,當(dāng)電子產(chǎn)品檢測到用戶選中輸入框時,還可以在用戶交互界面中呈現(xiàn)電子產(chǎn)品本地包含的音頻標(biāo)簽標(biāo)識列表,用戶可以在輸入框中輸入該音頻標(biāo)簽標(biāo)識列表中包含的任意一音頻標(biāo)簽標(biāo)識;或者,當(dāng)檢測到用戶在音頻文件生成操作區(qū)中選中音頻標(biāo)簽添加選項時,電子產(chǎn)品獲取用戶在該音頻標(biāo)簽列標(biāo)識表中選中的音頻標(biāo)簽標(biāo)識。
可選的,上述音頻標(biāo)簽標(biāo)識列表中除包含本地保存的所有音頻標(biāo)簽文件的標(biāo)識外,還可以包含網(wǎng)絡(luò)資源中搜索熱度最高的預(yù)設(shè)數(shù)目個音頻標(biāo)簽標(biāo)識。此外,上述音頻標(biāo)簽文件均擁有自身的音頻標(biāo)簽,該音頻標(biāo)簽用于表征該音頻標(biāo)簽文件的文件屬性,該音頻標(biāo)簽文件的文件屬性包含音頻標(biāo)簽所述類別,音頻標(biāo)簽的來源等等。
采用上述技術(shù)方案,當(dāng)需要在音頻錄制過程中添加音頻標(biāo)簽文件時,僅需要在具備語音錄制功能的應(yīng)用程序操作界面中,呈現(xiàn)音頻文件生成操作區(qū),并通過檢測用戶在該音頻文件生成操作區(qū)的操作,在錄音文件中添加音頻標(biāo)簽文件,避免了電子產(chǎn)品在啟動錄音軟件的同時,啟動第三方音頻編輯軟件,減輕了電子產(chǎn)品的負(fù)擔(dān),縮短了生成音頻文件的時長;此外,在音頻錄制操作界面中劃分音頻文件生成操作區(qū),使用戶無須在錄音軟件和第三方音頻編輯軟件之間進(jìn)行切換來生成音頻文件,從而保證了音頻文件的生成過程簡單快捷。
步驟110:獲取上述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
本申請實施例中,若電子產(chǎn)品的音頻錄制操作界面中包含輸入框,則電子產(chǎn)品根據(jù)用戶在輸入框中輸入的音頻標(biāo)簽標(biāo)識,查找該音頻標(biāo)簽標(biāo)識對應(yīng)的音 頻標(biāo)簽文件;若電子產(chǎn)品的音頻錄制操作界面中包含音頻標(biāo)簽標(biāo)識列表,則電子產(chǎn)品根據(jù)用戶選中的音頻標(biāo)簽標(biāo)識,查找該音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
進(jìn)一步的,電子產(chǎn)品查找該音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件的過程,具體包括:電子產(chǎn)品在本地查找上述音頻標(biāo)簽標(biāo)識;當(dāng)本地包含該音頻標(biāo)簽標(biāo)識時,從本地獲取該音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;當(dāng)本地不包含上述音頻標(biāo)簽標(biāo)識時,若檢測電子產(chǎn)品能夠獲取網(wǎng)絡(luò)資源,則啟動搜索引擎,從網(wǎng)絡(luò)資源中獲取上述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;若檢測本地不能夠獲取網(wǎng)絡(luò)資源,則啟動聯(lián)網(wǎng)功能,并在網(wǎng)絡(luò)連接成功后,從網(wǎng)絡(luò)資源中獲取上述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
進(jìn)一步的,當(dāng)電子產(chǎn)品檢測本地不能夠獲取網(wǎng)絡(luò)資源,啟動聯(lián)網(wǎng)功能之前,可以在音頻錄制操作界面中呈現(xiàn)啟動聯(lián)網(wǎng)功能提示框;當(dāng)電子產(chǎn)品檢測到用戶在該提示框中輸入允許啟動聯(lián)網(wǎng)功能時,啟動聯(lián)網(wǎng)功能;當(dāng)電子產(chǎn)品檢測到用戶在該提示框中輸入拒絕啟動聯(lián)網(wǎng)功能時,電子產(chǎn)品在音頻錄制操作界面中,提示無法查找到與音頻標(biāo)簽標(biāo)識相匹配的音頻標(biāo)簽文件。
采用上述技術(shù)方案,電子產(chǎn)品根據(jù)用戶輸入的音頻標(biāo)簽標(biāo)識,在本地查找該音頻標(biāo)簽標(biāo)識,當(dāng)電子產(chǎn)品本地保存有上述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件時,即無須通過在網(wǎng)絡(luò)資源中搜索該音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件,能夠有效提高獲取音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件的速度,從而進(jìn)一步縮短了音頻文件的生成時長,提高了時效性。
步驟120:根據(jù)用戶指示,將獲取的音頻標(biāo)簽文件添加到錄音文件中的指定位置,生成音頻文件。
本申請實施例中,電子產(chǎn)品的音頻錄制操作界面中還可以包含音頻播放選項,當(dāng)電子產(chǎn)品獲取到音頻標(biāo)簽文件時,若電子產(chǎn)品檢測到用戶選中上述音頻播放選項,則播放上述音頻標(biāo)簽文件,并在音頻錄制操作界面中顯示該音頻標(biāo)簽文件的播放進(jìn)度;待上述音頻標(biāo)簽文件播放完畢后,將該音頻標(biāo)簽文件添加 至錄音文件的指定位置。此外,電子產(chǎn)品還可以不對上述音頻標(biāo)簽文件進(jìn)行播放,直接將該音頻標(biāo)簽文件添加至上述錄音文件的指定位置。其中,上述錄音文件為基于音頻錄制過程生成的文件。
可選的,音頻播放選項還具備音頻播放暫停功能;當(dāng)在電子產(chǎn)品播放過程中,檢測到用戶選中音頻播放暫停選項時,暫停上述音頻標(biāo)簽文件的播放。因此,在將該音頻標(biāo)簽文件添加至上述錄音文件的指定位置之前,電子產(chǎn)品還可以檢測是否接收到用戶輸入的確認(rèn)添加指示,當(dāng)電子產(chǎn)品檢測到用戶輸入的確認(rèn)添加指示時,將上述音頻標(biāo)簽文件添加至上述錄音文件中的指定位置。
由于音頻標(biāo)簽文件包含多種格式,為了便于對不同格式音頻文件的合并,本申請實施例中,當(dāng)錄音文件和音頻標(biāo)簽文件的格式相同時,將該錄音文件作為第一音頻子文件,以及將該音頻標(biāo)簽文件作為第二音頻子文件;當(dāng)上述錄音文件和上述音頻標(biāo)簽文件的格式不同時,將該錄音文件作為第一音頻子文件,以及將該音頻標(biāo)簽文件進(jìn)行格式轉(zhuǎn)換,生成與上述錄音文件格式相同的音頻標(biāo)簽文件,并格式轉(zhuǎn)換后的音頻標(biāo)簽文件作為第二音頻子文件。例如,第一音頻子文件格式為mp4格式,而音頻標(biāo)簽文件的格式為wav格式,此時,需要將音頻標(biāo)簽文件的wav格式轉(zhuǎn)換為mp4格式,并將轉(zhuǎn)換為mp4格式的音頻標(biāo)簽文件作為第二音頻子文件。特殊地,當(dāng)電子產(chǎn)品已經(jīng)規(guī)定最終生成的音頻文件的格式,該音頻文件格式與錄音文件格式和音頻標(biāo)簽文件的格式均不相同,此時,需要將錄音文件的格式轉(zhuǎn)換為音頻文件的格式,并將音頻標(biāo)簽文件的格式轉(zhuǎn)換為音頻文件的格式,將格式轉(zhuǎn)換后的錄音文件作為第一音頻子文件,以及將格式轉(zhuǎn)換后的音頻標(biāo)簽文件作為第二音頻子文件。
采用上述技術(shù)方案,在將音頻標(biāo)簽文件添加至錄音文件之前,需要檢測上述兩個文件的格式,僅對擁有相同格式的文件進(jìn)行合并,避免了根據(jù)不同格式文件生成音頻文件時造成的音頻文件生成錯誤的問題,保證了生成的音頻文件的準(zhǔn)確性。
可選的,將獲取的音頻標(biāo)簽文件添加到錄音文件中的指定位置,具體包括: 將第二音頻子文件添加至第一音頻子文件之后,生成音頻文件;或者,將第二音頻子文件添加至第一音頻子文件之前,生成音頻文件;或者,將第二音頻子文件添加至第一音頻子文件之中,生成音頻文件。
進(jìn)一步的,在生成音頻文件之后,電子產(chǎn)品為生成的音頻文件設(shè)置文件屬性;其中,該文件屬性為音頻標(biāo)簽文件的音頻標(biāo)簽;當(dāng)一個音頻文件中包含多個音頻標(biāo)簽文件時,可以將上述多個音頻標(biāo)簽文件的音頻標(biāo)簽均設(shè)置為該音頻文件的文件屬性。
采用上述技術(shù)方案,為生成的音頻文件設(shè)置其包含的音頻標(biāo)簽文件的音頻標(biāo)簽,用戶可以通過對音頻標(biāo)簽進(jìn)行檢索,獲取文件屬性為該音頻標(biāo)簽的所有音頻文件,相對于現(xiàn)有技術(shù)中需要人工對所有音頻文件進(jìn)行一一試聽來查找任意一種文件屬性的音頻文件,本申請實施例中能夠快速獲取任意一種文件屬性的音頻文件,有效節(jié)約了人力資源,以及提高了檢索得到音頻文件的效率。
進(jìn)一步的,電子產(chǎn)品分別對上述第一音頻子文件和第二音頻子文件進(jìn)行解析,以判斷該第一音頻子文件和第二音頻子文件中是否包含語音信息;當(dāng)?shù)诙纛l子文件中包含語音信息時,獲取第一音頻子文件的語音信息中包含的音色;將第二音頻子文件的語音信息中包含的音色轉(zhuǎn)換為第一音頻子文件的語音信息中包含的音色。例如,第一音頻子文件中包含用戶A自身的語音信息;第二音頻子文件中包含歌手B的歌曲a時,從第二音頻子文件中獲取該歌手B的語音信息,并根據(jù)用戶A的音色,對該第二音頻子文件中包含的歌手B的音色進(jìn)行轉(zhuǎn)換,將歌手B的音色轉(zhuǎn)換為用戶A的音色,使最終生成的第二音頻子文件中是用戶A演唱歌曲a。
可選的,音頻文件生成操作區(qū)中還包含人名信息列表;該人名信息列表中包含通訊錄中的人名信息,或者網(wǎng)絡(luò)搜索熱度最高的人名信息;電子產(chǎn)品檢測到用戶選中人名信息列表中的任意一人名信息時,判斷該任意一人名信息是否為通訊錄中的人名信息,若是,則檢測本地是否包含該任意一人名信息對應(yīng)的語音信息,當(dāng)電子產(chǎn)品本地包含該任意一人名信息對應(yīng)的語音信息時,獲取該 任意一人名信息對應(yīng)的音色,并將音頻標(biāo)簽文件包含的音色轉(zhuǎn)換為上述任意一人名信息對應(yīng)的音色;否則,從本地或者網(wǎng)絡(luò)資源中獲取該任意一人名信息對應(yīng)的音色,并將音頻標(biāo)簽文件包含的音色轉(zhuǎn)換為上述任意一人名信息對應(yīng)的音色。
采用上述技術(shù)方案,在電子產(chǎn)品的音頻文件生成操作區(qū)中,能夠?qū)崿F(xiàn)不同音色的轉(zhuǎn)換,使生成的多媒體信息具備多樣性。
可選的,電子產(chǎn)品在所有音頻錄制完畢之后,在錄音文件的指定位置添加音頻標(biāo)簽文件;或者,電子產(chǎn)品在在音頻錄制過程中,在已經(jīng)錄制完畢的錄音文件的指定位置添加音頻標(biāo)簽文件,當(dāng)在錄音文件中添加音頻標(biāo)簽文件之后,電子產(chǎn)品根據(jù)用戶輸入的音頻錄制取消暫停指示,繼續(xù)音頻錄制過程,直至檢測到用戶輸入的音頻錄制結(jié)束指示,從而根據(jù)多個錄音文件和音頻標(biāo)簽文件,生成最終的音頻文件。
基于上述技術(shù)方案,電子產(chǎn)品根據(jù)用戶指示,可以交替進(jìn)行語音錄制以及音頻標(biāo)簽文件的添加,將該包含至少一個錄音文件和至少一個音頻標(biāo)簽文件的文件作為音頻文件;可選的,在音頻文件進(jìn)度條中每一段音頻子文件均采用不同形式顯示,該不同形式包括采用不同顏色顯示,采用不同填充格式顯示等。此外,音頻文件進(jìn)度條中進(jìn)度條總長度根據(jù)電子產(chǎn)品屏幕寬度相匹配,且每一個音頻子文件對應(yīng)于音頻文件進(jìn)度條的長度與該音頻子文件的時長相匹配。例如,進(jìn)度條總長度為S,單位時長進(jìn)度條長度為A,音頻文件總時長為T,則S=A*T,錄音文件對應(yīng)的進(jìn)度條長度=A*(錄音文件占用時長/T),音頻標(biāo)簽文件對應(yīng)的進(jìn)度條長度=A*(音頻標(biāo)簽文件占用總時長/T)。
進(jìn)一步的,生成音頻文件之后,若電子產(chǎn)品接收到用戶在通過音頻文件編輯選項輸入的編輯指示,則對該編輯指示進(jìn)行解析;其中,該編輯指示中包含待編輯的音頻子文件標(biāo)識和編輯類型,編輯類型包括刪除指示類型,修改指示類型,以及替換指示類型,其中:
當(dāng)編輯類型為刪除指示類型時,將編輯指示中包含的待編輯的音頻子文件 標(biāo)識對應(yīng)的音頻子文件進(jìn)行刪除;例如,參閱圖2a所示,電子產(chǎn)品檢測到用戶在音頻進(jìn)度條中選中音頻子文件1時,電子產(chǎn)品在音頻錄制操作界面中呈現(xiàn)編輯類型選項,當(dāng)電子產(chǎn)品確定用戶選中刪除指示類型時,刪除該音頻子文件1,刪除該音頻子文件1之后的音頻進(jìn)度條參閱圖2b所示。
當(dāng)編輯類型為修改指示類型時,獲取該編輯指示中包含的時間段,保留編輯指示中包含的待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件中時間段內(nèi)的部分;例如,參閱圖2a所示,電子產(chǎn)品檢測到用戶在音頻進(jìn)度條中選中音頻子文件1時,電子產(chǎn)品在音頻錄制操作界面中呈現(xiàn)編輯類型選項,當(dāng)電子產(chǎn)品確定用戶選中修改指示類型時,電子產(chǎn)品在音頻錄制操作界面中呈現(xiàn)時間段輸入框,參閱圖2c所示;電子產(chǎn)品根據(jù)在時間段輸入框中輸入的時間段(如1分12秒-2分20秒),僅保留音頻文件1中1分12秒-2分20秒部分的音頻數(shù)據(jù)。
當(dāng)編輯指示為替換指示時,獲取所述音頻子文件修改指示中包含的替換音頻標(biāo)簽標(biāo)識,將待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件替換為替換音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;例如,參閱圖2a所示,電子產(chǎn)品檢測到用戶在音頻進(jìn)度條中選中音頻子文件1時,電子產(chǎn)品在音頻錄制操作界面中呈現(xiàn)編輯類型選項,當(dāng)電子產(chǎn)品確定用戶選中替換指示類型時,電子產(chǎn)品在音頻錄制操作界面中呈現(xiàn)輸入框或者音頻標(biāo)簽標(biāo)識列表,若用戶選中音頻標(biāo)簽文件a為待替換的音頻標(biāo)簽文件,則電子產(chǎn)品獲取音頻標(biāo)簽文件5,并將該音頻標(biāo)簽文件5進(jìn)行格式轉(zhuǎn)換后生成音頻子文件5,添加至音頻子文件1的位置(參閱圖2d所示)。
基于上述技術(shù)方案,以下結(jié)合具體應(yīng)用場景,詳細(xì)描述音頻文件生成過程。
本申請實施例可以應(yīng)用在即時通訊應(yīng)用程序運行過程中,也可以應(yīng)用在短音頻廣播應(yīng)用程序等各種需要快速錄制音頻的應(yīng)用場景中。當(dāng)電子產(chǎn)品運行即時通訊工具時,參閱圖3a所示,為本申請實施例中即時通訊工具的音頻錄制操作界面(或應(yīng)用界面),在該音頻錄制操作界面處于初始狀態(tài)時,音頻錄制操作界面中僅包含已經(jīng)發(fā)送完畢的音頻文件,以及錄音選項;當(dāng)電子產(chǎn)品檢測 到用戶輸入的音頻文件生成觸發(fā)指示時,即呈現(xiàn)圖3b所示的音頻錄制操作界面,該音頻錄制操作界面中包含音頻文件生成操作區(qū)(參閱圖3b中虛線部分),該音頻文件生成操作區(qū)包括音頻標(biāo)簽添加選項,取消錄音選項,以及音頻文件進(jìn)度條;當(dāng)音頻文件生成完畢后,關(guān)閉音頻文件生成操作區(qū),并發(fā)送生成的音頻文件,呈現(xiàn)如圖3c所示的音頻錄制操作界面。
參閱圖4所示,在上述即時通訊過程中,生成音頻文件的方法包括:
步驟400:電子產(chǎn)品檢測到用戶激活錄音選項時,顯示音頻文件生成操作區(qū)。
本申請實施例中,參閱圖5a所示,為電子產(chǎn)品顯示的音頻文件生成操作區(qū);該音頻文件生成區(qū)中包含音頻標(biāo)簽標(biāo)識列表,該音頻標(biāo)簽標(biāo)識列表可以采用圖5a所示的環(huán)形顯示,也可以采用級聯(lián)菜單形式等多種方式顯示。
可選的,上述錄音選項可以采用按鈕形式呈現(xiàn),其包含三種狀態(tài),分別為未激活狀態(tài),激活狀態(tài),以及暫停狀態(tài),參閱圖6a所示;當(dāng)錄音選項為未激活狀態(tài)時,表示電子產(chǎn)品不會呈現(xiàn)音頻文件生成操作區(qū);當(dāng)錄音選項為激活狀態(tài)時,表示電子產(chǎn)品正在錄制音頻文件;當(dāng)錄音選項為暫停狀態(tài)時,表示電子產(chǎn)品暫停生成音頻文件。
步驟410:電子產(chǎn)品啟動麥克風(fēng)應(yīng)用程序,接收用戶輸入的語音信息,并將該語音信息保存為第一錄音文件;以及啟動定時器,對錄音時間進(jìn)行統(tǒng)計,并將統(tǒng)計得到的時間顯示在音頻文件進(jìn)度條中。
步驟420:電子產(chǎn)品檢測到用戶再次選中錄音選項時,關(guān)閉麥克風(fēng)應(yīng)用程序,進(jìn)入錄音暫停狀態(tài)。
步驟430:當(dāng)電子產(chǎn)品檢測到用戶選中音頻標(biāo)簽標(biāo)識時,播放該音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
本申請實施例中,用戶可以在音頻文件生成操作區(qū)中,通過將錄音選項拖拽至待添加的音頻標(biāo)簽標(biāo)識的形式選中音頻標(biāo)簽標(biāo)識,參閱圖5a和圖5b所示。
步驟440:在音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件播放完畢時,將該音頻標(biāo) 簽文件與上述第一錄音文件的指定位置。
本申請實施例中,參閱圖5c所示,當(dāng)音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件播放完畢時,若檢測到用戶將該音頻標(biāo)簽文件標(biāo)識拖拽至錄音選項,則將該音頻標(biāo)簽文件添加上述已經(jīng)第一錄音文件的指定位置。
步驟450:電子產(chǎn)品檢測到用戶再次選中錄音選項時,啟動麥克風(fēng)應(yīng)用程序,以及計時器,繼續(xù)語音錄制過程,并將錄制的語音保存為第二錄音文件。
步驟460:電子產(chǎn)品檢測到用戶輸入的錄音結(jié)束指示時,將上述插入音頻標(biāo)簽文件的第一錄音文件和第二錄音文件,生成音頻文件,并將音頻標(biāo)簽文件的音頻標(biāo)簽設(shè)置為生成的音頻文件的文件屬性。
可選的,在音頻標(biāo)簽標(biāo)識選項中,可以顯示每一個音頻標(biāo)簽的播放進(jìn)度,參閱圖6b所示。
本申請實施例中,僅以音頻標(biāo)簽標(biāo)識、錄音選項均為按鈕形式為例進(jìn)行介紹,除此之外,上述音頻標(biāo)簽標(biāo)識、錄音選項還可以以文字形式,或者其他圖標(biāo)形式呈現(xiàn),在此不再贅述。
基于上述技術(shù)方案,參閱圖7所示,本申請實施例提供一種音頻文件生成裝置,包括音頻標(biāo)簽標(biāo)識獲取單元70,音頻標(biāo)簽文件獲取單元71,音頻文件生成單元72,其中:
音頻標(biāo)簽標(biāo)識獲取單元70,用于在音頻錄制過程中,當(dāng)檢測到用戶在音頻文件生成操作區(qū)中輸入的音頻標(biāo)簽添加指示時,獲取所述音頻標(biāo)簽添加指示中包含的音頻標(biāo)簽標(biāo)識和添加音頻標(biāo)簽文件的指定位置;其中,所述音頻文件生成操作區(qū)位于音頻錄制操作界面中;
音頻標(biāo)簽文件獲取單元71,用于獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;
音頻文件生成單元72,用于根據(jù)用戶指示,將音頻標(biāo)簽文件添加到錄音文件中的指定位置,生成音頻文件。
可選的,所述音頻標(biāo)簽文件獲取單元71,具體用于:在本地查找所述音頻 標(biāo)簽標(biāo)識;當(dāng)本地包含所述音頻標(biāo)簽標(biāo)識時,從本地獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;當(dāng)本地不包含所述音頻標(biāo)簽標(biāo)識時,若檢測本地能夠獲取網(wǎng)絡(luò)資源,則啟動搜索引擎,從網(wǎng)絡(luò)資源中獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;若檢測本地不能夠獲取網(wǎng)絡(luò)資源,則啟動聯(lián)網(wǎng)功能,并在網(wǎng)絡(luò)連接成功后,從網(wǎng)絡(luò)資源中獲取所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
進(jìn)一步的,還包括播放單元73,用于:將音頻標(biāo)簽文件添加到錄音文件中的指定位置之前,當(dāng)檢測到用戶在音頻錄制操作界面中輸入的播放指示時,播放所述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻文件。
可選的,所述音頻文件生成單元72,具體用于:當(dāng)所述錄音文件和所述音頻標(biāo)簽文件的格式相同時,將所述錄音文件作為第一音頻子文件,以及將所述音頻標(biāo)簽文件作為第二音頻子文件;當(dāng)所述錄音文件和所述音頻標(biāo)簽文件的格式不同時,將所述錄音文件作為第一音頻子文件,以及將所述音頻標(biāo)簽文件進(jìn)行格式轉(zhuǎn)換,生成與所述錄音文件格式相同的音頻標(biāo)簽文件,并格式轉(zhuǎn)換后的音頻標(biāo)簽文件作為第二音頻子文件;將所述第二音頻子文件添加至所述第一音頻子文件的指定位置,生成音頻文件。
進(jìn)一步的,還包括音色轉(zhuǎn)換單元74,用于:生成音頻文件之前,當(dāng)所述第二音頻子文件中包含語音信息時,獲取所述第一音頻子文件中包含的語音信息;其中,所述語音信息中包含音色;將所述第二音頻子文件包含的音色轉(zhuǎn)換為所述第一音頻子文件中包含的音色。
可選的,所述音頻文件生成單元,具體用于:生成音頻文件之后,為生成的所述音頻文件設(shè)置文件屬性;其中,所述文件屬性為所述音頻標(biāo)簽文件的音頻標(biāo)簽。
進(jìn)一步的,還包括編輯單元75,用于:生成音頻文件之后,接收用戶在音頻錄制操作界面中輸入的編輯指示;其中,所述編輯指示中包含待編輯的音頻子文件標(biāo)識和編輯類型;當(dāng)所述編輯類型為刪除指示類型時,將所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件進(jìn)行刪除;當(dāng)所述編輯類型為修改指示類型 時,獲取所述編輯指示中包含的時間段,保留所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件中所述時間段內(nèi)的部分;當(dāng)所述編輯類型為替換指示類型時,獲取所述編輯指示中包含的替換音頻標(biāo)簽標(biāo)識,將所述待編輯的音頻子文件標(biāo)識對應(yīng)的音頻子文件替換為所述替換音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件。
綜上所述,本申請實施例中,在語音錄制過程中,當(dāng)檢測到用戶在音頻文件生成操作區(qū)中輸入的音頻標(biāo)簽添加指示時,獲取該音頻標(biāo)簽添加指示中包含的音頻標(biāo)簽標(biāo)識和添加音頻標(biāo)簽文件的指定位置;其中,上述音頻文件生成操作區(qū)位于音頻錄制操作界面中;獲取上述音頻標(biāo)簽標(biāo)識對應(yīng)的音頻標(biāo)簽文件;將上述音頻標(biāo)簽文件添加至錄音文件的指定位置,生成音頻文件,并將音頻標(biāo)簽文件的音頻標(biāo)簽設(shè)置為生成的音頻文件的文件屬性。采用本申請技術(shù)方案,在音頻錄制操作界面中設(shè)置音頻文件生成操作區(qū),該音頻文件生成操作區(qū)中包含音頻標(biāo)簽文件添加選項,在音頻錄制過程中,終端可以響應(yīng)用戶在該音頻文件生成操作區(qū)的操作進(jìn)而在錄音文件中添加任意一音頻標(biāo)簽文件,從而實現(xiàn)了邊錄音邊添加音頻標(biāo)簽文件的過程,無須啟動第三方音頻文件編輯應(yīng)用程序,即時性得到了有效提高;并且,相較于音頻文件編輯應(yīng)用程序,對音頻文件生成操作區(qū)的操作簡單快捷,復(fù)雜度低;此外,為生成的音頻文件設(shè)置其包含的音頻標(biāo)簽文件的音頻標(biāo)簽,用戶可以通過對音頻標(biāo)簽進(jìn)行檢索,獲取文件屬性為該音頻標(biāo)簽的所有音頻文件,相對于現(xiàn)有技術(shù)中需要人工對所有音頻文件進(jìn)行一一試聽來查找任意一種文件屬性的音頻文件,本申請實施例中能夠快速獲取任意一種文件屬性的音頻文件,有效節(jié)約了人力資源,以及提高了檢索得到音頻文件的效率。
本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全應(yīng)用程序?qū)嵤├?、或結(jié)合應(yīng)用程序和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。
本申請是參照根據(jù)本申請實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管已描述了本申請的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本申請范圍的所有變更和修改。
顯然,本領(lǐng)域的技術(shù)人員可以對本申請實施例進(jìn)行各種改動和變型而不脫離本申請實施例的精神和范圍。這樣,倘若本申請實施例的這些修改和變型屬于本申請權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本申請也意圖包含這些改動和變型在內(nèi)。