件生成單元117、編碼器121、解碼器123和用戶角度選擇單元127。
[0042]說(shuō)話者位置檢測(cè)單元111可以從多個(gè)麥克風(fēng)130所接收的音頻信號(hào)當(dāng)中找到具有最高能量水平的音頻信號(hào)的方向。此處,方向可以是角度信息。說(shuō)話者位置檢測(cè)單元111可以通過(guò)使用能量信息、相位信息或麥克風(fēng)之間的相關(guān)性信息,識(shí)別出當(dāng)前說(shuō)話者說(shuō)話時(shí)所對(duì)著的方向。當(dāng)多個(gè)說(shuō)話者同時(shí)說(shuō)話時(shí),說(shuō)話者位置檢測(cè)單元111可以按照說(shuō)話者生成的音頻信號(hào)的能量的強(qiáng)度的順序來(lái)識(shí)別出角度信息。
[0043]波束成形器113可以給予說(shuō)話者權(quán)重值以增大音頻信號(hào)的幅度,使得當(dāng)音頻信號(hào)的方向與噪聲的方向彼此不同時(shí)波束能夠在空間上降低相關(guān)噪聲。
[0044]在波束的成形方面,在音源中生成的聲波行進(jìn)過(guò)不同的距離后到達(dá)每個(gè)麥克風(fēng)。由于聲波的速度有限,聲波會(huì)在不同的時(shí)間點(diǎn)到達(dá)各個(gè)麥克風(fēng)。然而,除了時(shí)間差之外,在每個(gè)麥克風(fēng)處從同一個(gè)聲源生成的聲波可以被識(shí)別為相同的聲波。因此,如果給出了聲源的位置,就可以計(jì)算聲波的到達(dá)時(shí)間差異,以用于聲波校正從而使聲波彼此匹配。
[0045]PCM文件生成單元117可以將來(lái)自多個(gè)麥克風(fēng)130的音頻信號(hào)輸入轉(zhuǎn)換成PCM文件。此處,PCM文件指的是被存儲(chǔ)為從模擬信號(hào)(S卩,音頻信號(hào))轉(zhuǎn)換成的數(shù)字信號(hào)的文件。如果模擬信號(hào)沒(méi)有經(jīng)過(guò)轉(zhuǎn)換就被存儲(chǔ)起來(lái),則其可能會(huì)被噪聲影響,因此將模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)然后再存儲(chǔ)起來(lái)??梢詫⑸傻腜CM文件發(fā)送到D/Α轉(zhuǎn)換器。D/Α轉(zhuǎn)換器可以將數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào)。通過(guò)D/Α轉(zhuǎn)換器可以將PCM文件轉(zhuǎn)換成模擬文件,轉(zhuǎn)換成的音頻信號(hào)可以最終被發(fā)送給揚(yáng)聲器140,由此輸出給用戶。
[0046]編碼器121可以通過(guò)使用編解碼器將記錄的音頻信號(hào)存儲(chǔ)為壓縮文件,以便降低已經(jīng)轉(zhuǎn)換成數(shù)字信號(hào)的音頻信號(hào)的存儲(chǔ)容量。編碼器121可以從說(shuō)話者位置檢測(cè)單元111接收對(duì)應(yīng)于說(shuō)話者的角度信息,并且可以將該角度信息與對(duì)應(yīng)的記錄的音頻信號(hào)一起存儲(chǔ)起來(lái)。
[0047]解碼器123可以將通過(guò)編碼器121壓縮的文件解壓縮。用戶角度選擇單元127可以識(shí)別用戶的角度選擇。用戶角度選擇單元127可以識(shí)別用戶的說(shuō)話者選擇以及角度選擇。如果用戶希望聽(tīng)到說(shuō)話者“B”的音頻信號(hào),或映射為說(shuō)話者“B”的90°的音頻信號(hào),則用戶角度選擇單元127可以選擇說(shuō)話者“B”或90°。用戶可以在列表中或通過(guò)特定用戶界面(UI)做出選擇。
[0048]麥克風(fēng)單元130可以包括多個(gè)麥克風(fēng)。一個(gè)或多個(gè)麥克風(fēng)可以接收音頻信號(hào)。接收的音頻信號(hào)可以由控制器110記錄下來(lái),并且可以用于計(jì)算說(shuō)話者的位置。
[0049]揚(yáng)聲器140可以再現(xiàn)通過(guò)至少一個(gè)麥克風(fēng)接收的音頻信號(hào)??梢愿鶕?jù)用戶的選擇通過(guò)控制器110的指令再現(xiàn)音頻信號(hào)。
[0050]觸摸屏150可以從控制器110的用戶角度選擇單元127接收角度信息,并且可以顯示該信息。此處,角度信息與對(duì)應(yīng)的音頻信號(hào)一起作為文件存儲(chǔ)在存儲(chǔ)器160中。觸摸屏150可以檢測(cè)用戶對(duì)于顯示的角度中的一者或多者的選擇,并且可以將選擇的角度傳遞給用戶角度選擇單元127。
[0051]此外,觸摸屏150可以從控制器110接收被記錄的音頻信號(hào)列表。觸摸屏150可以顯示接收到的被記錄的音頻信號(hào)列表。觸摸屏150可以接收基于與特定說(shuō)話者相關(guān)聯(lián)的音頻信號(hào)生成的文本。該文本可以由控制器110通過(guò)使用文字轉(zhuǎn)語(yǔ)音(TTS)來(lái)產(chǎn)生。被記錄的音頻信號(hào)列表可以使用戶能知道每個(gè)音頻信號(hào)的內(nèi)容。
[0052]存儲(chǔ)器160可以包括內(nèi)部存儲(chǔ)器或外部存儲(chǔ)器中的至少一種。內(nèi)部存儲(chǔ)器,例如,可以包括以下項(xiàng)中的至少一種:易失性存儲(chǔ)器(例如,DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)、SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)、SDRAM(同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器或類似物)、非易失性存儲(chǔ)器(例如,0TPR0M(單次可編程只讀存儲(chǔ)器)、PR0M(可編程只讀存儲(chǔ)器)、EPR0M(可擦寫(xiě)且可編程的只讀存儲(chǔ)器)、EEPR0M(可電氣擦寫(xiě)且可編程的只讀存儲(chǔ)器)、掩膜只讀存儲(chǔ)器、閃存只讀存儲(chǔ)器,或類似物)、HDD (硬盤(pán)驅(qū)動(dòng)),或固態(tài)驅(qū)動(dòng)(SSD)。外部存儲(chǔ)器可以包括以下項(xiàng)中的至少一個(gè):CF (緊湊式閃存)、SD (安全數(shù)字)、微型SD (微型安全數(shù)字)、迷你SD (迷你安全數(shù)字)、xD(極速數(shù)字)、存儲(chǔ)棒、可接入網(wǎng)絡(luò)的存儲(chǔ)器(NAS)、云存儲(chǔ)或類似物。存儲(chǔ)器160可以存儲(chǔ)由編碼器121壓縮的音頻文件。
[0053]通信單元180可以使電子裝置100與外部電子裝置相連。例如,通信單元180可以通過(guò)無(wú)線或有線通信連接到網(wǎng)絡(luò),從而與外部電子裝置通信。無(wú)線通信可以包括W1-F1、BT(藍(lán)牙)、NFC(近場(chǎng)通訊)或類似通信。此外,無(wú)線通信可以包括從蜂窩式通信網(wǎng)絡(luò)(例如,LTE、LTE-A、CDMA、WCDMA、UMTS、WiBro、GSM或類似網(wǎng)絡(luò))當(dāng)中選出的至少一種。例如,有線通信可以包括以下項(xiàng)中的至少一種:USB(通用串行總線)、HDMI (高清晰度多媒體界面)、RS-232 (推薦性標(biāo)準(zhǔn)232)或POTS (普通老式電話業(yè)務(wù))。
[0054]圖2是根據(jù)本公開(kāi)的實(shí)施例的處理的示例的流程圖。參考圖2,控制器110可以識(shí)別用戶的請(qǐng)求以開(kāi)始音頻記錄。在操作203中,控制器110可以辨認(rèn)多個(gè)角度。例如,該多個(gè)角度可以是要被接收的音頻信號(hào)的角度。在一些實(shí)施方式中,控制器110可以將每一個(gè)接收到的音頻信號(hào)以90度的間隔映射至多個(gè)角(S卩,角度為0°、90°、180°和270°的角)中不同的一個(gè)角,從而將其存儲(chǔ)起來(lái)。例如,控制器110可以從四個(gè)麥克風(fēng)接收音頻信號(hào),以通過(guò)使用能量信息、相位信息或麥克風(fēng)之間的相關(guān)信息檢測(cè)說(shuō)話者的位置。在控制器110識(shí)別出說(shuō)話者的位置是80°的實(shí)例中,控制器110可以將說(shuō)話者的位置配置為90°,該角度與其他角度相比是相對(duì)接近的值。
[0055]在操作205中,控制器110可以通過(guò)麥克風(fēng)單元130的多個(gè)麥克風(fēng)接收多個(gè)音頻信號(hào)。
[0056]在操作207中,控制器110可以從多個(gè)麥克風(fēng)所接收的多個(gè)音頻信號(hào)中提取出具有最高能量水平的音頻信號(hào),從而檢測(cè)音頻信號(hào)的角度。在操作207中,控制器110可以將檢測(cè)的角度映射成在操作203中辨認(rèn)的多個(gè)角度中的一個(gè)角度。例如,如果控制器110確定具有最高能量水平的音頻信號(hào)是在160°的角度處接收到的,控制器110可以使音頻信號(hào)映射為180°,該角度與其他角度相比是接近的值。
[0057]在操作209中,控制器110可以確定在操作203中辨認(rèn)的多個(gè)角度中的角度是否仍有沒(méi)被處理的。例如,由于在操作203中控制器110配置成要接收成90°的間隔的四個(gè)音頻信號(hào),已經(jīng)在操作207中接收了一個(gè)音頻信號(hào)的控制器110可以確定還有三個(gè)音頻信號(hào)仍沒(méi)有被檢測(cè)到。如果確定存在仍沒(méi)有處理的角度,控制器110可以進(jìn)行操作211。在操作211中,控制器110可以從剩余的音頻信號(hào)(而不是檢測(cè)到的音頻信號(hào))當(dāng)中檢測(cè)具有最高能量水平的音頻信號(hào)的角度。例如,如果檢測(cè)到的音頻信號(hào)的角度是90°,則音頻信號(hào)可以與90°相映射。
[0058]在操作211中從剩余的音頻信號(hào)當(dāng)中檢測(cè)到具有最高能量水平的音頻信號(hào)的角度之后,控制器110可以返回到操作209。
[0059]控制器110可以重復(fù)以上操作,如果所有被配置的角度均被檢測(cè)到,即,如果確定不存在沒(méi)有被檢測(cè)到的角度,則控制器110可以終止操作。
[0060]圖3是根據(jù)本公開(kāi)的不同實(shí)施例的處理的示例的流程圖。圖4是根據(jù)本公開(kāi)的不同實(shí)施例的實(shí)施圖3中的處理的系統(tǒng)的示例的圖。
[0061]將與圖4中的信號(hào)流相關(guān)聯(lián)的描述圖3中的操作。在操作301中,控制器110可以開(kāi)始記錄音頻。例如,控制器110可以識(shí)別用戶的請(qǐng)求,從而開(kāi)始音頻記錄。使用了圖4中所示的麥克風(fēng)單元130的三個(gè)麥克風(fēng)。三個(gè)Α/D轉(zhuǎn)換器410可以將從多個(gè)麥克風(fēng)接收到的音頻信號(hào)轉(zhuǎn)換成數(shù)字文件。三個(gè)Α/D轉(zhuǎn)換器410可以將已經(jīng)被轉(zhuǎn)換成數(shù)字文件的音頻信號(hào)傳遞給控制器110。
[0062]在操作303中,控制器110可以檢測(cè)說(shuō)話者的位置。S卩,當(dāng)音頻信號(hào)被接收到時(shí),控制器110可以識(shí)別對(duì)應(yīng)于音頻信號(hào)的角度。在操作305中,控制器110可以選擇三個(gè)麥克風(fēng)中的一個(gè)。此處,麥克風(fēng)可以是全向麥克風(fēng)。在操作307中,控制器110可以通過(guò)使用選定的麥克風(fēng)記錄音頻信號(hào)。在操作309中,PCM文件生成單元117和說(shuō)話者位置檢測(cè)單元可以從Α/D轉(zhuǎn)換器410接收已經(jīng)被轉(zhuǎn)換成數(shù)字信號(hào)的音頻信號(hào)??刂破?10的編碼器121可以將從說(shuō)話者位置檢測(cè)單元111接收的角度信息編碼成包含音頻信號(hào)的PCM文件。此外,控制器110的編碼器121還可以將時(shí)間信息編碼到PCM文件中。該時(shí)間信息可以包括用于記錄音頻信號(hào)的時(shí)間段,或者記錄的開(kāi)始時(shí)間和結(jié)束時(shí)間。控制器110的編碼器121可以將壓縮的音頻文件傳遞給存儲(chǔ)器160,從而將音頻文件存儲(chǔ)在存儲(chǔ)器160中。
[0063]圖5是根據(jù)本公開(kāi)的不同