基于人工智能的家庭用智能機(jī)器人的麥克風(fēng)陣列的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的家庭用智能機(jī)器人的麥克風(fēng)陣列以及基于人工智能的家庭用智能機(jī)器人的聲源定位方法和裝置。
【背景技術(shù)】
[0002]人工智能(Artificial Intelligence,Al)是研宄、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計算機(jī)科學(xué)的一個分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研宄包括智能機(jī)器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。
[0003]現(xiàn)今的麥克風(fēng)陣列排布研宄主要作為聲源定位算法的輔助研宄。主要的研宄方向是麥克風(fēng)陣列在大型智能機(jī)器人進(jìn)行聲源定位的作用。排布方式由于智能機(jī)器人的大小導(dǎo)致比較粗礦,多為依據(jù)經(jīng)驗分布。但是,大型機(jī)器人并不適合家庭使用,需要研宄適合家庭用智能機(jī)器人的麥克風(fēng)排列解決方案。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005]為此,本發(fā)明的一個目的在于提出一種基于人工智能的家庭用智能機(jī)器人的麥克風(fēng)陣列,該麥克風(fēng)陣列可以適用于家庭用智能機(jī)器人。
[0006]本發(fā)明的另一個目的在于提出一種基于人工智能的家庭用智能機(jī)器人的聲源定位方法,該方法可以適用于家庭用智能機(jī)器人的基于麥克風(fēng)陣列的聲源定位。
[0007]本發(fā)明的另一個目的在于提出一種基于人工智能的家庭用智能機(jī)器人的聲源定位裝置。
[0008]為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的麥克風(fēng)陣列,所述麥克風(fēng)陣列設(shè)置在家庭用智能機(jī)器人的內(nèi)部,所述麥克風(fēng)陣列包括:至少兩層的麥克風(fēng),且每層的麥克風(fēng)所在的平面均與家庭用智能機(jī)器人的底盤平行;以及,相鄰的兩個麥克風(fēng)之間的距離小于或等于預(yù)設(shè)值。
[0009]本發(fā)明第一方面實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的麥克風(fēng)陣列,通過設(shè)置至少兩層的麥克風(fēng),且相鄰的兩個麥克風(fēng)之間的距離不超過預(yù)設(shè)值,可以適用于家庭用智能機(jī)器人。
[0010]為達(dá)到上述目的,本發(fā)明第二方面實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的聲源定位方法,包括:獲取麥克風(fēng)陣列收集的聲音信號;對所述聲音信號進(jìn)行放大處理;根據(jù)放大處理后的聲音信號,進(jìn)行聲源定位;其中,所述麥克風(fēng)陣列第一方面實(shí)施例任一項所述。
[0011]本發(fā)明第二方面實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的聲源定位方法,通過對麥克風(fēng)陣列收集的聲音信息進(jìn)行放大處理,可以滿足家庭用智能機(jī)器人的精確度要求。
[0012]為達(dá)到上述目的,本發(fā)明第三方面實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的聲源定位裝置,包括:獲取模塊,用于獲取麥克風(fēng)陣列收集的聲音信號;放大模塊,用于對所述聲音信號進(jìn)行放大處理;定位模塊,用于根據(jù)放大處理后的聲音信號,進(jìn)行聲源定位;其中,所述麥克風(fēng)陣列如第一方面實(shí)施例任一項所述。
[0013]本發(fā)明第三方面實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的聲源定位裝置,通過對麥克風(fēng)陣列收集的聲音信息進(jìn)行放大處理,可以滿足家庭用智能機(jī)器人的精確度要求。
[0014]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0015]本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
[0016]圖1是本發(fā)明一實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的麥克風(fēng)陣列的結(jié)構(gòu)不意圖;
[0017]圖2a是本發(fā)明實(shí)施例中的麥克風(fēng)陣列在家庭用智能機(jī)器人的正面方向上的設(shè)置示意圖;
[0018]圖2b是本發(fā)明實(shí)施例中的麥克風(fēng)陣列在家庭用智能機(jī)器人的反面方向上的設(shè)置示意圖;
[0019]圖3是本發(fā)明另一實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的聲源定位方法的流程示意圖;
[0020]圖4是本發(fā)明另一實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的聲源定位裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0021]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0022]圖1是本發(fā)明一實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的麥克風(fēng)陣列的結(jié)構(gòu)示意圖。家庭用智能機(jī)器人通常是指高度小于30厘米的智能機(jī)器人。
[0023]如果按照現(xiàn)有大型智能機(jī)器人的麥克風(fēng)陣列進(jìn)行排布,將把麥克風(fēng)陣列排布在家庭用智能機(jī)器人的體表外部。
[0024]而本實(shí)施例中,將麥克風(fēng)陣列設(shè)置在家庭用智能機(jī)器人的內(nèi)部。
[0025]該麥克風(fēng)陣列包括:
[0026]至少兩層的麥克風(fēng),且每層的麥克風(fēng)所在的平面均與家庭用智能機(jī)器人的底盤平行;以及,
[0027]相鄰的兩個麥克風(fēng)之間的距離小于或等于預(yù)設(shè)值。
[0028]參見圖1,以麥克風(fēng)陣列10包括兩層麥克風(fēng)為例,第一層麥克風(fēng)位于第一平面11上,第二層麥克風(fēng)位于第二平面12上。其中,圖中的麥克風(fēng)用圓圈表示。
[0029]其中,每層上的麥克風(fēng)可以采用硬件支架等方式設(shè)置在家庭用智能機(jī)器人的內(nèi)部。
[0030]另外,在家庭用智能機(jī)器人的體表上,與麥克風(fēng)相應(yīng)的位置處可以設(shè)置通風(fēng)孔,以便捕捉聲音信號。
[0031]后續(xù)實(shí)施例中將以兩層麥克風(fēng)為例,其中第一層麥克風(fēng)所在的平面稱為第一平面,第二層麥克風(fēng)所在平面稱為第二平面。
[0032]一些實(shí)施例中,所述第一層麥克風(fēng)的個數(shù)和所述第二層麥克風(fēng)的個數(shù)均為4個。從而組成共有8個麥克風(fēng)的麥克風(fēng)陣列。
[0033]例如,參見圖2a和圖2b,在家庭用智能機(jī)器人的正面和反面可以分別看到四個。
[0034]一些實(shí)施例中,所述第一層麥克風(fēng)組成邊長為第一邊長的正方形,所述第二層麥克風(fēng)組成邊長為第二邊長的正方形;其中,每層的麥克風(fēng)位于相應(yīng)層的正方形的頂點(diǎn)。
[0035]例如,每層的4個麥克風(fēng)分別位于該層的4個麥克風(fēng)組成的正方形的四個頂點(diǎn)處。
[0036]一些實(shí)施例中,所述第一邊長和所述第二邊長均是10厘米。
[0037]例如,參見圖2a,第一層麥克風(fēng)中的第一麥克風(fēng)211與第二麥克風(fēng)212之間的距離是10厘米,第二層麥克風(fēng)中的第三麥克風(fēng)221與第四麥克風(fēng)222之間的距離也是10厘米。
[0038]一些實(shí)施例中,所述第一邊長的正方形的四個頂點(diǎn),與所述第二邊長的正方形的四個頂點(diǎn)豎直對齊設(shè)置。
[0039]例如,參見圖2a,第一層的第一麥克風(fēng)211與第二層的第三麥克風(fēng)221之間的連線是垂直于第一平面和第二平面的。
[0040]一些實(shí)施例中,所述第一平面與所述第二平面之間的距離是6厘米。
[0041]例如,參見圖2a,第一層的第一麥克風(fēng)211與第二層的第三麥克風(fēng)221之間的距離是6厘米。
[0042]一些實(shí)施例中,所述預(yù)設(shè)值是10厘米。
[0043]例如,在圖2a和圖2b所示的場景下,相鄰的兩個麥克風(fēng)之間的距離分別是10厘米和6厘米,均不超過預(yù)設(shè)的10厘米。
[0044]本實(shí)施例中,通過設(shè)置至少兩層的麥克風(fēng),且相鄰的兩個麥克風(fēng)之間的距離不超過預(yù)設(shè)值,可以適用于家庭用智能機(jī)器人。進(jìn)一步的,通過選擇兩層麥克風(fēng),可以滿足家庭用智能機(jī)器人頭部兩個自由度的運(yùn)動需求。通過設(shè)置8個麥克風(fēng),可以完成三維聲源定位,并且同時追蹤多個聲源;通過設(shè)置上述的麥克風(fēng)組成形式和距離,可以更好的滿足家庭用智能機(jī)器人的需求。
[0045]圖3是本發(fā)明另一實(shí)施例提出的基于人工智能的家庭用智能機(jī)器人的聲源定位方法的流程示意圖,該方法包括:
[0046]S31:獲取麥克風(fēng)陣列收集的聲音信號。
[0047]其中,麥克風(fēng)陣列的組成形式可以參見上述實(shí)施例,在此不再贅述。
[0048]S32:對所述聲音信號進(jìn)行放大處理。
[0049]由于按照上述麥克風(fēng)陣列的排布方式,麥克風(fēng)之間的距離較近,從而聲音信號從同一個聲源分別到達(dá)一對麥克風(fēng)對中的兩個麥克風(fēng)的時間差較小,而在通常的聲源定位時,是依據(jù)該時間差進(jìn)行定位的。而時間差通常是根據(jù)組成一對麥克風(fēng)對的兩個麥克風(fēng)收集的聲音信號的互相關(guān)函數(shù)計算得到的,在計算互相關(guān)函數(shù)時,通過是將兩個麥克風(fēng)收集的時域聲音信號變換到頻域,再用頻域數(shù)據(jù)計算能量值,如果直接采用麥克風(fēng)收集的聲音信號進(jìn)行處理,則能量值差別較小,從而影響定位精度。
[0050]為了提高定位精度,本實(shí)施例中,可以對麥克風(fēng)接收到的聲音信息進(jìn)行放大處理,進(jìn)而提尚定位精度。
[0051]放大處理的倍數(shù)是配置的,例如,為2倍。
[0052]例如,在獲取到麥克風(fēng)陣列收集的聲音信號后,采用放大器對該聲音信號的值放大2倍。
[0053]S33:根據(jù)放大處理后的聲音信