一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲方法及其系統(tǒng)與流程

文檔序號：39727632發(fā)布日期：2024-10-22 13:29閱讀：58來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲方法及其系統(tǒng)與流程

本發(fā)明涉及聲音數(shù)據(jù)表示與存儲，特別是涉及一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲方法及其系統(tǒng)。

背景技術(shù)：

1、機器聲音反映了機器的運行狀況并可能預(yù)示著設(shè)備問題，利用機器聲音進行異常檢測是方便、易用、無損不停機檢測的一種方法，也是工業(yè)智能化、自動化領(lǐng)域的熱門研究方向。而為了更加準(zhǔn)確地分析出機器聲音表達出來的信息，需要采集質(zhì)量高、數(shù)量多的聲音數(shù)據(jù)，這就對磁盤存儲空間具有很高的要求，需要大量的磁盤存儲空間和網(wǎng)絡(luò)帶寬。

2、目前，對數(shù)據(jù)規(guī)模比較大的實時監(jiān)測數(shù)據(jù)存儲方法主要包括以下幾種：

3、（1）二進制數(shù)據(jù)存儲：首先通過采樣將連續(xù)的模擬信號轉(zhuǎn)換為離散的振幅值，然后進行量化將這些振幅值映射為固定位數(shù)的二進制數(shù)字。這些數(shù)字以連續(xù)的方式存儲在計算機內(nèi)存或磁盤上，構(gòu)成了pcm（脈沖編碼調(diào)制）形式的聲音數(shù)據(jù)。在實際應(yīng)用中，聲音文件可能包含附加的元數(shù)據(jù)，而不同的編碼方式如mp3、aac則引入更為復(fù)雜的算法以在減小文件大小的同時保持音頻質(zhì)量。

4、（2）聲音文件存儲：可以存儲將機器采集到的聲音數(shù)據(jù)保存在計算機本地磁盤中，可以選擇不同的存儲格式，如wav、mp3等。也可以存儲在分布式文件系統(tǒng)中，如hadoop的hdfs和谷歌的gfs等，采用分布式存儲的方式，將文件劃分成多個塊并存儲在不同的節(jié)點上，實現(xiàn)高可靠性和高性能的數(shù)據(jù)存儲。

5、（3）數(shù)據(jù)庫存儲：將機器采集到的聲音數(shù)據(jù)存儲在分布式數(shù)據(jù)庫系統(tǒng)hbase中，以便進行快速查詢、分析和檢索。

6、上述存儲方法中，二進制形式的聲音數(shù)據(jù)存儲，原始的pcm數(shù)據(jù)是非壓縮的，無法充分利用資源，且在實時傳輸應(yīng)用中可能引入延遲。并且，對于一些特殊應(yīng)用如語音識別，可能需要額外的處理或轉(zhuǎn)換。文件存儲音頻數(shù)據(jù)的缺點包括占用大量存儲空間、傳輸速度慢、對實時訪問的限制、易受損、備份和恢復(fù)復(fù)雜、耗電量相對較高以及數(shù)據(jù)有安全性風(fēng)險，影響了存儲效率、讀寫性能。使用hbase提供的數(shù)據(jù)壓縮功能可以在一定程度上優(yōu)化數(shù)據(jù)存儲和訪問效率，但是由于壓縮算法需要占用cpu資源對數(shù)據(jù)進行壓縮和解壓縮，因此采用較高壓縮比的算法可能會導(dǎo)致讀寫性能的下降，特別是對于數(shù)據(jù)量巨大的聲音檢測數(shù)據(jù)。

7、綜上所述，對于大規(guī)模的實時監(jiān)測數(shù)據(jù)，這些存儲方法存在存儲開銷較大、檢索速度慢、網(wǎng)絡(luò)帶寬要求高等問題。因此亟需提供一種新型的基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲方法及其系統(tǒng)來解決上述問題。

技術(shù)實現(xiàn)思路

1、本發(fā)明所要解決的技術(shù)問題是提供一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲方法及其系統(tǒng)，能夠針對有固定運行場景的機器設(shè)備，提出一種機器聲音數(shù)據(jù)壓縮存儲方法，并對大規(guī)模聲音數(shù)據(jù)索引優(yōu)化，用來降低聲音數(shù)據(jù)的存儲成本和檢索時間的同時不影響讀寫性能。

2、為解決上述技術(shù)問題，本發(fā)明采用的第一個技術(shù)方案是：提供一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲方法，包括以下步驟：

3、s1：根據(jù)機器運行場景建立相應(yīng)模板聲紋庫，模板聲紋庫中存儲有模板聲音片段及其編碼；

4、s2：利用步驟s1建立的模板聲紋庫針對該機器運行場景的聲音數(shù)據(jù)進行數(shù)據(jù)采集；當(dāng)新存儲聲音數(shù)據(jù)時，需要與所述模板聲紋庫進行匹配，模板聲紋庫已有的典型場景數(shù)據(jù)只需存入模板聲紋庫中對應(yīng)的數(shù)據(jù)編碼，模板聲紋庫中沒有的聲音數(shù)據(jù)則存入新建的機器聲紋庫中，并進行編碼；同時將模板聲紋庫中數(shù)據(jù)的編碼及機器聲紋庫中數(shù)據(jù)的編碼均存入一數(shù)據(jù)索引表中；

5、s3：當(dāng)進行數(shù)據(jù)調(diào)用時，調(diào)用所述數(shù)據(jù)索引表，根據(jù)數(shù)據(jù)索引表存儲的索引，在所述模板聲紋庫和機器聲紋庫中查找數(shù)據(jù)并輸出。

6、在本發(fā)明一個較佳實施例中，在步驟s1中，建立模板聲紋庫的具體步驟包括：

7、s101：判斷聲音采樣數(shù)據(jù)是否為空，若為空，則結(jié)束流程；若不為空，則進入下一步驟；

8、s102：對聲音采樣數(shù)據(jù)進行固定時長分段，再對分段之后的數(shù)據(jù)分片；

9、s103：對分片之后的每一幀聲音數(shù)據(jù)進行命名標(biāo)注編碼；

10、s104：創(chuàng)建一個候選模板庫，當(dāng)候選模板庫為空的時候均方誤差設(shè)置為無窮大，與預(yù)設(shè)的閾值進行比較，顯然均方誤差大于閾值，則對第一個聲音分片數(shù)據(jù)進行編碼，并存入候選模板庫中；

11、s105：當(dāng)候選模板庫不為空的時候，將剩余的聲音分片數(shù)據(jù)與候選模板庫中的聲音分片數(shù)據(jù)進行計算均方誤差，若計算的均方誤差小于等于閾值，則獲取該聲音分片數(shù)據(jù)的編碼，記錄該聲音分片數(shù)據(jù)出現(xiàn)次數(shù)n=n+1，并且對n的大小進行判斷，如果此聲音分片數(shù)據(jù)出現(xiàn)到達設(shè)定次數(shù)，則判定此聲音分片數(shù)據(jù)為典型的場景聲音，把此聲音分片數(shù)據(jù)和編碼進行復(fù)制存入模板聲紋庫，否則把該聲音分片數(shù)據(jù)出現(xiàn)的次數(shù)加一，并更新候選模板庫；若計算的均方誤差大于閾值，則對該聲音分片數(shù)據(jù)進行編碼，并存入候選模板庫中。

12、進一步的，在步驟s102中，數(shù)據(jù)分片的具體步驟包括：

13、s1021：對聲音采樣數(shù)據(jù)確定聲音周期；

14、s1022：將固定時長的聲音數(shù)據(jù)的長度設(shè)置為聲音周期的整數(shù)倍，作為滑動窗口的長度；

15、s1023：設(shè)置滑動窗口步長，即每次滑動的距離；

16、s1024：根據(jù)總聲音數(shù)據(jù)段的時長和滑動窗口的步長，計算需要的分片數(shù)量來覆蓋整個聲音數(shù)據(jù)，分片數(shù)量=((總聲音時長?-?滑動窗口長度)/步長)+1；

17、s1025：使用滑動窗口，從聲音數(shù)據(jù)的起始位置開始，以設(shè)定的滑動窗口步長滑動窗口，并將每個窗口視為一個分片，完成聲音數(shù)據(jù)的分割。

18、在本發(fā)明一個較佳實施例中，步驟s2的具體步驟包括：

19、s201：判斷聲音采樣數(shù)據(jù)是否為空，若為空，則結(jié)束流程；若不為空，則進入下一步驟；

20、s202：對聲音采樣數(shù)據(jù)進行固定時長分段，再對分段之后的數(shù)據(jù)分片，得到分片數(shù)據(jù)；

21、s203：把所述分片數(shù)據(jù)與模板聲紋庫中的數(shù)據(jù)進行比較，計算均方誤差，若計算的均方誤差小于等于閾值，則獲取模板聲紋庫中該分片數(shù)據(jù)對應(yīng)的編碼，并存儲在建立的數(shù)據(jù)索引表中；若計算的均方誤差大于閾值，則對該分片數(shù)據(jù)進行編碼，將該分片數(shù)據(jù)及編碼存入機器聲紋庫中，同時將該分片數(shù)據(jù)的編碼存入所述數(shù)據(jù)索引表中。

22、進一步的，所述編碼采用字母和數(shù)字組合的形式，用來唯一的表示一段聲音數(shù)據(jù)。

23、在本發(fā)明一個較佳實施例中，步驟s3的具體步驟包括：

24、s301：進行數(shù)據(jù)調(diào)用時，調(diào)用所述數(shù)據(jù)索引表，根據(jù)數(shù)據(jù)索引表檢索數(shù)據(jù)；

25、s302：在所述模板聲紋庫和機器聲紋庫中判斷所要檢索的索引是否存在；

26、s303：若存在，則在所述模板聲紋庫和機器聲紋庫中查找數(shù)據(jù)，并且返回該數(shù)據(jù)；若不存在，則返回null值。

27、為解決上述技術(shù)問題，本發(fā)明采用的第二個技術(shù)方案是：提供一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲系統(tǒng)，包括：

28、模板聲紋庫建立模塊，用于根據(jù)機器運行場景建立相應(yīng)模板聲紋庫，模板聲紋庫中存儲有模板聲音片段及其編碼；

29、數(shù)據(jù)存儲模塊，用于利用所述模板聲紋庫建立的模板聲紋庫針對該機器運行場景的聲音數(shù)據(jù)進行數(shù)據(jù)采集；當(dāng)新存儲聲音數(shù)據(jù)時，需要與所述模板聲紋庫進行匹配，模板聲紋庫已有的典型場景數(shù)據(jù)只需存入模板聲紋庫中對應(yīng)的數(shù)據(jù)編碼，模板聲紋庫中沒有的聲音數(shù)據(jù)則存入新建的機器聲紋庫中，并進行編碼；同時將模板聲紋庫中數(shù)據(jù)的編碼及機器聲音數(shù)據(jù)庫中數(shù)據(jù)的編碼均存入一數(shù)據(jù)索引表中；

30、數(shù)據(jù)調(diào)用模塊，用于當(dāng)進行數(shù)據(jù)調(diào)用時，調(diào)用所述數(shù)據(jù)索引表，根據(jù)數(shù)據(jù)索引表存儲的索引，在所述模板聲紋庫和機器聲紋庫中查找數(shù)據(jù)并輸出。

31、在本發(fā)明一個較佳實施例中，所述模板聲紋庫建立模塊根據(jù)機器運行場景建立相應(yīng)模板聲紋庫的具體步驟包括：

32、s101：判斷聲音采樣數(shù)據(jù)是否為空，若為空，則結(jié)束流程；若不為空，則進入下一步驟；

33、s102：對聲音采樣數(shù)據(jù)進行固定時長分段，再對分段之后的數(shù)據(jù)分片；

34、s103：對分片之后的每一幀聲音數(shù)據(jù)進行命名標(biāo)注編碼；

35、s104：創(chuàng)建一個候選模板庫，當(dāng)候選模板庫為空的時候均方誤差設(shè)置為無窮大，與預(yù)設(shè)的閾值進行比較，顯然均方誤差大于閾值，則對第一個聲音分片數(shù)據(jù)進行編碼，并存入候選模板庫中；

36、s105：當(dāng)候選模板庫不為空的時候，將剩余的聲音分片數(shù)據(jù)與候選模板庫中的聲音分片數(shù)據(jù)進行計算均方誤差，若計算的均方誤差小于等于閾值，則獲取該聲音分片數(shù)據(jù)的編碼，記錄該聲音分片數(shù)據(jù)出現(xiàn)次數(shù)n=n+1，并且對n的大小進行判斷，如果此聲音分片數(shù)據(jù)出現(xiàn)到達設(shè)定次數(shù)，則判定此聲音分片數(shù)據(jù)為典型的場景聲音，把此聲音分片數(shù)據(jù)和編碼進行復(fù)制存入模板聲紋庫，否則把該聲音分片數(shù)據(jù)出現(xiàn)的次數(shù)加一，并更新候選模板庫；若計算的均方誤差大于閾值，則對該聲音分片數(shù)據(jù)進行編碼，并存入候選模板庫中。

37、為解決上述技術(shù)問題，本發(fā)明采用的第三個技術(shù)方案是：提供一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲的裝置，包括存儲器和處理器，所述存儲器用于存儲至少一個程序，所述處理器用于加載所述至少一個程序以執(zhí)行上述任一項所述方法。

38、為解決上述技術(shù)問題，本發(fā)明采用的第四個技術(shù)方案是：提供一種計算機可讀存儲介質(zhì)，其中存儲有處理器可執(zhí)行的指令，所述處理器可執(zhí)行的指令在由處理器執(zhí)行時用于執(zhí)行如上任一項所述方法。

39、本發(fā)明的有益效果是：本發(fā)明針對聲學(xué)設(shè)備建模分析需要大規(guī)模的聲音數(shù)據(jù)時，進行多通道實時數(shù)據(jù)采集時會耗費大量存儲空間和網(wǎng)絡(luò)帶寬等問題，提出了一種數(shù)據(jù)壓縮存儲方法，對機器聲音采集數(shù)據(jù)進行壓縮表示和存儲，可以有效地降低數(shù)據(jù)規(guī)模、存儲成本以及網(wǎng)絡(luò)帶寬，并能實現(xiàn)機器運行聲音數(shù)據(jù)快速檢索。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孫勇,陳圣兵,萬夢緣,劉夢園,朱興成,余芬芬,王曉波,朱先峰
技術(shù)所有人：安徽云磬科技產(chǎn)業(yè)發(fā)展有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

一種基于模板技術(shù)的聲音采集數(shù)據(jù)壓縮與存儲方法及其系統(tǒng)與流程