專利名稱:即時通信中聲音信息映射性輸出的方法、終端和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計算機、網(wǎng)絡(luò)技術(shù)領(lǐng)域。
背景技術(shù):
網(wǎng)絡(luò)即時通信(IM)工具發(fā)展到今天,已成為用戶普遍使用的通訊工具,逐漸成為網(wǎng)絡(luò)用戶日常生活中必不可少的一部分。即時通信工具不但被使用在網(wǎng)絡(luò)用戶的工作中, 同樣也大量使用在網(wǎng)絡(luò)用戶的業(yè)余生活中,用戶通過網(wǎng)絡(luò)即時通信工具可以實現(xiàn)與聯(lián)系人及時有效的溝通。在目前的使用過程中,當用戶想為當前聯(lián)系人播放一段聲音片段時,所采用的方式多為發(fā)送聲音文件或發(fā)送聲音文件鏈接,整個過程都需要用戶對該聲音文件進行主動檢索,而且當用戶希望發(fā)送的是一段聲音的某個片段時,還需要對該聲音文件做預先處理,操作過程較為繁瑣,降低了用戶的使用體驗。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種即時通信中聲音信息映射性輸出的方法、終端和系統(tǒng),利用本發(fā)明,用戶可以通過自身哼唱或者播放聲音片段的方式向系統(tǒng)提供音頻片段,系統(tǒng)通過搜索比對,將與用戶提供的聲音片段符合的聲音片段發(fā)送至與用戶進行數(shù)據(jù)連接的接收方客戶端。本發(fā)明提供一種即時通信中聲音信息的映射性輸出的方法,包括如下步驟步驟1,建立用于在即時通信中映射輸出的映射影音庫;步驟2,針對于即時通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方的聲音信息;步驟3,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應的映射影音文件;步驟4,將上一步驟中檢索到的映射影音文件發(fā)送至即時通信接收方客戶端。進一步,所述映射影音庫包括下述三者至少其一,用戶終端映射影音庫,存儲在用戶即時通信工具所在的客戶端中;系統(tǒng)服務(wù)器映射影音庫,存儲在所述即時通信工具所對應的系統(tǒng)服務(wù)器中;網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫,存儲在能夠向網(wǎng)絡(luò)搜索提供音頻數(shù)據(jù)的網(wǎng)絡(luò)第三方。進一步,對應著所述的系統(tǒng)服務(wù)器映射影音庫,建立有和用戶的即時通信識別號相對應的個性影音數(shù)據(jù)映射列表。進一步,所述的針對于特定即時通信識別號的個性影音數(shù)據(jù)映射列表,包括有分別對應著該用戶即時通信聯(lián)系人的聯(lián)系人個性映射列表。進一步,所述聲音信息為用戶發(fā)出或以播放聲音的方式向即時通信發(fā)送方客戶端提供的聲音片段。進一步,所述映射輸出功能觸發(fā)方式包括下述三者至少其一,
方式一,通過即時通信交互界面中的映射功能控件進行觸發(fā),該即時通信交互界面和用戶所選擇的即時通信接收方相對應;方式二,在即時通信主面板的聯(lián)系人列表中,針對于所選擇的聯(lián)系人對象,進行映射功能觸發(fā);方式三,當本地客戶端處于錄音狀態(tài)時,采用特定的語音信息觸發(fā)。進一步,上述映射輸出功能觸發(fā)方式三主要包括如下步驟,步驟a,開啟本地客戶端的錄音功能;步驟b,采集來自于用戶的聲音信息;步驟c,識別用戶的聲音信息,判斷是否包括有聯(lián)系人標識;步驟d,觸發(fā)針對于前述聯(lián)系人標識所對應聯(lián)系人的映射輸出功能。進一步,針對于所述的步驟2中所采集的發(fā)送方聲音信息,以發(fā)送方的即時通信識別號作為索引信息,以對應的音頻數(shù)據(jù)作為被索引信息,將其存儲于本地客戶端、即時通信系統(tǒng)服務(wù)器和第三方存儲器三者至少其一中。進一步,所述映射影音庫中檢索對應的映射影音文件方式為以下二者至少其一,方式一,識別用戶提供的聲音信息,將其轉(zhuǎn)變成對應的文字信息,根據(jù)文字信息的匹配性檢索對應的映射影音文件;方式二,識別用戶所提供的聲音信息,獲得該聲音片段的音頻特征信息,將該音頻特征信息作為檢索的關(guān)鍵信息,根據(jù)相符程度進行判別,在影音庫中檢索對應的映射影音文件。進一步,存儲于映射影音庫中的影音文件需預先經(jīng)過數(shù)字處理,包括如下步驟,步驟bl,識別影音文件中語音信息對應的文字信息;步驟1^2,分析影音文件的音頻特征信息;步驟b3,將影音文件對應的文字信息和音頻特征信息同該影音文件建立映射關(guān)系,并將其存儲于映射影音文件庫中。進一步,在對映射影音庫中的影音文件進行分析對比沒有獲得對應的映射影音文件后,采用網(wǎng)絡(luò)抓取的方式,從互聯(lián)網(wǎng)中抓取匹配的映射影音文件及其相關(guān)信息。進一步,檢索到對應的目標影音文件后,從該映射文件中截取同用戶提供的聲音片段對應的映射影音文件片段,用于數(shù)據(jù)的發(fā)送操作。進一步,檢索出對應的映射影音文件后,給發(fā)送方客戶端返回檢索結(jié)果,采集用戶的確認信息后,用于數(shù)據(jù)的發(fā)送操作。進一步,所述的檢索結(jié)果包括該映射影音文件的名稱、映射影音文件片段時間長度、格式。進一步,在檢索到對應的映射影音文件后還包括如下步驟,步驟Cl,分析用戶提供的聲音信息的音頻特征信息;步驟c2,分析映射影音文件的音頻特征信息;步驟c3,根據(jù)用戶提供聲音信息的音頻特征信息,對映射影音文件中相應的音頻特征作出對應調(diào)整。進一步,所述步驟4中將檢索到的映射影音文件發(fā)送至即時通信接收方客戶端的方式為以下二者至少其一,
方式一,將該映射影音文件包含于即時通信聊天信息內(nèi),發(fā)送至接收方即時通信交互界面中,通過用戶點擊觸發(fā)后播放;方式二,預先建立雙方的語音通話連接,將該映射影音文件直接發(fā)送至接收方客戶端并播放。本發(fā)明提供一種即時通信中聲音信息的映射性輸出的終端包括即時通信交互界面,是為用戶提供即時通信信息交流以及映射性輸出相關(guān)操作的功能平臺;用戶終端映射影音庫,是位于用戶終端,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊。進一步,對應著所述的映射影音庫,設(shè)置有發(fā)送方語音篩選單元,它包括,個性語音特征模塊,是用于存儲用戶個人音頻特征數(shù)據(jù)的功能模塊;用戶語音識別模塊,是用于根據(jù)個性語音特征模塊中的用戶個人音頻特征數(shù)據(jù), 對比分析采集到的聲音信息,從而篩選出符合用戶個人音頻特征的音頻數(shù)據(jù)作為采集到的聲音信息的功能模塊。本發(fā)明還提供一種即時通信中聲音信息的映射性輸出的系統(tǒng),包括用戶操作使用的客戶端以及連接雙方客戶端的服務(wù)器,其中,所述客戶端包括即時通信交互界面,是為用戶提供即時通信信息交流以及映射性輸出相關(guān)操作的功能平臺;用戶終端映射影音庫,是位于用戶終端,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊;所述服務(wù)器包括系統(tǒng)服務(wù)器映射影音庫,是位于系統(tǒng)服務(wù)器,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;服務(wù)器數(shù)據(jù)檢索模塊,是用于根據(jù)用戶提供的聲音信息,從系統(tǒng)服務(wù)器映射影音庫檢索對應的映射影音文件的功能模塊;服務(wù)器數(shù)據(jù)處理模塊,是用于處理服務(wù)器與發(fā)送方、接收方客戶端之間數(shù)據(jù)交流的功能模塊。
圖1是本發(fā)明第一實施例提供的一種即時通信中聲音信息映射性輸出的方法中用戶向本地客戶端提供聲音片段的界面示意圖。圖2是本發(fā)明第一實施例提供的一種即時通信中聲音信息映射性輸出的方法中客戶端反饋用戶檢索結(jié)果的界面示意圖。圖3是本發(fā)明第二實施例提供的一種即時通信中聲音信息映射性輸出的方法流程圖。圖4是本發(fā)明第三實施例提供的一種即時通信中聲音信息映射性輸出的終端結(jié)構(gòu)圖。圖5是本發(fā)明第四實施例提供的一種即時通信中聲音信息映射性輸出的系統(tǒng)結(jié)構(gòu)圖。
具體實施例方式本發(fā)明的目的在于提供一種即時通信中聲音信息映射性輸出的方法、終端和系統(tǒng),利用本發(fā)明,用戶可以通過自身哼唱或者播放聲音片段的方式向系統(tǒng)提供音頻片段,系統(tǒng)通過搜索比對,將系統(tǒng)內(nèi)與用戶提供的聲音片段符合的聲音片段發(fā)送至與用戶進行數(shù)據(jù)連接的接收方客戶端。下面參照附圖,結(jié)合具體實施例對本發(fā)明做進一步的說明。圖1、圖2為本發(fā)明所述的一種即時通信中聲音信息映射性輸出方法的說明性示意圖,展示了用戶在使用該方法時的軟件界面,直觀地表達出本發(fā)明的發(fā)明目的。舉例說明,用戶Mary想通過即時通信工具向自己的即時通信聯(lián)系人Joy發(fā)送名為 XXXXX的歌曲中的其中一段內(nèi)容。如圖1所示,Mary通過點擊自身即時通信主面板400上對應Joy的即時通信聯(lián)系人圖標410,開啟二者間的即時通信交互界面300。點擊位于即時通信交互界面300上的映射功能控件310觸發(fā)相應的映射輸出功能。映射輸出功能開啟后,Mary只需將想發(fā)送的來自于歌曲XXXXX中的一段內(nèi)容哼唱出來,系統(tǒng)即會根據(jù)用戶提供的聲音信息,從自身的數(shù)據(jù)庫中檢索比對。圖1中所示的聲音采集控件311用來便于用戶控制系統(tǒng)對自身聲音信息的采集。該控件在用戶觸發(fā)映射輸出功能后顯示于映射功能控件310右側(cè)。如圖2所示,系統(tǒng)通過檢索比對,獲得相應的映射輸出聲音文件后,將檢索到的該映射文件的相關(guān)信息“已檢索到映射文件XXXXX,MP3格式,時長53S。,,返回至二者的交互界面輸出欄320。由于此時檢索出的文件內(nèi)容即為Mary想要發(fā)送的信息,用戶Mary點擊檢索結(jié)果響應控件321 “確定”,即可將該文件發(fā)送至Joy的即時通信客戶端。若檢索到的內(nèi)容錯誤,通過點擊檢索結(jié)果響應控件321“重新檢索”,即可啟動系統(tǒng)針對用戶提供的聲音信息進行重新檢索。圖3為本發(fā)明所述的即時通信中向自身發(fā)送數(shù)據(jù)的方法流程圖。下面結(jié)合具體步驟,對本發(fā)明做詳細說明。在步驟SlOl中,建立用于在即時通信中映射輸出的映射影音庫。為實現(xiàn)所述的在即時通信中聲音信息的映射性輸出,首先要建立存儲該映射性輸出的聲音文件的數(shù)據(jù)庫,即映射影音庫。其中,根據(jù)映射影音文件的存儲位置的不同,映射影音庫主要包括如下三個組成部分
用戶終端映射影音庫,存儲在用戶即時通信工具所在的客戶端中,這部分影音內(nèi)容主要為用戶自行建立,根據(jù)用戶自己的使用喜好,有選擇的設(shè)定映射影音庫內(nèi)容,是用戶個人使用的映射影音庫;系統(tǒng)服務(wù)器映射影音庫,存儲在所述即時通信工具所對應的系統(tǒng)服務(wù)器中,這部分影音內(nèi)容主要為系統(tǒng)提供,是系統(tǒng)為廣大用戶提供的一個公用映射影音庫;網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫,存儲在能夠向網(wǎng)絡(luò)搜索提供音頻數(shù)據(jù)的網(wǎng)絡(luò)第三方,這部分影音庫即指網(wǎng)絡(luò)資源,當用戶需要映射的聲音文件無法從前兩個影音庫中檢索到時,即從網(wǎng)絡(luò)中檢索對應的影音文件。在使用時,要采用其中至少其一。另外,在所述的系統(tǒng)服務(wù)器映射影音庫中,建有和用戶的即時通信識別號相對應的個性影音數(shù)據(jù)映射列表,且該數(shù)據(jù)映射列表中,包括有分別對應著該用戶即時通信聯(lián)系人的聯(lián)系人個性映射列表。舉例說明,用戶Mary根據(jù)自己的喜好,將一部分影音文件上傳至系統(tǒng)服務(wù)器映射影音庫中保存,作為自己個人使用的影音庫。系統(tǒng)即將這部分影音文件保存在對應用戶 Mary的UID的文件夾下。對應這部分影音文件建立的影音數(shù)據(jù)映射列表,就是同Mary的 UID號相對應的個性影音數(shù)據(jù)映射列表。另外,用戶Mary還可以對自己即時通信聯(lián)系人中的不同聯(lián)系人分別設(shè)置不同的聲音映射關(guān)系,即面對不同的聯(lián)系人,同一聲音信息對應不同的映射影音文件,根據(jù)Mary設(shè)置的對應關(guān)系生成對應Mary的UID的聯(lián)系人個性映射列表。在步驟S102中,針對于即時通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方
的聲音信息。其中,所述映射輸出功能觸發(fā)方式包括下述三者至少其一,方式一,通過即時通信交互界面中的映射功能控件進行觸發(fā),該即時通信交互界面和用戶所選擇的即時通信接收方相對應。例如,用戶Mary想要向用戶Joy發(fā)送一段映射性輸出的聲音文件,需要在已經(jīng)預先建立好相應的映射影音庫的情況下,觸發(fā)該映射輸出功能。如圖1中所示,Mary首先打開同Joy進行聊天的即時通信交互界面300,然后點擊位于該即時通信交互界面300上的映射功能控件310,通過該功能控件310觸發(fā)相應的映射輸出功能。方式二,在即時通信主面板的聯(lián)系人列表中,針對于所選擇的聯(lián)系人對象(Item), 進行映射功能觸發(fā)。在本方式中,用戶Mary可以在不需要打開相應用戶Joy的即時通信交互界面300 的情況下,直接在通過位于即時通信主面板400上的聯(lián)系人圖標410,進行映射功能觸發(fā)。 操作時,用戶Mary將光標移至用戶Joy的聯(lián)系人圖標410上,單擊鼠標右鍵,從右鍵菜單中選取對應的映射功能選項,觸發(fā)映射輸出功能的開啟。方式三,當本地客戶端處于錄音狀態(tài)時,采用特定的語音信息觸發(fā)。本觸發(fā)方式針對于用戶當前電腦已處于錄音開啟狀態(tài)的情況下,根據(jù)采集到的用戶特定的語音信息,觸發(fā)映射輸出功能的開啟。所述特定語音信息指該用戶的即時通信聯(lián)系人標識。針對本觸發(fā)方式,其觸發(fā)過程主要包括以下幾步
步驟a,開啟本地客戶端的錄音功能;步驟b,采集來自于用戶的聲音信息;步驟c,識別用戶的聲音信息,判斷是否包括有聯(lián)系人標識;步驟d,觸發(fā)針對于前述聯(lián)系人標識所對應聯(lián)系人的映射功能。舉例說明,當用戶Mary當前使用的電腦處于錄音開啟狀態(tài)時,若用戶Mary希望觸發(fā)針對用戶Joy的映射性輸出,只需要說出用戶Joy在用戶Mary的即時通信聯(lián)系人列表中對應的聯(lián)系人標識Joy,系統(tǒng)通過識別用戶的聲音信息,判斷出“Joy”這個信息有相應的聯(lián)系人標識,即開啟針對用戶Joy的映射輸出功能。其中,所述發(fā)送方提供的用于尋找映射輸出聲音文件的聲音信息有以下兩種提供方式方式一,通過用戶自身發(fā)出聲音的方式向即時通信發(fā)送方客戶端提供的聲音片段。例如用戶可以哼唱一段旋律,或者朗誦一段文字內(nèi)容。方式二,通過用戶利用其它裝置播放聲音的方式向即時通信發(fā)送方客戶端提供的聲音片段。例如,用戶可以利用樂器彈奏旋律,或者利用具有外放功能的音頻播放裝置播放一段聲音片段。另外,對于在本步驟中所采集到的發(fā)送方的聲音信息,以發(fā)送方的即時通信識別號作為索引信息,以對應的音頻數(shù)據(jù)作為被索引信息,存儲于本地客戶端、即時通信系統(tǒng)服務(wù)器和第三方存儲器三者至少其一中。所存儲的發(fā)送方聲音信息可以用于在以后的聲音信息的對比識別時,便于系統(tǒng)更準確地識別出用戶的聲音,從而提高系統(tǒng)檢索對應映射文件的效率。在步驟S103中,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應的映射影音文件。在本步驟中,主要采用匹配檢索算法檢索對應的映射影音文件。通過檢索內(nèi)容的匹配性來確定檢索結(jié)果。根據(jù)檢索時關(guān)鍵內(nèi)容的不同類型,所述映射影音庫中檢索對應的映射影音文件方式分為以下兩種方式一,檢索關(guān)鍵內(nèi)容為該聲音信息的文字信息。首先,通過語音識別技術(shù),分析用戶提供的聲音信息,將其轉(zhuǎn)變成對應的文字信息,根據(jù)文字信息的匹配性檢索對應的映射影音文件。這種檢索方式適應于用戶提供的聲音片段包含文字內(nèi)容的情況,例如歌詞。方式二,檢索關(guān)鍵內(nèi)容為該聲音信息的音頻特征信息。識別用戶所提供的聲音信息,獲得該聲音片段的音頻特征信息,作為檢索的關(guān)鍵信息,根據(jù)相符程度進行判別,在影音庫中檢索對應的映射影音文件。其中,所述的音頻特征信息是指該段聲音信息的音樂節(jié)拍和音符信息等音頻數(shù)據(jù)信息。這種檢索方式適應于用戶提供純音樂旋律的聲音片段的情況。在用戶提供的聲音信息既包括文字內(nèi)容,也包括音樂旋律時,例如,用戶哼唱一句歌詞時,可以任意選擇上述檢索方式其中之一。當然,也可同時選擇兩種檢索方式,交叉比對,這樣可以更加準確的檢索到映射影音文件。對應上述的檢索方式,在建立映射影音庫時,需要將映射影音庫中的影音文件預先經(jīng)過數(shù)字處理,預處理為包括相應文字信息和音頻特征信息的影音文件,主要步驟如下
步驟bl,識別影音文件中語音信息對應的文字信息;步驟132,分析影音文件的音頻特征信息;步驟b3,將影音文件對應的文字信息和音頻特征信息同該影音文件建立映射關(guān)系,并將其存儲于映射影音文件庫中。這樣,在提取到用戶提供的聲音信息的檢索關(guān)鍵內(nèi)容后,即可根據(jù)該關(guān)鍵內(nèi)容同映射影音庫中影音文件對應的關(guān)鍵內(nèi)容進行比對,根據(jù)相符程度進行判別選擇。在檢索時,優(yōu)先從本地電腦上的用戶終端映射影音庫中檢索比對。若檢索失敗,再從系統(tǒng)服務(wù)器映射影音庫中檢索比對。若仍未獲得符合要求的映射影音文件,則采用web 網(wǎng)絡(luò)抓取的方式,從互聯(lián)網(wǎng)中抓取匹配的映射影音文件及其相關(guān)信息,即從網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫中檢索比對。通過在上述多個影音庫中的檢索,在檢索到對應的映射影音文件后,從該映射文件中截取同用戶提供的聲音片段對應的映射影音文件片段,用于數(shù)據(jù)的發(fā)送操作。例如用戶提供的聲音文件為一首歌的一句歌詞,系統(tǒng)在通過匹配檢索的方式檢索到這首歌后,再從這首歌中截取用戶所提供的這句歌詞所對應的這一部分歌曲片段。最后發(fā)送至接收方客戶端的即是截取后的歌曲片段。另外,在檢索到對應的映射影音文件后,還可以根據(jù)用戶提供的聲音信息的音頻特征,對映射影音文件中相應的音頻特征作出對應調(diào)整,將調(diào)整后的映射影音文件用于數(shù)據(jù)的發(fā)送操作。這樣可以更好的提高用戶體驗,使得發(fā)送的影音文件變得更加個性化,增加用戶使用的樂趣。在步驟S104中,用戶判別檢索到的對應映射影音文件是否符合要求。若經(jīng)用戶判別為是,則轉(zhuǎn)入步驟S105 ;若經(jīng)用戶判定為否,則返回步驟S103 ;重新檢索對應的映射影音文件。其中,在經(jīng)上一步檢索出對應的映射影音文件后,給發(fā)送方客戶端返回檢索結(jié)果, 其中所述的檢索結(jié)果包括該映射影音文件的名稱、映射影音文件片段時間長度和格式。在經(jīng)過用戶確認后,該檢索到的映射影音文件即用于數(shù)據(jù)的發(fā)送操作。如圖2所示,在檢索到對應的映射影音文件后,在用戶Mary與用戶Joy的即時通信交互界面300的交互界面輸出欄320中,系統(tǒng)給用戶Mary返回一個檢索結(jié)果,檢索結(jié)果顯示出了該段映射影音文件名稱、時間長度和格式。用戶Mary通過點擊檢索結(jié)果響應控件 321——“確定”和“重新檢索”,來對該文件是否符合要求做出響應。符合用戶Mary要求的映射影音文件片段即用于發(fā)送至用戶Joy的即時通信終端。在步驟S105中,將經(jīng)上一步驟確定的映射影音文件發(fā)送至即時通信接收方客戶端。其中,將經(jīng)上一步驟確定的映射影音文件發(fā)送至即時通信接收方客戶端的方式為以下二者至少其一,方式一,將該映射影音文件包含于即時通信聊天信息內(nèi),發(fā)送至接收方即時通信交互界面中,通過用戶點擊觸發(fā)后播放。方式二,預先建立二者的語音通話連接,將該映射影音文件直接發(fā)送至接收方客戶端并播放。圖4所示為本發(fā)明所述一種即時通信中聲音信息的映射性輸出終端的結(jié)構(gòu)圖。
用戶終端映射影音庫110,是位于用戶終端,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊120,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊130,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件的功能模塊;影音播放模塊140,是用于播放接收到的映射影音文件的功能模塊。進一步,對應著所述的用戶終端映射影音庫,還設(shè)置有發(fā)送方語音篩選單元,它包括,個性語音特征模塊111,是用于存儲用戶個人音頻特征數(shù)據(jù)的功能模塊;用戶語音識別模塊112,是用于根據(jù)個性語音特征模塊111中的用戶個人音頻特征數(shù)據(jù),對比分析采集到的聲音信息,從而篩選出符合用戶個人音頻特征的音頻數(shù)據(jù)作為采集到的聲音信息的功能模塊。圖4中的即時通信工具中的即時通信交互界面300,它是為用戶提供即時通信信息交流以及映射性輸出的相關(guān)操作平臺。在本實施例中,用戶想要使用本發(fā)明所述的聲音信息的映射性輸出需要首先建立用戶終端映射影音庫110。實際應用時,聲音采集模塊120采集用戶提供的聲音信息,映射影音檢索模塊130根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件。檢索到的影音文件通過即時通信聊天工具發(fā)送至接收方客戶端。當用戶接收到來自其他用戶發(fā)送的含有映射影音文件的即時通信消息時,觸發(fā)播放后影音播放模塊140即對該映射影音文件進行播放。特別地,針對用戶提供的用戶自己相關(guān)的聲音信息還設(shè)置了針對用戶的發(fā)送方語音篩選功能,用戶預先通過個性語音特征模塊111記錄了用戶個人的音頻特征數(shù)據(jù),當聲音采集模塊120采集到用戶提供的聲音信息后,用戶語音識別模塊112根據(jù)個性語音特征模塊111記錄的音頻特征信息,篩選出符合用戶個人音頻特征的音頻數(shù)據(jù)作為采集到的聲
首{曰息。圖5所示為本發(fā)明所述一種即時通信中聲音信息的映射性輸出系統(tǒng)的結(jié)構(gòu)圖。由圖中可以看出,本發(fā)明所述系統(tǒng)由客戶端100和連接雙方客戶端100的服務(wù)器200兩部分組成。本發(fā)明所述終端,即客戶端100,它包括用戶終端映射影音庫110,是位于用戶終端,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊120,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊130,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件的功能模塊;影音播放模塊140,是用于播放接收到的映射影音文件的功能模塊。其中,所述服務(wù)器200包括系統(tǒng)服務(wù)器映射影音庫210,是位于系統(tǒng)服務(wù)器,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;服務(wù)器數(shù)據(jù)檢索模塊220,是用于根據(jù)用戶提供的聲音信息,從系統(tǒng)服務(wù)器映射影音庫檢索對應的映射影音文件的功能模塊;服務(wù)器數(shù)據(jù)處理模塊230,是用于處理服務(wù)器與發(fā)送方、接收方客戶端之間數(shù)據(jù)交流的功能模塊。圖5中300為即時通信工具中的即時通信交互界面,為用戶提供即時通信信息交流以及映射性輸出的相關(guān)操作平臺。在本實施例中,用戶想要使用本發(fā)明所述的聲音信息的映射性輸出需要首先建立用戶終端映射影音庫110。實際應用時,聲音采集模塊120采集用戶提供的聲音信息,映射影音檢索模塊130根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件。若檢索失敗,則通過服務(wù)器數(shù)據(jù)處理模塊230向服務(wù)器200發(fā)送請求,服務(wù)器數(shù)據(jù)檢索模塊 220根據(jù)用戶的請求從系統(tǒng)服務(wù)器映射影音庫210中檢索對應的映射影音文件。檢索成功后,通過服務(wù)器數(shù)據(jù)處理模塊230將該映射影音文件發(fā)送至接收方客戶端。接收方接收到該映射影音文件的即時通信消息后,通過觸發(fā)影音播放模塊140對該映射影音文件進行播放。以上是對本發(fā)明的描述而非限定,基于本發(fā)明思想的其它實施例,均在本發(fā)明的保護范圍之中。
權(quán)利要求
1.一種即時通信中聲音信息的映射性輸出的方法,其特征在于所述方法包括如下步驟步驟1,建立用于在即時通信中映射輸出的映射影音庫;步驟2,針對于即時通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方的聲音信息; 步驟3,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應的映射影音文件; 步驟4,將上一步驟中檢索到的映射影音文件發(fā)送至即時通信接收方客戶端。
2.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述映射影音庫包括下述三者至少其一,用戶終端映射影音庫,存儲在用戶即時通信工具所在的客戶端中; 系統(tǒng)服務(wù)器映射影音庫,存儲在所述即時通信工具所對應的系統(tǒng)服務(wù)器中; 網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫,存儲在能夠向網(wǎng)絡(luò)搜索提供音頻數(shù)據(jù)的網(wǎng)絡(luò)第三方。
3.根據(jù)權(quán)利要求2所述的即時通信中聲音信息的映射性輸出的方法,其特征在于對應著所述的系統(tǒng)服務(wù)器映射影音庫,建立有和用戶的即時通信識別號相對應的個性影音數(shù)據(jù)映射列表。
4.根據(jù)權(quán)利要求3所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述的針對于特定即時通信識別號的個性影音數(shù)據(jù)映射列表,包括有分別對應著該用戶即時通信聯(lián)系人的聯(lián)系人個性映射列表。
5.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述聲音信息為用戶發(fā)出或以播放聲音的方式,向即時通信發(fā)送方客戶端提供的聲音片段。
6.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述映射輸出功能觸發(fā)方式包括下述三者至少其一,方式一,通過即時通信交互界面中的映射功能控件進行觸發(fā),該即時通信交互界面和用戶所選擇的即時通信接受方相對應;方式二,在即時通信主面板的聯(lián)系人列表中,針對于所選擇的聯(lián)系人對象,進行映射功能觸發(fā);方式三,當本地客戶端處于錄音狀態(tài)時,采用特定的語音信息觸發(fā)。
7.根據(jù)權(quán)利要求6所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述映射輸出功能觸發(fā)方式三包括如下步驟,步驟al,開啟本地客戶端的錄音功能;步驟a2,采集來自于用戶的聲音信息;步驟a3,識別用戶的聲音信息,判斷是否包括有聯(lián)系人標識;步驟a4,觸發(fā)針對于前述聯(lián)系人標識所對應聯(lián)系人的映射輸出功能。
8.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于針對于所述的步驟2中所采集的發(fā)送方聲音信息,以發(fā)送方的即時通信識別號作為索引信息,以對應的音頻數(shù)據(jù)作為被索引信息,將其存儲于本地客戶端、即時通信系統(tǒng)服務(wù)器和第三方存儲器三者至少其一中。
9.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述映射影音庫中檢索對應的映射影音文件方式為以下二者至少其一,方式一,識別用戶提供的聲音信息,將其轉(zhuǎn)變成對應的文字信息,根據(jù)文字信息的匹配性檢索對應的映射影音文件;方式二,識別用戶所提供的聲音信息,獲得該聲音片段的音頻特征信息,將該音頻特征信息作為檢索的關(guān)鍵信息,根據(jù)相符程度進行判別,在影音庫中檢索對應的映射影音文件。
10.根據(jù)權(quán)利要求9所述的即時通信中聲音信息的映射性輸出的方法,其特征在于存儲于映射影音庫中的影音文件需預先經(jīng)過數(shù)字處理,包括如下步驟,步驟bl,識別影音文件中語音信息對應的文字信息; 步驟1^2,分析影音文件的音頻特征信息;步驟b3,將影音文件對應的文字信息和音頻特征信息同該影音文件建立映射關(guān)系,并將其存儲于映射影音文件庫中。
11.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于在對映射影音庫中的影音文件進行分析對比沒有獲得對應的映射影音文件后,采用網(wǎng)絡(luò)抓取的方式,從互聯(lián)網(wǎng)中抓取匹配的映射影音文件及其相關(guān)信息。
12.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于檢索到對應的目標影音文件后,從該映射文件中截取同用戶提供的聲音片段對應的映射影音文件片段,用于數(shù)據(jù)的發(fā)送操作。
13.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于檢索出對應的映射影音文件后,給發(fā)送方客戶端返回檢索結(jié)果,采集用戶的確認信息后用于數(shù)據(jù)的發(fā)送操作。
14.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述的檢索結(jié)果包括該映射影音文件的名稱、映射影音文件片段時間長度、格式。
15.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述步驟3中在檢索對應的映射影音文件后還包括如下步驟,步驟cl,分析用戶提供的聲音信息的音頻特征信息; 步驟c2,分析映射影音文件的音頻特征信息;步驟c3,根據(jù)用戶提供聲音信息的音頻特征信息,對映射影音文件中相應的音頻特征作出對應調(diào)整。
16.根據(jù)權(quán)利要求1所述的即時通信中聲音信息的映射性輸出的方法,其特征在于所述步驟4中將檢索到的映射影音文件發(fā)送至即時通信接收方客戶端的方式為以下二者至少其一,方式一,將該映射影音文件包含于即時通信聊天信息內(nèi),發(fā)送至接收方即時通信交互界面中,通過用戶點擊觸發(fā)后播放;方式二,預先建立雙方的語音通話連接,將該映射影音文件直接發(fā)送至接收方客戶端并播放。
17.—種即時通信中聲音信息的映射性輸出終端,其特征在于該終端包括如下組成部分用戶終端映射影音庫,是位于用戶終端,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊; 映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊。
18.根據(jù)權(quán)利要求17所述的即時通信中聲音信息的映射性輸出的終端,其特征在于 對應著所述的映射影音庫,設(shè)置有發(fā)送方語音篩選單元,它包括,個性語音特征模塊,是用于存儲用戶個人音頻特征數(shù)據(jù)的功能模塊; 用戶語音識別模塊,是用于根據(jù)個性語音特征模塊中的用戶個人音頻特征數(shù)據(jù),對比分析采集到的聲音信息,從而篩選出符合用戶個人音頻特征的音頻數(shù)據(jù)作為采集到的聲音信息的功能模塊。
19.一種即時通信中聲音信息的映射性輸出系統(tǒng),包括用戶操作使用的客戶端以及連接雙方客戶端的服務(wù)器,其特征在于所述客戶端包括,用戶終端映射影音庫,是位于用戶終端,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊; 映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊; 所述服務(wù)器包括,系統(tǒng)服務(wù)器映射影音庫,是位于系統(tǒng)服務(wù)器,用于存儲用于映射性輸出的影音文件的數(shù)據(jù)庫;服務(wù)器數(shù)據(jù)檢索模塊,是用于根據(jù)用戶提供的聲音信息,從系統(tǒng)服務(wù)器映射影音庫檢索對應的映射影音文件的功能模塊;服務(wù)器數(shù)據(jù)處理模塊,是用于處理服務(wù)器與發(fā)送方、接收方客戶端之間數(shù)據(jù)交流的功能模塊。
全文摘要
本發(fā)明提供了一種即時通信中聲音信息的映射性輸出的方法、終端和系統(tǒng),屬于計算機、網(wǎng)絡(luò)技術(shù)領(lǐng)域。即時通信中聲音信息的映射性輸出的方法包括如下步驟首先,建立用于在即時通信中映射輸出的映射影音庫;其次,針對于即時通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方的聲音信息;然后,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應的映射影音文件;最后,將上一步驟中檢索到的映射影音文件發(fā)送至即時通信接收方客戶端。利用本發(fā)明,用戶可以通過自身哼唱或者播放聲音片段的方式向系統(tǒng)提供音頻片段,系統(tǒng)通過搜索比對,將系統(tǒng)內(nèi)與用戶提供的聲音片段符合的聲音片段發(fā)送至與用戶進行數(shù)據(jù)連接的接收方客戶端。
文檔編號G06F17/30GK102377692SQ201110386949
公開日2012年3月14日 申請日期2011年11月28日 優(yōu)先權(quán)日2011年11月28日
發(fā)明者周鵬, 馬宇塵 申請人:上海量明科技發(fā)展有限公司