基于人工智能的智能交互設(shè)備控制方法及系統(tǒng)的制作方法

文檔序號：8942275閱讀：1236來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>控制;調(diào)節(jié)裝置的制造及其應(yīng)用技術(shù)

基于人工智能的智能交互設(shè)備控制方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及智能終端技術(shù)領(lǐng)域，特別涉及一種基于人工智能(ArtificialIntelligence,簡稱:AI)的智能交互設(shè)備控制方法、控制系統(tǒng)及智能交互設(shè)備。
【背景技術(shù)】
[0002]現(xiàn)在的智能交互設(shè)備，如電視機、生活電器等，通常是采用遙控或者提前設(shè)定好的程序來執(zhí)行相關(guān)的動作。這種通過遙控或者提前設(shè)定好的程序來執(zhí)行相關(guān)動作的智能交互設(shè)備存在以下缺點:
[0003]與人類之間的交互方式單一且互動性差，這是由于遙控操作功能有限，智能交互設(shè)備無法完成遙控操作功能以外的動作，同樣，智能交互設(shè)備按照提前設(shè)定好的程序進行動作，也是存在無法完成設(shè)定程序以外的其它動作，不能針對不同用戶需求進行不同的運動。另外，這些交互方式均是在用戶遙控或者觸發(fā)某個功能按鍵后進行的，因此，完全是被動的交互方式。
[0004]雖然有一些如視頻會議跟蹤系統(tǒng)可以根據(jù)說話人的聲音將攝像頭等轉(zhuǎn)向說話人，但是并不能夠準確判斷說話人是否存在交互意愿，也不能夠根據(jù)交互意愿做成適當(dāng)?shù)姆磻?yīng)。

【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的旨在至少解決所述技術(shù)缺陷之一。
[0006]為此，本發(fā)明的一個目的在于提出一種基于人工智能的智能交互設(shè)備控制方法。該方法能夠提升用戶與智能交互設(shè)備的交互體驗，提升智能交互設(shè)備的智能性。
[0007]本發(fā)明的另一個目的在于提出一種基于人工智能的智能交互設(shè)備控制方法。
[0008]本發(fā)明的再一個目的在于提出一種智能交互設(shè)備。
[0009]為達到上述目的，本發(fā)明的第一方面的實施例公開了一種基于人工智能的智能交互設(shè)備控制方法，包括以下步驟:接收多模態(tài)的輸入信號，所述多模態(tài)的輸入信號包括用戶輸入的圖像信號、聲音信號和/或距離信號；根據(jù)所述圖像信號進行人臉檢測，并在檢測到有人臉時，獲取所述人臉圖像和人臉信息；根據(jù)所述人臉圖像進行唇區(qū)檢測以確定唇區(qū)運動情況；根據(jù)所述聲音信號進行聲源定位以得到聲源信息；根據(jù)所述人臉信息、所述唇區(qū)運動情況、所述聲源信息和/或所述距離信號判斷所述用戶的交互意愿以及交互意愿強烈程度；以及根據(jù)所述用戶的交互意愿以及交互意愿強烈程度控制所述智能交互設(shè)備進行相應(yīng)的交互響應(yīng)。
[0010]根據(jù)本發(fā)明實施例的基于人工智能的智能交互設(shè)備控制方法，能夠?qū)崟r的采集用戶的聲音信號、圖像信號和/或距離信號，經(jīng)過人工智能的分析后確定出用戶是否存在交互意愿，并可以確定出交互意愿的強烈程度，然后自主地控制智能交互設(shè)備進行相應(yīng)的動作，主動地與用戶進行交互且交互手段豐富，進而提升用戶的使用體驗。
[0011]本發(fā)明第二方面的實施例公開了一種基于人工智能的智能交互設(shè)備控制系統(tǒng)，包括:接收模塊，用于接收多模態(tài)的輸入信號，所述多模態(tài)的輸入信號包括用戶輸入的圖像信號、聲音信號和/或距離信號；人臉檢測模塊，用于根據(jù)所述圖像信號進行人臉檢測，并在檢測到有人臉時，獲取所述人臉圖像和人臉信息；唇區(qū)檢測模塊，用于根據(jù)所述人臉圖像進行唇區(qū)檢測以確定唇區(qū)運動情況；聲源定位模塊，用于根據(jù)所述聲音信號進行聲源定位以得到聲源信息；決策模塊，所述決策模塊用于根據(jù)所述人臉信息、所述唇區(qū)運動情況、所述聲源信息和/或所述距離信號判斷所述用戶的交互意愿以及交互意愿強烈程度；以及復(fù)合輸出控制模塊，用于根據(jù)所述用戶的交互意愿以及交互意愿強烈程度控制所述智能交互設(shè)備進行相應(yīng)的交互響應(yīng)。
[0012]根據(jù)本發(fā)明實施例的基于人工智能的智能交互設(shè)備控制系統(tǒng)，能夠?qū)崟r的采集用戶的聲音信號、圖像信號和/或距離信號，經(jīng)過人工智能的分析后確定出用戶是否存在交互意愿，并可以確定出交互意愿的強烈程度，然后自主地控制智能交互設(shè)備進行相應(yīng)的動作，主動地與用戶進行交互且交互手段豐富，進而提升用戶的使用體驗。
[0013]本發(fā)明第三方面的實施例公開了一種智能交互設(shè)備，包括:根據(jù)上述的第二方面實施例所述的基于人工智能的智能交互設(shè)備控制系統(tǒng)。該智能的智能交互設(shè)備能夠?qū)崟r的采集用戶的聲音信號、圖像信號和/或距離信號，經(jīng)過人工智能的分析后確定出用戶是否存在交互意愿，并可以確定出交互意愿的強烈程度，然后自主地控制智能交互設(shè)備進行相應(yīng)的動作，主動地與用戶進行交互且交互手段豐富，進而提升用戶的使用體驗。
[0014]本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過本發(fā)明的實踐了解到。
【附圖說明】
[0015]本發(fā)明所述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解，其中:
[0016]圖1是根據(jù)本發(fā)明一個實施例的基于人工智能的智能交互設(shè)備控制方法的流程圖；以及
[0017]圖2是根據(jù)本發(fā)明一個實施例的基于人工智能的智能交互設(shè)備控制系統(tǒng)的結(jié)構(gòu)框圖；以及
[0018]圖3是根據(jù)本發(fā)明一個實施例的基于人工智能的智能交互設(shè)備控制系統(tǒng)的原理圖。
【具體實施方式】
[0019]下面詳細描述本發(fā)明的實施例，所述實施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的，僅用于解釋本發(fā)明，而不能解釋為對本發(fā)明的限制。
[0020]在本發(fā)明的描述中，需要說明的是，除非另有規(guī)定和限定，術(shù)語“安裝”、“相連”、“連接”應(yīng)做廣義理解，例如，可以是機械連接或電連接，也可以是兩個元件內(nèi)部的連通，可以是直接相連，也可以通過中間媒介間接相連，對于本領(lǐng)域的普通技術(shù)人員而言，可以根據(jù)具體情況理解所述術(shù)語的具體含義。
[0021]為了解決相關(guān)技術(shù)中存在的智能交互設(shè)備智能性差且不能很好與人類進行交互的問題，本發(fā)明基于人工智能實現(xiàn)了智能性高且與人類交互體驗好的智能交互設(shè)備控制方法、控制系統(tǒng)及智能交互設(shè)備，其中，人工智能(Artificial Intelligence，簡稱:AI)，是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計算機科學(xué)的一個分支，企圖了解智能的實質(zhì)，并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器，該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。
[0022]人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能，但能像人那樣思考，也可能超過人的智能。人工智能是包括十分廣泛的科學(xué)，由不同的領(lǐng)域組成，如機器學(xué)習(xí)，計算機視覺等等，總的說來，人工智能研究的一個主要目標(biāo)是使機器能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。
[0023]以下結(jié)合附圖描述根據(jù)本發(fā)明實施例的基于人工智能的智能交互設(shè)備控制方法、控制系統(tǒng)及智能交互設(shè)備。
[0024]圖1是根據(jù)本發(fā)明一個實施例的基于人工智能的智能交互設(shè)備控制方法的流程圖。如圖1所示，該方法包括如下步驟:
[0025]SlOl:接收多模態(tài)的輸入信號，所述多模態(tài)的輸入信號包括用戶輸入的圖像信號、
聲音信號和/或距離信號。
[0026]具體地，用戶輸入的聲音信號可以是用戶通過麥克風(fēng)輸入的；上述的圖像信號可以是通過攝像頭采集得到的；上述的距離信號可以通過紅外距離傳感器采集得到。
[0027]S102:根據(jù)圖像信號進行人臉檢測，并在檢測到有人臉時，獲取人臉圖像和人臉信息。其中，人臉信息包括但不限于人臉面積信息和人臉正面面對程度。
[0028]具體地，對于如攝像頭采集到的圖像，可以通過人臉檢測手段檢測圖像中是否存在人臉、人臉在圖像中占據(jù)的面積、人臉是否正對智能交互設(shè)備等。
[0029]當(dāng)檢測到圖像中存在人臉之后，可以從圖像中截取人臉圖像，并保存人臉信息。
[0030]S103:根據(jù)人臉圖像進行唇區(qū)檢測以確定唇區(qū)運動情況。
[0031]具體地，當(dāng)步驟S102中檢測到圖像中存在人臉后，可以通過唇區(qū)檢測手段從截取的人臉圖像中進行唇區(qū)運動情況的檢測。例如:檢測結(jié)果為唇區(qū)發(fā)送動作或者唇區(qū)未發(fā)生動作。
[0032]在本發(fā)明的一個實施例中，可以根據(jù)多幀人臉圖像之間的唇區(qū)形狀差異確定唇區(qū)運動情況。例如:前一幀人臉圖像中唇區(qū)部分顯示上下嘴唇閉合，而后一幀人臉圖像中唇區(qū)部分顯示上下嘴唇張開，此時，可以判定出用戶唇區(qū)產(chǎn)生動作，可能是用戶在開口說話等。
[0033]需要說明的是，正常情況下即使用戶沒有說話等，上下嘴唇也可能在某個時刻產(chǎn)生動作，例如打哈欠。這種情況下，不應(yīng)該認為用戶的唇區(qū)產(chǎn)生了了與說話等相關(guān)的動作，因此

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3 4 5

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：葛行飛;李崢;林漢權(quán);
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、唐老師：1.高效節(jié)能裝備 2.流動穩(wěn)定性 3.汽車流場分析和淀粉糖工藝技術(shù)。
2、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
3、王老師：電子信息處理、先進檢測方法和智能化儀表
4、周老師：1.智能電網(wǎng) 2.新能源利用 3.泛在電力物聯(lián)網(wǎng)
5、趙老師：檢測與控制技術(shù)、機器人技術(shù)、機電一體化技術(shù)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

人機交互與人工智能相關(guān)技術(shù)

人機交互和人工智能相關(guān)技術(shù)

人工智能設(shè)備相關(guān)技術(shù)

亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

基于人工智能的智能交互設(shè)備控制方法及系統(tǒng)的制作方法