專利名稱:一種具有對話及下載升級功能的智能玩具的制作方法
技術(shù)領(lǐng)域:
本實用新型涉及玩具技術(shù)領(lǐng)域,且特別涉及一種具有對話及下載升級 功能的智能玩具。
背景技術(shù):
中國是全球玩具業(yè)的生產(chǎn)大國,世界玩具產(chǎn)品總量的80%以上都是在 中國制造。然而,中國大陸生產(chǎn)主要以傳統(tǒng)玩具為主,尤其是科技含量較 低的毛絨、塑料等類型的玩具,這類生產(chǎn)設(shè)計技術(shù)含量較低的玩具,由于 利潤空間小、受歡迎程度低,己經(jīng)很難在市場上占據(jù)更多的份額。很長一段時間內(nèi),玩具產(chǎn)品將保持兩大發(fā)展趨勢 一是益智、創(chuàng)意及 有益身心發(fā)展的玩具,包括電子、機械和兩者兼?zhèn)涞耐婢?;另一方面,?能玩具方興未艾,智能化、人性化并具備圖文識別、語音、傳感等技術(shù)的 產(chǎn)品會大受歡迎。信息產(chǎn)業(yè)部在《2006年電子信息產(chǎn)業(yè)發(fā)展基金項目指南》中,將"多媒體益智娛樂產(chǎn)品"作為一項國家支持的產(chǎn)業(yè)化項目,也說明 了玩具產(chǎn)品的市場動向。搜索"語音智能玩具"字樣,可以搜索到一份實用新型專利。申請?zhí)?4223876.1 ,名稱語音智能玩具。該實用新型主要是實現(xiàn)一種語音智能 玩具,有玩具殼體,語音電路板、話筒、錄放音開關(guān)、揚聲器、電源開關(guān), 語音電路板由錄音鍵盤、語音識別電路、語音錄放電路和控制電路組成, 最終實現(xiàn)錄音、玩具與人對話等功能。該種方式的產(chǎn)品結(jié)構(gòu)相對復(fù)雜,不 能保證系統(tǒng)電路的穩(wěn)定性;該種方式產(chǎn)品為上世紀(jì)的語音處理技術(shù),在語 音錄音、語音識別技術(shù)方面的性能不能適應(yīng)很高的要求,達(dá)不到較高識別 率;該種方式的產(chǎn)品,不能實現(xiàn)內(nèi)容的實時更新下載,也不符合用戶的使 用習(xí)慣。
搜索"語音識別and玩具"字樣,可以搜索到三份專利。申請?zhí)?94201945.8 ,名稱語音遙控玩具。該實用新型由手持的指令發(fā)射機、裝在玩具內(nèi)的指令接收機和玩具機械運動部分組成,該實用新型具備語音識 別功能,但是需要將語音命令事先存儲在玩具內(nèi),即需要事先訓(xùn)練。申請 號200510032667.0,名稱 一種玩具聲控裝置。該發(fā)明中包含了語音識別 模塊、語音合成模塊。該發(fā)明中,語音識別時與預(yù)存的模型進(jìn)行比較。申 請?zhí)?3247967.0,名稱智能語聲玩具。該實用新型涉及具有一定智能、 能說話的玩具,能與兒童直接交流、玩耍,具有一定的語音識別能力。當(dāng)前,具有簡單對話功能的玩具種類繁多、形式多樣,包括仿真娃娃、 動物等,其核心技術(shù)都是采用具有語音識別功能的電子技術(shù)。主要基于美 國Sensory公司的RSC系列語音處理芯片或者臺灣凌陽公司的芯片,這類 芯片的處理核心是8位或者16位MCU, MCU作為核心處理器,其計算 能力不足,內(nèi)存SRAM也比較小,因此只能實現(xiàn)較為簡單的語音識別功 能,如特定人語音識別、基于整詞的非特定人語音識別等。采用這類語音 處理技術(shù)實現(xiàn)最終的產(chǎn)品,其識別的詞表容量有限, 一般不能大于50個 詞,而且識別率較低,在噪聲環(huán)境下識別率尤其低;每實現(xiàn)一套識別詞表 集合,都需要經(jīng)過前期的訓(xùn)練處理,所以就不能隨時更換識別詞表,不能 夠?qū)崿F(xiàn)玩具內(nèi)容的即時下載;由于MCU的計算能力有限,錄放音不能采 用較為復(fù)雜的算法,因此錄放音的音質(zhì)不高。發(fā)明內(nèi)容鑒于上述,本實用新型提供一種結(jié)構(gòu)簡單、計算能力強、識別率高、 抗噪性能好、錄/放音質(zhì)量高、互動性強、可自由下載升級的具有對話及下 載升級功能的智能玩具。本實用新型的具有對話及下載升級功能的智能玩具,包括玩具體(包 括但不限于仿真娃娃、動物、機械玩具)、電子模塊盒、放音模塊、拾音 模塊、多個按鍵,其特征在于上述電子模塊盒安裝在玩具體內(nèi),上述放音 模塊和拾音模塊分別連接至語音處理芯片的數(shù)/模轉(zhuǎn)換模塊和模/數(shù)轉(zhuǎn)換模 塊;上述多個按鍵設(shè)置于玩具體的外形體表面或接近表面處,連接至電子
模塊盒中的語音處理芯片的第一輸入輸出接口;上述電子模塊盒以基于音素的語音識別的語音處理芯片為中心,外接 有電源模塊、閃速(flash)存儲器、啟動管理模塊、下載端口;上述電源模塊連接至語音處理芯片內(nèi)的電源管理模塊,為語音處理芯 片提供穩(wěn)定的電源;上述flash存儲器用于存儲語音處理芯片工作必需的 程序和模型數(shù)據(jù)及腳本和錄音、發(fā)音文件;上述啟動管理模塊為語音處理 芯片啟動所需的專用芯片;上述下載端口的一端連接至語音處理芯片的第 二輸入輸出接口,其另一端可以與外部計算機連接,以對智能玩具進(jìn)行下 載升級。本實用新型的智能玩具可以還包括多個設(shè)置在玩具的外形體的表面 或接近表面的傳感器。上述下載端口類型包括但不限于串口和USB接口 ;上述多個按鍵可以包括電源開關(guān)、錄音鍵、放音鍵;上述拾音模塊可以為麥克風(fēng);上述放音模塊可以包括功放和揚聲器;上述傳感器可以包括壓敏傳感器、紅外傳感器。本實用新型涉及的語音識別、錄放音等功能所用芯片可以是基于語音 專用處理芯片UniLite, UniLite芯片是一款用于語音處理的專用芯片,芯片采用高集成度的SOC系統(tǒng)結(jié)構(gòu)以0.18um半導(dǎo)體工藝制造,以16位定 點DSP( 104MIPS)為核心,片內(nèi)集成了直接雙訪問快速SRAM、 1路ADC、 1路DAC (有效精度達(dá)到12Bit)、多種通信接口和通用GPIO等設(shè)備。外 部Flash存儲器、電源芯片、啟動芯片等少量芯片即可構(gòu)成完整系統(tǒng)應(yīng)用, 基于此芯片構(gòu)成的高端智能對話系統(tǒng)。本實用新型可以很好的彌補背景技術(shù)中提到的幾點不足。本實用新型 釆用計算能力更強、內(nèi)存空間更大的語音處理專用DSP芯片作為核心處 理器,F(xiàn)lash存儲器存儲玩具內(nèi)容,本實用新型的智能玩具在UniLite芯片 上實現(xiàn)的基于音素的非特定人語音識別系統(tǒng)具備如下的特點 1. 實現(xiàn)基于音素的非特定人語音識別技術(shù),可以識別更多的詞表,目前的芯片處理能力達(dá)到識別ioo詞條語音命令,并在ioo詞以內(nèi)都能夠達(dá)到很高的識別率,尤其對兒童的識別率可以達(dá)到96%以上;2. 系統(tǒng)性能優(yōu)秀,在較大規(guī)模識別任務(wù)下系統(tǒng)具有較高識別率,而 且在噪聲環(huán)境下仍然能夠保持較高的識別率;3. 特別適合中文普通話的識別任務(wù),為當(dāng)前語音識別的主流技術(shù), 其使用者可以是男性、女性,不同的年齡,甚至帶有地方口音的普通話都 具有較高的識別率;4. 模型參數(shù)的規(guī)模不隨識別任務(wù)的變化而變化,可以通過音素拼接 的方式得到識別詞表中各詞條的識別模板;5. 采用基于音素的非特定人語音識別技術(shù),修改識別任務(wù)時無需任 何訓(xùn)練,只要將識別詞條以GB2312/GBK (包含繁體)/Unicode/漢語拼音 等任意的形式下載到硬件中去,即可進(jìn)行識別,因此可以實現(xiàn)識別詞表和 識別內(nèi)容的下載功能;6. 在錄放音方面,充分發(fā)揮DSP芯片的計算能力,采用ACELP語 音編解碼方式實現(xiàn)錄放音功能,為產(chǎn)品提供更好的放音質(zhì)量。
以下結(jié)合附圖,對本實用新型的具體實施方式
作進(jìn)一步的詳細(xì)說明。 對于所屬技術(shù)領(lǐng)域的技術(shù)人員而言,從對本實用新型的詳細(xì)說明中,本實 用新型的上述和其他目的、特征和優(yōu)點將顯而易見。
圖1表示本實用新型的智能玩具的一個實施例的示意圖;圖2表示本實用新型的以UniLite芯片為核心的模塊電子系統(tǒng)結(jié)構(gòu)的 一個實施例的示意圖;圖3表示以玩具為主動的本實用新型的智能玩具實現(xiàn)流程的一個實施 例的示意圖;圖4表示以人為主動的本實用新型的智能玩具實現(xiàn)流程的一個實施例 的示意圖;圖5表示實現(xiàn)本實用新型的智能玩具的下載升級功能的一個實施例的示意圖。
具體實施方式
圖1表示本實用新型的智能玩具的一個實施例的示意圖。如圖1所示, 本實用新型的一個示例性的實施例的智能玩具為一個玩具娃娃,其包括玩 具體IOO、電子模塊盒200、電源開關(guān)301、錄音按鍵302、放音按鍵303。 上述電子模塊盒200安裝在玩具體100的外形體內(nèi),電子模塊盒200內(nèi)部 安裝有語音處理芯片,例如UniLite芯片及其外接模塊,UniLite芯片及其 外接模塊安裝在電子模塊盒中使其得到保護,不易因玩具主人的玩耍而損 壞。上述電源開關(guān)301、錄音按鍵302、放音按鍵303設(shè)置于玩具體100 的外形體表面或接近表面處,以玩具主人能夠自然和明顯的看到或感觸到 為宜,其通過設(shè)置于玩具體100的外形體內(nèi)的導(dǎo)線與電子模塊盒中的 UniLite芯片電連接。當(dāng)然上述電子模塊盒200和電源開關(guān)301、錄音按鍵302、放音按鍵 303的位置不限于圖1所示。例如,為增加趣味性,錄音按鍵302可設(shè)置 在玩具娃娃的耳朵上,放音按鍵303可以設(shè)置在玩具娃娃的嘴巴上或鼻子 上,但這些部位為易損的部位,需要特別的注意。在本實用新型的另一個實施例中,本實用新型的智能玩具還包括多個 設(shè)置在玩具的外形體的表面或接近表面的壓敏傳感器(圖中未示出)。圖2表示本實用新型的以UniLite芯片400為核心的模塊電子系統(tǒng)結(jié) 構(gòu)的一個實施例的示意圖。如圖2所示,本實用新型的具有對話及下載升級功能的智能玩具的以 UniLite芯片400為核心的模塊電子系統(tǒng)結(jié)構(gòu)的一個示例性的實施例其中,電源模塊471連接至UniLite芯片400的電源管理模塊470, 為UniLite芯片4(M)提供三路穩(wěn)定電流,分別為3,3V、 2.5V、 UV;外接的啟動管理模塊403為UniLite芯片400啟動所需的專用芯片;
Flash存儲器405用于存儲UniLite芯片400工作必需的程序和模型數(shù) 據(jù)及腳本和錄音、發(fā)音文件;按鍵控制411,即本實新型的多個按鍵連接至UniLite芯片400的第 一輸入輸出接口 GPIO410,通過按鍵控制與智能玩具進(jìn)行交互;下載口 421,即本實新型的下載端口一端連接至UniLite芯片400的 第二輸入輸出接口,即下載接口 420,其另一端可以與外部PC通過串口 或者USB接口連接,以對智能玩具進(jìn)行下載升級;揚聲器465和功放463組成本實用新型的放音模塊,處理器系統(tǒng)發(fā)出 聲音數(shù)據(jù)經(jīng)音頻采樣接口 460傳遞給數(shù)/模轉(zhuǎn)換模塊DAC461轉(zhuǎn)換為模擬 聲音信號,該模擬聲音信號通過功放463和揚聲器465傳遞給玩具主人;麥克風(fēng)466,即本實新型的拾音模塊收集到的聲音經(jīng)AGC464的自動 增益調(diào)節(jié),由模/數(shù)轉(zhuǎn)換模塊ADC462轉(zhuǎn)換為數(shù)字聲音信號,該數(shù)字聲音 信號經(jīng)音頻釆樣接口 460送入處理器系統(tǒng)進(jìn)行處理。本實用新型可以實現(xiàn)以玩具為主動的模式和以人為主動的模式,該模 式的選擇確定可以由儲存在Flash存儲器405中的程序決定,即可以在劇 本設(shè)計時設(shè)計成以玩具為主動、以人為主動或者二者混合的模式。在本實用新型的一個實施例中,當(dāng)玩具電源打開后,拾音裝置始終處 于工作狀態(tài),實時的收集環(huán)境聲音信號傳遞給處理器系統(tǒng),處理器系統(tǒng)分 析這些聲音信號是否與模型數(shù)據(jù)中或腳本中的的預(yù)定詞條匹配,以決定是 否做出反應(yīng)。圖3表示以玩具為主動的模式的本實用新型的智能玩具實現(xiàn)流程的一 個實施例的示意圖。在進(jìn)入以智能玩具為主動的模式后,玩具提出話題,如向人發(fā)問,人 進(jìn)行回答,玩具進(jìn)行語音識別后進(jìn)行回應(yīng)。在這種方式下,玩具的提問需 要設(shè)計成回答內(nèi)容有限可能的形式。這種形式可以有效地培養(yǎng)兒童的語言 交流能力、提高兒童的智力水平。如圖3所示,首先由智能玩具的程序從Flash存儲器中選擇腳本,如提出問題610,處理器系統(tǒng)找到與該腳本的該問題對應(yīng)的發(fā)音數(shù)據(jù),并在 模型數(shù)據(jù)中找到對應(yīng)的模型由處理器系統(tǒng)合成數(shù)字聲音信號,該數(shù)字聲音 信號通過音頻采樣接口 460由DAC461轉(zhuǎn)換為模擬聲音信號,該模擬聲音 信號通過功放463放大后由揚聲器465傳遞給玩具主人,玩具主人便聽到 問題610。玩具主人聽到問題后做出回答,該聲音信號由麥克風(fēng)466傳遞 給AGC464自動增益調(diào)節(jié)后,由ADC462將該模擬聲音信號轉(zhuǎn)換為數(shù)字聲 音信號,該數(shù)字聲意信號通過音頻采樣接口 460傳遞給處理器系統(tǒng),處理 器系統(tǒng)將該數(shù)字聲音信號與腳本中的對應(yīng)答案進(jìn)行比對,作出相應(yīng)的應(yīng) 答。例如答案為621則輸出應(yīng)答631,答案為622則輸出應(yīng)答632,答案 為623則輸出應(yīng)答633,答案為624則輸出應(yīng)答634。在一個互動完成后,由程序選擇進(jìn)入下一個互動或進(jìn)入其它動作。 圖4表示以人為主動的模式的本實用新型的智能玩具實現(xiàn)流程的一個 實施例的示意圖。在以人為主動的模式下,由人直接命令,玩具對命令進(jìn)行語音識別, 響應(yīng)人提出的要求。如用戶命令711對應(yīng)玩具應(yīng)答721,用戶命令712對 應(yīng)玩具應(yīng)答722,用戶命令713對應(yīng)玩具應(yīng)答723,用戶命令714對應(yīng)玩 具應(yīng)答724。這種方式可以實現(xiàn)大量的教育元素,例如圖4中714和724 中的背誦唐詩等?;赨niLite芯片的語音編解碼,采用低碼率語音壓縮算法,實現(xiàn)小 于6kbps的語音編碼,編碼后數(shù)據(jù)保存在Flash存儲器中。本實用新型的智能玩具還可以作為留言工具,如父母將聲音錄入玩 具,子女打開玩具中的特定功能(如收聽留言鍵)后,即可收聽該留言, 以可增進(jìn)父母與子女之間的感情。由于本實用新型的UniLite芯片實現(xiàn)的基于音素的語音識別,在輸入 文本后,采用音素拼接的方式即可進(jìn)入識別,不需要進(jìn)行訓(xùn)練,因此,可 以將玩具的發(fā)音內(nèi)容、識別詞表結(jié)合起來,實現(xiàn)下載升級功能,本實用新 型的下載升級包括發(fā)音數(shù)據(jù)的下載、識別詞表的修改下載及整套劇本創(chuàng)意 的下載升級。圖5即表示實現(xiàn)本實用新型的智能玩具的下載升級功能的一 個實施例如的示意圖。如圖5所示,經(jīng)過劇本創(chuàng)意811步驟后便可錄制提 示音812和制作識別詞表813,當(dāng)下載口 421與外部PC連接后,智能玩 具自動進(jìn)入下載程序,即可將提示音812和識別詞表813通過PC端軟件 從數(shù)據(jù)光盤、PC或數(shù)據(jù)庫網(wǎng)站傳送到UniLite芯片的Flash存儲器中儲存。 即可以實現(xiàn)數(shù)據(jù)庫網(wǎng)站或數(shù)據(jù)光盤到智能玩具的劇本更新,大大的提高了 玩具的新穎性,同時在娛樂性的基礎(chǔ)上增加教育益智的功能。雖然,本實用新型已通過以上實施例及其附圖而清楚說明,然而在不 背離本實用新型精神及其實質(zhì)的情況下,所屬技術(shù)領(lǐng)域的技術(shù)人員當(dāng)可根 據(jù)本實用新型作出各種相應(yīng)的變化和修正,但這些相應(yīng)的變化和修正都應(yīng) 屬于本實用新型的權(quán)利要求的保護范圍。因此,本實用新型應(yīng)由其權(quán)利要 求加以界定。
權(quán)利要求1. 一種具有對話及下載升級功能的智能玩具,包括玩具體、電子模 塊盒、放音模塊、拾音模塊、多個按鍵,其特征在于上述電子模塊盒安裝 在玩具體內(nèi),上述放音模塊和拾音模塊分別連接至語音處理芯片的數(shù)/模轉(zhuǎn)換模塊和模/數(shù)轉(zhuǎn)換模塊;上述多個按鍵設(shè)置于玩具體的外形體表面,連接 至電子模塊盒中的語音處理芯片的第一輸入輸出接口 ;上述電子模塊盒包括基于音素的語音識別的語音處理芯片,還包括與 語音處理芯片連接的電源模塊、閃速存儲器、啟動管理模塊、下載端口;上述電源模塊連接至語音處理芯片內(nèi)的電源管理模塊,為語音處理芯 片供電;上述閃速存儲器用于存儲至少包括程序和模型數(shù)據(jù)及腳本和錄 音、發(fā)音文件的文件;上述啟動管理模塊用于啟動語音處理芯片;上述下 載端口連接至語音處理芯片的第二輸入輸出接口 。
2. 根據(jù)權(quán)利要求1所述的智能玩具,其特征在于上述下載端口還連 接外部計算機。
3. 根據(jù)權(quán)利要求1或2所述的智能玩具,其特征在于還包括多個設(shè) 置在智能玩具的外表面的傳感器。
4. 根據(jù)權(quán)利要求1或2所述的智能玩具,其特征在于上述下載端口的 類型為串口或USB接口。
5. 根據(jù)權(quán)利要求1或2所述的智能玩具,其特征在于上述多個按鍵 包括電源開關(guān)、錄音鍵、放音鍵。
6. 根據(jù)權(quán)利要求1或2所述的智能玩具,其特征在于上述拾音模塊 為麥克風(fēng)。
7. 根據(jù)權(quán)利要求1或2所述的智能玩具,其特征在于上述放音模塊 包括功放和揚聲器。
8. 根據(jù)權(quán)利要求3所述的智能玩具,其特征在于上述傳感器為壓敏 傳感器或紅外傳感器。
專利摘要本實用新型提供一種具有對話及下載升級功能的智能玩具,包括玩具體、電子模塊盒、放音模塊、拾音模塊、多個按鍵;上述電子模塊盒安裝在玩具的體內(nèi),上述放音模塊和拾音模塊分別連接至語音處理芯片的數(shù)/模轉(zhuǎn)換模塊和模/數(shù)轉(zhuǎn)換模塊;上述多個按鍵設(shè)置于玩具體的外形體表面或接近表面處,連接至電子模塊盒中的語音處理芯片的第一輸入輸出接口。上述電子模塊盒以語音處理芯片為中心,外接有電源模塊、閃存存儲器、啟動管理模塊、下載端口。本實用新型的一種具有對話及下載升級功能的智能玩具結(jié)構(gòu)簡單、計算能力強、識別率高、抗噪性能好、錄/放音質(zhì)量高、互動性強、可自由下載升級。
文檔編號A63H33/26GK201036708SQ20072014909
公開日2008年3月19日 申請日期2007年5月11日 優(yōu)先權(quán)日2007年5月11日
發(fā)明者丁玉國, 志 劉, 劉潤生, 梁維謙, 明 董 申請人:劉 志;丁玉國