亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

對(duì)話裝置、對(duì)話主機(jī)裝置、對(duì)話子機(jī)裝置、對(duì)話控制方法及對(duì)話控制程序的制作方法

文檔序號(hào):7743742閱讀:262來源:國知局
專利名稱:對(duì)話裝置、對(duì)話主機(jī)裝置、對(duì)話子機(jī)裝置、對(duì)話控制方法及對(duì)話控制程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種例如應(yīng)答視聽電視廣播的視聽者等的發(fā)聲而進(jìn)行對(duì)話的對(duì)話裝置相關(guān)的技術(shù)。
背景技術(shù)
近年來,伴隨聲音辨識(shí)、聲音合成技術(shù)的進(jìn)步,提出了一種通過聲音進(jìn)行對(duì)計(jì)算機(jī)等的指示操作,或通過圖像與聲音使其應(yīng)答進(jìn)行的技術(shù)(例如,日本特開2001-249924號(hào)公報(bào)、日本特開平7-302351號(hào)公報(bào))。這些裝置可以通過聲音的輸入輸出來進(jìn)行以往由鍵盤或指點(diǎn)設(shè)備(pointingdevice)進(jìn)行的操作或由文字表示的應(yīng)答。
然而,這些裝置是對(duì)應(yīng)于其裝置的動(dòng)作或應(yīng)答,接收了預(yù)先確定過的聲音的輸入,不能進(jìn)行自由度高的對(duì)話。
另一方面,作為能給予與自由對(duì)話接近的印象的裝置,例如公知被稱為“話匣子家族打開話匣子”的對(duì)話型玩具等。這種裝置具備在進(jìn)行基于已輸入的發(fā)話聲音的聲音辨識(shí)的同時(shí),存儲(chǔ)了與辨識(shí)結(jié)果對(duì)應(yīng)的應(yīng)答數(shù)據(jù)的對(duì)話數(shù)據(jù)庫,能夠針對(duì)各種發(fā)話內(nèi)容進(jìn)行應(yīng)答。另外,作為以更自然的對(duì)話為目標(biāo)的裝置,有進(jìn)行語言解析或含義解析,或參照作為木結(jié)構(gòu)或堆棧存儲(chǔ)的過去的發(fā)話記錄,能從大規(guī)模的對(duì)話數(shù)據(jù)庫中檢索到適當(dāng)?shù)膽?yīng)答數(shù)據(jù)的裝置(例如,日本特許第3017492號(hào)公報(bào))。
然而,在上述以往的技術(shù)中,有在適當(dāng)進(jìn)行比較自由的對(duì)話的同時(shí)難于達(dá)到裝置構(gòu)成的小規(guī)?;哪康牡膯栴}點(diǎn)。即,在通過從利用者一方開始說話才開始對(duì)話的情況下,由于對(duì)話內(nèi)容的自由度高,故若不具備非常大規(guī)模的對(duì)話數(shù)據(jù)庫,就不能進(jìn)行適當(dāng)?shù)膶?duì)話內(nèi)容的辨識(shí)、應(yīng)答。具體地講,例如在利用者發(fā)問“今天星期幾”時(shí),若對(duì)話數(shù)據(jù)庫內(nèi)未存儲(chǔ)有設(shè)想過該發(fā)問的對(duì)話數(shù)據(jù),則不能貼切應(yīng)答。再有,若碰巧存儲(chǔ)了與音響距離近的“現(xiàn)在幾點(diǎn)”對(duì)應(yīng)的對(duì)話數(shù)據(jù),則誤辨識(shí)為該數(shù)據(jù),可能會(huì)應(yīng)答“10點(diǎn)50分”,成為對(duì)話不對(duì)路。而且,在反復(fù)進(jìn)行利用者的發(fā)話與裝置的應(yīng)答時(shí),由于該對(duì)話內(nèi)容的組合按指數(shù)函數(shù)增大,故即使具備了相當(dāng)大規(guī)模的數(shù)據(jù)庫,可以準(zhǔn)確接續(xù)適當(dāng)?shù)膽?yīng)答也是困難的。

發(fā)明內(nèi)容
鑒于上述問題點(diǎn),本發(fā)明的目的在于,提供一種即使在比較小規(guī)模的裝置構(gòu)成中,也難誤辨識(shí)利用者的發(fā)音,從而順利進(jìn)行對(duì)話,可以容易地給予接近自由對(duì)話的印象的對(duì)話裝置及對(duì)話控制方法。
為了達(dá)到上述目的,本發(fā)明的第1對(duì)話裝置,其特征在于,具備顯示控制機(jī)構(gòu),其根據(jù)圖像數(shù)據(jù),在顯示部上顯示對(duì)視聽者非對(duì)話性進(jìn)展的圖像;對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu),其存儲(chǔ)對(duì)應(yīng)于上述圖像的進(jìn)展的對(duì)話數(shù)據(jù);聲音辨識(shí)機(jī)構(gòu),其通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理機(jī)構(gòu),其根據(jù)上述視聽者發(fā)話數(shù)據(jù)、上述對(duì)話數(shù)據(jù)及對(duì)應(yīng)于上述圖像的進(jìn)展的時(shí)間信息,輸出表示對(duì)話裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制機(jī)構(gòu),其根據(jù)上述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
根據(jù)該構(gòu)成,由于可以進(jìn)行與顯示的圖像進(jìn)展對(duì)應(yīng)的內(nèi)容的對(duì)話,故可以容易以自然感將視聽者引入對(duì)話裝置預(yù)先設(shè)定的對(duì)話內(nèi)容中。因此,即使在比較小規(guī)模的裝置構(gòu)成中,也難誤辨識(shí)利用者的發(fā)音,從而順利地進(jìn)行對(duì)話,可以容易地給予接近自由對(duì)話的印象。
本發(fā)明的第2對(duì)話裝置,是在上述第1對(duì)話裝置中,其特征在于,還具備輸入機(jī)構(gòu),其通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入上述圖像數(shù)據(jù)及上述對(duì)話數(shù)據(jù),向上述顯示控制機(jī)構(gòu)及上述對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)輸出上述已輸入的數(shù)據(jù)。
本發(fā)明的第3對(duì)話裝置,是在上述第2對(duì)話裝置中,其特征在于,上述輸入機(jī)構(gòu)構(gòu)成為通過互不相同的路徑輸入上述圖像數(shù)據(jù)與上述對(duì)話數(shù)據(jù)。
這樣,即使在以各種路徑輸入圖像數(shù)據(jù)與對(duì)話數(shù)據(jù)的情況下,由于若能取得圖像的進(jìn)展與對(duì)話數(shù)據(jù)之間的對(duì)應(yīng)(同步),則可以如上所述地進(jìn)行適當(dāng)?shù)膶?duì)話,故可以構(gòu)成各種靈活構(gòu)成的對(duì)話裝置。
本發(fā)明的第4對(duì)話裝置,是在上述第2對(duì)話裝置中,其特征在于,上述輸入機(jī)構(gòu)構(gòu)成為通過在與上述圖像數(shù)據(jù)對(duì)應(yīng)的給定時(shí)間內(nèi)輸入上述對(duì)話數(shù)據(jù),從而輸出上述時(shí)間信息。
由此,通過根據(jù)對(duì)話數(shù)據(jù)的輸入時(shí)間來輸出時(shí)間信息,可以容易將圖像的進(jìn)展與對(duì)話數(shù)據(jù)建立對(duì)應(yīng)關(guān)系。
本發(fā)明的第5對(duì)話裝置,是在上述第2對(duì)話裝置中,其特征在于,還具備視聽者發(fā)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu),其存儲(chǔ)上述視聽者發(fā)話數(shù)據(jù);上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)已存儲(chǔ)于上述視聽者發(fā)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)內(nèi)的上述視聽者發(fā)話數(shù)據(jù)、及上述視聽者發(fā)出基于上述視聽者發(fā)話數(shù)據(jù)的上述聲音后重新向上述輸入機(jī)構(gòu)輸入的對(duì)話數(shù)據(jù),輸出上述裝置發(fā)話數(shù)據(jù)。
由此,可以進(jìn)行在對(duì)話的開始時(shí)刻以后的對(duì)話內(nèi)容不確定的對(duì)話。因此,減輕所謂的沿用預(yù)先設(shè)定的腳本的機(jī)械性對(duì)話的印象,可以進(jìn)行例如給予以問答形式一起欣賞廣播節(jié)目的感覺的對(duì)話。
本發(fā)明的第6對(duì)話裝置,是在上述第1對(duì)話裝置中,其特征在于,上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)上述圖像數(shù)據(jù)內(nèi)包含的上述時(shí)間信息,輸出上述裝置發(fā)話數(shù)據(jù)。
本發(fā)明的第7對(duì)話裝置,是在上述第6對(duì)話裝置中,其特征在于,上述對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)構(gòu)成為可以存儲(chǔ)多個(gè)上述對(duì)話數(shù)據(jù);同時(shí)上述圖像數(shù)據(jù)包含上述時(shí)間信息與特定上述多個(gè)對(duì)話數(shù)據(jù)中的至少任意一個(gè)的對(duì)話數(shù)據(jù)特定信息;上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)上述時(shí)間信息及上述對(duì)話數(shù)據(jù)特定信息,輸出上述裝置發(fā)話數(shù)據(jù)。
本發(fā)明的第8對(duì)話裝置,是在上述第1對(duì)話裝置中,其特征在于,還具備計(jì)時(shí)機(jī)構(gòu),其輸出與上述圖像的顯示時(shí)間的經(jīng)過對(duì)應(yīng)的上述時(shí)間信息;上述對(duì)話數(shù)據(jù)包括表示上述對(duì)話處理機(jī)構(gòu)應(yīng)輸出的上述裝置發(fā)話數(shù)據(jù)的時(shí)間的輸出時(shí)間信息;上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)上述時(shí)間信息及上述輸出時(shí)間信息,輸出上述裝置發(fā)話數(shù)據(jù)。
這樣,通過利用圖像數(shù)據(jù)所包含的時(shí)間信息或特定對(duì)話數(shù)據(jù)的對(duì)話數(shù)據(jù)特定信息、對(duì)應(yīng)于圖像的顯示時(shí)間的經(jīng)過的上述時(shí)間信息,從而當(dāng)然可以容易建立圖像的進(jìn)展與對(duì)話數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系。
本發(fā)明的第9對(duì)話裝置,是在上述第1對(duì)話裝置中,其特征在于,上述對(duì)話處理機(jī)構(gòu)構(gòu)成為通過根據(jù)上述對(duì)話數(shù)據(jù)及上述時(shí)間信息,輸出上述裝置發(fā)話數(shù)據(jù),從而開始與視聽者的對(duì)話,另一方面通過根據(jù)上述對(duì)話數(shù)據(jù)及上述視聽者發(fā)話數(shù)據(jù),輸出上述裝置發(fā)話數(shù)據(jù),從而繼續(xù)上述已開始的對(duì)話。
由此,由于根據(jù)與圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息,可以開始新的對(duì)話,故可以進(jìn)一步準(zhǔn)確地以自然的感覺將視聽者引入對(duì)話裝置預(yù)先設(shè)想的對(duì)話內(nèi)容中。
本發(fā)明的第10對(duì)話裝置,是在上述第9對(duì)話裝置中,其特征在于,上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)已經(jīng)開始的與視聽者的對(duì)話中的上述裝置發(fā)話數(shù)據(jù)與上述視聽者發(fā)話數(shù)據(jù)之間的適合度、以及與視聽者的新對(duì)話開始的優(yōu)先度,開始上述新的對(duì)話。
本發(fā)明的第11對(duì)話裝置,是在上述第9對(duì)話裝置中,其特征在于,上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)視聽者相關(guān)的簡介信息及對(duì)應(yīng)于上述簡介信息、表示用來開始與視聽者的對(duì)話的條件的對(duì)話開始條件信息,開始與視聽者的對(duì)話。
本發(fā)明的第12對(duì)話裝置,是在上述第9對(duì)話裝置中,其特征在于,上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)已經(jīng)開始的與視聽者的對(duì)話中的上述裝置發(fā)話數(shù)據(jù)與上述視聽者發(fā)話數(shù)據(jù)之間的適合度、視聽者相關(guān)的簡介信息、以及對(duì)應(yīng)于上述適合度和上述簡介信息表示用來開始與視聽者的對(duì)話的條件的對(duì)話開始條件信息,開始與視聽者的新對(duì)話。
這樣,通過根據(jù)對(duì)話的適合度、或者新對(duì)話開始的優(yōu)先度、視聽者的簡介信息,控制新對(duì)話的開始,例如在對(duì)話的適合度高的情況下,即所謂的對(duì)話談得起勁的情況下,可以繼續(xù)該話題的對(duì)話,另一方面由于在能進(jìn)行與圖像的內(nèi)容密接的對(duì)話時(shí)可以開始新的對(duì)話,故可以進(jìn)行能給予更自然的印象的對(duì)話。
本發(fā)明的第13對(duì)話裝置,是在上述第12對(duì)話裝置中,其特征在于,上述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)上述已開始的對(duì)話中的上述裝置發(fā)話數(shù)據(jù)與上述視聽者發(fā)話數(shù)據(jù)之間的適合度,更新上述簡介信息。
由此,由于對(duì)話的適合度被反饋到簡介信息,故可以進(jìn)行更適當(dāng)?shù)膶?duì)話開始的控制。
本發(fā)明的第14對(duì)話裝置,是在上述第1對(duì)話裝置中,其特征在于,上述對(duì)話處理機(jī)構(gòu)構(gòu)成為在給定一系列的上述圖像顯示在給定時(shí)間連接進(jìn)行時(shí),輸出上述裝置發(fā)話數(shù)據(jù)。
由此,例如在視聽者依次切換廣播節(jié)目等時(shí),可以防止每次對(duì)話開始的繁瑣。
本發(fā)明的對(duì)話主機(jī)裝置,其特征在于,具備輸入機(jī)構(gòu),其通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入表示對(duì)視聽者非對(duì)話性進(jìn)展的圖像之圖像數(shù)據(jù)、及與上述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù);顯示控制機(jī)構(gòu),其根據(jù)上述圖像數(shù)據(jù),在顯示部上顯示上述圖像;和傳送機(jī)構(gòu),其向?qū)υ捵訖C(jī)裝置傳送上述對(duì)話數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息。
本發(fā)明的對(duì)話子機(jī)裝置,其特征在于,具備接收機(jī)構(gòu),其接收從對(duì)話主機(jī)裝置傳送來的、與對(duì)視聽者非對(duì)話性進(jìn)展的圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及對(duì)應(yīng)于上述圖像的進(jìn)展的時(shí)間信息;對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu),其存儲(chǔ)上述對(duì)話數(shù)據(jù);聲音辨識(shí)機(jī)構(gòu),其通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理機(jī)構(gòu),其根據(jù)上述視聽者發(fā)話數(shù)據(jù)、上述對(duì)話數(shù)據(jù)及時(shí)間信息,輸出表示對(duì)話子機(jī)裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制機(jī)構(gòu),其根據(jù)上述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
本發(fā)明的第1對(duì)話控制方法,其特征在于,具有顯示控制步驟,根據(jù)圖像信息,在顯示部上顯示對(duì)視聽者非對(duì)話性進(jìn)展的圖像;聲音辨識(shí)步驟,通過基于視聽者發(fā)話了的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)上述視聽者發(fā)話數(shù)據(jù)、與上述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息,輸出表示對(duì)話裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)上述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
本發(fā)明的第2對(duì)話控制方法,其特征在于,具有輸入步驟,通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入表示對(duì)視聽者非對(duì)話性進(jìn)展的圖像之圖像數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù);顯示控制步驟,根據(jù)上述圖像數(shù)據(jù),在顯示部上顯示上述圖像;和傳送步驟,向?qū)υ捵訖C(jī)裝置傳送上述對(duì)話數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息。
本發(fā)明的第3對(duì)話控制方法,其特征在于,具有接收步驟,接收從對(duì)話主機(jī)裝置傳送來的、與對(duì)視聽者非對(duì)話性進(jìn)展的圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息;聲音辨識(shí)步驟,通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)上述視聽者發(fā)話數(shù)據(jù)、上述對(duì)話數(shù)據(jù)及時(shí)間信息,輸出表示對(duì)話子機(jī)裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)上述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
本發(fā)明的第1對(duì)話控制程序,其特征在于,使計(jì)算機(jī)執(zhí)行以下處理顯示控制步驟,根據(jù)圖像信息,在顯示部上顯示對(duì)視聽者非對(duì)話性進(jìn)展的圖像;聲音辨識(shí)步驟,通過基于視聽者發(fā)話了的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)上述視聽者發(fā)話數(shù)據(jù)、與上述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息,輸出表示對(duì)話裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)上述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
本發(fā)明的第2對(duì)話控制程序,其特征在于,使計(jì)算機(jī)執(zhí)行以下處理輸入步驟,通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入表示對(duì)視聽者非對(duì)話性進(jìn)展的圖像之圖像數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù);顯示控制步驟,根據(jù)上述圖像數(shù)據(jù),在顯示部上顯示上述圖像;和傳送步驟,向?qū)υ捵訖C(jī)裝置傳送上述對(duì)話數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息。
本發(fā)明的第3對(duì)話控制程序,其特征在于,使計(jì)算機(jī)執(zhí)行以下處理接收步驟,接收從對(duì)話主機(jī)裝置傳送來的、與對(duì)視聽者非對(duì)話性進(jìn)展的圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與上述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息;聲音辨識(shí)步驟,通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)上述視聽者發(fā)話數(shù)據(jù)、上述對(duì)話數(shù)據(jù)及時(shí)間信息,輸出表示對(duì)話子機(jī)裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)上述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
根據(jù)這些構(gòu)成,由于可以進(jìn)行與上述那樣顯示的圖像的進(jìn)展對(duì)應(yīng)的內(nèi)容的對(duì)話,故可以容易地以自然的感覺將視聽者引入對(duì)話裝置預(yù)先設(shè)想的對(duì)話內(nèi)容中。因此,即使在比較小規(guī)模的裝置構(gòu)成中,也難誤辨識(shí)利用者的發(fā)音,從而順利地進(jìn)行對(duì)話,可以容易地給予接近自由對(duì)話的印象。


圖1是表示實(shí)施方式1的對(duì)話裝置的構(gòu)成的框圖。
圖2是表示同一裝置的圖像顯示例的說明圖。
圖3是表示同一裝置的對(duì)話數(shù)據(jù)庫的存儲(chǔ)內(nèi)容的說明圖。
圖4是表示實(shí)施方式2的對(duì)話裝置的整體構(gòu)成的說明圖。
圖5是表示同一裝置的具體構(gòu)成的框圖。
圖6是表示同一裝置的對(duì)話數(shù)據(jù)庫的存儲(chǔ)內(nèi)容的說明圖。
圖7是表示同一裝置的對(duì)話動(dòng)作的流程圖。
圖8是表示實(shí)施方式3的對(duì)話裝置的具體構(gòu)成的框圖。
圖9是表示同一裝置的關(guān)鍵字詞典的存儲(chǔ)內(nèi)容的說明圖。
圖10是表示同一裝置的對(duì)話數(shù)據(jù)庫的存儲(chǔ)內(nèi)容的說明圖。
圖11是表示同一裝置的全部對(duì)話動(dòng)作的流程圖。
圖12是表示同一裝置的顯示畫面的示例的說明圖。
圖13是表示同一裝置的對(duì)話處理的詳細(xì)動(dòng)作的流程圖。
圖14是表示實(shí)施方式4的對(duì)話裝置的具體構(gòu)成的框圖。
圖15是表示同一裝置的對(duì)話處理的詳細(xì)動(dòng)作的流程圖。
圖16是表示同一裝置的關(guān)鍵字詞典的存儲(chǔ)內(nèi)容的說明圖。
圖17是表示同一裝置的對(duì)話數(shù)據(jù)庫的存儲(chǔ)內(nèi)容的說明圖。
圖18是表示同一裝置的暫時(shí)存儲(chǔ)部的存儲(chǔ)內(nèi)容的說明圖。
圖19是表示實(shí)施方式5的對(duì)話裝置的數(shù)據(jù)廣播信息存儲(chǔ)部的存儲(chǔ)內(nèi)容的說明圖。
圖20是表示同一裝置的對(duì)話腳本數(shù)據(jù)庫的存儲(chǔ)內(nèi)容的說明圖。
圖21是表示同一裝置的具體構(gòu)成的框圖。
圖22是表示同一裝置的全部對(duì)話動(dòng)作的流程圖。
圖23是表示實(shí)施方式6的對(duì)話裝置的具體構(gòu)成的框圖。
具體實(shí)施例方式
以下,參照

本發(fā)明的實(shí)施方式。
(實(shí)施方式1)首先,對(duì)于本發(fā)明的原理性構(gòu)成,以能接收包含節(jié)目信息與節(jié)目附加信息的數(shù)據(jù)廣播的電視接收機(jī)為例進(jìn)行說明。圖1是表示電視接收機(jī)的整體構(gòu)成的框圖。
輸入部101接收數(shù)據(jù)廣播的電視廣播電波,將上述節(jié)目信息中包含的圖像數(shù)據(jù)、聲音數(shù)據(jù)及上述節(jié)目附加信息內(nèi)包含的對(duì)話數(shù)據(jù)、表示對(duì)話的開始時(shí)間的時(shí)間信號(hào)分離并分別輸出。在這里,上述圖像數(shù)據(jù)或聲音數(shù)據(jù),并未限于數(shù)字?jǐn)?shù)據(jù),其含義也包含模擬的圖像信號(hào)或模擬的聲音信號(hào)的廣義數(shù)據(jù)。
圖像輸出部102根據(jù)上述圖像數(shù)據(jù),輸出圖像信號(hào),并使圖像顯示在顯像管等的顯示部103上。
對(duì)話數(shù)據(jù)庫104暫時(shí)存儲(chǔ)從上述輸入部101輸出的對(duì)話數(shù)據(jù)。
聲音辨識(shí)部106對(duì)已從麥克風(fēng)等聲音輸入部105輸入的視聽者的發(fā)話聲音進(jìn)行聲音辨識(shí)處理,輸出表示發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù)。
對(duì)話處理部107在從輸入部101已輸入時(shí)間信號(hào)時(shí),根據(jù)已存儲(chǔ)于對(duì)話數(shù)據(jù)庫104內(nèi)的對(duì)話數(shù)據(jù),輸出開始對(duì)話用的裝置發(fā)話數(shù)據(jù),另一方面,若之后從視聽者發(fā)話,則根據(jù)從聲音辨識(shí)部106輸出的視聽者發(fā)話數(shù)據(jù)及已存儲(chǔ)于對(duì)話數(shù)據(jù)庫104內(nèi)的對(duì)話數(shù)據(jù),輸出用來應(yīng)答視聽者的發(fā)話的裝置發(fā)話數(shù)據(jù)。
聲音合成輸出部108根據(jù)從對(duì)話處理部107輸出的裝置發(fā)話數(shù)據(jù)及從輸入部101輸出的聲音數(shù)據(jù),進(jìn)行聲音合成處理或數(shù)字模擬變換,輸出聲音信號(hào),并使揚(yáng)聲器等聲音輸出部109發(fā)出聲音。
在這樣構(gòu)成的電視接收機(jī)中,按以下那樣進(jìn)行與顯示圖像對(duì)應(yīng)的對(duì)話。
首先,例如播放稱為“今日的運(yùn)勢”的節(jié)目,如圖2所示在顯示部103上顯示節(jié)目的題目后,顯示每個(gè)誕生星座的運(yùn)勢。此時(shí),若與圖像數(shù)據(jù)一起,接收?qǐng)D3所示的與上述圖像數(shù)據(jù)對(duì)應(yīng)的對(duì)話數(shù)據(jù),則該對(duì)話數(shù)據(jù)被保持于對(duì)話數(shù)據(jù)庫104內(nèi)。接著若接收時(shí)間信號(hào),則對(duì)話處理部107讀出保持于對(duì)話數(shù)據(jù)庫104內(nèi)的對(duì)話開始用的對(duì)話數(shù)據(jù),向聲音合成輸出部108輸出裝置發(fā)話數(shù)據(jù)。因此,從聲音輸出部109發(fā)出“占卜您今日的運(yùn)勢。請(qǐng)告知您的星座?!钡穆曇?。
針對(duì)上述發(fā)聲,若視聽者發(fā)出例如包含“雙子座”的詞語的聲音,則聲音辨識(shí)部106向?qū)υ捥幚聿?07輸出表示該詞語的辨識(shí)的視聽者發(fā)話數(shù)據(jù)。
對(duì)話處理部107參照對(duì)話數(shù)據(jù)庫104內(nèi)保持的應(yīng)答用對(duì)話數(shù)據(jù),讀出于上述辨識(shí)出的“雙子座”對(duì)應(yīng)的應(yīng)答(裝置發(fā)話數(shù)據(jù)),并輸出到聲音合成輸出部108。由此,從聲音輸出部109發(fā)出“注意人際關(guān)系,首先從問候開始”的聲音。
之后,由于若顯示畫面變化為下一節(jié)目內(nèi)容,則話題也可以轉(zhuǎn)移到于下一顯示畫面對(duì)應(yīng)的話題上去,故即使在上述時(shí)刻切斷話題,也不會(huì)讓視聽者感覺到非常不自然的感覺。
如上所述,由于成為與顯示畫面對(duì)應(yīng)的內(nèi)容的對(duì)話,故視聽者的應(yīng)答內(nèi)容的范圍被縮小,可以將由聲音辨識(shí)部106產(chǎn)生誤辨識(shí)的可能性抑制得低。另外,由于根據(jù)顯示畫面的轉(zhuǎn)移而中止關(guān)于某個(gè)話題的對(duì)話,可以容易地切換為其他話題,可以將繼續(xù)對(duì)話的反復(fù)次數(shù)抑制為少,故也可以將向設(shè)想以外的話題展開的可能性抑制為低。由此,即使不具備大規(guī)模的對(duì)話數(shù)據(jù)庫,也可以比較自然且容易地進(jìn)行適當(dāng)?shù)膶?duì)話。
(實(shí)施方式2)以下,對(duì)更詳細(xì)的對(duì)話裝置的示例進(jìn)行說明。而且,在以下的實(shí)施方式中,對(duì)具有與上述實(shí)施方式1等對(duì)應(yīng)的功能的構(gòu)成要素采用相同的標(biāo)號(hào)并省略說明。
在本實(shí)施方式2中,如圖4及圖5所示,由數(shù)字電視接收機(jī)201(對(duì)話主機(jī)裝置)與偶人狀的對(duì)話型代理(agent)裝置251(對(duì)話子機(jī)裝置)構(gòu)成對(duì)話裝置。
數(shù)字電視接收機(jī)201具備有廣播數(shù)據(jù)接收部202、節(jié)目信息處理部203、顯示/聲音輸出控制部204、附加信息處理部205、對(duì)話數(shù)據(jù)傳送部206、顯示部103與聲音輸出部109。
另外,對(duì)話型代理裝置251具備有對(duì)話數(shù)據(jù)接收部252、對(duì)話數(shù)據(jù)處理部253、對(duì)話數(shù)據(jù)庫254、對(duì)話處理部255、聲音合成部256、聲音輸入部105、聲音辨識(shí)部106與聲音輸出部109。
上述數(shù)字電視接收機(jī)201的廣播數(shù)據(jù)接收部202接收包含節(jié)目信息(圖像數(shù)據(jù)、聲音數(shù)據(jù))與節(jié)目附加信息(對(duì)話數(shù)據(jù))的數(shù)字廣播的電視機(jī)廣播電波,抽出上述節(jié)目信息與上述節(jié)目附加信息并進(jìn)行輸出。
節(jié)目信息處理部203與顯示/聲音輸出控制部204進(jìn)行與通常的電視接收機(jī)同樣的處理。即,節(jié)目信息處理部203將由廣播數(shù)據(jù)接收部接收完的節(jié)目信息變換為圖像與聲音的數(shù)據(jù)。更詳細(xì)地講,從節(jié)目信息所包含的多個(gè)節(jié)目相關(guān)的信息中,選擇由視聽者指示過的特定節(jié)目的信息,輸出該節(jié)目的圖像/聲音數(shù)據(jù)。另外,顯示/聲音輸出控制部204根據(jù)上述圖像/聲音數(shù)據(jù),輸出圖像信號(hào)及聲音信號(hào),并使顯示部103顯示圖像,同時(shí)使聲音輸出部109發(fā)出聲音。
再有,附加信息處理部205根據(jù)從廣播數(shù)據(jù)接收部202輸出的節(jié)目附加信息,輸出與顯示部103上顯示的圖像對(duì)應(yīng)的對(duì)話數(shù)據(jù)。該對(duì)話數(shù)據(jù),例如與上述圖3中示出的同樣,包含最初與利用者搭話的言語等的對(duì)話開始用對(duì)話數(shù)據(jù)和與視聽者發(fā)聲的辨識(shí)結(jié)果對(duì)應(yīng)的應(yīng)答被定義過的表格形式的應(yīng)答用對(duì)話數(shù)據(jù)。
對(duì)話數(shù)據(jù)傳送部206通過無線電波等向?qū)υ捫痛硌b置251傳送上述對(duì)話數(shù)據(jù),對(duì)話型代理裝置251的對(duì)話數(shù)據(jù)接收部252接收被傳送來的對(duì)話數(shù)據(jù)。
對(duì)話型代理裝置251的對(duì)話數(shù)據(jù)處理部253將上述接收過的對(duì)話數(shù)據(jù)中的對(duì)話開始用的對(duì)話數(shù)據(jù)向聲音合成部256輸出,另一方面,使應(yīng)答用的對(duì)話數(shù)據(jù)保持在對(duì)話數(shù)據(jù)庫254內(nèi)。
即,與上述實(shí)施方式1不同的是,對(duì)話數(shù)據(jù)庫254如圖6所示,僅保持應(yīng)答用的對(duì)話數(shù)據(jù),對(duì)話處理部255根據(jù)上述應(yīng)答用的對(duì)話數(shù)據(jù)與從聲音辨識(shí)部106輸出的視聽者發(fā)話數(shù)據(jù),輸出用來應(yīng)答視聽者的發(fā)話的裝置發(fā)話數(shù)據(jù)。
另外,聲音合成部256根據(jù)從對(duì)話數(shù)據(jù)處理部253輸出的對(duì)話數(shù)據(jù)(對(duì)話開始用),或從對(duì)話處理部253輸出的裝置發(fā)話數(shù)據(jù),進(jìn)行聲音合成處理及數(shù)字模擬變換,輸出聲音信號(hào),并使聲音輸出部109發(fā)出對(duì)話聲音。
即使在如上所述構(gòu)成的對(duì)話裝置中,通過圖7所示的動(dòng)作,與上述實(shí)施方式1同樣,例如在廣播占卜節(jié)目“今日的運(yùn)勢”的場面中,進(jìn)行以下那樣的對(duì)話(1)對(duì)話型代理裝置“占卜您今日的運(yùn)勢,請(qǐng)告知您的星座?!?2)視聽者“雙子座”(3)對(duì)話型代理裝置“請(qǐng)注意人際關(guān)系。首先,從問候開始?!?。
(S101)即,首先,廣播數(shù)據(jù)接收部202接收包含節(jié)目信息與節(jié)目附加信息的廣播電波,根據(jù)上述節(jié)目信息中的圖像數(shù)據(jù)及聲音數(shù)據(jù),由顯示部103顯示圖像,同時(shí)由聲音輸出部109輸出聲音。
(S102)另一方面,附加信息處理部205輸出所接收到的節(jié)目附加信息中與顯示圖像(占卜節(jié)目)相關(guān)的對(duì)話數(shù)據(jù)。該輸出了的對(duì)話數(shù)據(jù)通過數(shù)字電視接收機(jī)201的對(duì)話數(shù)據(jù)傳送部206及對(duì)話型代理裝置251的對(duì)話數(shù)據(jù)接收部252,被輸入到對(duì)話數(shù)據(jù)處理部253,應(yīng)答用的對(duì)話數(shù)據(jù)存儲(chǔ)于對(duì)話數(shù)據(jù)庫254內(nèi)(圖6)。
(S103)再有,對(duì)話開始用的對(duì)話數(shù)據(jù),從對(duì)話數(shù)據(jù)處理部253直接輸入到聲音合成部256,從聲音輸出部109可以發(fā)出最初的對(duì)話聲音“占卜您今日的運(yùn)勢。請(qǐng)告知您的星座。”。即,如上述實(shí)施方式1所示,即使不接收時(shí)間信號(hào),通過接收對(duì)話數(shù)據(jù),也能開始對(duì)話。
(S104)之后,若從聲音輸入部105輸入視聽者的發(fā)聲“雙子座”,則進(jìn)行聲音辨識(shí)部106的聲音辨識(shí),表示發(fā)聲內(nèi)容為“雙子座”的視聽者發(fā)話數(shù)據(jù)被輸入到對(duì)話處理部255。
(S105)因此,對(duì)話處理部255參照對(duì)話數(shù)據(jù)庫254,選擇與“雙子座”對(duì)應(yīng)的應(yīng)答“請(qǐng)注意人際關(guān)系。首先,從問候開始?!?,輸出裝置發(fā)話數(shù)據(jù)。聲音合成部256將上述裝置發(fā)話數(shù)據(jù)變換為聲音信號(hào),從聲音輸出部109輸出應(yīng)答的聲音。
如上所述,與實(shí)施方式1同樣,通過共有所謂與占卜節(jié)目聯(lián)動(dòng)的對(duì)話之對(duì)話場面,故難于誤辨識(shí)視聽者的發(fā)音,可以容易順利地進(jìn)入對(duì)話。另外,伴隨節(jié)目的結(jié)束或顯示畫面的進(jìn)行,在不會(huì)有不自然的印象的情況下,可以結(jié)束該話題的對(duì)話。
(實(shí)施方式3)實(shí)施方式3的對(duì)話裝置,與上述實(shí)施方式2的對(duì)話裝置(圖5)相比,將視聽者的發(fā)話內(nèi)容分類為例如“肯定”或“否定”類型,使其與上述類型對(duì)應(yīng),求得應(yīng)答用的對(duì)話數(shù)據(jù)。另外,視聽者只在給定時(shí)間間以上觀看相同節(jié)目時(shí)且想進(jìn)行對(duì)話的情況下,進(jìn)行上述對(duì)話。
具體地講,例如圖8所示,數(shù)字電視接收機(jī)301,是在實(shí)施方式2(圖5)的數(shù)字電視接收機(jī)201的構(gòu)成的基礎(chǔ)上,還具有定時(shí)器管理部311。另外,具有附加信息處理部305,而取代附加信息處理部205。
上述定時(shí)器管理部311,計(jì)量相同節(jié)目被視聽的時(shí)間,在給定時(shí)間視聽時(shí),向附加信息處理部305通知該情況。即,在視聽者不斷切換頻道進(jìn)行所謂迅速移動(dòng)功能(zapping)時(shí),由于厭煩于每切換頻道就開始對(duì)話,故在例如由視聽者選擇1分鐘左右以上的相同節(jié)目的情況下,向附加信息處理部305通知該主旨,使對(duì)話開始。
附加信息處理部305,只在有來自上述定時(shí)器管理部311的通知且視聽者希望的情況下,才開始對(duì)話。即,例如在使顯示部103顯示后述的圖12所示的畫面,視聽者通過遙控器等進(jìn)行過表示對(duì)話意思的操作時(shí),與實(shí)施方式2同樣,將對(duì)話數(shù)據(jù)傳送到對(duì)話型代理裝置351。另外,在本實(shí)施方式中,在上述視聽者的意向確認(rèn)時(shí),確認(rèn)對(duì)話中視聽者的立場(例如在看棒球的轉(zhuǎn)播節(jié)目時(shí),是巨人球迷還是阪神球迷等),從而能進(jìn)行更適當(dāng)?shù)膶?duì)話。
另一方面,對(duì)話型代理裝置351在實(shí)施方式2的對(duì)話型代理裝置251的構(gòu)成的基礎(chǔ)上,還具有關(guān)鍵字詞典361。另外,具備有聲音辨識(shí)部362、對(duì)話數(shù)據(jù)處理部353、對(duì)話數(shù)據(jù)庫354及對(duì)話處理部355,而取代聲音辨識(shí)部106、對(duì)話數(shù)據(jù)處理部253、對(duì)話數(shù)據(jù)庫254及對(duì)話處理部255。
在上述關(guān)鍵字詞典361中,例如圖9所示,存儲(chǔ)表示視聽者的各種發(fā)話內(nèi)容中包含的關(guān)鍵字的候選屬于“肯定”或“否定”的哪一類型的關(guān)鍵字詞典數(shù)據(jù)。在這里,上述“肯定”或“否定”的類型是可以和設(shè)想如后所述在對(duì)話開始時(shí)與視聽者搭話的言語的示例,對(duì)此,與進(jìn)行肯定的或否定的應(yīng)答的情況對(duì)應(yīng)。即,在關(guān)鍵字詞典361中,并未限于“肯定”“否定”,也可以存儲(chǔ)與從裝置發(fā)出的發(fā)話內(nèi)容對(duì)應(yīng)的類型的關(guān)鍵字詞典數(shù)據(jù)。
聲音辨識(shí)部362對(duì)從聲音輸入部105輸入的視聽者的發(fā)話聲音進(jìn)行聲音辨識(shí)處理,檢測出具有視聽者的意圖特征的詞語(關(guān)鍵字),參照上述關(guān)鍵字詞典361,輸出表示視聽者的意圖屬于“肯定”或“否定”的哪一類型(視聽者的意圖)的類型數(shù)據(jù)。再有,在未檢測出關(guān)鍵字時(shí),輸出表示為“其他”類型的類型數(shù)據(jù)。更詳細(xì)地講,例如利用所謂的關(guān)鍵字定位(spotting)的方法,檢測出單詞的存在。而且,也可以從聲音輸入部105的輸入聲音,利用連續(xù)聲音辨識(shí)的方法,生成分解為單詞的正文數(shù)據(jù),通過上述單詞是否符合關(guān)鍵字詞典361的關(guān)鍵字,來求得類型。
在對(duì)話數(shù)據(jù)庫354中,例如圖10所示,存儲(chǔ)使上述類型“肯定”、“否定”或“其他”和與此相對(duì)的各自的多個(gè)應(yīng)答(裝置發(fā)話數(shù)據(jù))對(duì)應(yīng)的應(yīng)答用的對(duì)話數(shù)據(jù)。在這里,在同圖的示例中,針對(duì)“其他”,存儲(chǔ)有表示無妨礙的應(yīng)答的數(shù)據(jù)。
對(duì)話處理部355根據(jù)從上述聲音辨識(shí)部362輸出的類型數(shù)據(jù)及保持于對(duì)話數(shù)據(jù)庫354內(nèi)的應(yīng)答用的對(duì)話數(shù)據(jù),輸出用于應(yīng)答視聽者的發(fā)話的裝置發(fā)話數(shù)據(jù)。更具體地講,隨機(jī)地選擇(或者相同應(yīng)答不連續(xù)地進(jìn)行選擇等)并輸出與上述類型數(shù)據(jù)對(duì)應(yīng)且保持于對(duì)話數(shù)據(jù)庫354內(nèi)的多個(gè)應(yīng)答中的任意一個(gè)。而且,雖然并不一定需要如上所述地保持多個(gè)應(yīng)答,但可以只保持適當(dāng)?shù)膫€(gè)數(shù),通過進(jìn)行隨機(jī)的選擇,可以更容易具有對(duì)話的自然感。
另外,對(duì)話數(shù)據(jù)處理部353根據(jù)從數(shù)字電視接收機(jī)301傳送來的對(duì)話數(shù)據(jù),使上述的應(yīng)答用對(duì)話數(shù)據(jù)及關(guān)鍵字詞典數(shù)據(jù)分別保持于對(duì)話數(shù)據(jù)庫354或關(guān)鍵字詞典361中。還有,將對(duì)話開始用的對(duì)話數(shù)據(jù)向聲音合成部256輸出。
根據(jù)圖11,對(duì)在如上所述構(gòu)成的對(duì)話裝置中,視聽作為運(yùn)動(dòng)節(jié)目的棒球廣播時(shí)進(jìn)行對(duì)話的情況下的動(dòng)作進(jìn)行說明。
(S201)首先,廣播數(shù)據(jù)接收部202接收視聽者選擇后的棒球廣播的節(jié)目信息,根據(jù)該節(jié)目信息中的圖像信息及聲音信息,在由顯示部103顯示圖像的同時(shí),由聲音輸出部109輸出聲音。
(S202)定時(shí)器管理部311計(jì)量上述棒球廣播的接收被選擇后的經(jīng)過時(shí)間,例如若經(jīng)過1分鐘,則向附加信息處理部305通知該情況。而且,在經(jīng)過1分鐘前若進(jìn)行切換接收頻道的操作,則反復(fù)進(jìn)行上述(S201、S202)。
(S203)若接收來自上述定時(shí)器管理部311的通知,則附加信息處理部305首先如圖12所示,使顯示部103顯示視聽者是否希望對(duì)話服務(wù)及確認(rèn)聲援模式(聲援哪個(gè)球隊(duì))的畫面,例如接受與EPG(Electric ProgramGuide,電子節(jié)目引導(dǎo))中的節(jié)目選擇同樣的遙控器的操作。而且,在進(jìn)行過表示不利用對(duì)話服務(wù)的操作時(shí),對(duì)話相關(guān)的處理結(jié)束,以下若進(jìn)行視聽節(jié)目的切換操作,則反復(fù)進(jìn)行上述(201)以后的操作。另外,表示已指定的聲援模式的信息例如保持在附加信息處理部305內(nèi)。而且,上述的顯示或操作的接受也可以通過用附加信息處理部305或顯示/聲音輸出控制部204執(zhí)行節(jié)目附加信息所包含的對(duì)話開始命令而進(jìn)行。還有,上述的對(duì)話服務(wù)利用的有無并未限于每逢視聽節(jié)目就進(jìn)行確認(rèn),也可以在接通了裝置的電源的時(shí)刻進(jìn)行,或通過切換給定的設(shè)定模式而進(jìn)行設(shè)定。
(S204)在由視聽者利用對(duì)話服務(wù)的同時(shí),例如進(jìn)行過表示聲援巨人的操作時(shí),作為節(jié)目附加信息,校驗(yàn)是否接收了對(duì)應(yīng)于巨人的聲援模式的對(duì)話數(shù)據(jù)。
(S205)若在上述(S204)中未接收對(duì)話數(shù)據(jù),則判斷是接收中的棒球節(jié)目結(jié)束了,還是由視聽者結(jié)束了視聽,即進(jìn)行過切換使用的節(jié)目的操作,在節(jié)目結(jié)束或視聽結(jié)束的情況下,反復(fù)進(jìn)行上述(S201)以后的操作。一方面,若節(jié)目既未結(jié)束,視聽也未結(jié)束,則反復(fù)進(jìn)行(S204)以后的操作。
(S206)另外,若在上述(S204)中接收了對(duì)話數(shù)據(jù),則進(jìn)行過對(duì)話處理后,返回上述(S204),反復(fù)進(jìn)行對(duì)話數(shù)據(jù)的接收校驗(yàn)以后的操作。作為上述對(duì)話處理,更詳細(xì)地講,例如進(jìn)行圖13所示的處理。
(S211)首先,廣播數(shù)據(jù)接收部202接收包含節(jié)目信息與節(jié)目附加信息的廣播電波,根據(jù)上述節(jié)目信息中的圖像數(shù)據(jù)及聲音數(shù)據(jù),在由顯示部103顯示圖像的同時(shí),由聲音輸出部109輸出聲音。
(S212)另一方面,附加信息處理部305輸出接收到的節(jié)目附加信息中的顯示圖像(棒球廣播)及巨人的聲援模式相關(guān)的對(duì)話數(shù)據(jù)。在該對(duì)話數(shù)據(jù)中包含有對(duì)話開始用的對(duì)話數(shù)據(jù)、應(yīng)答用的對(duì)話數(shù)據(jù)與關(guān)鍵字詞典數(shù)據(jù)。上述已輸出的對(duì)話數(shù)據(jù)通過數(shù)字電視接收機(jī)301的對(duì)話數(shù)據(jù)傳送部206及對(duì)話型代理裝置351的對(duì)話數(shù)據(jù)接收部252,輸入到對(duì)話數(shù)據(jù)處理部355中,應(yīng)答用的對(duì)話數(shù)據(jù)存儲(chǔ)于對(duì)話數(shù)據(jù)庫254內(nèi)(圖10)。
(S213)另外,同樣地將關(guān)鍵字詞典數(shù)據(jù)存儲(chǔ)在關(guān)鍵字詞典361內(nèi)(圖9)。
(S214)再有,對(duì)話開始用的對(duì)話數(shù)據(jù)從對(duì)話數(shù)據(jù)處理部353直接輸入到聲音合成部256,從聲音輸出部109發(fā)出最初的對(duì)話聲音,例如若在聲援球隊(duì)(巨人)得分的時(shí)刻,“干得好,干得好,追加得分!最近的清原真的狀態(tài)很好。在第8小局還相差3分,那么今日的比賽獲勝是顯而易見的?”等聲音,從而開始對(duì)話。
(S215)然后,例如視聽者若發(fā)出“哎呀!還是有點(diǎn)擔(dān)心?!钡穆曇簦瑒t聲音辨識(shí)部362檢測出“擔(dān)心”與“哎呀”的言詞,輸出表示視聽者發(fā)出“否定”類型的言詞的類型數(shù)據(jù)。另外,若視聽者發(fā)出“如果岡島的狀態(tài)好的話?!钡穆曇?,則由于關(guān)鍵字詞典361內(nèi)保持著的關(guān)鍵字未被檢測出,故輸出表示“其他”的類型數(shù)據(jù)。
(S216)因此,對(duì)話處理部355參照對(duì)話數(shù)據(jù)庫354,隨機(jī)地選擇與上述類型數(shù)據(jù)對(duì)應(yīng)的多個(gè)裝置發(fā)話數(shù)據(jù)中的任意一個(gè)并輸出。
具體地講,相對(duì)上述視聽者的發(fā)話“哎呀!還是有點(diǎn)擔(dān)心?!?類型“否定”),例如輸出表示“是的,要繼續(xù)助威。接著是高橋!”的裝置對(duì)話數(shù)據(jù)。
另外,針對(duì)視聽者的發(fā)話“如果岡島的狀態(tài)好的話?!?類型“其他”),例如輸出表示“的確”的裝置發(fā)話數(shù)據(jù)。
聲音合成部256將上述裝置發(fā)話數(shù)據(jù)變換為聲音信號(hào),從聲音輸出部109輸出應(yīng)答的聲音。
如上所述,與實(shí)施方式1、2同樣,例如通過根據(jù)與得分場面等的顯示圖像對(duì)應(yīng)的對(duì)話數(shù)據(jù),進(jìn)行對(duì)話,從而難于誤辨識(shí)視聽者的發(fā)音,可以容易順利進(jìn)入對(duì)話,同時(shí)伴隨顯示圖像的進(jìn)行,在不會(huì)有不自然的印象的情況下可以結(jié)束各話題,轉(zhuǎn)向下一話題。另外,通過根據(jù)視聽者的發(fā)話中所包含的關(guān)鍵字,將發(fā)話內(nèi)容分類,生成裝置發(fā)話數(shù)據(jù),從而可以容易且更靈活進(jìn)行對(duì)話,同時(shí)也可以容易將對(duì)話數(shù)據(jù)庫354內(nèi)保持的應(yīng)答用的對(duì)話數(shù)據(jù)抑制為小,或提高應(yīng)答性。再有,通過根據(jù)與視聽者的立場(巨人的聲援模式)等對(duì)應(yīng)的對(duì)話數(shù)據(jù)來使對(duì)話進(jìn)行,例如可以進(jìn)行作為對(duì)聲援球隊(duì)的得分一起歡喜的伙伴,而使對(duì)話型代理裝置351對(duì)話的演出,給予視聽者宛如與對(duì)話型代理裝置351一起看棒球節(jié)目的感覺。
(實(shí)施方式4)對(duì)作為實(shí)施方式4的對(duì)話裝置,例如棒球節(jié)目中針對(duì)比賽展開的預(yù)測的對(duì)話等,在對(duì)話時(shí)刻進(jìn)行后面對(duì)話內(nèi)容不確定那樣的內(nèi)容的對(duì)話,同時(shí)將該對(duì)話內(nèi)容暫時(shí)存儲(chǔ),根據(jù)與之后的實(shí)際比賽展開對(duì)應(yīng)的對(duì)話數(shù)據(jù),而可以進(jìn)入對(duì)話的對(duì)話裝置的示例進(jìn)行說明。
在本實(shí)施方式的對(duì)話裝置中,與上述實(shí)施方式3的對(duì)話裝置(圖8)相比,例如圖14所示,數(shù)字電視接收機(jī)401包括僅在不具有視聽者的聲援模式的確認(rèn)功能方面不同的附加信息處理部405,而取代附加信息處理部305。(而且,也可以使用與實(shí)施方式3相同的數(shù)字電視接收機(jī)301。)另一方面,對(duì)話型代理裝置451,在實(shí)施方式3的對(duì)話型代理裝置351的構(gòu)成的基礎(chǔ)上,還具有暫時(shí)存儲(chǔ)部471。另外,具備有對(duì)話數(shù)據(jù)處理部453而取代對(duì)話數(shù)據(jù)處理部353。再有,聲音辨識(shí)部362雖然與實(shí)施方式3相同,但其輸出根據(jù)對(duì)話狀況也向暫時(shí)存儲(chǔ)部471輸出。即,暫時(shí)存儲(chǔ)部471保持表示裝置發(fā)話內(nèi)容及視聽者發(fā)話內(nèi)容中對(duì)顯示畫面進(jìn)展進(jìn)行預(yù)測的數(shù)據(jù)。還有,對(duì)話數(shù)據(jù)處理部453可以根據(jù)上述暫時(shí)存儲(chǔ)部471內(nèi)保持的數(shù)據(jù)與之后根據(jù)顯示畫面的實(shí)際進(jìn)展而被傳送來的對(duì)話數(shù)據(jù),輸出與預(yù)測是否正確對(duì)應(yīng)的裝置對(duì)話數(shù)據(jù)。
作為如上所述構(gòu)成的對(duì)話裝置的動(dòng)作,根據(jù)圖15~圖18,對(duì)在作為運(yùn)動(dòng)節(jié)目的棒球節(jié)目中,進(jìn)行接下來投手(pitcher)投擲的球種的預(yù)測相關(guān)的對(duì)話(即,只以投手投球前的對(duì)話數(shù)據(jù)結(jié)束對(duì)話,根據(jù)投球后的對(duì)話數(shù)據(jù),對(duì)之后的對(duì)話內(nèi)容有影響)時(shí)的示例進(jìn)行說明。在這里,對(duì)話裝置的全部對(duì)話控制動(dòng)作,與上述實(shí)施方式3(圖11)基本相同,在圖15中表示并主要說明大不相同的對(duì)話處理自身。
(S301)~(S304)首先,與實(shí)施方式3(圖13)的(S211)~(S214)同樣,進(jìn)行節(jié)目的圖像顯示或聲音輸出、對(duì)話數(shù)據(jù)或關(guān)鍵字詞典數(shù)據(jù)向關(guān)鍵字詞典361與對(duì)話數(shù)據(jù)庫354的存儲(chǔ)及最初的對(duì)話聲音的發(fā)聲。具體地講,例如在由顯示部103顯示投手與擊球手(batter)對(duì)戰(zhàn)場面的圖像,同時(shí)從聲音輸出部109輸出該聲音。另外,在關(guān)鍵字詞典361及對(duì)話數(shù)據(jù)庫354中分別存儲(chǔ)例如圖16、圖17所示的關(guān)鍵字詞典數(shù)據(jù)及對(duì)話數(shù)據(jù)。再有,從對(duì)話數(shù)據(jù)處理部453向聲音合成部256輸出對(duì)話開始用的對(duì)話數(shù)據(jù),從聲音輸出部109發(fā)出例如“下一擊球手是松井。預(yù)測投手的投球。最初的球是什么呢?我想是從‘曲線球’開始?!钡穆曇?。此外,此時(shí)對(duì)話數(shù)據(jù)處理部453使暫時(shí)存儲(chǔ)部471存儲(chǔ)例如圖18所示的表示由對(duì)話型代理裝置451進(jìn)行的預(yù)測是曲線球的屬性數(shù)據(jù)及類型數(shù)據(jù)(屬性代理,類型曲線球類)。
(S305)然后,例如若視聽者發(fā)出“嗯,我想是‘直球’”的聲音,則聲音辨識(shí)部362檢測出“直球”的言詞,輸出表示視聽者發(fā)出“直球類”的類型言詞的類型數(shù)據(jù),使暫時(shí)存儲(chǔ)部471存儲(chǔ)表示視聽者的預(yù)測是直球的屬性數(shù)據(jù)及類型數(shù)據(jù)(屬性視聽者,類型直球類)。
(S306)另外,從上述聲音辨識(shí)部362輸出的類型數(shù)據(jù)也輸入到對(duì)話數(shù)據(jù)處理部355,從對(duì)話處理部355輸出裝置對(duì)話數(shù)據(jù),從聲音輸出部109輸出應(yīng)答的聲音例如“好!決勝負(fù)?!?。在這里,對(duì)話裝置的應(yīng)答內(nèi)容,與實(shí)施方式3同樣,雖然對(duì)應(yīng)于類型數(shù)據(jù)有所不同(雖然將這種對(duì)話數(shù)據(jù)存儲(chǔ)于對(duì)話數(shù)據(jù)庫354內(nèi)也可以),但不管類型數(shù)據(jù)如何,都可以做成“好,決勝負(fù)!”等的應(yīng)答,另外,只在類型數(shù)據(jù)表示“其他”時(shí),可以進(jìn)行不同的應(yīng)答。
(S307)接著,實(shí)際上在投手投球之后,若傳送與該投球內(nèi)容對(duì)應(yīng)的對(duì)話數(shù)據(jù)即表示已投球的球種的正確類型數(shù)據(jù)和表示與此對(duì)應(yīng)的對(duì)話內(nèi)容的結(jié)果發(fā)話用的對(duì)話數(shù)據(jù),則由廣播數(shù)據(jù)接收部202接收,通過對(duì)話數(shù)據(jù)傳送部206及對(duì)話數(shù)據(jù)接收部252,輸入到對(duì)話數(shù)據(jù)處理部353。
(S308)對(duì)話數(shù)據(jù)處理部353將上述正確類型數(shù)據(jù)(例如“直球”)與暫時(shí)存儲(chǔ)部471的存儲(chǔ)內(nèi)容進(jìn)行對(duì)照,向聲音合成部256輸出與該對(duì)照結(jié)果(上述的情況下視聽者正確)對(duì)應(yīng)的結(jié)果發(fā)話用的對(duì)話數(shù)據(jù)。
(S309)因此,根據(jù)上述結(jié)果發(fā)話用的對(duì)話數(shù)據(jù),發(fā)出例如“內(nèi)角降低的直球。我輸了。我想下一個(gè)投球是‘曲線球’”等的聲音。
(S310)另外,判斷例如上述“認(rèn)為下一個(gè)投球是‘曲線球’”的結(jié)果發(fā)話用的對(duì)話數(shù)據(jù)中是否含有針對(duì)下一個(gè)投球的對(duì)話型代理裝置451的預(yù)測數(shù)據(jù),若包含有,則反復(fù)進(jìn)行上述(S306)以后的操作,另一方面若不包含,則結(jié)束對(duì)話處理。在這里,上述的判斷可以通過用對(duì)話數(shù)據(jù)處理部353執(zhí)行與對(duì)話數(shù)據(jù)一起送來的程序而進(jìn)行。
如上所述,通過暫時(shí)存儲(chǔ)與視聽者的對(duì)話內(nèi)容,并根據(jù)該內(nèi)容與后來接收到的對(duì)話數(shù)據(jù),進(jìn)行之后的對(duì)話,從而可以在對(duì)話開始的時(shí)刻進(jìn)行之后的對(duì)話內(nèi)容不確定的內(nèi)容的對(duì)話。即,可以減輕沿用預(yù)先設(shè)定過的腳本的所謂機(jī)械對(duì)話的印象,給予以問答形式一起欣賞播放節(jié)目的感覺。
(實(shí)施方式5)作為實(shí)施方式5,對(duì)不是接收直接表示對(duì)話內(nèi)容的對(duì)話數(shù)據(jù),而是通過接收對(duì)應(yīng)于節(jié)目(顯示畫面)的進(jìn)展?fàn)顩r的數(shù)據(jù)和表示用于根據(jù)對(duì)應(yīng)于該進(jìn)展?fàn)顩r的數(shù)據(jù),生成對(duì)話數(shù)據(jù)的規(guī)則的信息,從而進(jìn)行對(duì)話的對(duì)話裝置的示例進(jìn)行說明。
即,例如在棒球的數(shù)據(jù)廣播中,有時(shí)伴隨圖像或聲音的數(shù)據(jù),傳送圖19所示的表示比賽經(jīng)過的比賽信息或選手的成績等相關(guān)的選手信息等數(shù)據(jù)廣播信息。因此,通過執(zhí)行參照這種數(shù)據(jù)廣播信息的腳本,從而可以生成與畫面的進(jìn)展?fàn)顩r對(duì)應(yīng)的對(duì)話數(shù)據(jù)。在以下的說明中,例如說明由圖20所示的腳本而生成對(duì)話開始用的對(duì)話數(shù)據(jù)及應(yīng)答用的對(duì)話數(shù)據(jù)的示例(而且,同樣也可以由腳本生成關(guān)鍵字詞典數(shù)據(jù))。另外,作為對(duì)話內(nèi)容的示例,對(duì)結(jié)果與上述實(shí)施方式3進(jìn)行相同內(nèi)容的對(duì)話的示例進(jìn)行說明。
在本實(shí)施方式的對(duì)話裝置中,與上述實(shí)施方式3的對(duì)話裝置(圖8)相比,例如圖21所示,數(shù)字電視接收機(jī)501具備有觸發(fā)(trigger)信息傳送部506,而取代對(duì)話數(shù)據(jù)傳送部206。另外,對(duì)話型代理裝置551具有觸發(fā)信息接收部552及對(duì)話數(shù)據(jù)生成部553,而取代對(duì)話數(shù)據(jù)接收部252及對(duì)話數(shù)據(jù)處理部353,同時(shí)還具備有數(shù)據(jù)廣播信息存儲(chǔ)部561及對(duì)話腳本數(shù)據(jù)庫562。
上述觸發(fā)信息傳送部506及觸發(fā)信息接收部552,雖然是傳送接收作為節(jié)目附加信息而接收到的對(duì)話腳本數(shù)據(jù)、數(shù)據(jù)廣播信息(比賽信息及選手信息)及表示后述的對(duì)話的開始時(shí)間的觸發(fā)信息的構(gòu)件,但實(shí)質(zhì)的構(gòu)成與實(shí)施方式3的對(duì)話數(shù)據(jù)傳送部206及對(duì)話數(shù)據(jù)接收部252相同。
對(duì)話數(shù)據(jù)生成部553在接收到對(duì)話腳本數(shù)據(jù)及數(shù)據(jù)廣播信息時(shí),分別將其存儲(chǔ)于對(duì)話腳本數(shù)據(jù)庫562或數(shù)據(jù)廣播信息存儲(chǔ)部561內(nèi)。另外,對(duì)話數(shù)據(jù)生成部553在接收到觸發(fā)信息時(shí),根據(jù)上述對(duì)話腳本數(shù)據(jù)及數(shù)據(jù)廣播信息,生成對(duì)話數(shù)據(jù)(對(duì)話開始用的對(duì)話數(shù)據(jù)、應(yīng)答用的對(duì)話數(shù)據(jù)及關(guān)鍵字詞典數(shù)據(jù)),并向聲音合成部256輸出,或者存儲(chǔ)于對(duì)話數(shù)據(jù)庫354或關(guān)鍵字詞典361內(nèi)。
在這里,具體地說明數(shù)據(jù)廣播信息存儲(chǔ)部561內(nèi)存儲(chǔ)的數(shù)據(jù)廣播信息及對(duì)話腳本數(shù)據(jù)庫562內(nèi)存儲(chǔ)的對(duì)話腳本數(shù)據(jù)的示例。
在圖19所示的數(shù)據(jù)廣播信息中,如上所述包含有比賽信息與選手信息。上述比賽信息是包含對(duì)應(yīng)類型與屬性的各種數(shù)據(jù)的信息。更具體地講,某時(shí)刻的得分差,作為“類型=得分,屬性=差”,通過特定而得到。另外,選手信息是通過特定球隊(duì)及選手名而得到關(guān)于各選手的各種數(shù)據(jù)的。
再有,在對(duì)話腳本數(shù)據(jù)庫562中,如圖20所示,對(duì)應(yīng)于由類型及屬性構(gòu)成的觸發(fā)信息,將分別對(duì)應(yīng)于各種顯示畫面的進(jìn)展?fàn)顩r的多個(gè)對(duì)話腳本數(shù)據(jù)分類,并對(duì)應(yīng)進(jìn)行存儲(chǔ)。因此,例如在聲援側(cè)的球隊(duì)得分時(shí),若接收到“類型=得分,屬性=聲援側(cè)”的觸發(fā)信息,則執(zhí)行與該圖的得分、聲援側(cè)的欄對(duì)應(yīng)的對(duì)話腳本數(shù)據(jù),生成對(duì)話開始用的對(duì)話數(shù)據(jù)。與上述觸發(fā)信息的對(duì)應(yīng)關(guān)系,對(duì)于關(guān)鍵字詞典數(shù)據(jù)或應(yīng)答用的對(duì)話數(shù)據(jù)也同樣??墒牵谂c觸發(fā)信息無關(guān),共通的情況下,與觸發(fā)信息不一定是一對(duì)一地對(duì)應(yīng),也可以兼用。在對(duì)于同種的廣播節(jié)目能通用的情況下,也可以預(yù)先存儲(chǔ)于(在裝置的制造階段等)裝置內(nèi)。另外,并未一定限于如上所述地分類,例如可以由識(shí)別信息(ID)等來選擇對(duì)話腳本數(shù)據(jù)等。
接下來,簡單地說明上述對(duì)話腳本數(shù)據(jù)的具體內(nèi)容。在圖20的示例中,例如表示將“得分、變化”置換為與比賽信息中的“類型=得分,屬性=變化”對(duì)應(yīng)的數(shù)據(jù)即“追加得分”的言語。另外,表示將“@(擊球手.目前).最近的5場比賽的打率”置換為針對(duì)與比賽信息中的“(擊球手.目前)”對(duì)應(yīng)的“清原”,從選手信息中得到的“最近5場比賽的打率”即“.342”。另外,“if”或“Else”等句法與一般的C語言等同樣,表示根據(jù)條件控制執(zhí)行。通過使用這種對(duì)話腳本數(shù)據(jù)庫,在得分每次變化時(shí)即使不接收對(duì)話數(shù)據(jù),也可以對(duì)應(yīng)于時(shí)刻更新的數(shù)據(jù)廣播信息,生成適當(dāng)?shù)膶?duì)話數(shù)據(jù)。
以下,根據(jù)圖22說明如上所述構(gòu)成的對(duì)話裝置的動(dòng)作。
(S201)~(S203)由于該處理與實(shí)施方式3中(圖11)用相同標(biāo)號(hào)示出的步驟相同,故省略說明。
(S401)若接收數(shù)據(jù)廣播信息,則由對(duì)話數(shù)據(jù)生成部553將廣播節(jié)目開始時(shí)刻的比賽信息及選手信息存儲(chǔ)在數(shù)據(jù)廣播信息存儲(chǔ)部561內(nèi)。
(S402)接著,若接收對(duì)話腳本數(shù)據(jù)、關(guān)鍵字詞典數(shù)據(jù)及應(yīng)答用的對(duì)話數(shù)據(jù),則由對(duì)話數(shù)據(jù)生成部553將這些數(shù)據(jù)存儲(chǔ)在對(duì)話腳本數(shù)據(jù)庫562內(nèi)。在這里,上述(S401)及(S402)的處理在廣播節(jié)目開始時(shí)只進(jìn)行1次。而且,(S401)與(S402)的處理順序可以與上述的相反。另外,可以取代(S401)的處理,在最初進(jìn)行以下的(S403)的處理時(shí)進(jìn)行同樣的處理。再有,(S402)中的對(duì)話腳本數(shù)據(jù)等廣播中變更的必要性低的數(shù)據(jù),可以預(yù)先存儲(chǔ),或以與借助網(wǎng)絡(luò)或記錄介質(zhì)的廣播不同的路線進(jìn)行存儲(chǔ)。
(S403)在接收了表示數(shù)據(jù)廣播信息的變更的信息時(shí),更新數(shù)據(jù)廣播信息存儲(chǔ)部561內(nèi)的比賽信息與/或選手信息。
(S404)判定是否接收了與顯示畫面的進(jìn)展對(duì)應(yīng)的觸發(fā)信息。
(S205)若在上述(S404)中未接收觸發(fā)信息,則判定是接收中的棒球節(jié)目結(jié)束還是由視聽者結(jié)束視聽即還是進(jìn)行過切換使用的節(jié)目的操作,在節(jié)目結(jié)束或視聽結(jié)束的情況下,反復(fù)進(jìn)行上述(S201)以后的操作。一方面,若既不是節(jié)目結(jié)束也不是視聽結(jié)束,則反復(fù)進(jìn)行(S403)以后的操作。
(S405)另外,若在上述(S404)中接收了觸發(fā)信息,則執(zhí)行該觸發(fā)信息對(duì)應(yīng)的對(duì)話腳本數(shù)據(jù),以生成對(duì)話開始用的對(duì)話數(shù)據(jù)。
具體地講,例如在表示聲援球隊(duì)側(cè)得分場面的圖像時(shí),若接收了“類型=得分,屬性=聲援側(cè)”的觸發(fā)信息,則通過遵循上述規(guī)則的對(duì)話腳本數(shù)據(jù)的執(zhí)行,作為對(duì)話開始用的對(duì)話數(shù)據(jù),生成“干得好,干得好,追加得分!清原最近狀態(tài)很好。在第8小局還相差3分,那么今日的比賽獲勝是顯而易見的?”。
更詳細(xì)地講,對(duì)于第1句,對(duì)話腳本數(shù)據(jù)中的“(得分.變化)”的部分置換為由比賽信息的檢索而得到的“追加得分”,生成“干得好,干得好,追加得分!”。
對(duì)于第2句,則是“@(擊球手.目前).最近5場比賽打率”的部分,置換為與“清原.最近5場比賽打率”(作為進(jìn)行了適時(shí)安打的目前擊球手的清原的最近5場比賽的打率)對(duì)應(yīng)的“.342”之后,評(píng)價(jià)if句法的條件判定“.342>.320”,由于評(píng)價(jià)結(jié)果為真,故生成“清原最近狀態(tài)很好?!?。
另外,對(duì)于第3句也同樣,將對(duì)話腳本數(shù)據(jù)中的“(次數(shù).回合)”、“(得分.差)”分別置換為“8”、“3”,生成“在第8小局還相差3分,那么今日的比賽獲勝是顯而易見的?”。
從對(duì)話數(shù)據(jù)生成部553向聲音合成部256輸出如上所述地生成的對(duì)話開始用的對(duì)話數(shù)據(jù)。
還有,對(duì)于應(yīng)答用的對(duì)話數(shù)據(jù)的“否定”應(yīng)答中的(擊球手.下一擊球手),也通過同樣的檢索、置換,生成“~下一個(gè)是高橋”,并存儲(chǔ)于對(duì)話數(shù)據(jù)庫354內(nèi)。
再有,由于與上述觸發(fā)信息對(duì)應(yīng)的關(guān)鍵字詞典數(shù)據(jù)在本示例中不包括上述的置換,故直接從對(duì)話腳本數(shù)據(jù)庫562讀出,存儲(chǔ)于關(guān)鍵字詞典361內(nèi)。
(S206)這樣,由于輸出到聲音合成部256的對(duì)話開始用的對(duì)話數(shù)據(jù)及對(duì)話數(shù)據(jù)庫354與關(guān)鍵字詞典361的存儲(chǔ)內(nèi)容與實(shí)施方式3的相同,故通過進(jìn)行與上述圖13示出的相同的處理,構(gòu)成同樣的對(duì)話。
如上所述,由于根據(jù)預(yù)先存儲(chǔ)過的對(duì)話腳本數(shù)據(jù)、數(shù)據(jù)廣播信息及對(duì)應(yīng)于顯示畫面的進(jìn)展?fàn)顩r的觸發(fā)信息,自動(dòng)生成對(duì)話信息,故不會(huì)在每次進(jìn)行對(duì)話時(shí)接收對(duì)話數(shù)據(jù),從而可以靈活地進(jìn)行對(duì)應(yīng)于顯示畫面的適當(dāng)對(duì)話,同時(shí)也可以達(dá)到通過數(shù)據(jù)傳送量的降低或使重復(fù)量減少而減少存儲(chǔ)容量的目的。
(實(shí)施方式6)接下來說明本發(fā)明的實(shí)施方式6的對(duì)話裝置。首先,對(duì)該對(duì)話裝置的構(gòu)成進(jìn)行說明。該對(duì)話裝置,如圖23所示,在數(shù)字電視接收機(jī)601、對(duì)話型代理裝置651的基礎(chǔ)上還具備通報(bào)電話(door phone)1801。通報(bào)電話1801具有第1數(shù)據(jù)收發(fā)部1802、控制部1803、開關(guān)1804、圖像輸入部1805、聲音輸入部1806、聲音輸出部1807、對(duì)話數(shù)據(jù)庫1808。上述第1數(shù)據(jù)收發(fā)部1802在與數(shù)字電視接收機(jī)601之間收發(fā)圖像及聲音的數(shù)據(jù)。開關(guān)1804是通報(bào)電話1801的呼出開關(guān),來訪者壓下該開關(guān)1804,通知來訪。圖像輸入部1805例如是電視攝像機(jī),拍攝來訪者。聲音輸入部1806例如是麥克風(fēng),輸入來訪者的發(fā)聲。對(duì)話數(shù)據(jù)庫1808保持對(duì)來訪者的發(fā)聲的對(duì)話數(shù)據(jù)。聲音輸出部1807將對(duì)話數(shù)據(jù)作為聲音輸出??刂撇?803進(jìn)行通報(bào)電話1801整體的控制。
數(shù)字電視接收機(jī)601與上述實(shí)施方式3(圖8)的數(shù)字電視接收機(jī)301相比,具備在其與通報(bào)電話1901之間收發(fā)圖像及聲音的數(shù)據(jù)的第2數(shù)據(jù)收發(fā)部602及在其與對(duì)話型代理裝置651之間收發(fā)與來自圖像輸入部1805的圖像聯(lián)動(dòng)的對(duì)話數(shù)據(jù)等的第1對(duì)話數(shù)據(jù)收發(fā)部603,而取代廣播數(shù)據(jù)接收部202、節(jié)目信息處理部203、附加信息處理部305及對(duì)話數(shù)據(jù)傳送部206,在不具備定時(shí)器管理部311方面是不同的,但其他構(gòu)成是同樣的。而且,第1對(duì)話數(shù)據(jù)收發(fā)部603兼任向?qū)υ捫痛硌b置651傳送對(duì)話數(shù)據(jù)等的對(duì)話數(shù)據(jù)傳送部。
對(duì)話型代理裝置651與實(shí)施方式3的對(duì)話型代理裝置351相比,雖然在具備第2對(duì)話數(shù)據(jù)收發(fā)部652而取代對(duì)話數(shù)據(jù)接收部252的方面不同,但其他的構(gòu)成是同樣的。而且,第2對(duì)話數(shù)據(jù)收發(fā)部652兼任接收從數(shù)字電視接收機(jī)傳送來的對(duì)話數(shù)據(jù)等的對(duì)話數(shù)據(jù)接收部。
接下來,對(duì)于如上所述構(gòu)成的對(duì)話裝置的動(dòng)作,以利用者視聽數(shù)字電視接收機(jī)601時(shí)有來訪者的場面為例進(jìn)行說明。具體講,利用者一邊處在數(shù)字電視接收機(jī)601之前一邊決定是否應(yīng)答來訪者,可以進(jìn)行以下所示的對(duì)話。
(1)對(duì)話型代理裝置“有人來了。去見?”(在顯示部103上顯示來訪者)(2)利用者“不見”(邊看來訪者)(3)對(duì)話型代理裝置“知道了”
(4)通報(bào)電話“現(xiàn)在主人不在家”首先,來訪者按壓開關(guān)1804??刂撇?803判斷為有來訪者,將圖像輸入部1805、聲音輸入部1806及聲音輸出部1807通電。而且,經(jīng)過控制部1803、第1數(shù)據(jù)收發(fā)部1802、第2數(shù)據(jù)收發(fā)部602、顯示/聲音輸出控制部204,將從圖像輸入部1805輸入的來訪者的圖像顯示在顯示部103的畫面的一部分或全部上。
接著,控制部1803從第1數(shù)據(jù)收發(fā)部1802傳送對(duì)話數(shù)據(jù)庫1808內(nèi)存儲(chǔ)的與利用者之間進(jìn)行對(duì)話用的對(duì)話數(shù)據(jù)或利用者最初搭話的言語。該對(duì)話數(shù)據(jù)等經(jīng)過數(shù)字電視接收機(jī)601的第2數(shù)據(jù)收發(fā)部602,從第1對(duì)話數(shù)據(jù)收發(fā)部603向?qū)υ捫痛硌b置651傳送。對(duì)話型代理裝置651的第2對(duì)話數(shù)據(jù)收發(fā)部652接收對(duì)話數(shù)據(jù)等,并向?qū)υ挃?shù)據(jù)處理部253傳送。對(duì)話數(shù)據(jù)處理部253向?qū)υ挃?shù)據(jù)庫354傳送對(duì)話數(shù)據(jù)及對(duì)利用者的應(yīng)答數(shù)據(jù)。對(duì)話數(shù)據(jù)庫354存儲(chǔ)應(yīng)答數(shù)據(jù)。同時(shí),對(duì)話數(shù)據(jù)處理部253向聲音合成部256傳送對(duì)話型代理裝置651最初與利用者搭話的言語(1)“有人來了。去見?”。聲音合成部256以合成聲音輸出發(fā)音(1)。而且,應(yīng)答數(shù)據(jù),可以在來訪者來之前,預(yù)先從對(duì)話數(shù)據(jù)庫(通報(bào)電話側(cè))1808傳送到對(duì)話數(shù)據(jù)庫(對(duì)話型代理裝置側(cè))354,也可以在裝置出廠時(shí)預(yù)先存儲(chǔ)。
接下來,從聲音輸入部105輸入利用者的發(fā)聲(2)“不見”。聲音辨識(shí)部362辨識(shí)利用者的發(fā)聲(2),對(duì)話處理部355從對(duì)話數(shù)據(jù)庫354中選擇與利用者的發(fā)聲“不見”(即,“否定”的類型)對(duì)應(yīng)的應(yīng)答(3)“知道了”,并送至聲音合成部256。聲音合成部256以合成聲音輸出應(yīng)答(3)。
另一方面,對(duì)話處理部355向?qū)υ挃?shù)據(jù)處理部253傳送表示聲音辨識(shí)結(jié)果為“否定”類型的信息。經(jīng)過第2數(shù)據(jù)收發(fā)部652、第1對(duì)話數(shù)據(jù)收發(fā)部603、第2數(shù)據(jù)收發(fā)部602及第1數(shù)據(jù)收發(fā)部1802,向控制部1803通知為“否定”類型的信息??刂撇?803從對(duì)話數(shù)據(jù)庫1808中選擇發(fā)聲(4)“現(xiàn)在主人不在家”,并從聲音輸出部1807輸出。
最后,通過來自控制部1803的指令,顯示部103的顯示結(jié)束,對(duì)話數(shù)據(jù)處理部253的對(duì)話結(jié)束,斷開通報(bào)電話1801中的圖像輸入部1805、聲音輸入部1806、聲音輸出部1807的電源。
這樣,在實(shí)施方式6的對(duì)話裝置中,由于對(duì)應(yīng)于辨識(shí)了看來訪者的圖像的利用者的發(fā)聲“哎呀”的結(jié)果為“否定”等,根據(jù)與來訪者的圖像聯(lián)動(dòng)的對(duì)話數(shù)據(jù),生成應(yīng)答數(shù)據(jù)“知道了”等,可以在與利用者之間對(duì)來訪者共有對(duì)話場面,難于誤辨識(shí)利用者的發(fā)聲,可以順利地進(jìn)入對(duì)話。另外,由于利用者能視聽數(shù)字電視接收機(jī)601邊對(duì)應(yīng)來訪者,故也可以得到對(duì)應(yīng)成為樂趣的效果。
而且,在上述實(shí)施方式2~實(shí)施方式5中,雖然示出了對(duì)話裝置由電視接收機(jī)與對(duì)話型代理裝置構(gòu)成的示例,但并未限于此,也可以如實(shí)施方式1所示,具有以電視接收機(jī)單體使文字圖像等顯示在顯示部上,以此進(jìn)行對(duì)話那樣的印象。進(jìn)而,并未限于聲音的對(duì)話,對(duì)于裝置側(cè)的發(fā)話,也可以由文字顯示來進(jìn)行。
另外,實(shí)施方式2~實(shí)施方式5中的各構(gòu)成要素設(shè)于電視接收機(jī)與對(duì)話型代理裝置的哪個(gè)中的方式,并未限于上述情況,例如在對(duì)話型代理裝置側(cè)設(shè)置附加信息處理部,在電視接收機(jī)側(cè)設(shè)置對(duì)話數(shù)據(jù)處理部及對(duì)話數(shù)據(jù)庫,在電視接收機(jī)或STB(機(jī)頂盒)中設(shè)置聲音辨識(shí)部等,可以進(jìn)行各種設(shè)定。再有,也可以只由實(shí)施方式2~5中示出的對(duì)話型代理裝置構(gòu)成對(duì)話裝置,廣播圖像的顯示等由通常的電視接收機(jī)等來進(jìn)行。
此外,并未限于使用電視接收機(jī),例如也可以用STB等構(gòu)成只進(jìn)行數(shù)據(jù)處理或信號(hào)處理的對(duì)話裝置,圖像的顯示或聲音的輸入輸出在外部其他的顯示裝置中進(jìn)行。
再有,在上述的示例中,雖然示出了接收?qǐng)D像數(shù)據(jù)(圖像信號(hào))等或?qū)υ挃?shù)據(jù)被傳送過的數(shù)據(jù)的示例,但這些數(shù)據(jù)等并未限于通過廣播供給,通過互聯(lián)網(wǎng)(寬帶)或記錄介質(zhì)等供給也可以得到同樣的效果。另外,關(guān)于廣播,也可以適用于接收地面波廣播或衛(wèi)星廣播、CATV(有線電視廣播)等各種形式的廣播的機(jī)器。
還有,可以用互不相同的路線輸入圖像數(shù)據(jù)等和對(duì)話數(shù)據(jù)。另外,并未限于同步輸入,可以在圖像數(shù)據(jù)等之前輸入對(duì)話數(shù)據(jù)(也包含關(guān)鍵字詞典數(shù)據(jù)等),或預(yù)先(制造階段等中)存儲(chǔ)于(所謂常駐)裝置內(nèi)。如上所述,對(duì)于關(guān)鍵字詞典數(shù)據(jù)等一般能共用的數(shù)據(jù),預(yù)先進(jìn)行存儲(chǔ)對(duì)于傳送數(shù)據(jù)量的降低或傳送處理的簡化是有利的。在這里,雖然在伴隨顯示圖像的進(jìn)展而順序處理對(duì)話數(shù)據(jù)的情況下,優(yōu)選根據(jù)對(duì)應(yīng)于顯示圖像的進(jìn)展的時(shí)間信號(hào)(或信息)來順次進(jìn)行對(duì)話處理,但在以隨機(jī)(不定)的順序處理對(duì)話數(shù)據(jù)或反復(fù)處理同一對(duì)話數(shù)據(jù)時(shí),可以對(duì)應(yīng)于顯示圖像的進(jìn)展,伴隨時(shí)間信號(hào),利用特定對(duì)話數(shù)據(jù)的識(shí)別信息。此外,可以使對(duì)話數(shù)據(jù)包含例如表示從圖像的顯示開始到應(yīng)使用該對(duì)話數(shù)據(jù)的時(shí)刻為止的時(shí)間等的時(shí)間信息,同時(shí)在圖像的顯示時(shí)計(jì)時(shí)該顯示時(shí)間的經(jīng)過,比較上述已計(jì)時(shí)的經(jīng)過時(shí)間與上述時(shí)間信息,在由上述時(shí)間信息表示的時(shí)間經(jīng)過了時(shí),開始該對(duì)話數(shù)據(jù)的對(duì)話。
另外,作為對(duì)話數(shù)據(jù)等的形式,并未限于表示數(shù)據(jù)內(nèi)容的純粹的數(shù)據(jù)形式,也可以使用包含該對(duì)話數(shù)據(jù)等的處理內(nèi)容的程序或命令等形式。這種方法,更具體講,例如若利用XML或?qū)ML適用于廣播數(shù)據(jù)中BML等的記述格式,則能容易地實(shí)現(xiàn)。即,作為對(duì)話裝置,若設(shè)置解釋上述命令等并執(zhí)行的結(jié)構(gòu),則可以通過對(duì)話數(shù)據(jù)等進(jìn)行更靈活的對(duì)話處理。
再有,上述各實(shí)施方式或變形例的構(gòu)成要素,可以在理論上可能的范圍內(nèi)進(jìn)行各種組合或取舍選擇。具體講,例如省略實(shí)施方式3(圖8)的定時(shí)器管理部311,或適用于實(shí)施方式2(圖5),或?qū)?shí)施方式4(圖14)的暫時(shí)存儲(chǔ)部471適用于實(shí)施方式2等。
還有,作為聲音合成的方法,例如并未限于通過合成聲音來讀出正文數(shù)據(jù)的方法,例如可以使用將錄音聲音預(yù)先編碼的聲音數(shù)據(jù),根據(jù)對(duì)話數(shù)據(jù)進(jìn)行譯碼處理等,使其發(fā)聲。這種情況下,可以簡單地表現(xiàn)以合成聲音難生成的音質(zhì)或聲調(diào)。此外,并未限于這些,也可以適用各種公知的方法。
此外,作為聲音辨識(shí)的方法,也可以適用各種公知的方法,無論該方法如何,都可以得到本發(fā)明的本質(zhì)效果。
另外,在實(shí)施方式1等中,雖然示出了對(duì)話只回答1次就結(jié)束的示例,但當(dāng)然并未限于此,可以進(jìn)行更多次的交談。即使在這種情況下,也在某種程度地反復(fù)進(jìn)行應(yīng)答時(shí)刻,通過根據(jù)新畫面的進(jìn)展而自然地切換話題,從而可以不繼續(xù)進(jìn)行不對(duì)路的對(duì)話。
還有,在反復(fù)數(shù)次得到對(duì)話的應(yīng)答時(shí),即使在伴隨顯示圖像的進(jìn)展而輸入新的對(duì)話數(shù)據(jù)或時(shí)間信息的情況下,也不一定開始與此對(duì)應(yīng)的新對(duì)話。例如,在視聽者的發(fā)話數(shù)據(jù)進(jìn)入對(duì)話數(shù)據(jù)預(yù)先設(shè)想的對(duì)話內(nèi)容的范圍內(nèi)時(shí),即在對(duì)話數(shù)據(jù)內(nèi)定義的關(guān)鍵字的命中率高(以下,對(duì)話的適合度高)時(shí),即使在輸入了新的對(duì)話數(shù)據(jù)的情況下,也繼續(xù)進(jìn)行到此為止的對(duì)話。另外,新的對(duì)話數(shù)據(jù)等中包含表示優(yōu)先順序的信息,可以根據(jù)其優(yōu)先順序與對(duì)話的適合度,來決定是繼續(xù)對(duì)話還是切換為新的對(duì)話。具體講,例如在對(duì)話的適合度高,且輸入了優(yōu)先度低的新對(duì)話等時(shí),繼續(xù)對(duì)話,另一方面,在對(duì)話的適合度低(對(duì)話不對(duì)路)的情況下,即使優(yōu)先度低,也在輸入了新的對(duì)話數(shù)據(jù)時(shí),通過切換為新的對(duì)話,從而可以容易地解除不適當(dāng)?shù)膶?duì)話的繼續(xù)。
再有,可以根據(jù)保持于對(duì)話裝置內(nèi)或從其他機(jī)器通過網(wǎng)絡(luò)而取得的視聽者的簡介信息(或者根據(jù)簡介信息、上述對(duì)話的適合度與新對(duì)話數(shù)據(jù)的優(yōu)先度的2個(gè)或以上的組合),決定是否開始新的對(duì)話。具體講,例如在由簡介信息表示視聽者對(duì)料理相關(guān)的話題感興趣時(shí),在進(jìn)行料理相關(guān)的對(duì)話時(shí)即使輸入了與其他話題相關(guān)的新對(duì)話數(shù)據(jù)等,也會(huì)繼續(xù)到此為止的對(duì)話,另一方面,在進(jìn)行與其他話題相關(guān)的對(duì)話時(shí)輸入了料理相關(guān)話題的新對(duì)話數(shù)據(jù)時(shí),若無論對(duì)話的適合度多高都開始新的對(duì)話,則也可以進(jìn)一步順利地進(jìn)行對(duì)話的繼續(xù)、切換。另外,針對(duì)上述的簡介信息或?qū)υ挼倪m合度等的組合,可以任意設(shè)定將重點(diǎn)置于何處等的對(duì)話繼續(xù)、切換的條件信息自身。
另外,如上所述,在根據(jù)簡介信息控制對(duì)話的繼續(xù)、切換時(shí),也可以根據(jù)之后的對(duì)話適合度,來更新上述簡介信息本身。具體講,例如在對(duì)料理相關(guān)的話題的對(duì)話適合度高的情況下,如視聽者對(duì)料理相關(guān)的話題更感興趣的情況所示,通過更新簡介信息,可以容易地進(jìn)行更適當(dāng)?shù)膶?duì)話。
此外,在如上所述地進(jìn)行伴隨圖像顯示的對(duì)話時(shí),能將視聽者的發(fā)話內(nèi)容對(duì)應(yīng)的數(shù)據(jù)或?qū)υ掃m合度與圖像一起記錄于記錄介質(zhì)中,同時(shí),在再生記錄過的圖像時(shí),若將上述數(shù)據(jù)或適合度作為關(guān)鍵字,能搜索再生場所,則可以容易地再生進(jìn)行了表示視聽者對(duì)顯示圖像印象深的發(fā)話的場所或與對(duì)話裝置的對(duì)話起勁的場所。
(工業(yè)上的可利用性)根據(jù)如上所述的本發(fā)明,由于通過對(duì)視聽者,根據(jù)與非對(duì)話性進(jìn)行的圖像對(duì)應(yīng)的對(duì)話數(shù)據(jù)而進(jìn)行對(duì)話,從而可以容易地以自然的感覺將視聽者引入對(duì)話裝置預(yù)先設(shè)想的對(duì)話內(nèi)容中,因此,即使在比較小規(guī)模的裝置構(gòu)成中,也難誤辨識(shí)利用者的發(fā)音,從而順利地進(jìn)行對(duì)話,可以容易地給予與自由對(duì)話接近的印象,故在視聽機(jī)器或家用電器產(chǎn)品等領(lǐng)域內(nèi)是有用的。
權(quán)利要求
1.一種對(duì)話裝置,其特征在于,具備顯示控制機(jī)構(gòu),其根據(jù)圖像數(shù)據(jù),在顯示部上顯示對(duì)視聽者非對(duì)話性進(jìn)展的圖像;對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu),其存儲(chǔ)對(duì)應(yīng)于所述圖像的進(jìn)展的對(duì)話數(shù)據(jù);聲音辨識(shí)機(jī)構(gòu),其通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理機(jī)構(gòu),其根據(jù)所述視聽者發(fā)話數(shù)據(jù)、所述對(duì)話數(shù)據(jù)及對(duì)應(yīng)于所述圖像的進(jìn)展的時(shí)間信息,輸出表示對(duì)話裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制機(jī)構(gòu),其根據(jù)所述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
2.根據(jù)權(quán)利要求1所述的對(duì)話裝置,其特征在于,還具備輸入機(jī)構(gòu),其通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入所述圖像數(shù)據(jù)及所述對(duì)話數(shù)據(jù),向所述顯示控制機(jī)構(gòu)及所述對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)輸出所述已輸入的數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的對(duì)話裝置,其特征在于,所述輸入機(jī)構(gòu)構(gòu)成為通過互不相同的路徑輸入所述圖像數(shù)據(jù)與所述對(duì)話數(shù)據(jù)。
4.根據(jù)權(quán)利要求2所述的對(duì)話裝置,其特征在于,所述輸入機(jī)構(gòu)構(gòu)成為通過在與所述圖像數(shù)據(jù)對(duì)應(yīng)的給定時(shí)間內(nèi)輸入所述對(duì)話數(shù)據(jù),從而輸出所述時(shí)間信息。
5.根據(jù)權(quán)利要求2所述的對(duì)話裝置,其特征在于,還具備視聽者發(fā)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu),其存儲(chǔ)所述視聽者發(fā)話數(shù)據(jù);所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)已存儲(chǔ)于所述視聽者發(fā)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)內(nèi)的所述視聽者發(fā)話數(shù)據(jù)、及所述視聽者發(fā)出基于所述視聽者發(fā)話數(shù)據(jù)的所述聲音后重新向所述輸入機(jī)構(gòu)輸入的對(duì)話數(shù)據(jù),輸出所述裝置發(fā)話數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的對(duì)話裝置,其特征在于,所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)所述圖像數(shù)據(jù)內(nèi)包含的所述時(shí)間信息,輸出所述裝置發(fā)話數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的對(duì)話裝置,其特征在于,所述對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)構(gòu)成為可以存儲(chǔ)多個(gè)所述對(duì)話數(shù)據(jù);同時(shí)所述圖像數(shù)據(jù)包含所述時(shí)間信息與特定所述多個(gè)對(duì)話數(shù)據(jù)中的至少任意一個(gè)的對(duì)話數(shù)據(jù)特定信息;所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)所述時(shí)間信息及所述對(duì)話數(shù)據(jù)特定信息,輸出所述裝置發(fā)話數(shù)據(jù)。
8.根據(jù)權(quán)利要求1所述的對(duì)話裝置,其特征在于,還具備計(jì)時(shí)機(jī)構(gòu),其輸出與所述圖像的顯示時(shí)間的經(jīng)過對(duì)應(yīng)的所述時(shí)間信息;所述對(duì)話數(shù)據(jù)包括表示所述對(duì)話處理機(jī)構(gòu)應(yīng)輸出的所述裝置發(fā)話數(shù)據(jù)的時(shí)間的輸出時(shí)間信息;所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)所述時(shí)間信息及所述輸出時(shí)間信息,輸出所述裝置發(fā)話數(shù)據(jù)。
9.根據(jù)權(quán)利要求1所述的對(duì)話裝置,其特征在于,所述對(duì)話處理機(jī)構(gòu)構(gòu)成為通過根據(jù)所述對(duì)話數(shù)據(jù)及所述時(shí)間信息,輸出所述裝置發(fā)話數(shù)據(jù),從而開始與視聽者的對(duì)話,另一方面通過根據(jù)所述對(duì)話數(shù)據(jù)及所述視聽者發(fā)話數(shù)據(jù),輸出所述裝置發(fā)話數(shù)據(jù),從而繼續(xù)所述已開始的對(duì)話。
10.根據(jù)權(quán)利要求9的對(duì)話裝置,其特征在于,所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)已經(jīng)開始的與視聽者的對(duì)話中的所述裝置發(fā)話數(shù)據(jù)與所述視聽者發(fā)話數(shù)據(jù)之間的適合度、以及與視聽者的新對(duì)話開始的優(yōu)先度,開始所述新的對(duì)話。
11.根據(jù)權(quán)利要求9所述的對(duì)話裝置,其特征在于,所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)視聽者相關(guān)的簡介信息及對(duì)應(yīng)于所述簡介信息、表示用來開始與視聽者的對(duì)話的條件的對(duì)話開始條件信息,開始與視聽者的對(duì)話。
12.根據(jù)權(quán)利要求9所述的對(duì)話裝置,其特征在于,所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)已經(jīng)開始的與視聽者的對(duì)話中的所述裝置發(fā)話數(shù)據(jù)與所述視聽者發(fā)話數(shù)據(jù)之間的適合度、視聽者相關(guān)的簡介信息、以及對(duì)應(yīng)于所述適合度和所述簡介信息表示用來開始與視聽者的對(duì)話的條件的對(duì)話開始條件信息,開始與視聽者的新對(duì)話。
13.根據(jù)權(quán)利要求12所述的對(duì)話裝置,其特征在于,所述對(duì)話處理機(jī)構(gòu)構(gòu)成為根據(jù)所述已開始的對(duì)話中的所述裝置發(fā)話數(shù)據(jù)與所述視聽者發(fā)話數(shù)據(jù)之間的適合度,更新所述簡介信息。
14.根據(jù)權(quán)利要求1所述的對(duì)話裝置,其特征在于,所述對(duì)話處理機(jī)構(gòu)構(gòu)成為在給定一系列的所述圖像顯示在給定時(shí)間連續(xù)進(jìn)行時(shí),輸出所述裝置發(fā)話數(shù)據(jù)。
15.一種對(duì)話主機(jī)裝置,其特征在于,具備輸入機(jī)構(gòu),其通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入表示對(duì)視聽者非對(duì)話性進(jìn)展的圖像之圖像數(shù)據(jù)、及與所述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù);顯示控制機(jī)構(gòu),其根據(jù)所述圖像數(shù)據(jù),在顯示部上顯示所述圖像;和傳送機(jī)構(gòu),其向?qū)υ捵訖C(jī)裝置傳送所述對(duì)話數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息。
16.一種對(duì)話子機(jī)裝置,其特征在于,具備接收機(jī)構(gòu),其接收從對(duì)話主機(jī)裝置傳送來的、與對(duì)視聽者非對(duì)話性進(jìn)展的圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及對(duì)應(yīng)于所述圖像的進(jìn)展的時(shí)間信息;對(duì)話數(shù)據(jù)存儲(chǔ)機(jī)構(gòu),其存儲(chǔ)所述對(duì)話數(shù)據(jù);聲音辨識(shí)機(jī)構(gòu),其通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理機(jī)構(gòu),其根據(jù)所述視聽者發(fā)話數(shù)據(jù)、所述對(duì)話數(shù)據(jù)及時(shí)間信息,輸出表示對(duì)話子機(jī)裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制機(jī)構(gòu),其根據(jù)所述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
17.一種對(duì)話控制方法,其特征在于,具有顯示控制步驟,根據(jù)圖像信息,在顯示部上顯示對(duì)視聽者非對(duì)話性進(jìn)展的圖像;聲音辨識(shí)步驟,通過基于視聽者發(fā)話了的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)所述視聽者發(fā)話數(shù)據(jù)、與所述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息,輸出表示對(duì)話裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)所述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
18.一種對(duì)話控制方法,其特征在于,具有輸入步驟,通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入表示對(duì)視聽者非對(duì)話性進(jìn)展的圖像之圖像數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù);顯示控制步驟,根據(jù)所述圖像數(shù)據(jù),在顯示部上顯示所述圖像;和傳送步驟,向?qū)υ捵訖C(jī)裝置傳送所述對(duì)話數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息。
19.一種對(duì)話控制方法,其特征在于,具有接收步驟,接收從對(duì)話主機(jī)裝置傳送來的、與對(duì)視聽者非對(duì)話性進(jìn)展的圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息;聲音辨識(shí)步驟,通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)所述視聽者發(fā)話數(shù)據(jù)、所述對(duì)話數(shù)據(jù)及時(shí)間信息,輸出表示對(duì)話子機(jī)裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)所述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
20.一種對(duì)話控制程序,其特征在于,使計(jì)算機(jī)執(zhí)行以下處理顯示控制步驟,根據(jù)圖像信息,在顯示部上顯示對(duì)視聽者非對(duì)話性進(jìn)展的圖像;聲音辨識(shí)步驟,通過基于視聽者發(fā)話了的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)所述視聽者發(fā)話數(shù)據(jù)、與所述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息,輸出表示對(duì)話裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)所述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
21.一種對(duì)話控制程序,其特征在于,使計(jì)算機(jī)執(zhí)行以下處理輸入步驟,通過無線通信、有線通信、網(wǎng)絡(luò)通信及記錄介質(zhì)的至少任意一種,輸入表示對(duì)視聽者非對(duì)話性進(jìn)展的圖像之圖像數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù);顯示控制步驟,根據(jù)所述圖像數(shù)據(jù),在顯示部上顯示所述圖像;和傳送步驟,向?qū)υ捵訖C(jī)裝置傳送所述對(duì)話數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息。
22.一種對(duì)話控制程序,其特征在于,使計(jì)算機(jī)執(zhí)行以下處理接收步驟,接收從對(duì)話主機(jī)裝置傳送來的、與對(duì)視聽者非對(duì)話性進(jìn)展的圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù)及與所述圖像的進(jìn)展對(duì)應(yīng)的時(shí)間信息;聲音辨識(shí)步驟,通過基于視聽者發(fā)出的聲音的辨識(shí)處理,輸出表示視聽者的發(fā)話內(nèi)容的視聽者發(fā)話數(shù)據(jù);對(duì)話處理步驟,根據(jù)所述視聽者發(fā)話數(shù)據(jù)、所述對(duì)話數(shù)據(jù)及時(shí)間信息,輸出表示對(duì)話子機(jī)裝置的發(fā)話內(nèi)容的裝置發(fā)話數(shù)據(jù);和發(fā)聲控制步驟,根據(jù)所述裝置發(fā)話數(shù)據(jù),使發(fā)音部發(fā)出聲音。
全文摘要
為了即使在比較小規(guī)模的裝置構(gòu)成中,也難誤辨識(shí)利用者的發(fā)音,從而順利地進(jìn)行對(duì)話,可以容易地給予接近自由對(duì)話的印象,圖像輸出部將被廣播的圖像等與視聽者非對(duì)話性進(jìn)行的圖像顯示在顯示部上,對(duì)話處理部根據(jù)存儲(chǔ)于對(duì)話數(shù)據(jù)庫內(nèi)的與上述圖像的進(jìn)展對(duì)應(yīng)的對(duì)話數(shù)據(jù),輸出開始對(duì)話用的裝置發(fā)話數(shù)據(jù),同時(shí)若從視聽者進(jìn)行發(fā)話,則根據(jù)從聲音辨識(shí)部輸出的視聽者發(fā)話數(shù)據(jù)與上述對(duì)話數(shù)據(jù),輸出用來應(yīng)答視聽者的發(fā)話的裝置發(fā)話數(shù)據(jù)。
文檔編號(hào)H04N7/14GK1561514SQ0281918
公開日2005年1月5日 申請(qǐng)日期2002年9月27日 優(yōu)先權(quán)日2001年9月27日
發(fā)明者前川英嗣, 脅田由實(shí), 水谷研治, 芳澤伸一, 廣瀨良文, 松井謙二 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1