亚洲狠狠干,亚洲国产福利精品一区二区,国产八区,激情文学亚洲色图

意圖理解裝置以及方法與流程

文檔序號(hào):11161273閱讀:538來(lái)源:國(guó)知局
意圖理解裝置以及方法與制造工藝

本發(fā)明涉及根據(jù)語(yǔ)音識(shí)別結(jié)果估計(jì)用戶的意圖的意圖理解裝置以及其方法。



背景技術(shù):

近年來(lái),使用人們說(shuō)的語(yǔ)言的語(yǔ)音識(shí)別結(jié)果來(lái)執(zhí)行裝置的操作的技術(shù)受到關(guān)注。該技術(shù)被用作移動(dòng)電話、導(dǎo)航裝置等的語(yǔ)音接口。作為現(xiàn)有的基本方法,具有以下這樣的方法:例如裝置預(yù)先存儲(chǔ)假定的語(yǔ)音識(shí)別結(jié)果與操作的對(duì)應(yīng)關(guān)系,當(dāng)用戶發(fā)出的語(yǔ)音的識(shí)別結(jié)果是假定的內(nèi)容時(shí),執(zhí)行與該識(shí)別結(jié)果對(duì)應(yīng)的操作。

該方法與用戶手動(dòng)操作的情況相比,可通過(guò)語(yǔ)音的發(fā)聲進(jìn)行直接操作,因此,作為快捷功能有效地發(fā)揮作用。另一方面,用戶為了執(zhí)行操作,需要發(fā)出裝置等待的語(yǔ)言,當(dāng)裝置處理的功能增加時(shí),用戶不得不預(yù)先記住的語(yǔ)言增加。另外,一般情況下,在充分理解使用說(shuō)明書后使用裝置的用戶較少,所以,沒(méi)有理解的用戶不知道為了進(jìn)行操作要說(shuō)什么,所以,還具有這樣的問(wèn)題:實(shí)際上,除了記住的功能的指令以外,無(wú)法利用語(yǔ)音進(jìn)行操作。

因此,作為改良上述問(wèn)題的技術(shù),提出了以下這樣的方法:即使用戶沒(méi)有記住用于達(dá)成目的的指令,裝置也通過(guò)對(duì)話來(lái)引導(dǎo)用戶達(dá)成目的。作為其實(shí)現(xiàn)的方法的一個(gè)重要技術(shù),例如在專利文獻(xiàn)1中公開(kāi)了根據(jù)用戶的發(fā)話來(lái)正確地估計(jì)該用戶的意圖的技術(shù)。

專利文獻(xiàn)1的語(yǔ)音處理裝置按照分別表示多個(gè)意圖的多個(gè)意圖信息,具有語(yǔ)言的詞典數(shù)據(jù)庫(kù)以及文法數(shù)據(jù)庫(kù),還將此前執(zhí)行的指令的信息作為事先分?jǐn)?shù)進(jìn)行保持。該語(yǔ)音處理裝置按照多個(gè)意圖信息來(lái)計(jì)算音響分?jǐn)?shù)、語(yǔ)言分?jǐn)?shù)以及事先分?jǐn)?shù),作為表示根據(jù)用戶發(fā)話而輸入的語(yǔ)音信號(hào)相對(duì)于意圖信息的一致度的分?jǐn)?shù),選擇綜合這些分?jǐn)?shù)而獲得的綜合分?jǐn)?shù)最大的意圖信息。此外,還公開(kāi)了以下的情況:語(yǔ)音處理裝置根據(jù)綜合分?jǐn)?shù)來(lái)執(zhí)行所選擇的意圖信息,在用戶確認(rèn)后執(zhí)行或放棄。

但是,在專利文獻(xiàn)1中,所定義的意圖是“請(qǐng)告訴天氣”、“請(qǐng)告訴時(shí)間”這種形式的唯一決定的意圖,沒(méi)有提及例如假定了包含在導(dǎo)航裝置的終點(diǎn)設(shè)定中所需的多用的設(shè)施名這樣的意圖的處理。

現(xiàn)有技術(shù)文獻(xiàn)

專利文獻(xiàn)

專利文獻(xiàn)1:日本特開(kāi)2011-33680號(hào)公報(bào)



技術(shù)實(shí)現(xiàn)要素:

發(fā)明要解決的課題

在上述專利文獻(xiàn)1的語(yǔ)音處理裝置中,因?yàn)榘凑找鈭D來(lái)設(shè)計(jì)語(yǔ)音識(shí)別結(jié)果,所以,僅僅是從多個(gè)不同的意圖中進(jìn)行選擇、以及判定最終選擇的意圖信息的執(zhí)行和放棄,不處理語(yǔ)音識(shí)別結(jié)果的次級(jí)候選。

例如,在用戶聽(tīng)音樂(lè)的狀態(tài)下作出“不聽(tīng)音樂(lè)”這樣的發(fā)話的情況下,當(dāng)“想聽(tīng)音樂(lè)”這樣的第1候選和“不聽(tīng)音樂(lè)”這樣的第2候選的意圖作為結(jié)果求出時(shí),選擇第1候選的“想聽(tīng)音樂(lè)”。

此外,在導(dǎo)航裝置的終點(diǎn)已經(jīng)設(shè)定了“○○中心”的狀態(tài)下用戶為了追加途經(jīng)地而作出“停在○×中心”這樣的發(fā)話的結(jié)果是,在“停在○○中心”是第1候選的意圖、“停在○×中心”是第2候選的意圖的情況下也會(huì)選擇第1候選的“停在○○中心”。

這樣,具有以下這樣的課題:因?yàn)楝F(xiàn)有裝置不處理次級(jí)候選,所以,難以正確地理解用戶的意圖。其結(jié)果是,用戶必須取消所選擇的第1候選,再次作出發(fā)話。

本發(fā)明是為了解決上述這樣的課題而完成的,其目的是提供利用輸入語(yǔ)音來(lái)正確地理解用戶的意圖的意圖理解裝置以及方法。

解決問(wèn)題的手段

本發(fā)明的意圖理解裝置具備:語(yǔ)音識(shí)別部,其識(shí)別用戶用自然語(yǔ)言發(fā)出的一個(gè)語(yǔ)音,生成多個(gè)語(yǔ)音識(shí)別結(jié)果;詞素分析部,其將語(yǔ)音識(shí)別結(jié)果分別轉(zhuǎn)換為詞素串;意圖理解部,其根據(jù)詞素串估計(jì)用戶的發(fā)話的意圖,從一個(gè)詞素串中輸出一個(gè)以上的意圖理解結(jié)果候選和表示可能性的程度的分?jǐn)?shù);權(quán)重計(jì)算部,其計(jì)算每個(gè)意圖理解結(jié)果候選的權(quán)重;以及意圖理解校正部,其使用權(quán)重校正意圖理解結(jié)果候選的分?jǐn)?shù),算出最終分?jǐn)?shù),根據(jù)該最終分?jǐn)?shù)從意圖理解結(jié)果候選中選擇意圖理解結(jié)果。

本發(fā)明的意圖理解方法包括以下的步驟:語(yǔ)音識(shí)別步驟,識(shí)別用戶用自然語(yǔ)言發(fā)出的一個(gè)語(yǔ)音,生成多個(gè)語(yǔ)音識(shí)別結(jié)果;詞素分析步驟,將語(yǔ)音識(shí)別結(jié)果分別轉(zhuǎn)換為詞素串;意圖理解步驟,根據(jù)詞素串估計(jì)用戶的發(fā)話的意圖,從一個(gè)詞素串中輸出一個(gè)以上的意圖理解結(jié)果候選和表示可能性的程度的分?jǐn)?shù);權(quán)重計(jì)算步驟,計(jì)算每個(gè)意圖理解結(jié)果候選的權(quán)重;以及意圖理解校正步驟,使用權(quán)重校正意圖理解結(jié)果候選的分?jǐn)?shù)來(lái)算出最終分?jǐn)?shù),根據(jù)該最終分?jǐn)?shù)從所述意圖理解結(jié)果候選中選擇意圖理解結(jié)果。

發(fā)明效果

根據(jù)本發(fā)明,根據(jù)一個(gè)語(yǔ)音生成多個(gè)語(yǔ)音識(shí)別結(jié)果,從語(yǔ)音識(shí)別結(jié)果分別生成意圖理解結(jié)果候選,使用權(quán)重來(lái)校正意圖理解結(jié)果候選的分?jǐn)?shù),算出最終分?jǐn)?shù),根據(jù)該最終分?jǐn)?shù)從多個(gè)意圖理解結(jié)果候選中選擇意圖理解結(jié)果,所以,能夠從不僅包含與輸入語(yǔ)音相對(duì)的語(yǔ)音識(shí)別結(jié)果的第1候選還包含次級(jí)候選的候選中選擇最終的意圖理解結(jié)果。因此,能夠提供可正確地理解用戶意圖的意圖理解裝置。

根據(jù)本發(fā)明,根據(jù)一個(gè)語(yǔ)音生成多個(gè)語(yǔ)音識(shí)別結(jié)果,根據(jù)語(yǔ)音識(shí)別結(jié)果分別生成意圖理解結(jié)果候選,使用權(quán)重來(lái)校正意圖理解結(jié)果候選的分?jǐn)?shù),算出最終分?jǐn)?shù),根據(jù)該最終分?jǐn)?shù)從多個(gè)意圖理解結(jié)果候選中選擇意圖理解結(jié)果,所以,能夠從不僅包含與輸入語(yǔ)音相對(duì)的語(yǔ)音識(shí)別結(jié)果的第1候選還包含次級(jí)候選的候選中選擇最終的意圖理解結(jié)果。因此,能夠提供可正確地理解用戶意圖的意圖理解方法。

附圖說(shuō)明

圖1是示出本發(fā)明的實(shí)施方式1的意圖理解裝置的結(jié)構(gòu)的框圖。

圖2是示出將實(shí)施方式1的意圖理解裝置作為語(yǔ)音接口組裝的導(dǎo)航裝置的結(jié)構(gòu)的框圖。

圖3是說(shuō)明實(shí)施方式1的意圖理解裝置的動(dòng)作的圖,圖3的(a)是設(shè)定信息的例子,圖3的(b)是對(duì)話的例子。

圖4是示出實(shí)施方式1的意圖理解裝置的各部的輸出結(jié)果的圖,圖4的(a)是語(yǔ)音識(shí)別結(jié)果的例子,圖4的(a)~圖4的(d)是與語(yǔ)音識(shí)別結(jié)果1位~3位相對(duì)的意圖理解結(jié)果候選等的例子。

圖5是定義了實(shí)施方式1的意圖理解裝置的權(quán)重計(jì)算部所使用的制約條件與等待權(quán)重的對(duì)應(yīng)關(guān)系的表。

圖6是示出實(shí)施方式1的意圖理解裝置的動(dòng)作的流程圖。

圖7是示出本發(fā)明的實(shí)施方式2的意圖理解裝置的結(jié)構(gòu)的框圖。

圖8是說(shuō)明實(shí)施方式2的意圖理解裝置的動(dòng)作的圖,示出對(duì)話的例子。

圖9是示出實(shí)施方式2的意圖理解裝置的各部的輸出結(jié)果的圖,圖9的(a)是語(yǔ)音識(shí)別結(jié)果的例子,圖9的(b)~圖9的(d)是與語(yǔ)音識(shí)別結(jié)果1位~3位相對(duì)的意圖理解結(jié)果候選等的例子。

圖10是示出實(shí)施方式2的意圖理解裝置的層次樹(shù)的例子的圖。

圖11是圖10的層次樹(shù)的各節(jié)點(diǎn)的意圖的列表。

圖12是示出實(shí)施方式2的意圖理解裝置的權(quán)重計(jì)算部計(jì)算的等待權(quán)重的例子的圖。

圖13是示出實(shí)施方式2的意圖理解裝置的動(dòng)作的流程圖。

圖14是示出圖13的步驟ST20的具體動(dòng)作的流程圖。

圖15是示出本發(fā)明的實(shí)施方式3的意圖理解裝置的結(jié)構(gòu)的框圖。

圖16是示出實(shí)施方式3的意圖理解裝置的關(guān)鍵字表的例子的圖。

圖17是示出實(shí)施方式3的意圖理解裝置的關(guān)鍵字對(duì)應(yīng)意圖的例子的圖。

圖18是示出實(shí)施方式3的意圖理解裝置的各個(gè)部的輸出結(jié)果的圖,圖18的(a)是語(yǔ)音識(shí)別結(jié)果的例子,圖18的(b)~圖18的(d)是與語(yǔ)音識(shí)別結(jié)果第1位~第3位相對(duì)的意圖理解結(jié)果候選等的例子。

圖19是示出實(shí)施方式3的意圖理解裝置的動(dòng)作的流程圖。

圖20是示出圖19的步驟ST31的具體動(dòng)作的流程圖。

圖21是示出本發(fā)明的意圖理解裝置的變形例的框圖。

圖22是說(shuō)明本發(fā)明的意圖理解裝置的動(dòng)作的圖,示出對(duì)話的例子。

具體實(shí)施方式

以下,為了更詳細(xì)地說(shuō)明本發(fā)明,根據(jù)附圖說(shuō)明用于實(shí)施本發(fā)明的方式。

實(shí)施方式1.

如圖1所示,本發(fā)明的實(shí)施方式1的意圖理解裝置1具備:語(yǔ)音識(shí)別部3,其對(duì)用戶發(fā)出的輸入語(yǔ)音2進(jìn)行語(yǔ)音識(shí)別,轉(zhuǎn)換為文本;語(yǔ)音識(shí)別部3在語(yǔ)音識(shí)別中使用的語(yǔ)音識(shí)別詞典4;詞素分析部5,其將語(yǔ)音識(shí)別結(jié)果分解為詞素;詞素分析部5在詞素分析中使用的詞素分析詞典6;意圖理解部7,其根據(jù)詞素分析結(jié)果生成意圖理解結(jié)果的候選;用于供意圖理解部7估計(jì)用戶的意圖的意圖理解模型8;設(shè)定信息存儲(chǔ)部10,其存儲(chǔ)控制對(duì)象設(shè)備的設(shè)定信息9;權(quán)重計(jì)算部11,其使用設(shè)定信息存儲(chǔ)部10的設(shè)定信息9計(jì)算權(quán)重;以及意圖理解校正部12,其使用權(quán)重來(lái)校正意圖理解結(jié)果的候選,從中選擇最終的意圖理解結(jié)果13并輸出。

意圖理解裝置1由未圖示的CPU(Central Processing Unit)構(gòu)成,該CPU通過(guò)執(zhí)行內(nèi)部存儲(chǔ)器存儲(chǔ)的程序,實(shí)現(xiàn)作為語(yǔ)音識(shí)別部3、詞素分析部5、意圖理解部7、權(quán)重計(jì)算部11以及意圖理解校正部12的功能。

語(yǔ)音識(shí)別詞典4、詞素分析詞典6、意圖理解模型8以及設(shè)定信息存儲(chǔ)部10由HDD(Hard Disk Drive)、DVD(Digital Versatile Disc)、存儲(chǔ)器等構(gòu)成。

圖2是示出將意圖理解裝置1作為語(yǔ)音接口組裝的導(dǎo)航裝置100的結(jié)構(gòu)的框圖。該導(dǎo)航裝置100是基于語(yǔ)音的控制對(duì)象。語(yǔ)音輸入部101由麥克風(fēng)等構(gòu)成,將用戶發(fā)出的語(yǔ)音轉(zhuǎn)換為信號(hào),將其作為輸入語(yǔ)音2輸出至意圖理解裝置1。導(dǎo)航控制部102由CPU等構(gòu)成,執(zhí)行從當(dāng)前地到終點(diǎn)的路徑的搜索以及引導(dǎo)等功能。終點(diǎn)等的設(shè)定信息9從導(dǎo)航控制部102輸出至意圖理解裝置1。另外,該導(dǎo)航控制部102從意圖理解裝置1接收意圖理解結(jié)果13,執(zhí)行意圖理解結(jié)果13所示的操作,或者將關(guān)于意圖理解結(jié)果13的語(yǔ)音信號(hào)輸出到語(yǔ)音輸出部103。語(yǔ)音輸出部103由揚(yáng)聲器等構(gòu)成,再現(xiàn)從導(dǎo)航控制部102輸入的語(yǔ)音信號(hào)。

此外,可以使用不同的CPU構(gòu)成意圖理解裝置1和導(dǎo)航控制部102,也可以使用1個(gè)CPU構(gòu)成意圖理解裝置1和導(dǎo)航控制部102。

例如,以“<主意圖>[<槽名>=<槽值>、···]”這樣的形式來(lái)表現(xiàn)意圖。具體地說(shuō),以“終點(diǎn)設(shè)定[設(shè)施=?]”以及“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○店)]”這樣的方式表現(xiàn)?!敖K點(diǎn)設(shè)定[設(shè)施=?]”表示這樣的狀態(tài):雖然用戶希望設(shè)定終點(diǎn),但尚未決定具體的設(shè)施名?!敖K點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○店)]”表示這樣的狀態(tài):用戶將“○○店”這樣的具體設(shè)施設(shè)定為終點(diǎn)。

作為意圖理解部7進(jìn)行的意圖理解方法,例如可利用最大熵法等方法。具體地說(shuō),意圖理解模型8大量地保持“終點(diǎn)、設(shè)定”這樣的獨(dú)立單詞(以下,稱為特征)與“終點(diǎn)設(shè)定[設(shè)施=?]”這樣的正確意圖的組。意圖理解部7例如從“希望設(shè)定終點(diǎn)”這樣的輸入語(yǔ)音2的詞素分析結(jié)果中提取“終點(diǎn)、設(shè)定”這樣的特征,利用統(tǒng)計(jì)的方法從意圖理解模型8中估計(jì)哪個(gè)意圖有多大的可能性。意圖理解部7輸出意圖與表示該意圖的可能性的分?jǐn)?shù)的組的列表作為意圖理解結(jié)果的候選。

以下,說(shuō)明意圖理解部7執(zhí)行利用最大熵法的意圖理解方法的情況。

圖3的(a)是實(shí)施方式1中的設(shè)定信息9的例子,圖3的(b)是對(duì)話的例子。

在基于語(yǔ)音的控制對(duì)象是導(dǎo)航裝置100的情況下,在設(shè)定信息9中包含有無(wú)終點(diǎn)以及經(jīng)由地的設(shè)定,在進(jìn)行了設(shè)定的情況下包含該終點(diǎn)或經(jīng)由地的名稱,此外還包含所顯示的地圖的類型等信息。意圖理解裝置1的設(shè)定信息存儲(chǔ)部10存儲(chǔ)導(dǎo)航裝置100的導(dǎo)航控制部102所輸出的設(shè)定信息9。在圖3的(a)的例子中,在設(shè)定信息9中包含“終點(diǎn):△△”和“經(jīng)由地:○○”的信息。

圖3的(b)表示在導(dǎo)航裝置100與用戶之間從上依次進(jìn)行對(duì)話的情況。在對(duì)話內(nèi)容中,各行的行頭的“U:”表示用戶發(fā)出的輸入語(yǔ)音2,“S:”表示來(lái)自導(dǎo)航裝置100的應(yīng)答。

圖4是意圖理解裝置1的各部的輸出結(jié)果的例子。

圖4的(a)表示語(yǔ)音識(shí)別部3所輸出的語(yǔ)音識(shí)別結(jié)果的例子。語(yǔ)音識(shí)別結(jié)果是“○○是目的地”這樣的語(yǔ)音識(shí)別結(jié)果與表示該語(yǔ)音識(shí)別結(jié)果的可能性的似然度的組的列表,按照似然度從高到低的順序排列。

圖4的(b)是與圖4的(a)的語(yǔ)音識(shí)別結(jié)果中的第1位的語(yǔ)音識(shí)別結(jié)果“○○是目的地”相對(duì)的意圖理解結(jié)果候選、分?jǐn)?shù)、等待權(quán)重以及最終分?jǐn)?shù),圖4的(c)與第2位的語(yǔ)音識(shí)別結(jié)果“不去○○”相對(duì),圖4的(d)與第3位的語(yǔ)音識(shí)別結(jié)果“尋找○△”相對(duì)。意圖理解部7輸出“經(jīng)由地設(shè)定[設(shè)施=$設(shè)施$]”這樣的意圖與分?jǐn)?shù)的組的列表作為意圖理解結(jié)果的候選。這些意圖理解結(jié)果候選按照分?jǐn)?shù)從高到低的順序排列。權(quán)重計(jì)算部11按照意圖理解部7輸出的每個(gè)意圖理解結(jié)果候選,計(jì)算等待權(quán)重。意圖理解校正部12按照意圖理解部7所輸出的每個(gè)意圖理解結(jié)果候選,使用等待權(quán)重計(jì)算最終分?jǐn)?shù)。

圖5是定義了制約條件與等待權(quán)重的對(duì)應(yīng)關(guān)系的表。

例如,可認(rèn)為在導(dǎo)航裝置100的終點(diǎn)已被設(shè)定為“△△”的情況下,用戶在下一次發(fā)話時(shí)再一次進(jìn)行“將終點(diǎn)設(shè)定為△△”這樣的意圖的發(fā)話的可能性較低。由此,針對(duì)此制約條件,將意圖“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=△△)]”的等待權(quán)重設(shè)定為“0.0”。另一方面,因?yàn)榇嬖谟脩魧⒔K點(diǎn)變更為“?”(△△以外的場(chǎng)所)的可能性,所以,將意圖“終點(diǎn)設(shè)定[設(shè)施=設(shè)施=$設(shè)施$(=?)]”的等待權(quán)重設(shè)定為“1.0”。另外,因?yàn)橛脩暨M(jìn)行將與終點(diǎn)相同的“○○”設(shè)定為經(jīng)由地的意圖的發(fā)話的可能性較低,所以,將意圖“經(jīng)由地設(shè)定[設(shè)施=$設(shè)施$(=○○)]”的等待權(quán)重設(shè)定為“0.0”。此外,因?yàn)橛袝r(shí)用戶刪除已經(jīng)設(shè)定的經(jīng)由地“○○”,所以,將意圖“刪除經(jīng)由地[設(shè)施=$設(shè)施$(=○○)]”的等待權(quán)重設(shè)定為“1.0”。

權(quán)重計(jì)算部11保持如上所述地根據(jù)產(chǎn)生意圖的可能性而事先定義的等待權(quán)重的信息,根據(jù)設(shè)定信息9選擇與意圖對(duì)應(yīng)的等待權(quán)重。

意圖理解校正部12使用以下的式(1),校正意圖理解部7的意圖理解結(jié)果的候選。具體地說(shuō),意圖理解校正部12對(duì)從語(yǔ)音識(shí)別部3獲得的語(yǔ)音識(shí)別結(jié)果的似然度與從意圖理解部7獲得的意圖理解結(jié)果候選的意圖理解分?jǐn)?shù)進(jìn)行乘法計(jì)算,來(lái)計(jì)算分?jǐn)?shù)(相當(dāng)于圖4的(b)等所示的“分?jǐn)?shù)”),對(duì)該分?jǐn)?shù)與從權(quán)重計(jì)算部11獲得的等待權(quán)重進(jìn)行乘法運(yùn)算,獲得最終分?jǐn)?shù)(相當(dāng)于圖4的(b)等所示的“最終分?jǐn)?shù)”)。在本實(shí)施方式1中,如式(1)那樣進(jìn)行利用乘法運(yùn)算的意圖理解校正,但不限于該方法。

(似然度)×(意圖理解分?jǐn)?shù))=(分?jǐn)?shù))

(分?jǐn)?shù))×(等待權(quán)重)=(最終分?jǐn)?shù))

···(1)

接著,參照?qǐng)D6的流程圖,來(lái)說(shuō)明意圖理解裝置1的動(dòng)作。

這里,意圖理解裝置1被組裝到作為控制對(duì)象的導(dǎo)航裝置100,當(dāng)用戶按下未明示的對(duì)話開(kāi)始按鈕時(shí),開(kāi)始對(duì)話。另外,假設(shè)在設(shè)定信息存儲(chǔ)部10中存儲(chǔ)有圖3的(a)所示的設(shè)定信息9,針對(duì)圖3的(b)的對(duì)話內(nèi)容進(jìn)行意圖理解過(guò)程的詳細(xì)說(shuō)明。

在檢測(cè)到用戶已按下導(dǎo)航裝置100的對(duì)話開(kāi)始按鈕時(shí),導(dǎo)航控制部102以語(yǔ)音的形式從語(yǔ)音輸出部103輸出提示對(duì)話開(kāi)始的應(yīng)答“發(fā)出嗶的聲音后,請(qǐng)說(shuō)話”,繼續(xù)使蜂鳴聲鳴叫。另外,意圖理解裝置1使語(yǔ)音識(shí)別部3成為可識(shí)別的狀態(tài),成為等待用戶發(fā)話的狀態(tài)。

接著,如圖3的(b)那樣,當(dāng)用戶發(fā)出“不去○○”時(shí),語(yǔ)音輸入部101將該發(fā)話轉(zhuǎn)換為語(yǔ)音數(shù)據(jù),并輸出至意圖理解裝置1的語(yǔ)音識(shí)別部3。意圖理解裝置1的語(yǔ)音識(shí)別部3使用語(yǔ)音識(shí)別詞典4將輸入語(yǔ)音2轉(zhuǎn)換為文本,并且算出似然度,輸出至詞素分析部5(步驟ST11)。

接著,詞素分析部5使用詞素分析詞典6,對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行詞素分析,輸出至意圖理解部7(步驟ST12)。例如,語(yǔ)音識(shí)別結(jié)果“○○是目的地”的詞素分析結(jié)果為“○○/名詞、は/助詞、目的地/名詞、で/助詞”。

接著,意圖理解部7使用意圖理解模型8,根據(jù)詞素分析結(jié)果估計(jì)意圖,并且算出分?jǐn)?shù),作為意圖理解結(jié)果候選輸出至意圖理解校正部12(步驟ST13)。此時(shí),意圖理解部7從詞素分析結(jié)果中提取使用于意圖理解的特征,將該特征與意圖理解模型8進(jìn)行對(duì)照來(lái)估計(jì)意圖。從圖4的(a)的語(yǔ)音識(shí)別結(jié)果“○○是目的地”的詞素分析結(jié)果中,提取“○○、目的地”這樣的特征的列表,并獲得圖4的(b)的意圖理解結(jié)果候選“經(jīng)由地設(shè)定[設(shè)施=$設(shè)施$(=○○)]”及其分?jǐn)?shù)“0.623”以及意圖理解結(jié)果候選“設(shè)施檢索[設(shè)施=$設(shè)施$(=○○)]”及其分?jǐn)?shù)“0.286”。

然后,權(quán)重計(jì)算部11從設(shè)定信息存儲(chǔ)部10中讀入設(shè)定信息9,根據(jù)該設(shè)定信息9和圖5所示的表來(lái)選擇每個(gè)意圖的等待權(quán)重,輸出至意圖理解校正部12(步驟ST14)。

接著,意圖理解校正部12使用語(yǔ)音識(shí)別部3所計(jì)算的語(yǔ)音識(shí)別結(jié)果的似然度、意圖理解部7計(jì)算的意圖理解結(jié)果候選的分?jǐn)?shù)和權(quán)重計(jì)算部11選擇的等待權(quán)重,根據(jù)上式(1)來(lái)算出意圖理解結(jié)果候選的最終分?jǐn)?shù)(步驟ST15)。此時(shí),意圖理解校正部12按照語(yǔ)音識(shí)別結(jié)果的似然度從上位到下位的順序且同一語(yǔ)音識(shí)別結(jié)果中的意圖理解結(jié)果候選的分?jǐn)?shù)從上位到下位的順序,計(jì)算最終分?jǐn)?shù),每次計(jì)算都評(píng)價(jià)其最終分?jǐn)?shù)。意圖理解校正部12例如在發(fā)現(xiàn)最終分?jǐn)?shù)X=0.5以上的意圖理解結(jié)果候選的時(shí)刻,使該意圖理解結(jié)果候選成為最終的意圖理解結(jié)果13。

在圖4的例子中,關(guān)于與輸入語(yǔ)音2“不去○○”相對(duì)的第1位的語(yǔ)音識(shí)別結(jié)果“○○是目的地”,圖4的(b)的意圖理解結(jié)果候選第1位“經(jīng)由地設(shè)定[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)為“0.0”,第2位“設(shè)施檢索[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)為“0.286”,任意的意圖理解結(jié)果候選都不滿足最終分?jǐn)?shù)是X以上的條件(步驟ST16“否”)。

因此,意圖理解裝置1針對(duì)第2位的語(yǔ)音識(shí)別結(jié)果“不去○○”反復(fù)進(jìn)行步驟ST12~ST15的處理,其結(jié)果是,獲得圖4的(c)的意圖理解結(jié)果候選第1位“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.589”和第2位“設(shè)施檢索[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.232”。因?yàn)檎Z(yǔ)音識(shí)別結(jié)果第2位且意圖理解結(jié)果候選第1位的“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.589”滿足X以上(步驟ST16“是”),所以,在此時(shí)刻,意圖理解校正部12將“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”作為最終的意圖理解結(jié)果13返回導(dǎo)航控制部102,結(jié)束處理。

導(dǎo)航控制部102在從意圖理解裝置1接收到意圖理解結(jié)果13的“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”時(shí),對(duì)語(yǔ)音輸出部103進(jìn)行指示,如圖3的(b)那樣以語(yǔ)音的形式輸出“刪除經(jīng)由地○○。可以嗎?”。在用戶對(duì)其發(fā)出“是”的情況下,意圖理解裝置1通過(guò)語(yǔ)音輸入部101受理該發(fā)出的輸入語(yǔ)音2,判斷為正確地進(jìn)行了語(yǔ)音識(shí)別以及意圖理解。另外,意圖理解裝置1針對(duì)“是”的輸入語(yǔ)音2進(jìn)行語(yǔ)音識(shí)別以及意圖理解,將意圖理解結(jié)果13輸出至導(dǎo)航控制部102。導(dǎo)航控制部102根據(jù)該意圖理解結(jié)果13,執(zhí)行刪除經(jīng)由地“○○”的操作。

由此,在導(dǎo)航控制部102中,執(zhí)行“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”,而不是具有語(yǔ)音識(shí)別結(jié)果的最大似然度以及意圖理解結(jié)果的最大分?jǐn)?shù)的“經(jīng)由地設(shè)定[設(shè)施=$設(shè)施$(=○○)]”,能夠排除誤識(shí)別的影響。

以上,根據(jù)實(shí)施方式1,意圖理解裝置1構(gòu)成為具備:語(yǔ)音識(shí)別部3,其識(shí)別用戶以自然語(yǔ)言發(fā)出的一個(gè)輸入語(yǔ)音2,生成多個(gè)語(yǔ)音識(shí)別結(jié)果;詞素分析部5,其將語(yǔ)音識(shí)別結(jié)果分別轉(zhuǎn)換為詞素串;意圖理解部7,其根據(jù)詞素串估計(jì)用戶發(fā)話的意圖,從一個(gè)詞素串輸出一個(gè)以上的意圖理解結(jié)果候選和分?jǐn)?shù);權(quán)重計(jì)算部11,其計(jì)算每個(gè)意圖理解結(jié)果候選的等待權(quán)重;以及意圖理解校正部12,其使用等待權(quán)重校正意圖理解結(jié)果候選的分?jǐn)?shù),算出最終分?jǐn)?shù),根據(jù)該最終分?jǐn)?shù)從意圖理解結(jié)果候選中選擇意圖理解結(jié)果13。因此,可以從不僅包含與輸入語(yǔ)音2相對(duì)的第1位的語(yǔ)音識(shí)別結(jié)果、還包含第2位以后的語(yǔ)音識(shí)別結(jié)果的結(jié)果中選擇最終的意圖理解結(jié)果13。因此,能夠提供可正確地理解用戶的意圖的意圖理解裝置1。

另外,根據(jù)實(shí)施方式1,意圖理解部7從多個(gè)語(yǔ)音識(shí)別結(jié)果中的具有可能性的語(yǔ)音識(shí)別結(jié)果依次生成意圖理解結(jié)果候選,意圖理解校正部12構(gòu)成為,每當(dāng)意圖理解部7生成意圖理解結(jié)果候選時(shí),算出最終分?jǐn)?shù),選擇該最終分?jǐn)?shù)滿足預(yù)先設(shè)定的條件X的意圖理解結(jié)果候選作為意圖理解結(jié)果13。因此,能夠抑制意圖理解裝置1的運(yùn)算量。

另外,根據(jù)實(shí)施方式1,權(quán)重計(jì)算部11構(gòu)成為,使用根據(jù)意圖理解校正部12所選擇的意圖理解結(jié)果13而工作的控制對(duì)象設(shè)備(例如,導(dǎo)航裝置100)的設(shè)定信息9,計(jì)算等待權(quán)重。具體地說(shuō),權(quán)重計(jì)算部11構(gòu)成為,具有對(duì)制約條件和滿足該制約條件時(shí)的等待權(quán)重進(jìn)行定義的圖5這樣的表,根據(jù)設(shè)定信息9來(lái)判斷是否滿足制約條件,選擇等待權(quán)重。因此,能夠估計(jì)與控制對(duì)象設(shè)備的狀況相應(yīng)的確切意圖。

實(shí)施方式2.

圖7是示出實(shí)施方式2的意圖理解裝置20的結(jié)構(gòu)的框圖。在圖7中對(duì)與圖1相同或相當(dāng)?shù)牟糠謽?biāo)注相同的符號(hào),并省略說(shuō)明。該意圖理解裝置20具備:層級(jí)地表現(xiàn)意圖的層次樹(shù)21;以及根據(jù)層次樹(shù)21的意圖中的已激活的意圖來(lái)計(jì)算等待權(quán)重的權(quán)重計(jì)算部22。

圖8是實(shí)施方式2中的對(duì)話的例子。與圖3的(b)相同,行頭的“U:”表示用戶發(fā)話,“S:”表示來(lái)自控制對(duì)象的裝置(例如,圖2所示的導(dǎo)航裝置100)的應(yīng)答。

圖9是意圖理解裝置1的各部的輸出結(jié)果的例子。圖9的(a)是語(yǔ)音識(shí)別部3輸出的語(yǔ)音識(shí)別結(jié)果及其似然度。圖9的(b)~圖9的(d)是意圖理解部7輸出的意圖理解結(jié)果的候選及其分?jǐn)?shù)、權(quán)重計(jì)算部22所輸出的等待權(quán)重以及意圖理解校正部12輸出的最終分?jǐn)?shù)。圖9的(b)示出圖9的(a)的第1位的語(yǔ)音識(shí)別結(jié)果“不去○○”的意圖理解結(jié)果候選,圖9的(c)示出第2位的語(yǔ)音識(shí)別結(jié)果“經(jīng)由○○”的意圖理解結(jié)果候選,圖9的(d)示出第3位的語(yǔ)音識(shí)別結(jié)果“把○○作為目的地”的意圖理解結(jié)果候選。

圖10以及圖11是層次樹(shù)21的例子。如圖10所示,在層次樹(shù)21中,表示意圖的節(jié)點(diǎn)是層級(jí)構(gòu)造,越到根(上的層級(jí))部,則越成為表示抽象意圖的節(jié)點(diǎn),越到葉(下的層級(jí))部,則越成為表示具體意圖的節(jié)點(diǎn)。例如,當(dāng)比較第3層級(jí)的節(jié)點(diǎn)#9的“終點(diǎn)設(shè)定[設(shè)施=?]”與第4層級(jí)的節(jié)點(diǎn)#16的“目的設(shè)定[設(shè)施=$設(shè)施$(=○○店)]”這兩個(gè)意圖時(shí),在上位的層級(jí)存在表示更抽象的意圖的節(jié)點(diǎn)#9,表示填充了具體的槽值(例如,○○店)的意圖的節(jié)點(diǎn)#16位于其下方。

位于第1層級(jí)的節(jié)點(diǎn)#1的意圖“導(dǎo)航”是表示導(dǎo)航控制部102的導(dǎo)航功能的集合的抽象節(jié)點(diǎn),表示個(gè)別的導(dǎo)航功能的節(jié)點(diǎn)#2~#5位于其下方的第2層級(jí)。例如,節(jié)點(diǎn)#4的意圖“終點(diǎn)設(shè)定[]”表示這樣的狀態(tài):雖然用戶希望設(shè)定終點(diǎn),但尚未決定具體的場(chǎng)所。當(dāng)成為已設(shè)定終點(diǎn)的狀態(tài)時(shí),從節(jié)點(diǎn)#4轉(zhuǎn)移到節(jié)點(diǎn)#9或節(jié)點(diǎn)#16。在圖10的例子中示出根據(jù)圖8所示的“設(shè)定目的地”這樣的用戶的發(fā)話激活了節(jié)點(diǎn)#4的狀態(tài)。

層次樹(shù)21根據(jù)導(dǎo)航裝置100所輸出的信息,激活意圖節(jié)點(diǎn)。

圖12是權(quán)重計(jì)算部22計(jì)算出的等待權(quán)重的例子。

根據(jù)“設(shè)定目的地”這樣的用戶發(fā)話,層次樹(shù)21的節(jié)點(diǎn)#4的意圖“終點(diǎn)設(shè)定[]”已被激活,所以,節(jié)點(diǎn)#4的枝葉方向的節(jié)點(diǎn)#9、#10的意圖的等待權(quán)重成為1.0,其它意圖節(jié)點(diǎn)的等待權(quán)重成為0.5。

后面敘述權(quán)重計(jì)算部22的等待權(quán)重的計(jì)算方法。

圖13是示出意圖理解裝置20的動(dòng)作的流程圖。圖13的步驟ST11~ST13、ST15、ST16與圖6的步驟ST11~ST13、ST15、ST16的處理相同。

在步驟ST20中,權(quán)重計(jì)算部22參照層次樹(shù)21,計(jì)算意圖理解部7的意圖理解結(jié)果候選的等待權(quán)重,輸出至意圖理解校正部12。

圖14是示出圖13的步驟ST20的具體動(dòng)作的流程圖。在步驟ST21中,權(quán)重計(jì)算部22對(duì)意圖理解部7的意圖理解結(jié)果候選與層次樹(shù)21的被激活的意圖進(jìn)行比較。在意圖理解部7的意圖理解結(jié)果候選位于層次樹(shù)21的被激活的意圖的枝葉方向時(shí)(步驟ST22“是”),權(quán)重計(jì)算部22將等待權(quán)重設(shè)為第1權(quán)重a(步驟ST23)。另一方面,在意圖理解部7的意圖理解結(jié)果候選位于層次樹(shù)21的被激活的意圖的枝葉方向以外時(shí)(步驟ST22“否”),權(quán)重計(jì)算部22將等待權(quán)重設(shè)為第2權(quán)重b(步驟ST24)。在本實(shí)施方式2中,a=1、0,b=0.5。另外,在不存在被激活的意圖節(jié)點(diǎn)時(shí),使等待權(quán)重成為1.0。

接著,說(shuō)明意圖理解裝置20的動(dòng)作。

意圖理解裝置20的動(dòng)作基本上與上述實(shí)施方式1的意圖理解裝置1的動(dòng)作相同。本實(shí)施方式2與上述實(shí)施方式1的區(qū)別是等待權(quán)重的計(jì)算方法。

以下,關(guān)于圖8所示的對(duì)話內(nèi)容,詳細(xì)地說(shuō)明意圖理解過(guò)程。與上述實(shí)施方式1相同,假定在作為控制對(duì)象的導(dǎo)航裝置100(圖2所示)中組裝了意圖理解裝置20的情況。另外,當(dāng)由用戶按下未圖示的發(fā)話開(kāi)始按鈕時(shí),開(kāi)始對(duì)話。在圖8的最初的用戶發(fā)話“設(shè)定目的地”的時(shí)刻,導(dǎo)航裝置100沒(méi)有取得任何來(lái)自用戶的信息,所以,是在意圖理解裝置20的層次樹(shù)21上不存在激活的意圖節(jié)點(diǎn)的狀態(tài)。

此外,層次樹(shù)21根據(jù)意圖理解校正部12所輸出的意圖理解結(jié)果13激活意圖節(jié)點(diǎn)。

在對(duì)話開(kāi)始后,當(dāng)用戶發(fā)出“設(shè)定目的地”時(shí),該發(fā)話的輸入語(yǔ)音2被輸入到意圖理解裝置20。該輸入語(yǔ)音2被語(yǔ)音識(shí)別部3識(shí)別(步驟ST11),被詞素分析部5分解為詞素(步驟ST12),意圖理解部7算出意圖理解結(jié)果候選(步驟ST13)。這里,假設(shè)對(duì)用戶發(fā)話“設(shè)定目的地”正確地進(jìn)行了識(shí)別而沒(méi)有誤識(shí)別、正確地理解了其意圖,意圖理解校正部12獲得“終點(diǎn)設(shè)定[]”的意圖理解結(jié)果13。導(dǎo)航控制部102為了使設(shè)定為終點(diǎn)的設(shè)施具體化,對(duì)語(yǔ)音輸出部103進(jìn)行指示,以語(yǔ)音的形式輸出“設(shè)定終點(diǎn)。請(qǐng)說(shuō)出場(chǎng)所”。另外,層次樹(shù)21激活與意圖理解結(jié)果13的“終點(diǎn)設(shè)定[]”相應(yīng)的節(jié)點(diǎn)#4。

導(dǎo)航裝置100進(jìn)行了提示下一發(fā)話的應(yīng)答,所以,繼續(xù)與用戶的對(duì)話,如圖8那樣,用戶發(fā)出“把○○作為目的地”。意圖理解裝置20對(duì)該用戶發(fā)話“把○○作為目的地”進(jìn)行步驟ST11、ST12的處理。其結(jié)果,獲得圖9的(a)的語(yǔ)音識(shí)別結(jié)果“不去○○”、“經(jīng)由○○”、“把○○作為目的地”的各個(gè)詞素分析結(jié)果。接著,意圖理解部7根據(jù)詞素分析結(jié)果估計(jì)意圖(步驟ST13)。這里,假設(shè)意圖理解結(jié)果的候選成為圖9的(b)的“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”和“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”。

接著,權(quán)重計(jì)算部22參照層次樹(shù)21計(jì)算等待權(quán)重(步驟ST20)。在此時(shí)刻,層次樹(shù)21的節(jié)點(diǎn)#4為激活狀態(tài),權(quán)重計(jì)算部22根據(jù)此狀態(tài)計(jì)算權(quán)重。

首先,在步驟ST21中,將激活的節(jié)點(diǎn)#4的信息從層次樹(shù)21傳遞到權(quán)重計(jì)算部22,并且將意圖理解結(jié)果候選“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”和“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”從意圖理解部7傳遞到權(quán)重計(jì)算部22。權(quán)重計(jì)算部22比較已激活的節(jié)點(diǎn)#4的意圖和意圖理解結(jié)果候選,在意圖理解結(jié)果候選位于激活節(jié)點(diǎn)#4的枝葉方向(即,節(jié)點(diǎn)#9以及節(jié)點(diǎn)#10)的情況下(步驟ST22“是”),將等待權(quán)重設(shè)為第1權(quán)重a(步驟ST23)。另一方面,在意圖理解結(jié)果候選位于激活節(jié)點(diǎn)#4的枝葉方向以外的情況下(步驟ST22“否”),權(quán)重計(jì)算部22將等待權(quán)重設(shè)為第2權(quán)重b(步驟ST24)。

第1權(quán)重a為大于第2權(quán)重b的值。例如,在a=1.0、b=0.5的情況下,等待權(quán)重如圖9的(b)所示。

接著,意圖理解校正部12使用語(yǔ)音識(shí)別部3計(jì)算的語(yǔ)音識(shí)別結(jié)果的似然度、意圖理解部7計(jì)算的意圖理解結(jié)果候選的分?jǐn)?shù)和權(quán)重計(jì)算部22計(jì)算的等待權(quán)重,根據(jù)上式(1)算出意圖理解結(jié)果候選的最終分?jǐn)?shù)(步驟ST15)。最終分?jǐn)?shù)如圖9的(b)所示。

接著,意圖理解校正部12與上述實(shí)施方式1同樣地判定最終分?jǐn)?shù)是否滿足條件X以上(步驟ST16)。這里,如果也把X=0.5作為條件,則與語(yǔ)音識(shí)別結(jié)果第1位“不去○○”相對(duì)的圖9的(b)的意圖理解結(jié)果候選“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.314”和“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.127”都不滿足條件。

因此,意圖理解裝置20針對(duì)語(yǔ)音識(shí)別結(jié)果第2位的“經(jīng)由○○”反復(fù)進(jìn)行步驟ST12~ST14、ST20、ST15的處理。其結(jié)果是,如圖9的(c)那樣求出意圖理解結(jié)果候選“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.295”和“設(shè)施檢索[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.116”,但這些也不滿足X以上的條件。

因此,意圖理解裝置20針對(duì)語(yǔ)音識(shí)別結(jié)果第3位的“把○○作為目的地”反復(fù)進(jìn)行步驟ST12、ST13、ST20、ST15的處理,其結(jié)果是,如圖9的(d)那樣求出意圖理解結(jié)果候選“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.538”。因?yàn)樵撟罱K分?jǐn)?shù)滿足X以上的條件,所以,意圖理解校正部12將“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”作為最終的意圖理解結(jié)果13輸出。層次樹(shù)21根據(jù)意圖理解結(jié)果13激活節(jié)點(diǎn)#16。

導(dǎo)航控制部102在從意圖理解裝置20接收到意圖理解結(jié)果13的“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”時(shí),對(duì)語(yǔ)音輸出部103進(jìn)行指示,如圖8那樣,以語(yǔ)音的形式輸出“將○○設(shè)定為終點(diǎn)??梢詥??”。在用戶對(duì)此發(fā)出“是”的情況下,意圖理解裝置20通過(guò)語(yǔ)音輸入部101受理該發(fā)話的輸入語(yǔ)音2,判斷為正確地進(jìn)行了語(yǔ)音識(shí)別以及意圖理解。另外,意圖理解裝置20對(duì)“是”的輸入語(yǔ)音2進(jìn)行語(yǔ)音識(shí)別以及意圖理解,將意圖理解結(jié)果13輸出至導(dǎo)航控制部102。導(dǎo)航控制部102根據(jù)該意圖理解結(jié)果13將“○○”設(shè)定為終點(diǎn),從語(yǔ)音輸出部103以語(yǔ)音的形式輸出“已經(jīng)把○○作為終點(diǎn)”,向用戶通知已進(jìn)行終點(diǎn)設(shè)定。

以上,根據(jù)實(shí)施方式2,權(quán)重計(jì)算部22構(gòu)成為,以使得意圖理解校正部12容易地選擇出符合根據(jù)與用戶的對(duì)話的流程而期待的意圖的意圖理解結(jié)果候選的方式進(jìn)行加權(quán)。因此,能夠估計(jì)與用戶和控制對(duì)象設(shè)備的對(duì)話狀況相應(yīng)的確切意圖。

另外,根據(jù)實(shí)施方式2,意圖理解裝置20具備層次樹(shù)21,該層次樹(shù)21使用越到根部則越成為抽象意圖、越到葉部則越成為具體意圖的樹(shù)結(jié)構(gòu)表現(xiàn)用戶的意圖,權(quán)重計(jì)算部22根據(jù)層次樹(shù)21,以容易選擇出相對(duì)于與剛剛選擇的意圖理解結(jié)果13對(duì)應(yīng)的意圖位于枝葉方向的意圖理解結(jié)果候選的方式進(jìn)行加權(quán)。這樣,可通過(guò)利用意圖的層次性校正與用戶發(fā)話相對(duì)的意圖,使控制對(duì)象設(shè)備根據(jù)確切的語(yǔ)音識(shí)別結(jié)果以及意圖理解結(jié)果進(jìn)行動(dòng)作。

實(shí)施方式3.

圖15是示出實(shí)施方式3的意圖理解裝置30的結(jié)構(gòu)的框圖。在圖15中對(duì)與圖1以及圖5相同或相當(dāng)?shù)牟糠謽?biāo)注相同的符號(hào)并省略說(shuō)明。該意圖理解裝置30具備:關(guān)鍵字表31,其存儲(chǔ)與意圖對(duì)應(yīng)的關(guān)鍵字;關(guān)鍵字檢索部32,其從關(guān)鍵字表31中檢索與詞素分析結(jié)果對(duì)應(yīng)的意圖;以及權(quán)重計(jì)算部33,其使對(duì)應(yīng)于關(guān)鍵字的意圖與層次樹(shù)21的激活的意圖進(jìn)行比較,計(jì)算等待權(quán)重。

圖16是關(guān)鍵字表31的一例。關(guān)鍵字表31存儲(chǔ)意圖與關(guān)鍵字的組。例如,針對(duì)意圖“終點(diǎn)設(shè)定[]”,賦予“目的地”、“去”、“終點(diǎn)”等成為意圖的特征表現(xiàn)的關(guān)鍵字。對(duì)除了層次樹(shù)21的第1層級(jí)的節(jié)點(diǎn)#1之外的第2層級(jí)以下的各節(jié)點(diǎn)的意圖賦予關(guān)鍵字。

以下,將與關(guān)鍵字對(duì)應(yīng)的意圖稱為關(guān)鍵字對(duì)應(yīng)意圖。另外,將與層次樹(shù)21的激活的意圖節(jié)點(diǎn)對(duì)應(yīng)的意圖稱為層次樹(shù)對(duì)應(yīng)意圖。

圖17是語(yǔ)音識(shí)別部3輸出的語(yǔ)音識(shí)別結(jié)果、語(yǔ)音識(shí)別結(jié)果所包含的關(guān)鍵字、關(guān)鍵字檢索部32檢索到的關(guān)鍵字對(duì)應(yīng)意圖的例子。與語(yǔ)音識(shí)別結(jié)果“不去○○”的關(guān)鍵字“不去”對(duì)應(yīng)的關(guān)鍵字對(duì)應(yīng)意圖為“經(jīng)由地刪除[]”,與語(yǔ)音識(shí)別結(jié)果“經(jīng)由○○”的關(guān)鍵字“經(jīng)由”對(duì)應(yīng)的關(guān)鍵字對(duì)應(yīng)意圖為“經(jīng)由地設(shè)定[]”,與語(yǔ)音識(shí)別結(jié)果“把○○作為目的地”的關(guān)鍵字“目的地”對(duì)應(yīng)的關(guān)鍵字對(duì)應(yīng)意圖為“終點(diǎn)設(shè)定[]”。

圖18的(a)是語(yǔ)音識(shí)別部3輸出的語(yǔ)音識(shí)別結(jié)果及其似然度的例子。圖18的(b)~圖18的(d)是意圖理解部7輸出的意圖理解結(jié)果候選及其分?jǐn)?shù)、權(quán)重計(jì)算部33輸出的等待權(quán)重以及意圖理解校正部12輸出的最終分?jǐn)?shù)。圖18的(b)示出圖18的(a)的第1位的語(yǔ)音識(shí)別結(jié)果“不去○○”的意圖理解結(jié)果候選,圖18的(c)示出第2位的語(yǔ)音識(shí)別結(jié)果“經(jīng)由○○”的意圖理解結(jié)果候選,圖18的(d)示出第3位的語(yǔ)音識(shí)別結(jié)果“把○○作為目的地”的意圖理解結(jié)果候選。

圖19是示出意圖理解裝置30的動(dòng)作的流程圖。圖19的步驟ST11~ST13、ST15、ST16與圖6的步驟ST11~ST13、ST15、ST16的處理相同。

在步驟ST30中,關(guān)鍵字檢索部32從關(guān)鍵字表31中檢索與詞素分析結(jié)果對(duì)應(yīng)的關(guān)鍵字,取得與檢索的關(guān)鍵字對(duì)應(yīng)的關(guān)鍵字對(duì)應(yīng)意圖。關(guān)鍵字檢索部32向權(quán)重計(jì)算部33輸出所取得的關(guān)鍵字對(duì)應(yīng)意圖。

圖20是示出圖19的步驟ST31的具體動(dòng)作的流程圖。在步驟ST32中,權(quán)重計(jì)算部33對(duì)意圖理解部7的意圖理解結(jié)果候選、層次樹(shù)21的激活的層次樹(shù)對(duì)應(yīng)意圖、關(guān)鍵字檢索部32的關(guān)鍵字對(duì)應(yīng)意圖進(jìn)行比較。在意圖理解結(jié)果候選與關(guān)鍵字對(duì)應(yīng)意圖、層次樹(shù)對(duì)應(yīng)意圖都不一致的情況下(步驟ST32“否”),權(quán)重計(jì)算部33將等待權(quán)重設(shè)為第3權(quán)重c。

在意圖理解結(jié)果候選與層次樹(shù)對(duì)應(yīng)意圖一致的情況下(步驟ST32“是”且步驟ST34“是”),權(quán)重計(jì)算部33將等待權(quán)重設(shè)為第4權(quán)重d(步驟ST35)。此外,在步驟ST34“是”中,可能存在意圖理解結(jié)果候選與層次樹(shù)對(duì)應(yīng)意圖、關(guān)鍵字對(duì)應(yīng)意圖雙方一致的情況。

在意圖理解結(jié)果候選與層次樹(shù)對(duì)應(yīng)意圖不一致而僅與關(guān)鍵字對(duì)應(yīng)意圖一致的情況下(步驟ST34“否”),權(quán)重計(jì)算部33將等待權(quán)重設(shè)為第5權(quán)重e(步驟ST36)。

在本實(shí)施方式3中,假設(shè)c=0.0、d=1.0、e=0.5。即,如果意圖理解結(jié)果候選與層次樹(shù)對(duì)應(yīng)意圖一致,則等待權(quán)重成為1.0,如果與層次樹(shù)對(duì)應(yīng)意圖不一致而與關(guān)鍵字對(duì)應(yīng)意圖一致,則成為0.5,如果與層次樹(shù)對(duì)應(yīng)意圖、關(guān)鍵字對(duì)應(yīng)意圖都不一致,則成為0.0。

接著,說(shuō)明意圖理解裝置30的動(dòng)作。

意圖理解裝置30的動(dòng)作基本上與上述實(shí)施方式1、2的意圖理解裝置1、20的動(dòng)作相同。本實(shí)施方式3與上述實(shí)施方式1、2的區(qū)別是等待權(quán)重的計(jì)算方法。

以下,詳細(xì)地說(shuō)明圖8所示的對(duì)話內(nèi)容中的用戶發(fā)話“把○○作為目的地”的意圖理解過(guò)程。與上述實(shí)施方式1、2同樣,假定在作為控制對(duì)象的導(dǎo)航裝置100(圖2所示)中組裝了意圖理解裝置30的情況。

另外,層次樹(shù)21引用圖10以及圖11。

用戶發(fā)話“把○○作為目的地”的輸入語(yǔ)音2被語(yǔ)音識(shí)別部3識(shí)別(步驟ST11),被詞素分析部5分解為詞素(步驟ST12),意圖理解部7算出意圖理解結(jié)果的候選(步驟ST13)。然后,可獲得圖18的(b)這樣的意圖理解結(jié)果候選“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”及其分?jǐn)?shù)“0.623”以及“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”及其分?jǐn)?shù)“0.127”。

接著,關(guān)鍵字檢索部32從關(guān)鍵字表31中檢索與詞素分析部5的詞素分析結(jié)果對(duì)應(yīng)的關(guān)鍵字,取得與檢索出的關(guān)鍵字對(duì)應(yīng)的關(guān)鍵字對(duì)應(yīng)意圖。因?yàn)樵凇安蝗ァ稹稹钡脑~素分析結(jié)果中存在圖16的“不去”這樣的關(guān)鍵字,所以,關(guān)鍵字對(duì)應(yīng)意圖成為“經(jīng)由地刪除[]”。

接著,權(quán)重計(jì)算部33計(jì)算等待權(quán)重(步驟ST31)。在此時(shí)刻,層次樹(shù)21的節(jié)點(diǎn)#4是激活狀態(tài),節(jié)點(diǎn)#4的層次樹(shù)對(duì)應(yīng)意圖是“終點(diǎn)設(shè)定[]”。

首先,在步驟ST32中,層次樹(shù)21對(duì)權(quán)重計(jì)算部33輸出已激活的節(jié)點(diǎn)#4的層次樹(shù)對(duì)應(yīng)意圖“終點(diǎn)設(shè)定[]”。另外,意圖理解部7對(duì)權(quán)重計(jì)算部33輸出用戶發(fā)話“不去○○”的意圖理解結(jié)果候選第1位“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”。此外,關(guān)鍵字檢索部32對(duì)權(quán)重計(jì)算部33輸出關(guān)鍵字對(duì)應(yīng)意圖“經(jīng)由地刪除[]”。

因?yàn)橐鈭D理解結(jié)果候選第1位的“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”與關(guān)鍵字對(duì)應(yīng)意圖“經(jīng)由地刪除[]”一致(步驟ST32“是”且步驟ST34“否”),所以,權(quán)重計(jì)算部33將意圖理解結(jié)果候選第1位的等待權(quán)重設(shè)為第5權(quán)重e(=0.5)(步驟ST35)。

這里,權(quán)重計(jì)算部33還把層次樹(shù)21的父子關(guān)系包含在內(nèi)判斷一致,因?yàn)椤敖?jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”是“經(jīng)由地刪除[]”的子,所以,判斷為一致。

另一方面,因?yàn)橐鈭D理解結(jié)果候選第2位“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”與層次樹(shù)對(duì)應(yīng)意圖“終點(diǎn)設(shè)定[]”一致(步驟ST32“是”且步驟ST34“是”),所以,權(quán)重計(jì)算部33將意圖理解結(jié)果候選第2位的等待權(quán)重設(shè)為第4權(quán)重d(=1.0)(步驟ST36)。

最終,如圖18的(b)那樣,求出與第1位的語(yǔ)音識(shí)別結(jié)果“不去○○”相對(duì)的第1位的意圖理解結(jié)果候選“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.312”、第2位的意圖理解結(jié)果候選“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)“0.127”。因?yàn)榈?位、第2位的最終分?jǐn)?shù)都不滿足X以上的條件,所以,意圖理解裝置30針對(duì)第2位的語(yǔ)音識(shí)別結(jié)果“經(jīng)由○○”,進(jìn)行步驟ST12、ST13、ST30、ST31、ST15的處理。

其結(jié)果是,如圖18的(c)那樣,“經(jīng)由○○”的意圖理解結(jié)果候選第1位“經(jīng)由地刪除[設(shè)施=$設(shè)施$(=○○)]”以及第2位“設(shè)施檢索[設(shè)施=$設(shè)施$(=○○)]”分別設(shè)定等待權(quán)重“0.0”(=c),最終分?jǐn)?shù)分別為“0.0”,這里也不滿足X以上的條件。

因此,處理對(duì)象轉(zhuǎn)移至第3位的語(yǔ)音識(shí)別結(jié)果“把○○作為目的地”,如圖18的(d)那樣,意圖理解結(jié)果候選第1位“終點(diǎn)設(shè)定[設(shè)施=$設(shè)施$(=○○)]”的最終分?jǐn)?shù)滿足X以上的條件,所以,作為意圖理解結(jié)果13進(jìn)行輸出。由此,與上述實(shí)施方式2同樣地將“○○”設(shè)定為終點(diǎn)。

以上,根據(jù)實(shí)施方式3,意圖理解裝置30具備關(guān)鍵字檢索部32,其從定義了意圖與關(guān)鍵字的對(duì)應(yīng)關(guān)系的關(guān)鍵字表31中檢索與詞素串一致的關(guān)鍵字,并取得與該檢索的關(guān)鍵字對(duì)應(yīng)的關(guān)鍵字對(duì)應(yīng)意圖,權(quán)重計(jì)算部33構(gòu)成為,使用層次樹(shù)對(duì)應(yīng)意圖和關(guān)鍵字對(duì)應(yīng)意圖來(lái)計(jì)算等待權(quán)重。因此,可利用意圖的層級(jí)性和作為意圖的特征表現(xiàn)的關(guān)鍵字來(lái)校正與用戶發(fā)話相對(duì)的意圖,并能夠使控制對(duì)象設(shè)備根據(jù)確切的語(yǔ)音識(shí)別結(jié)果以及意圖理解結(jié)果進(jìn)行動(dòng)作。

此外,在上述實(shí)施方式1~3中,雖然說(shuō)明了日語(yǔ)的例子,但也可以按照各種語(yǔ)言變更與意圖理解相關(guān)的特征提取方法,由此,能夠應(yīng)用于英語(yǔ)、德語(yǔ)以及中文等各種語(yǔ)言。

另外,在單詞是用特定的符號(hào)(例如,空格)劃分的語(yǔ)言的情況下,如果難以分析語(yǔ)言的構(gòu)造,則可以針對(duì)輸入語(yǔ)音2的自然語(yǔ)言文本,利用模式匹配這樣的方法提取“$設(shè)施$”、“$住所$”等槽值,然后,直接執(zhí)行意圖理解處理。

此外,在上述實(shí)施方式1~3中,通過(guò)利用詞素分析部5分析語(yǔ)音識(shí)別結(jié)果的文本來(lái)進(jìn)行意圖理解處理的準(zhǔn)備,但是,根據(jù)語(yǔ)音識(shí)別部3的識(shí)別方法的不同,有時(shí)存在語(yǔ)音識(shí)別結(jié)果本身包含詞素分析結(jié)果的情況,在此情況下,可以省略詞素分析部5和詞素分析詞典6,在語(yǔ)音識(shí)別處理之后直接執(zhí)行意圖理解處理。

另外,在上述實(shí)施方式1~3中,作為意圖理解的方法,以假定基于最大熵法的學(xué)習(xí)模型的例子進(jìn)行了說(shuō)明,但不是限定意圖理解方法。

此外,在上述實(shí)施方式3中,構(gòu)成為,權(quán)重計(jì)算部33使用層次樹(shù)對(duì)應(yīng)意圖和關(guān)鍵字對(duì)應(yīng)意圖來(lái)計(jì)算等待權(quán)重,但即便不使用層次樹(shù)21而根據(jù)關(guān)鍵字表31的關(guān)鍵字在詞素分析結(jié)果中出現(xiàn)的次數(shù)來(lái)變更意圖理解結(jié)果候選的分?jǐn)?shù),也能夠計(jì)算等待權(quán)重。

例如,在用戶發(fā)話中出現(xiàn)了對(duì)于確定“不去”、“經(jīng)由”這樣的意圖而言重要的單詞的情況下,意圖理解部7通常對(duì)用戶發(fā)話“不去○○”使用“○○、不去”這樣的特征進(jìn)行意圖理解處理。取而代之,也可以通過(guò)像“○○、不去、不去”這樣地重復(fù)位于關(guān)鍵字表31中的關(guān)鍵字,意圖理解部7計(jì)算在估計(jì)意圖時(shí)根據(jù)“不去”的個(gè)數(shù)而加權(quán)的分?jǐn)?shù)。

另外,在上述實(shí)施方式1~3中,按照多個(gè)語(yǔ)音識(shí)別結(jié)果中的似然度從高到低的順序依次進(jìn)行意圖理解處理,在發(fā)現(xiàn)最終分?jǐn)?shù)滿足X以上的條件的意圖理解結(jié)果候選的時(shí)刻結(jié)束處理,但在意圖理解裝置的運(yùn)算處理中存在富余的情況下,對(duì)全部語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖理解處理來(lái)選擇意圖理解結(jié)果13的方法也是可行的。

此外,在上述實(shí)施方式1~3中,雖然在執(zhí)行與意圖理解結(jié)果13對(duì)應(yīng)的操作之前向用戶確認(rèn)是否可以執(zhí)行(例如,圖3的(b)的“刪除經(jīng)由地○○??梢詥??”),但也可以根據(jù)意圖理解結(jié)果13的最終分?jǐn)?shù)來(lái)變更是否進(jìn)行確認(rèn)。

另外,例如,也可以是,在將語(yǔ)音識(shí)別結(jié)果第1位的意圖理解結(jié)果候選被選擇為意圖理解結(jié)果13的情況下不進(jìn)行確認(rèn)、在第2位以后的意圖理解結(jié)果候選被選擇為意圖理解結(jié)果13的情況下進(jìn)行確認(rèn)等,根據(jù)名次變更是否進(jìn)行確認(rèn)。

另外,例如,也可以是,在用等待權(quán)重進(jìn)行校正之前的分?jǐn)?shù)最高的意圖理解結(jié)果候選被選擇為意圖理解結(jié)果13的情況下不進(jìn)行確認(rèn),在分?jǐn)?shù)比其低的意圖理解結(jié)果候選被選擇為意圖理解結(jié)果13的情況下進(jìn)行確認(rèn)等,根據(jù)分?jǐn)?shù)的大小變更是否進(jìn)行確認(rèn)。

這里,圖21示出意圖理解裝置40的變形例。意圖理解裝置40具備:語(yǔ)音輸入部41,其將用戶發(fā)出的語(yǔ)音轉(zhuǎn)換成信號(hào),并取得該信號(hào)作為輸入語(yǔ)音;意圖確認(rèn)處理部42,其在意圖理解校正部12排除可能性最大的意圖理解結(jié)果候選(即,利用等待權(quán)重校正之前的分?jǐn)?shù)大的意圖理解結(jié)果候選)并將其以外的意圖理解結(jié)果候選選擇為意圖理解結(jié)果13的情況下,向用戶確認(rèn)是否采用該意圖理解結(jié)果13而決定可否采用;以及語(yǔ)音輸出部43,其輸出意圖確認(rèn)處理部42所生成的意圖理解結(jié)果確認(rèn)用的語(yǔ)音信號(hào)。這些語(yǔ)音輸入部41、意圖確認(rèn)處理部42以及語(yǔ)音輸出部43發(fā)揮與圖2所示的語(yǔ)音輸入部101、導(dǎo)航控制部102以及語(yǔ)音輸出部103相同的作用,通過(guò)如圖3的(b)那樣的“刪除經(jīng)由地○○??梢詥幔俊钡恼Z(yǔ)音輸出,向用戶確認(rèn)可否采用意圖理解結(jié)果13。

此外,向用戶的確認(rèn)方法除了語(yǔ)音輸出之外,還可以是畫面顯示等。

此外,在上述實(shí)施方式2、3中,雖然利用層次樹(shù)21的樹(shù)結(jié)構(gòu)表現(xiàn)了意圖的層次性,但并非必需是完整的樹(shù)結(jié)構(gòu),如果是不包含環(huán)結(jié)構(gòu)的曲線結(jié)構(gòu),也能夠進(jìn)行同樣的處理。

此外,在上述實(shí)施方式2、3中,雖然在意圖理解處理中僅利用了本次的用戶發(fā)話,但在層次樹(shù)21的層次變化過(guò)程中的發(fā)話的情況下,也可以使用從包含本次之前的用戶發(fā)話在內(nèi)的多個(gè)發(fā)話中提取的特征來(lái)進(jìn)行意圖理解處理。由此,能夠估計(jì)根據(jù)通過(guò)多個(gè)部分發(fā)話獲得的部分信息難以估計(jì)的意圖。

這里,使用圖22所示的對(duì)話內(nèi)容作為例子進(jìn)行說(shuō)明。

在上述實(shí)施方式2的情況下,從最初的用戶發(fā)話“設(shè)定目的地”中提取“目的地、設(shè)定”作為特征。另外,從第2個(gè)的發(fā)話“○○”中提取“$設(shè)施$(=○○)”作為特征。作為結(jié)果,通常在第2個(gè)的發(fā)話中僅使用“$設(shè)施$(=○○)”進(jìn)行意圖理解處理(圖13的步驟ST13)。

另一方面,在考慮是否是層次變化過(guò)程中的情況下,最初的發(fā)話“設(shè)定目的地”是層次樹(shù)21的節(jié)點(diǎn)#4、第2個(gè)的發(fā)話與節(jié)點(diǎn)#4為父子關(guān)系的可能性高,所以,對(duì)第2個(gè)發(fā)話使用“目的地、設(shè)定、$設(shè)施$(=○○)”這3個(gè)特征進(jìn)行意圖理解處理,由此可獲得更確切的意圖理解結(jié)果。

另外,在上述實(shí)施方式1~3中,雖然作為意圖理解裝置的控制對(duì)象設(shè)備,以圖2的導(dǎo)航裝置100為例,但不限于導(dǎo)航裝置。另外,在圖2中將意圖理解裝置內(nèi)置于控制對(duì)象設(shè)備,但也可以外置。

除了上述以外,本發(fā)明在其發(fā)明的范圍內(nèi),可進(jìn)行各實(shí)施方式的自由組合、各實(shí)施方式的任意構(gòu)成要素的變形或者在各實(shí)施方式中省略任意的構(gòu)成要素。

工業(yè)上的可利用性

如以上那樣,本發(fā)明的意圖理解裝置使用輸入語(yǔ)音來(lái)估計(jì)用戶的意圖,所以,適合用于手動(dòng)難以操作的汽車導(dǎo)航裝置等的語(yǔ)音接口。

標(biāo)號(hào)說(shuō)明

1、20、30、40意圖理解裝置,2輸入語(yǔ)音,3語(yǔ)音識(shí)別部,4語(yǔ)音識(shí)別詞典,5詞素分析部,6詞素分析詞典,7意圖理解部,8意圖理解模型,9設(shè)定信息,10設(shè)定信息存儲(chǔ)部,11、22、33權(quán)重計(jì)算部,12意圖理解校正部,13意圖理解結(jié)果,21層次樹(shù),31關(guān)鍵字表,32關(guān)鍵字檢索部,41、101語(yǔ)音輸入部,43、103語(yǔ)音輸出部,42意圖確認(rèn)處理部,100導(dǎo)航裝置,102導(dǎo)航控制部。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1